Fold clamp_{x,y} into the gathers.

All three image tile modes go through exclusive_clamp() and then a
gather today, so we can move the work of exclusive_clamp() into eac
gather_ stage, eliminating the need for clamp_{x,y} stages.

Luckily, we've got a convenient place to bottleneck this, ptr_and_ix(),
which works out the pointer and vector of indices to load for gathers.

This deletes SkRasterPipeline_repeat_tiling unit test, which now
no longer exactly makes sense.  It tests that repeat_x does that
clamp, but that's now done automatically outside that stage.

Change-Id: I24637ef60921bec7aa00082984c0c6a49dd86ca9
Reviewed-on: https://skia-review.googlesource.com/50260
Commit-Queue: Mike Klein <mtklein@chromium.org>
Reviewed-by: Mike Reed <reed@google.com>
Reviewed-by: Florin Malita <fmalita@chromium.org>
diff --git a/src/core/SkRasterPipeline.h b/src/core/SkRasterPipeline.h
index b6cb71c..f5fad00 100644
--- a/src/core/SkRasterPipeline.h
+++ b/src/core/SkRasterPipeline.h
@@ -73,8 +73,8 @@
     M(parametric_a) M(gamma)                                     \
     M(table_r) M(table_g) M(table_b) M(table_a)                  \
     M(lab_to_xyz)                                                \
-    M(clamp_x)   M(mirror_x)   M(repeat_x)                       \
-    M(clamp_y)   M(mirror_y)   M(repeat_y)                       \
+                 M(mirror_x)   M(repeat_x)                       \
+                 M(mirror_y)   M(repeat_y)                       \
     M(clamp_x_1) M(mirror_x_1) M(repeat_x_1)                     \
     M(bilinear_nx) M(bilinear_px) M(bilinear_ny) M(bilinear_py)  \
     M(bicubic_n3x) M(bicubic_n1x) M(bicubic_p1x) M(bicubic_p3x)  \
diff --git a/src/jumper/SkJumper.h b/src/jumper/SkJumper.h
index 9d7b7ab..9de28f3 100644
--- a/src/jumper/SkJumper.h
+++ b/src/jumper/SkJumper.h
@@ -62,6 +62,13 @@
     int   stride;
 };
 
+struct SkJumper_GatherCtx {
+    void* pixels;
+    int   stride;
+    float width,
+          height;
+};
+
 // State shared by save_xy, accumulate, and bilinear_* / bicubic_*.
 struct SkJumper_SamplerCtx {
     float      x[SkJumper_kMaxStride];
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 7929778..5dda700 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -4387,12 +4387,24 @@
 _sk_gather_a8_vfp4:
   .long  0xe92d4070                          // push          {r4, r5, r6, lr}
   .long  0xe8911008                          // ldm           r1, {r3, ip}
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
+  .long  0xf2c00050                          // vmov.i32      q8, #0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe283200c                          // add           r2, r3, #12
   .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e26cbf                          // vld1.32       {d22[]-d23[]}, [r2 :32]
+  .long  0xe2832008                          // add           r2, r3, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e28cbf                          // vld1.32       {d24[]-d25[]}, [r2 :32]
   .long  0xe4932004                          // ldr           r2, [r3], #4
-  .long  0xf2800050                          // vmov.i32      q0, #0
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
+  .long  0xf2800050                          // vmov.i32      q0, #0
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf2802050                          // vmov.i32      q1, #0
   .long  0xf2804050                          // vmov.i32      q2, #0
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
@@ -4441,7 +4453,7 @@
   .long  0xe0224392                          // mla           r2, r2, r3, r4
   .long  0xe082200e                          // add           r2, r2, lr
   .long  0xf3f60220                          // vmovn.i32     d16, q8
-  .long  0x1a000005                          // bne           3ef0 <sk_store_a8_vfp4+0x58>
+  .long  0x1a000005                          // bne           3f20 <sk_store_a8_vfp4+0x58>
   .long  0xf3f20121                          // vuzp.8        d16, d17
   .long  0xf4c2080f                          // vst1.32       {d16[0]}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
@@ -4450,21 +4462,21 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a00000a                          // beq           3f28 <sk_store_a8_vfp4+0x90>
+  .long  0x0a00000a                          // beq           3f58 <sk_store_a8_vfp4+0x90>
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000003                          // beq           3f14 <sk_store_a8_vfp4+0x7c>
+  .long  0x0a000003                          // beq           3f44 <sk_store_a8_vfp4+0x7c>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1afffff4                          // bne           3ee0 <sk_store_a8_vfp4+0x48>
+  .long  0x1afffff4                          // bne           3f10 <sk_store_a8_vfp4+0x48>
   .long  0xeeb03bb0                          // vmov.u16      r3, d16[2]
   .long  0xe5c23002                          // strb          r3, [r2, #2]
   .long  0xee903bf0                          // vmov.u16      r3, d16[1]
   .long  0xee904bb0                          // vmov.u16      r4, d16[0]
   .long  0xe5c23001                          // strb          r3, [r2, #1]
   .long  0xe5c24000                          // strb          r4, [r2]
-  .long  0xeaffffed                          // b             3ee0 <sk_store_a8_vfp4+0x48>
+  .long  0xeaffffed                          // b             3f10 <sk_store_a8_vfp4+0x48>
   .long  0xee903bb0                          // vmov.u16      r3, d16[0]
   .long  0xe5c23000                          // strb          r3, [r2]
-  .long  0xeaffffea                          // b             3ee0 <sk_store_a8_vfp4+0x48>
+  .long  0xeaffffea                          // b             3f10 <sk_store_a8_vfp4+0x48>
   .long  0xe320f000                          // nop           {0}
   .long  0x437f0000                          // .word         0x437f0000
   .long  0x437f0000                          // .word         0x437f0000
@@ -4485,7 +4497,7 @@
   .long  0xe35c0000                          // cmp           ip, #0
   .long  0xe0224392                          // mla           r2, r2, r3, r4
   .long  0xe082200e                          // add           r2, r2, lr
-  .long  0x1a000013                          // bne           3fc4 <sk_load_g8_vfp4+0x7c>
+  .long  0x1a000013                          // bne           3ff4 <sk_load_g8_vfp4+0x7c>
   .long  0xe5922000                          // ldr           r2, [r2]
   .long  0xe58d2000                          // str           r2, [sp]
   .long  0xe1a0200d                          // mov           r2, sp
@@ -4508,12 +4520,12 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a000012                          // beq           401c <sk_load_g8_vfp4+0xd4>
+  .long  0x0a000012                          // beq           404c <sk_load_g8_vfp4+0xd4>
   .long  0xf2c00010                          // vmov.i32      d16, #0
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000005                          // beq           3ff4 <sk_load_g8_vfp4+0xac>
+  .long  0x0a000005                          // beq           4024 <sk_load_g8_vfp4+0xac>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1affffe8                          // bne           3f88 <sk_load_g8_vfp4+0x40>
+  .long  0x1affffe8                          // bne           3fb8 <sk_load_g8_vfp4+0x40>
   .long  0xe3a04000                          // mov           r4, #0
   .long  0xe5d23002                          // ldrb          r3, [r2, #2]
   .long  0xee804bb0                          // vdup.16       d16, r4
@@ -4527,12 +4539,12 @@
   .long  0xf3f62124                          // vuzp.16       d18, d20
   .long  0xf2f004a2                          // vext.8        d16, d16, d18, #4
   .long  0xf2f004a0                          // vext.8        d16, d16, d16, #4
-  .long  0xeaffffda                          // b             3f88 <sk_load_g8_vfp4+0x40>
+  .long  0xeaffffda                          // b             3fb8 <sk_load_g8_vfp4+0x40>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xe5d22000                          // ldrb          r2, [r2]
   .long  0xee803bb0                          // vdup.16       d16, r3
   .long  0xee002bb0                          // vmov.16       d16[0], r2
-  .long  0xeaffffd5                          // b             3f88 <sk_load_g8_vfp4+0x40>
+  .long  0xeaffffd5                          // b             3fb8 <sk_load_g8_vfp4+0x40>
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
@@ -4559,7 +4571,7 @@
   .long  0xe0824003                          // add           r4, r2, r3
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a000015                          // bne           40e0 <sk_load_g8_dst_vfp4+0x90>
+  .long  0x1a000015                          // bne           4110 <sk_load_g8_dst_vfp4+0x90>
   .long  0xe5944000                          // ldr           r4, [r4]
   .long  0xe58d4000                          // str           r4, [sp]
   .long  0xe1a0400d                          // mov           r4, sp
@@ -4584,12 +4596,12 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xe2065003                          // and           r5, r6, #3
   .long  0xe3550001                          // cmp           r5, #1
-  .long  0x0a000012                          // beq           4138 <sk_load_g8_dst_vfp4+0xe8>
+  .long  0x0a000012                          // beq           4168 <sk_load_g8_dst_vfp4+0xe8>
   .long  0xf2c00010                          // vmov.i32      d16, #0
   .long  0xe3550002                          // cmp           r5, #2
-  .long  0x0a000005                          // beq           4110 <sk_load_g8_dst_vfp4+0xc0>
+  .long  0x0a000005                          // beq           4140 <sk_load_g8_dst_vfp4+0xc0>
   .long  0xe3550003                          // cmp           r5, #3
-  .long  0x1affffe6                          // bne           409c <sk_load_g8_dst_vfp4+0x4c>
+  .long  0x1affffe6                          // bne           40cc <sk_load_g8_dst_vfp4+0x4c>
   .long  0xe3a06000                          // mov           r6, #0
   .long  0xe5d45002                          // ldrb          r5, [r4, #2]
   .long  0xee806bb0                          // vdup.16       d16, r6
@@ -4603,12 +4615,12 @@
   .long  0xf3f62124                          // vuzp.16       d18, d20
   .long  0xf2f004a2                          // vext.8        d16, d16, d18, #4
   .long  0xf2f004a0                          // vext.8        d16, d16, d16, #4
-  .long  0xeaffffd8                          // b             409c <sk_load_g8_dst_vfp4+0x4c>
+  .long  0xeaffffd8                          // b             40cc <sk_load_g8_dst_vfp4+0x4c>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xe5d44000                          // ldrb          r4, [r4]
   .long  0xee805bb0                          // vdup.16       d16, r5
   .long  0xee004bb0                          // vmov.16       d16[0], r4
-  .long  0xeaffffd3                          // b             409c <sk_load_g8_dst_vfp4+0x4c>
+  .long  0xeaffffd3                          // b             40cc <sk_load_g8_dst_vfp4+0x4c>
   .long  0xe320f000                          // nop           {0}
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
@@ -4621,11 +4633,23 @@
 _sk_gather_g8_vfp4:
   .long  0xe92d4070                          // push          {r4, r5, r6, lr}
   .long  0xe8911008                          // ldm           r1, {r3, ip}
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
+  .long  0xf2c00050                          // vmov.i32      q8, #0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe283200c                          // add           r2, r3, #12
   .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e26cbf                          // vld1.32       {d22[]-d23[]}, [r2 :32]
+  .long  0xe2832008                          // add           r2, r3, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e28cbf                          // vld1.32       {d24[]-d25[]}, [r2 :32]
   .long  0xe4932004                          // ldr           r2, [r3], #4
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
   .long  0xee323b90                          // vmov.32       r3, d18[1]
   .long  0xee12eb90                          // vmov.32       lr, d18[0]
@@ -4675,7 +4699,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842082                          // add           r2, r4, r2, lsl #1
   .long  0xe082208e                          // add           r2, r2, lr, lsl #1
-  .long  0x1a00001b                          // bne           42a0 <sk_load_565_vfp4+0xa0>
+  .long  0x1a00001b                          // bne           4300 <sk_load_565_vfp4+0xa0>
   .long  0xf462074f                          // vld1.16       {d16}, [r2]
   .long  0xf3d00a30                          // vmovl.u16     q8, d16
   .long  0xe3a02e7e                          // mov           r2, #2016
@@ -4706,12 +4730,12 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a000011                          // beq           42f4 <sk_load_565_vfp4+0xf4>
+  .long  0x0a000011                          // beq           4354 <sk_load_565_vfp4+0xf4>
   .long  0xf2c00010                          // vmov.i32      d16, #0
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000005                          // beq           42d0 <sk_load_565_vfp4+0xd0>
+  .long  0x0a000005                          // beq           4330 <sk_load_565_vfp4+0xd0>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1affffdc                          // bne           4234 <sk_load_565_vfp4+0x34>
+  .long  0x1affffdc                          // bne           4294 <sk_load_565_vfp4+0x34>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xee803bb0                          // vdup.16       d16, r3
   .long  0xe2823004                          // add           r3, r2, #4
@@ -4724,11 +4748,11 @@
   .long  0xf3f62121                          // vuzp.16       d18, d17
   .long  0xf2f004a2                          // vext.8        d16, d16, d18, #4
   .long  0xf2f004a0                          // vext.8        d16, d16, d16, #4
-  .long  0xeaffffcf                          // b             4234 <sk_load_565_vfp4+0x34>
+  .long  0xeaffffcf                          // b             4294 <sk_load_565_vfp4+0x34>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xee803bb0                          // vdup.16       d16, r3
   .long  0xf4e2041f                          // vld1.16       {d16[0]}, [r2 :16]
-  .long  0xeaffffcb                          // b             4234 <sk_load_565_vfp4+0x34>
+  .long  0xeaffffcb                          // b             4294 <sk_load_565_vfp4+0x34>
   .long  0xe320f000                          // nop           {0}
   .long  0x37842108                          // .word         0x37842108
   .long  0x37842108                          // .word         0x37842108
@@ -4765,7 +4789,7 @@
   .long  0xe0824083                          // add           r4, r2, r3, lsl #1
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a00001f                          // bne           4404 <sk_load_565_dst_vfp4+0xbc>
+  .long  0x1a00001f                          // bne           4464 <sk_load_565_dst_vfp4+0xbc>
   .long  0xf464074f                          // vld1.16       {d16}, [r4]
   .long  0xf3d00a30                          // vmovl.u16     q8, d16
   .long  0xe3a04e7e                          // mov           r4, #2016
@@ -4800,12 +4824,12 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xe2065003                          // and           r5, r6, #3
   .long  0xe3550001                          // cmp           r5, #1
-  .long  0x0a000011                          // beq           4458 <sk_load_565_dst_vfp4+0x110>
+  .long  0x0a000011                          // beq           44b8 <sk_load_565_dst_vfp4+0x110>
   .long  0xf2c00010                          // vmov.i32      d16, #0
   .long  0xe3550002                          // cmp           r5, #2
-  .long  0x0a000005                          // beq           4434 <sk_load_565_dst_vfp4+0xec>
+  .long  0x0a000005                          // beq           4494 <sk_load_565_dst_vfp4+0xec>
   .long  0xe3550003                          // cmp           r5, #3
-  .long  0x1affffd8                          // bne           4388 <sk_load_565_dst_vfp4+0x40>
+  .long  0x1affffd8                          // bne           43e8 <sk_load_565_dst_vfp4+0x40>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xee805bb0                          // vdup.16       d16, r5
   .long  0xe2845004                          // add           r5, r4, #4
@@ -4818,11 +4842,11 @@
   .long  0xf3f62121                          // vuzp.16       d18, d17
   .long  0xf2f004a2                          // vext.8        d16, d16, d18, #4
   .long  0xf2f004a0                          // vext.8        d16, d16, d16, #4
-  .long  0xeaffffcb                          // b             4388 <sk_load_565_dst_vfp4+0x40>
+  .long  0xeaffffcb                          // b             43e8 <sk_load_565_dst_vfp4+0x40>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xee805bb0                          // vdup.16       d16, r5
   .long  0xf4e4041f                          // vld1.16       {d16[0]}, [r4 :16]
-  .long  0xeaffffc7                          // b             4388 <sk_load_565_dst_vfp4+0x40>
+  .long  0xeaffffc7                          // b             43e8 <sk_load_565_dst_vfp4+0x40>
   .long  0x37842108                          // .word         0x37842108
   .long  0x37842108                          // .word         0x37842108
   .long  0x37842108                          // .word         0x37842108
@@ -4842,12 +4866,24 @@
 _sk_gather_565_vfp4:
   .long  0xe92d4830                          // push          {r4, r5, fp, lr}
   .long  0xe8911008                          // ldm           r1, {r3, ip}
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
+  .long  0xf2c00050                          // vmov.i32      q8, #0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe283200c                          // add           r2, r3, #12
   .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e26cbf                          // vld1.32       {d22[]-d23[]}, [r2 :32]
+  .long  0xe2832008                          // add           r2, r3, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e28cbf                          // vld1.32       {d24[]-d25[]}, [r2 :32]
   .long  0xe4932004                          // ldr           r2, [r3], #4
-  .long  0xf2c1605f                          // vmov.i32      q11, #31
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
+  .long  0xf2c1605f                          // vmov.i32      q11, #31
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
   .long  0xf3c74258                          // vmov.i32      q10, #63488
   .long  0xee123b90                          // vmov.32       r3, d18[0]
@@ -4934,7 +4970,7 @@
   .long  0xf26401f0                          // vorr          q8, q10, q8
   .long  0xf26001f2                          // vorr          q8, q8, q9
   .long  0xf3f60220                          // vmovn.i32     d16, q8
-  .long  0x1a000004                          // bne           4614 <sk_store_565_vfp4+0x84>
+  .long  0x1a000004                          // bne           46a4 <sk_store_565_vfp4+0x84>
   .long  0xf442074f                          // vst1.16       {d16}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xe2811008                          // add           r1, r1, #8
@@ -4942,11 +4978,11 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a00000c                          // beq           4654 <sk_store_565_vfp4+0xc4>
+  .long  0x0a00000c                          // beq           46e4 <sk_store_565_vfp4+0xc4>
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000003                          // beq           4638 <sk_store_565_vfp4+0xa8>
+  .long  0x0a000003                          // beq           46c8 <sk_store_565_vfp4+0xa8>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1afffff4                          // bne           4604 <sk_store_565_vfp4+0x74>
+  .long  0x1afffff4                          // bne           4694 <sk_store_565_vfp4+0x74>
   .long  0xe2823004                          // add           r3, r2, #4
   .long  0xf4c3049f                          // vst1.16       {d16[2]}, [r3 :16]
   .long  0xee903bb0                          // vmov.u16      r3, d16[0]
@@ -4955,9 +4991,9 @@
   .long  0xee204b90                          // vmov.32       d16[1], r4
   .long  0xf3f60121                          // vuzp.16       d16, d17
   .long  0xf4c2080f                          // vst1.32       {d16[0]}, [r2]
-  .long  0xeaffffeb                          // b             4604 <sk_store_565_vfp4+0x74>
+  .long  0xeaffffeb                          // b             4694 <sk_store_565_vfp4+0x74>
   .long  0xf4c2041f                          // vst1.16       {d16[0]}, [r2 :16]
-  .long  0xeaffffe9                          // b             4604 <sk_store_565_vfp4+0x74>
+  .long  0xeaffffe9                          // b             4694 <sk_store_565_vfp4+0x74>
   .long  0xe320f000                          // nop           {0}
   .long  0x427c0000                          // .word         0x427c0000
   .long  0x427c0000                          // .word         0x427c0000
@@ -4979,7 +5015,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842082                          // add           r2, r4, r2, lsl #1
   .long  0xe082208e                          // add           r2, r2, lr, lsl #1
-  .long  0x1a00001e                          // bne           471c <sk_load_4444_vfp4+0xac>
+  .long  0x1a00001e                          // bne           47ac <sk_load_4444_vfp4+0xac>
   .long  0xf462074f                          // vld1.16       {d16}, [r2]
   .long  0xf3d00a30                          // vmovl.u16     q8, d16
   .long  0xe28f20d0                          // add           r2, pc, #208
@@ -5013,12 +5049,12 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a000011                          // beq           4770 <sk_load_4444_vfp4+0x100>
+  .long  0x0a000011                          // beq           4800 <sk_load_4444_vfp4+0x100>
   .long  0xf2c00010                          // vmov.i32      d16, #0
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000005                          // beq           474c <sk_load_4444_vfp4+0xdc>
+  .long  0x0a000005                          // beq           47dc <sk_load_4444_vfp4+0xdc>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1affffd9                          // bne           46a4 <sk_load_4444_vfp4+0x34>
+  .long  0x1affffd9                          // bne           4734 <sk_load_4444_vfp4+0x34>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xee803bb0                          // vdup.16       d16, r3
   .long  0xe2823004                          // add           r3, r2, #4
@@ -5031,11 +5067,11 @@
   .long  0xf3f62121                          // vuzp.16       d18, d17
   .long  0xf2f004a2                          // vext.8        d16, d16, d18, #4
   .long  0xf2f004a0                          // vext.8        d16, d16, d16, #4
-  .long  0xeaffffcc                          // b             46a4 <sk_load_4444_vfp4+0x34>
+  .long  0xeaffffcc                          // b             4734 <sk_load_4444_vfp4+0x34>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xee803bb0                          // vdup.16       d16, r3
   .long  0xf4e2041f                          // vld1.16       {d16[0]}, [r2 :16]
-  .long  0xeaffffc8                          // b             46a4 <sk_load_4444_vfp4+0x34>
+  .long  0xeaffffc8                          // b             4734 <sk_load_4444_vfp4+0x34>
   .long  0x3b888889                          // .word         0x3b888889
   .long  0x3b888889                          // .word         0x3b888889
   .long  0x3b888889                          // .word         0x3b888889
@@ -5071,7 +5107,7 @@
   .long  0xe0824083                          // add           r4, r2, r3, lsl #1
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a000023                          // bne           488c <sk_load_4444_dst_vfp4+0xcc>
+  .long  0x1a000023                          // bne           491c <sk_load_4444_dst_vfp4+0xcc>
   .long  0xf464074f                          // vld1.16       {d16}, [r4]
   .long  0xf3d00a30                          // vmovl.u16     q8, d16
   .long  0xe28f40e4                          // add           r4, pc, #228
@@ -5110,12 +5146,12 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xe2065003                          // and           r5, r6, #3
   .long  0xe3550001                          // cmp           r5, #1
-  .long  0x0a000011                          // beq           48e0 <sk_load_4444_dst_vfp4+0x120>
+  .long  0x0a000011                          // beq           4970 <sk_load_4444_dst_vfp4+0x120>
   .long  0xf2c00010                          // vmov.i32      d16, #0
   .long  0xe3550002                          // cmp           r5, #2
-  .long  0x0a000005                          // beq           48bc <sk_load_4444_dst_vfp4+0xfc>
+  .long  0x0a000005                          // beq           494c <sk_load_4444_dst_vfp4+0xfc>
   .long  0xe3550003                          // cmp           r5, #3
-  .long  0x1affffd4                          // bne           4800 <sk_load_4444_dst_vfp4+0x40>
+  .long  0x1affffd4                          // bne           4890 <sk_load_4444_dst_vfp4+0x40>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xee805bb0                          // vdup.16       d16, r5
   .long  0xe2845004                          // add           r5, r4, #4
@@ -5128,11 +5164,11 @@
   .long  0xf3f62121                          // vuzp.16       d18, d17
   .long  0xf2f004a2                          // vext.8        d16, d16, d18, #4
   .long  0xf2f004a0                          // vext.8        d16, d16, d16, #4
-  .long  0xeaffffc7                          // b             4800 <sk_load_4444_dst_vfp4+0x40>
+  .long  0xeaffffc7                          // b             4890 <sk_load_4444_dst_vfp4+0x40>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xee805bb0                          // vdup.16       d16, r5
   .long  0xf4e4041f                          // vld1.16       {d16[0]}, [r4 :16]
-  .long  0xeaffffc3                          // b             4800 <sk_load_4444_dst_vfp4+0x40>
+  .long  0xeaffffc3                          // b             4890 <sk_load_4444_dst_vfp4+0x40>
   .long  0x37888889                          // .word         0x37888889
   .long  0x37888889                          // .word         0x37888889
   .long  0x37888889                          // .word         0x37888889
@@ -5156,12 +5192,24 @@
 _sk_gather_4444_vfp4:
   .long  0xe92d4830                          // push          {r4, r5, fp, lr}
   .long  0xe8911008                          // ldm           r1, {r3, ip}
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
+  .long  0xf2c00050                          // vmov.i32      q8, #0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe283200c                          // add           r2, r3, #12
   .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e26cbf                          // vld1.32       {d22[]-d23[]}, [r2 :32]
+  .long  0xe2832008                          // add           r2, r3, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e28cbf                          // vld1.32       {d24[]-d25[]}, [r2 :32]
   .long  0xe4932004                          // ldr           r2, [r3], #4
-  .long  0xf2c0625f                          // vmov.i32      q11, #3840
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
+  .long  0xf2c0625f                          // vmov.i32      q11, #3840
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf2c0805f                          // vmov.i32      q12, #15
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
   .long  0xf3c74050                          // vmov.i32      q10, #240
@@ -5255,7 +5303,7 @@
   .long  0xf26001f6                          // vorr          q8, q8, q11
   .long  0xf26001f2                          // vorr          q8, q8, q9
   .long  0xf3f60220                          // vmovn.i32     d16, q8
-  .long  0x1a000004                          // bne           4ac8 <sk_store_4444_vfp4+0x90>
+  .long  0x1a000004                          // bne           4b88 <sk_store_4444_vfp4+0x90>
   .long  0xf442074f                          // vst1.16       {d16}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xe2811008                          // add           r1, r1, #8
@@ -5263,11 +5311,11 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a00000c                          // beq           4b08 <sk_store_4444_vfp4+0xd0>
+  .long  0x0a00000c                          // beq           4bc8 <sk_store_4444_vfp4+0xd0>
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000003                          // beq           4aec <sk_store_4444_vfp4+0xb4>
+  .long  0x0a000003                          // beq           4bac <sk_store_4444_vfp4+0xb4>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1afffff4                          // bne           4ab8 <sk_store_4444_vfp4+0x80>
+  .long  0x1afffff4                          // bne           4b78 <sk_store_4444_vfp4+0x80>
   .long  0xe2823004                          // add           r3, r2, #4
   .long  0xf4c3049f                          // vst1.16       {d16[2]}, [r3 :16]
   .long  0xee903bb0                          // vmov.u16      r3, d16[0]
@@ -5276,9 +5324,9 @@
   .long  0xee204b90                          // vmov.32       d16[1], r4
   .long  0xf3f60121                          // vuzp.16       d16, d17
   .long  0xf4c2080f                          // vst1.32       {d16[0]}, [r2]
-  .long  0xeaffffeb                          // b             4ab8 <sk_store_4444_vfp4+0x80>
+  .long  0xeaffffeb                          // b             4b78 <sk_store_4444_vfp4+0x80>
   .long  0xf4c2041f                          // vst1.16       {d16[0]}, [r2 :16]
-  .long  0xeaffffe9                          // b             4ab8 <sk_store_4444_vfp4+0x80>
+  .long  0xeaffffe9                          // b             4b78 <sk_store_4444_vfp4+0x80>
 
 HIDDEN _sk_load_8888_vfp4
 .globl _sk_load_8888_vfp4
@@ -5294,7 +5342,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842102                          // add           r2, r4, r2, lsl #2
   .long  0xe082210e                          // add           r2, r2, lr, lsl #2
-  .long  0x1a000015                          // bne           4b94 <sk_load_8888_vfp4+0x84>
+  .long  0x1a000015                          // bne           4c54 <sk_load_8888_vfp4+0x84>
   .long  0xf4620a8f                          // vld1.32       {d16-d17}, [r2]
   .long  0xf3c7205f                          // vmov.i32      q9, #255
   .long  0xe28f209c                          // add           r2, pc, #156
@@ -5319,12 +5367,12 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a00000c                          // beq           4bd4 <sk_load_8888_vfp4+0xc4>
+  .long  0x0a00000c                          // beq           4c94 <sk_load_8888_vfp4+0xc4>
   .long  0xf2c00050                          // vmov.i32      q8, #0
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000005                          // beq           4bc4 <sk_load_8888_vfp4+0xb4>
+  .long  0x0a000005                          // beq           4c84 <sk_load_8888_vfp4+0xb4>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1affffe2                          // bne           4b40 <sk_load_8888_vfp4+0x30>
+  .long  0x1affffe2                          // bne           4c00 <sk_load_8888_vfp4+0x30>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xeea03b90                          // vdup.32       q8, r3
   .long  0xe2823008                          // add           r3, r2, #8
@@ -5332,11 +5380,11 @@
   .long  0xedd22b00                          // vldr          d18, [r2]
   .long  0xf2f008e2                          // vext.8        q8, q8, q9, #8
   .long  0xf2f008e0                          // vext.8        q8, q8, q8, #8
-  .long  0xeaffffda                          // b             4b40 <sk_load_8888_vfp4+0x30>
+  .long  0xeaffffda                          // b             4c00 <sk_load_8888_vfp4+0x30>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xeea03b90                          // vdup.32       q8, r3
   .long  0xf4e2083f                          // vld1.32       {d16[0]}, [r2 :32]
-  .long  0xeaffffd6                          // b             4b40 <sk_load_8888_vfp4+0x30>
+  .long  0xeaffffd6                          // b             4c00 <sk_load_8888_vfp4+0x30>
   .long  0xe320f000                          // nop           {0}
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
@@ -5360,7 +5408,7 @@
   .long  0xe0824103                          // add           r4, r2, r3, lsl #2
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a00001a                          // bne           4c9c <sk_load_8888_dst_vfp4+0xa4>
+  .long  0x1a00001a                          // bne           4d5c <sk_load_8888_dst_vfp4+0xa4>
   .long  0xf4640a8f                          // vld1.32       {d16-d17}, [r4]
   .long  0xf3c7205f                          // vmov.i32      q9, #255
   .long  0xe28f40b0                          // add           r4, pc, #176
@@ -5390,12 +5438,12 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xe2065003                          // and           r5, r6, #3
   .long  0xe3550001                          // cmp           r5, #1
-  .long  0x0a00000c                          // beq           4cdc <sk_load_8888_dst_vfp4+0xe4>
+  .long  0x0a00000c                          // beq           4d9c <sk_load_8888_dst_vfp4+0xe4>
   .long  0xf2c00050                          // vmov.i32      q8, #0
   .long  0xe3550002                          // cmp           r5, #2
-  .long  0x0a000005                          // beq           4ccc <sk_load_8888_dst_vfp4+0xd4>
+  .long  0x0a000005                          // beq           4d8c <sk_load_8888_dst_vfp4+0xd4>
   .long  0xe3550003                          // cmp           r5, #3
-  .long  0x1affffdd                          // bne           4c34 <sk_load_8888_dst_vfp4+0x3c>
+  .long  0x1affffdd                          // bne           4cf4 <sk_load_8888_dst_vfp4+0x3c>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xeea05b90                          // vdup.32       q8, r5
   .long  0xe2845008                          // add           r5, r4, #8
@@ -5403,11 +5451,11 @@
   .long  0xedd42b00                          // vldr          d18, [r4]
   .long  0xf2f008e2                          // vext.8        q8, q8, q9, #8
   .long  0xf2f008e0                          // vext.8        q8, q8, q8, #8
-  .long  0xeaffffd5                          // b             4c34 <sk_load_8888_dst_vfp4+0x3c>
+  .long  0xeaffffd5                          // b             4cf4 <sk_load_8888_dst_vfp4+0x3c>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xeea05b90                          // vdup.32       q8, r5
   .long  0xf4e4083f                          // vld1.32       {d16[0]}, [r4 :32]
-  .long  0xeaffffd1                          // b             4c34 <sk_load_8888_dst_vfp4+0x3c>
+  .long  0xeaffffd1                          // b             4cf4 <sk_load_8888_dst_vfp4+0x3c>
   .long  0xe320f000                          // nop           {0}
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
@@ -5420,11 +5468,23 @@
 _sk_gather_8888_vfp4:
   .long  0xe92d4830                          // push          {r4, r5, fp, lr}
   .long  0xe8911008                          // ldm           r1, {r3, ip}
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
+  .long  0xf2c00050                          // vmov.i32      q8, #0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe283200c                          // add           r2, r3, #12
   .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e26cbf                          // vld1.32       {d22[]-d23[]}, [r2 :32]
+  .long  0xe2832008                          // add           r2, r3, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e28cbf                          // vld1.32       {d24[]-d25[]}, [r2 :32]
   .long  0xe4932004                          // ldr           r2, [r3], #4
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
   .long  0xee133b90                          // vmov.32       r3, d19[0]
   .long  0xee12eb90                          // vmov.32       lr, d18[0]
@@ -5497,7 +5557,7 @@
   .long  0xf2f84576                          // vshl.s32      q10, q11, #24
   .long  0xf26001f2                          // vorr          q8, q8, q9
   .long  0xf26001f4                          // vorr          q8, q8, q10
-  .long  0x1a000004                          // bne           4e40 <sk_store_8888_vfp4+0x90>
+  .long  0x1a000004                          // bne           4f30 <sk_store_8888_vfp4+0x90>
   .long  0xf4420a8f                          // vst1.32       {d16-d17}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xe2811008                          // add           r1, r1, #8
@@ -5505,17 +5565,17 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a000007                          // beq           4e6c <sk_store_8888_vfp4+0xbc>
+  .long  0x0a000007                          // beq           4f5c <sk_store_8888_vfp4+0xbc>
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000003                          // beq           4e64 <sk_store_8888_vfp4+0xb4>
+  .long  0x0a000003                          // beq           4f54 <sk_store_8888_vfp4+0xb4>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1afffff4                          // bne           4e30 <sk_store_8888_vfp4+0x80>
+  .long  0x1afffff4                          // bne           4f20 <sk_store_8888_vfp4+0x80>
   .long  0xe2823008                          // add           r3, r2, #8
   .long  0xf4c3183f                          // vst1.32       {d17[0]}, [r3 :32]
   .long  0xedc20b00                          // vstr          d16, [r2]
-  .long  0xeafffff0                          // b             4e30 <sk_store_8888_vfp4+0x80>
+  .long  0xeafffff0                          // b             4f20 <sk_store_8888_vfp4+0x80>
   .long  0xf4c2083f                          // vst1.32       {d16[0]}, [r2 :32]
-  .long  0xeaffffee                          // b             4e30 <sk_store_8888_vfp4+0x80>
+  .long  0xeaffffee                          // b             4f20 <sk_store_8888_vfp4+0x80>
   .long  0xe320f000                          // nop           {0}
   .long  0x437f0000                          // .word         0x437f0000
   .long  0x437f0000                          // .word         0x437f0000
@@ -5536,7 +5596,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842102                          // add           r2, r4, r2, lsl #2
   .long  0xe082210e                          // add           r2, r2, lr, lsl #2
-  .long  0x1a000015                          // bne           4f0c <sk_load_bgra_vfp4+0x84>
+  .long  0x1a000015                          // bne           4ffc <sk_load_bgra_vfp4+0x84>
   .long  0xf4620a8f                          // vld1.32       {d16-d17}, [r2]
   .long  0xf3c7205f                          // vmov.i32      q9, #255
   .long  0xe28f209c                          // add           r2, pc, #156
@@ -5561,12 +5621,12 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a00000c                          // beq           4f4c <sk_load_bgra_vfp4+0xc4>
+  .long  0x0a00000c                          // beq           503c <sk_load_bgra_vfp4+0xc4>
   .long  0xf2c00050                          // vmov.i32      q8, #0
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000005                          // beq           4f3c <sk_load_bgra_vfp4+0xb4>
+  .long  0x0a000005                          // beq           502c <sk_load_bgra_vfp4+0xb4>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1affffe2                          // bne           4eb8 <sk_load_bgra_vfp4+0x30>
+  .long  0x1affffe2                          // bne           4fa8 <sk_load_bgra_vfp4+0x30>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xeea03b90                          // vdup.32       q8, r3
   .long  0xe2823008                          // add           r3, r2, #8
@@ -5574,11 +5634,11 @@
   .long  0xedd22b00                          // vldr          d18, [r2]
   .long  0xf2f008e2                          // vext.8        q8, q8, q9, #8
   .long  0xf2f008e0                          // vext.8        q8, q8, q8, #8
-  .long  0xeaffffda                          // b             4eb8 <sk_load_bgra_vfp4+0x30>
+  .long  0xeaffffda                          // b             4fa8 <sk_load_bgra_vfp4+0x30>
   .long  0xe3a03000                          // mov           r3, #0
   .long  0xeea03b90                          // vdup.32       q8, r3
   .long  0xf4e2083f                          // vld1.32       {d16[0]}, [r2 :32]
-  .long  0xeaffffd6                          // b             4eb8 <sk_load_bgra_vfp4+0x30>
+  .long  0xeaffffd6                          // b             4fa8 <sk_load_bgra_vfp4+0x30>
   .long  0xe320f000                          // nop           {0}
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
@@ -5602,7 +5662,7 @@
   .long  0xe0824103                          // add           r4, r2, r3, lsl #2
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a00001a                          // bne           5014 <sk_load_bgra_dst_vfp4+0xa4>
+  .long  0x1a00001a                          // bne           5104 <sk_load_bgra_dst_vfp4+0xa4>
   .long  0xf4640a8f                          // vld1.32       {d16-d17}, [r4]
   .long  0xf3c7205f                          // vmov.i32      q9, #255
   .long  0xe28f40b0                          // add           r4, pc, #176
@@ -5632,12 +5692,12 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xe2065003                          // and           r5, r6, #3
   .long  0xe3550001                          // cmp           r5, #1
-  .long  0x0a00000c                          // beq           5054 <sk_load_bgra_dst_vfp4+0xe4>
+  .long  0x0a00000c                          // beq           5144 <sk_load_bgra_dst_vfp4+0xe4>
   .long  0xf2c00050                          // vmov.i32      q8, #0
   .long  0xe3550002                          // cmp           r5, #2
-  .long  0x0a000005                          // beq           5044 <sk_load_bgra_dst_vfp4+0xd4>
+  .long  0x0a000005                          // beq           5134 <sk_load_bgra_dst_vfp4+0xd4>
   .long  0xe3550003                          // cmp           r5, #3
-  .long  0x1affffdd                          // bne           4fac <sk_load_bgra_dst_vfp4+0x3c>
+  .long  0x1affffdd                          // bne           509c <sk_load_bgra_dst_vfp4+0x3c>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xeea05b90                          // vdup.32       q8, r5
   .long  0xe2845008                          // add           r5, r4, #8
@@ -5645,11 +5705,11 @@
   .long  0xedd42b00                          // vldr          d18, [r4]
   .long  0xf2f008e2                          // vext.8        q8, q8, q9, #8
   .long  0xf2f008e0                          // vext.8        q8, q8, q8, #8
-  .long  0xeaffffd5                          // b             4fac <sk_load_bgra_dst_vfp4+0x3c>
+  .long  0xeaffffd5                          // b             509c <sk_load_bgra_dst_vfp4+0x3c>
   .long  0xe3a05000                          // mov           r5, #0
   .long  0xeea05b90                          // vdup.32       q8, r5
   .long  0xf4e4083f                          // vld1.32       {d16[0]}, [r4 :32]
-  .long  0xeaffffd1                          // b             4fac <sk_load_bgra_dst_vfp4+0x3c>
+  .long  0xeaffffd1                          // b             509c <sk_load_bgra_dst_vfp4+0x3c>
   .long  0xe320f000                          // nop           {0}
   .long  0x3b808081                          // .word         0x3b808081
   .long  0x3b808081                          // .word         0x3b808081
@@ -5662,11 +5722,23 @@
 _sk_gather_bgra_vfp4:
   .long  0xe92d4830                          // push          {r4, r5, fp, lr}
   .long  0xe8911008                          // ldm           r1, {r3, ip}
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
+  .long  0xf2c00050                          // vmov.i32      q8, #0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe283200c                          // add           r2, r3, #12
   .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e26cbf                          // vld1.32       {d22[]-d23[]}, [r2 :32]
+  .long  0xe2832008                          // add           r2, r3, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e28cbf                          // vld1.32       {d24[]-d25[]}, [r2 :32]
   .long  0xe4932004                          // ldr           r2, [r3], #4
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
   .long  0xee133b90                          // vmov.32       r3, d19[0]
   .long  0xee12eb90                          // vmov.32       lr, d18[0]
@@ -5739,7 +5811,7 @@
   .long  0xf2f84576                          // vshl.s32      q10, q11, #24
   .long  0xf26001f2                          // vorr          q8, q8, q9
   .long  0xf26001f4                          // vorr          q8, q8, q10
-  .long  0x1a000004                          // bne           51b8 <sk_store_bgra_vfp4+0x90>
+  .long  0x1a000004                          // bne           52d8 <sk_store_bgra_vfp4+0x90>
   .long  0xf4420a8f                          // vst1.32       {d16-d17}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xe2811008                          // add           r1, r1, #8
@@ -5747,17 +5819,17 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe20c3003                          // and           r3, ip, #3
   .long  0xe3530001                          // cmp           r3, #1
-  .long  0x0a000007                          // beq           51e4 <sk_store_bgra_vfp4+0xbc>
+  .long  0x0a000007                          // beq           5304 <sk_store_bgra_vfp4+0xbc>
   .long  0xe3530002                          // cmp           r3, #2
-  .long  0x0a000003                          // beq           51dc <sk_store_bgra_vfp4+0xb4>
+  .long  0x0a000003                          // beq           52fc <sk_store_bgra_vfp4+0xb4>
   .long  0xe3530003                          // cmp           r3, #3
-  .long  0x1afffff4                          // bne           51a8 <sk_store_bgra_vfp4+0x80>
+  .long  0x1afffff4                          // bne           52c8 <sk_store_bgra_vfp4+0x80>
   .long  0xe2823008                          // add           r3, r2, #8
   .long  0xf4c3183f                          // vst1.32       {d17[0]}, [r3 :32]
   .long  0xedc20b00                          // vstr          d16, [r2]
-  .long  0xeafffff0                          // b             51a8 <sk_store_bgra_vfp4+0x80>
+  .long  0xeafffff0                          // b             52c8 <sk_store_bgra_vfp4+0x80>
   .long  0xf4c2083f                          // vst1.32       {d16[0]}, [r2 :32]
-  .long  0xeaffffee                          // b             51a8 <sk_store_bgra_vfp4+0x80>
+  .long  0xeaffffee                          // b             52c8 <sk_store_bgra_vfp4+0x80>
   .long  0xe320f000                          // nop           {0}
   .long  0x437f0000                          // .word         0x437f0000
   .long  0x437f0000                          // .word         0x437f0000
@@ -5778,7 +5850,7 @@
   .long  0xe0020293                          // mul           r2, r3, r2
   .long  0xe0842182                          // add           r2, r4, r2, lsl #3
   .long  0xe082318e                          // add           r3, r2, lr, lsl #3
-  .long  0x1a000008                          // bne           5250 <sk_load_f16_vfp4+0x50>
+  .long  0x1a000008                          // bne           5370 <sk_load_f16_vfp4+0x50>
   .long  0xf463004f                          // vld4.16       {d16-d19}, [r3]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xf3b60720                          // vcvt.f32.f16  q0, d16
@@ -5790,14 +5862,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xf4e3070f                          // vld4.16       {d16[0],d17[0],d18[0],d19[0]}, [r3]
   .long  0xe35c0001                          // cmp           ip, #1
-  .long  0x0afffff4                          // beq           5230 <sk_load_f16_vfp4+0x30>
+  .long  0x0afffff4                          // beq           5350 <sk_load_f16_vfp4+0x30>
   .long  0xe2832008                          // add           r2, r3, #8
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4e2074f                          // vld4.16       {d16[1],d17[1],d18[1],d19[1]}, [r2]
-  .long  0x3afffff0                          // bcc           5230 <sk_load_f16_vfp4+0x30>
+  .long  0x3afffff0                          // bcc           5350 <sk_load_f16_vfp4+0x30>
   .long  0xe2832010                          // add           r2, r3, #16
   .long  0xf4e2078f                          // vld4.16       {d16[2],d17[2],d18[2],d19[2]}, [r2]
-  .long  0xeaffffed                          // b             5230 <sk_load_f16_vfp4+0x30>
+  .long  0xeaffffed                          // b             5350 <sk_load_f16_vfp4+0x30>
 
 HIDDEN _sk_load_f16_dst_vfp4
 .globl _sk_load_f16_dst_vfp4
@@ -5816,7 +5888,7 @@
   .long  0xe0825183                          // add           r5, r2, r3, lsl #3
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a00000d                          // bne           52e8 <sk_load_f16_dst_vfp4+0x70>
+  .long  0x1a00000d                          // bne           5408 <sk_load_f16_dst_vfp4+0x70>
   .long  0xf465004f                          // vld4.16       {d16-d19}, [r5]
   .long  0xf3f64720                          // vcvt.f32.f16  q10, d16
   .long  0xf3f66721                          // vcvt.f32.f16  q11, d17
@@ -5833,14 +5905,14 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xf4e5070f                          // vld4.16       {d16[0],d17[0],d18[0],d19[0]}, [r5]
   .long  0xe3560001                          // cmp           r6, #1
-  .long  0x0affffef                          // beq           52b4 <sk_load_f16_dst_vfp4+0x3c>
+  .long  0x0affffef                          // beq           53d4 <sk_load_f16_dst_vfp4+0x3c>
   .long  0xe2854008                          // add           r4, r5, #8
   .long  0xe3560003                          // cmp           r6, #3
   .long  0xf4e4074f                          // vld4.16       {d16[1],d17[1],d18[1],d19[1]}, [r4]
-  .long  0x3affffeb                          // bcc           52b4 <sk_load_f16_dst_vfp4+0x3c>
+  .long  0x3affffeb                          // bcc           53d4 <sk_load_f16_dst_vfp4+0x3c>
   .long  0xe2854010                          // add           r4, r5, #16
   .long  0xf4e4078f                          // vld4.16       {d16[2],d17[2],d18[2],d19[2]}, [r4]
-  .long  0xeaffffe8                          // b             52b4 <sk_load_f16_dst_vfp4+0x3c>
+  .long  0xeaffffe8                          // b             53d4 <sk_load_f16_dst_vfp4+0x3c>
 
 HIDDEN _sk_gather_f16_vfp4
 .globl _sk_gather_f16_vfp4
@@ -5850,11 +5922,23 @@
   .long  0xe28db008                          // add           fp, sp, #8
   .long  0xe24dd030                          // sub           sp, sp, #48
   .long  0xe7c4d01f                          // bfc           sp, #0, #5
+  .long  0xf2c00050                          // vmov.i32      q8, #0
   .long  0xe5912000                          // ldr           r2, [r1]
-  .long  0xf3fb0742                          // vcvt.s32.f32  q8, q1
-  .long  0xf3fb2740                          // vcvt.s32.f32  q9, q0
+  .long  0xf3c74e5f                          // vmov.i8       q10, #255
+  .long  0xf2402fc0                          // vmax.f32      q9, q8, q0
+  .long  0xe282300c                          // add           r3, r2, #12
+  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
+  .long  0xf4e36cbf                          // vld1.32       {d22[]-d23[]}, [r3 :32]
+  .long  0xe2823008                          // add           r3, r2, #8
+  .long  0xf26668e4                          // vadd.i32      q11, q11, q10
+  .long  0xf4e38cbf                          // vld1.32       {d24[]-d25[]}, [r3 :32]
   .long  0xe4923004                          // ldr           r3, [r2], #4
+  .long  0xf26848e4                          // vadd.i32      q10, q12, q10
+  .long  0xf2600fe6                          // vmin.f32      q8, q8, q11
+  .long  0xf2622fe4                          // vmin.f32      q9, q9, q10
   .long  0xf4e24cbf                          // vld1.32       {d20[]-d21[]}, [r2 :32]
+  .long  0xf3fb0760                          // vcvt.s32.f32  q8, q8
+  .long  0xf3fb2762                          // vcvt.s32.f32  q9, q9
   .long  0xf26429e0                          // vmla.i32      q9, q10, q8
   .long  0xee33cb90                          // vmov.32       ip, d19[1]
   .long  0xee322b90                          // vmov.32       r2, d18[1]
@@ -5901,7 +5985,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842182                          // add           r2, r4, r2, lsl #3
   .long  0xe082218e                          // add           r2, r2, lr, lsl #3
-  .long  0x1a000004                          // bne           53f0 <sk_store_f16_vfp4+0x50>
+  .long  0x1a000004                          // bne           5540 <sk_store_f16_vfp4+0x50>
   .long  0xf442004f                          // vst4.16       {d16-d19}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xe2811008                          // add           r1, r1, #8
@@ -5909,14 +5993,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe35c0001                          // cmp           ip, #1
   .long  0xf4c2070f                          // vst4.16       {d16[0],d17[0],d18[0],d19[0]}, [r2]
-  .long  0x0afffff8                          // beq           53e0 <sk_store_f16_vfp4+0x40>
+  .long  0x0afffff8                          // beq           5530 <sk_store_f16_vfp4+0x40>
   .long  0xe2823008                          // add           r3, r2, #8
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4c3074f                          // vst4.16       {d16[1],d17[1],d18[1],d19[1]}, [r3]
-  .long  0x3afffff4                          // bcc           53e0 <sk_store_f16_vfp4+0x40>
+  .long  0x3afffff4                          // bcc           5530 <sk_store_f16_vfp4+0x40>
   .long  0xe2822010                          // add           r2, r2, #16
   .long  0xf4c2078f                          // vst4.16       {d16[2],d17[2],d18[2],d19[2]}, [r2]
-  .long  0xeafffff1                          // b             53e0 <sk_store_f16_vfp4+0x40>
+  .long  0xeafffff1                          // b             5530 <sk_store_f16_vfp4+0x40>
 
 HIDDEN _sk_load_u16_be_vfp4
 .globl _sk_load_u16_be_vfp4
@@ -5932,7 +6016,7 @@
   .long  0xe0020293                          // mul           r2, r3, r2
   .long  0xe0842082                          // add           r2, r4, r2, lsl #1
   .long  0xe082318e                          // add           r3, r2, lr, lsl #3
-  .long  0x1a00001e                          // bne           54c0 <sk_load_u16_be_vfp4+0xa8>
+  .long  0x1a00001e                          // bne           5610 <sk_load_u16_be_vfp4+0xa8>
   .long  0xf463004f                          // vld4.16       {d16-d19}, [r3]
   .long  0xf3d84030                          // vshr.u16      d20, d16, #8
   .long  0xe28f2094                          // add           r2, pc, #148
@@ -5966,14 +6050,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xf4e3070f                          // vld4.16       {d16[0],d17[0],d18[0],d19[0]}, [r3]
   .long  0xe35c0001                          // cmp           ip, #1
-  .long  0x0affffde                          // beq           5448 <sk_load_u16_be_vfp4+0x30>
+  .long  0x0affffde                          // beq           5598 <sk_load_u16_be_vfp4+0x30>
   .long  0xe2832008                          // add           r2, r3, #8
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4e2074f                          // vld4.16       {d16[1],d17[1],d18[1],d19[1]}, [r2]
-  .long  0x3affffda                          // bcc           5448 <sk_load_u16_be_vfp4+0x30>
+  .long  0x3affffda                          // bcc           5598 <sk_load_u16_be_vfp4+0x30>
   .long  0xe2832010                          // add           r2, r3, #16
   .long  0xf4e2078f                          // vld4.16       {d16[2],d17[2],d18[2],d19[2]}, [r2]
-  .long  0xeaffffd7                          // b             5448 <sk_load_u16_be_vfp4+0x30>
+  .long  0xeaffffd7                          // b             5598 <sk_load_u16_be_vfp4+0x30>
   .long  0x37800080                          // .word         0x37800080
   .long  0x37800080                          // .word         0x37800080
   .long  0x37800080                          // .word         0x37800080
@@ -5994,7 +6078,7 @@
   .long  0xe08e308e                          // add           r3, lr, lr, lsl #1
   .long  0xe0842082                          // add           r2, r4, r2, lsl #1
   .long  0xe0823083                          // add           r3, r2, r3, lsl #1
-  .long  0x1a00001a                          // bne           5594 <sk_load_rgb_u16_be_vfp4+0x9c>
+  .long  0x1a00001a                          // bne           56e4 <sk_load_rgb_u16_be_vfp4+0x9c>
   .long  0xf463044f                          // vld3.16       {d16-d18}, [r3]
   .long  0xf3d84030                          // vshr.u16      d20, d16, #8
   .long  0xe28f2088                          // add           r2, pc, #136
@@ -6024,14 +6108,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xf4e3060f                          // vld3.16       {d16[0],d17[0],d18[0]}, [r3]
   .long  0xe35c0001                          // cmp           ip, #1
-  .long  0x0affffe2                          // beq           552c <sk_load_rgb_u16_be_vfp4+0x34>
+  .long  0x0affffe2                          // beq           567c <sk_load_rgb_u16_be_vfp4+0x34>
   .long  0xe2832006                          // add           r2, r3, #6
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4e2064f                          // vld3.16       {d16[1],d17[1],d18[1]}, [r2]
-  .long  0x3affffde                          // bcc           552c <sk_load_rgb_u16_be_vfp4+0x34>
+  .long  0x3affffde                          // bcc           567c <sk_load_rgb_u16_be_vfp4+0x34>
   .long  0xe283200c                          // add           r2, r3, #12
   .long  0xf4e2068f                          // vld3.16       {d16[2],d17[2],d18[2]}, [r2]
-  .long  0xeaffffdb                          // b             552c <sk_load_rgb_u16_be_vfp4+0x34>
+  .long  0xeaffffdb                          // b             567c <sk_load_rgb_u16_be_vfp4+0x34>
   .long  0xe320f000                          // nop           {0}
   .long  0x37800080                          // .word         0x37800080
   .long  0x37800080                          // .word         0x37800080
@@ -6086,7 +6170,7 @@
   .long  0xf2d84534                          // vshl.s16      d20, d20, #8
   .long  0xf26811b7                          // vorr          d17, d24, d23
   .long  0xf26401b9                          // vorr          d16, d20, d25
-  .long  0x1a000004                          // bne           5698 <sk_store_u16_be_vfp4+0xb8>
+  .long  0x1a000004                          // bne           57e8 <sk_store_u16_be_vfp4+0xb8>
   .long  0xf443004f                          // vst4.16       {d16-d19}, [r3]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
   .long  0xe2811008                          // add           r1, r1, #8
@@ -6094,14 +6178,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe35c0001                          // cmp           ip, #1
   .long  0xf4c3070f                          // vst4.16       {d16[0],d17[0],d18[0],d19[0]}, [r3]
-  .long  0x0afffff8                          // beq           5688 <sk_store_u16_be_vfp4+0xa8>
+  .long  0x0afffff8                          // beq           57d8 <sk_store_u16_be_vfp4+0xa8>
   .long  0xe2832008                          // add           r2, r3, #8
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4c2074f                          // vst4.16       {d16[1],d17[1],d18[1],d19[1]}, [r2]
-  .long  0x3afffff4                          // bcc           5688 <sk_store_u16_be_vfp4+0xa8>
+  .long  0x3afffff4                          // bcc           57d8 <sk_store_u16_be_vfp4+0xa8>
   .long  0xe2832010                          // add           r2, r3, #16
   .long  0xf4c2078f                          // vst4.16       {d16[2],d17[2],d18[2],d19[2]}, [r2]
-  .long  0xeafffff1                          // b             5688 <sk_store_u16_be_vfp4+0xa8>
+  .long  0xeafffff1                          // b             57d8 <sk_store_u16_be_vfp4+0xa8>
   .long  0x477fff00                          // .word         0x477fff00
   .long  0x477fff00                          // .word         0x477fff00
   .long  0x477fff00                          // .word         0x477fff00
@@ -6121,7 +6205,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842102                          // add           r2, r4, r2, lsl #2
   .long  0xe082220e                          // add           r2, r2, lr, lsl #4
-  .long  0x1a000009                          // bne           5724 <sk_load_f32_vfp4+0x54>
+  .long  0x1a000009                          // bne           5874 <sk_load_f32_vfp4+0x54>
   .long  0xf462018d                          // vld4.32       {d16,d18,d20,d22}, [r2]!
   .long  0xf462118f                          // vld4.32       {d17,d19,d21,d23}, [r2]
   .long  0xf22001f0                          // vorr          q0, q8, q8
@@ -6134,14 +6218,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xf4a20b4f                          // vld4.32       {d0[0],d2[0],d4[0],d6[0]}, [r2]
   .long  0xe35c0001                          // cmp           ip, #1
-  .long  0x0afffff8                          // beq           5714 <sk_load_f32_vfp4+0x44>
+  .long  0x0afffff8                          // beq           5864 <sk_load_f32_vfp4+0x44>
   .long  0xe2823010                          // add           r3, r2, #16
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4a30bcf                          // vld4.32       {d0[1],d2[1],d4[1],d6[1]}, [r3]
-  .long  0x3afffff4                          // bcc           5714 <sk_load_f32_vfp4+0x44>
+  .long  0x3afffff4                          // bcc           5864 <sk_load_f32_vfp4+0x44>
   .long  0xe2822020                          // add           r2, r2, #32
   .long  0xf4a21b4f                          // vld4.32       {d1[0],d3[0],d5[0],d7[0]}, [r2]
-  .long  0xeafffff1                          // b             5714 <sk_load_f32_vfp4+0x44>
+  .long  0xeafffff1                          // b             5864 <sk_load_f32_vfp4+0x44>
 
 HIDDEN _sk_load_f32_dst_vfp4
 .globl _sk_load_f32_dst_vfp4
@@ -6160,7 +6244,7 @@
   .long  0xe0824203                          // add           r4, r2, r3, lsl #4
   .long  0xe2802020                          // add           r2, r0, #32
   .long  0xe2803010                          // add           r3, r0, #16
-  .long  0x1a00000e                          // bne           57c0 <sk_load_f32_dst_vfp4+0x74>
+  .long  0x1a00000e                          // bne           5910 <sk_load_f32_dst_vfp4+0x74>
   .long  0xf464818d                          // vld4.32       {d24,d26,d28,d30}, [r4]!
   .long  0xf464918f                          // vld4.32       {d25,d27,d29,d31}, [r4]
   .long  0xf26801f8                          // vorr          q8, q12, q12
@@ -6178,14 +6262,14 @@
   .long  0xe12fff13                          // bx            r3
   .long  0xf4e40b4f                          // vld4.32       {d16[0],d18[0],d20[0],d22[0]}, [r4]
   .long  0xe3560001                          // cmp           r6, #1
-  .long  0x0afffff3                          // beq           579c <sk_load_f32_dst_vfp4+0x50>
+  .long  0x0afffff3                          // beq           58ec <sk_load_f32_dst_vfp4+0x50>
   .long  0xe2845010                          // add           r5, r4, #16
   .long  0xe3560003                          // cmp           r6, #3
   .long  0xf4e50bcf                          // vld4.32       {d16[1],d18[1],d20[1],d22[1]}, [r5]
-  .long  0x3affffef                          // bcc           579c <sk_load_f32_dst_vfp4+0x50>
+  .long  0x3affffef                          // bcc           58ec <sk_load_f32_dst_vfp4+0x50>
   .long  0xe2844020                          // add           r4, r4, #32
   .long  0xf4e41b4f                          // vld4.32       {d17[0],d19[0],d21[0],d23[0]}, [r4]
-  .long  0xeaffffec                          // b             579c <sk_load_f32_dst_vfp4+0x50>
+  .long  0xeaffffec                          // b             58ec <sk_load_f32_dst_vfp4+0x50>
 
 HIDDEN _sk_store_f32_vfp4
 .globl _sk_store_f32_vfp4
@@ -6201,7 +6285,7 @@
   .long  0xe0020392                          // mul           r2, r2, r3
   .long  0xe0842102                          // add           r2, r4, r2, lsl #2
   .long  0xe082220e                          // add           r2, r2, lr, lsl #4
-  .long  0x1a000005                          // bne           582c <sk_store_f32_vfp4+0x44>
+  .long  0x1a000005                          // bne           597c <sk_store_f32_vfp4+0x44>
   .long  0xf402018d                          // vst4.32       {d0,d2,d4,d6}, [r2]!
   .long  0xf402118f                          // vst4.32       {d1,d3,d5,d7}, [r2]
   .long  0xe5912004                          // ldr           r2, [r1, #4]
@@ -6210,44 +6294,14 @@
   .long  0xe12fff12                          // bx            r2
   .long  0xe35c0001                          // cmp           ip, #1
   .long  0xf4820b4f                          // vst4.32       {d0[0],d2[0],d4[0],d6[0]}, [r2]
-  .long  0x0afffff8                          // beq           581c <sk_store_f32_vfp4+0x34>
+  .long  0x0afffff8                          // beq           596c <sk_store_f32_vfp4+0x34>
   .long  0xe2823010                          // add           r3, r2, #16
   .long  0xe35c0003                          // cmp           ip, #3
   .long  0xf4830bcf                          // vst4.32       {d0[1],d2[1],d4[1],d6[1]}, [r3]
-  .long  0x3afffff4                          // bcc           581c <sk_store_f32_vfp4+0x34>
+  .long  0x3afffff4                          // bcc           596c <sk_store_f32_vfp4+0x34>
   .long  0xe2822020                          // add           r2, r2, #32
   .long  0xf4821b4f                          // vst4.32       {d1[0],d3[0],d5[0],d7[0]}, [r2]
-  .long  0xeafffff1                          // b             581c <sk_store_f32_vfp4+0x34>
-
-HIDDEN _sk_clamp_x_vfp4
-.globl _sk_clamp_x_vfp4
-FUNCTION(_sk_clamp_x_vfp4)
-_sk_clamp_x_vfp4:
-  .long  0xf2c00050                          // vmov.i32      q8, #0
-  .long  0xe5913000                          // ldr           r3, [r1]
-  .long  0xf3c72e5f                          // vmov.i8       q9, #255
-  .long  0xe5912004                          // ldr           r2, [r1, #4]
-  .long  0xf2400fc0                          // vmax.f32      q8, q8, q0
-  .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
-  .long  0xf26428e2                          // vadd.i32      q9, q10, q9
-  .long  0xf2200fe2                          // vmin.f32      q0, q8, q9
-  .long  0xe12fff12                          // bx            r2
-
-HIDDEN _sk_clamp_y_vfp4
-.globl _sk_clamp_y_vfp4
-FUNCTION(_sk_clamp_y_vfp4)
-_sk_clamp_y_vfp4:
-  .long  0xf2c00050                          // vmov.i32      q8, #0
-  .long  0xe5913000                          // ldr           r3, [r1]
-  .long  0xf3c72e5f                          // vmov.i8       q9, #255
-  .long  0xe5912004                          // ldr           r2, [r1, #4]
-  .long  0xf2400fc2                          // vmax.f32      q8, q8, q1
-  .long  0xe2811008                          // add           r1, r1, #8
-  .long  0xf4e34cbf                          // vld1.32       {d20[]-d21[]}, [r3 :32]
-  .long  0xf26428e2                          // vadd.i32      q9, q10, q9
-  .long  0xf2202fe2                          // vmin.f32      q1, q8, q9
-  .long  0xe12fff12                          // bx            r2
+  .long  0xeafffff1                          // b             596c <sk_store_f32_vfp4+0x34>
   .long  0xe320f000                          // nop           {0}
 
 HIDDEN _sk_repeat_x_vfp4
@@ -6260,7 +6314,7 @@
   .long  0xe2811008                          // add           r1, r1, #8
   .long  0xf4e30cbd                          // vld1.32       {d16[]-d17[]}, [r3 :32]!
   .long  0xf4e32cbf                          // vld1.32       {d18[]-d19[]}, [r3 :32]
-  .long  0xe28f3030                          // add           r3, pc, #48
+  .long  0xe28f3020                          // add           r3, pc, #32
   .long  0xf3422dd0                          // vmul.f32      q9, q9, q0
   .long  0xf4638acf                          // vld1.64       {d24-d25}, [r3]
   .long  0xf3fb4762                          // vcvt.s32.f32  q10, q9
@@ -6268,11 +6322,7 @@
   .long  0xf3642ee2                          // vcgt.f32      q9, q10, q9
   .long  0xf35821f6                          // vbsl          q9, q12, q11
   .long  0xf2642de2                          // vsub.f32      q9, q10, q9
-  .long  0xf3c74e5f                          // vmov.i8       q10, #255
   .long  0xf2200cf2                          // vfms.f32      q0, q8, q9
-  .long  0xf26008e4                          // vadd.i32      q8, q8, q10
-  .long  0xf2462fc0                          // vmax.f32      q9, q11, q0
-  .long  0xf2220fe0                          // vmin.f32      q0, q9, q8
   .long  0xe12fff12                          // bx            r2
   .long  0x3f800000                          // .word         0x3f800000
   .long  0x3f800000                          // .word         0x3f800000
@@ -6289,7 +6339,7 @@
   .long  0xe2811008                          // add           r1, r1, #8
   .long  0xf4e30cbd                          // vld1.32       {d16[]-d17[]}, [r3 :32]!
   .long  0xf4e32cbf                          // vld1.32       {d18[]-d19[]}, [r3 :32]
-  .long  0xe28f3030                          // add           r3, pc, #48
+  .long  0xe28f3020                          // add           r3, pc, #32
   .long  0xf3422dd2                          // vmul.f32      q9, q9, q1
   .long  0xf4638acf                          // vld1.64       {d24-d25}, [r3]
   .long  0xf3fb4762                          // vcvt.s32.f32  q10, q9
@@ -6297,11 +6347,7 @@
   .long  0xf3642ee2                          // vcgt.f32      q9, q10, q9
   .long  0xf35821f6                          // vbsl          q9, q12, q11
   .long  0xf2642de2                          // vsub.f32      q9, q10, q9
-  .long  0xf3c74e5f                          // vmov.i8       q10, #255
   .long  0xf2202cf2                          // vfms.f32      q1, q8, q9
-  .long  0xf26008e4                          // vadd.i32      q8, q8, q10
-  .long  0xf2462fc2                          // vmax.f32      q9, q11, q1
-  .long  0xf2222fe0                          // vmin.f32      q1, q9, q8
   .long  0xe12fff12                          // bx            r2
   .long  0x3f800000                          // .word         0x3f800000
   .long  0x3f800000                          // .word         0x3f800000
@@ -6320,7 +6366,7 @@
   .long  0xe2811008                          // add           r1, r1, #8
   .long  0xed938a00                          // vldr          s16, [r3]
   .long  0xed939a01                          // vldr          s18, [r3, #4]
-  .long  0xe28f3050                          // add           r3, pc, #80
+  .long  0xe28f3040                          // add           r3, pc, #64
   .long  0xf3f40c48                          // vdup.32       q8, d8[0]
   .long  0xf2602d60                          // vsub.f32      q9, q0, q8
   .long  0xf463aacf                          // vld1.64       {d26-d27}, [r3]
@@ -6334,12 +6380,8 @@
   .long  0xf2664de4                          // vsub.f32      q10, q11, q10
   .long  0xf3f46c40                          // vdup.32       q11, d0[0]
   .long  0xf2662cf4                          // vfms.f32      q9, q11, q10
-  .long  0xf3c74e5f                          // vmov.i8       q10, #255
-  .long  0xf2622de0                          // vsub.f32      q9, q9, q8
-  .long  0xf26008e4                          // vadd.i32      q8, q8, q10
-  .long  0xf3f92762                          // vabs.f32      q9, q9
-  .long  0xf2482fe2                          // vmax.f32      q9, q12, q9
-  .long  0xf2220fe0                          // vmin.f32      q0, q9, q8
+  .long  0xf2620de0                          // vsub.f32      q8, q9, q8
+  .long  0xf3b90760                          // vabs.f32      q0, q8
   .long  0xecbd8b06                          // vpop          {d8-d10}
   .long  0xe12fff12                          // bx            r2
   .long  0x3f800000                          // .word         0x3f800000
@@ -6359,7 +6401,7 @@
   .long  0xe2811008                          // add           r1, r1, #8
   .long  0xed938a00                          // vldr          s16, [r3]
   .long  0xed939a01                          // vldr          s18, [r3, #4]
-  .long  0xe28f3050                          // add           r3, pc, #80
+  .long  0xe28f3040                          // add           r3, pc, #64
   .long  0xf3f40c48                          // vdup.32       q8, d8[0]
   .long  0xf2622d60                          // vsub.f32      q9, q1, q8
   .long  0xf463aacf                          // vld1.64       {d26-d27}, [r3]
@@ -6373,12 +6415,8 @@
   .long  0xf2664de4                          // vsub.f32      q10, q11, q10
   .long  0xf3f46c42                          // vdup.32       q11, d2[0]
   .long  0xf2662cf4                          // vfms.f32      q9, q11, q10
-  .long  0xf3c74e5f                          // vmov.i8       q10, #255
-  .long  0xf2622de0                          // vsub.f32      q9, q9, q8
-  .long  0xf26008e4                          // vadd.i32      q8, q8, q10
-  .long  0xf3f92762                          // vabs.f32      q9, q9
-  .long  0xf2482fe2                          // vmax.f32      q9, q12, q9
-  .long  0xf2222fe0                          // vmin.f32      q1, q9, q8
+  .long  0xf2620de0                          // vsub.f32      q8, q9, q8
+  .long  0xf3b92760                          // vabs.f32      q1, q8
   .long  0xecbd8b06                          // vpop          {d8-d10}
   .long  0xe12fff12                          // bx            r2
   .long  0x3f800000                          // .word         0x3f800000
@@ -6911,7 +6949,7 @@
   .long  0xf2c00050                          // vmov.i32      q8, #0
   .long  0xe5931000                          // ldr           r1, [r3]
   .long  0xe3510002                          // cmp           r1, #2
-  .long  0x3a00000a                          // bcc           61c8 <sk_gradient_vfp4+0x60>
+  .long  0x3a00000a                          // bcc           6288 <sk_gradient_vfp4+0x60>
   .long  0xe5932024                          // ldr           r2, [r3, #36]
   .long  0xf2c04051                          // vmov.i32      q10, #1
   .long  0xf2c00050                          // vmov.i32      q8, #0
@@ -6922,7 +6960,7 @@
   .long  0xf3468ee8                          // vcge.f32      q12, q11, q12
   .long  0xf35481f2                          // vbsl          q12, q10, q9
   .long  0xf26008e8                          // vadd.i32      q8, q8, q12
-  .long  0x1afffff9                          // bne           61b0 <sk_gradient_vfp4+0x48>
+  .long  0x1afffff9                          // bne           6270 <sk_gradient_vfp4+0x48>
   .long  0xee317b90                          // vmov.32       r7, d17[1]
   .long  0xe9934400                          // ldmib         r3, {sl, lr}
   .long  0xee111b90                          // vmov.32       r1, d17[0]
@@ -8063,7 +8101,7 @@
   .long  0xe0835105                          // add           r5, r3, r5, lsl #2
   .long  0xedd55a00                          // vldr          s11, [r5]
   .long  0xee325b90                          // vmov.32       r5, d18[1]
-  .long  0xea000004                          // b             71d0 <sk_clut_3D_vfp4+0x510>
+  .long  0xea000004                          // b             7290 <sk_clut_3D_vfp4+0x510>
   .long  0xe320f000                          // nop           {0}
   .long  0x3f7ff972                          // .word         0x3f7ff972
   .long  0x3f7ff972                          // .word         0x3f7ff972
@@ -8584,7 +8622,7 @@
   .long  0xf2802051                          // vmov.i32      q1, #1
   .long  0xf22e29e0                          // vmla.i32      q1, q15, q8
   .long  0xedd20a00                          // vldr          s1, [r2]
-  .long  0xea000004                          // b             79e0 <sk_clut_4D_vfp4+0x530>
+  .long  0xea000004                          // b             7aa0 <sk_clut_4D_vfp4+0x530>
   .long  0xe320f000                          // nop           {0}
   .long  0x3f7ff972                          // .word         0x3f7ff972
   .long  0x3f7ff972                          // .word         0x3f7ff972
@@ -9384,14 +9422,14 @@
   .byte  197,249,110,194                     // vmovd         %edx,%xmm0
   .byte  196,226,125,88,192                  // vpbroadcastd  %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  197,252,88,5,182,167,2,0            // vaddps        0x2a7b6(%rip),%ymm0,%ymm0        # 2a860 <_sk_srcover_rgba_8888_sse2_lowp+0x2c4>
+  .byte  197,252,88,5,22,171,2,0             // vaddps        0x2ab16(%rip),%ymm0,%ymm0        # 2abc0 <_sk_srcover_rgba_8888_sse2_lowp+0x2c4>
   .byte  197,249,110,201                     // vmovd         %ecx,%xmm1
   .byte  196,226,125,88,201                  // vpbroadcastd  %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,36,173,2,0        // vbroadcastss  0x2ad24(%rip),%ymm2        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,21,132,176,2,0       // vbroadcastss  0x2b084(%rip),%ymm2        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,244,88,202                      // vaddps        %ymm2,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,21,25,173,2,0        // vbroadcastss  0x2ad19(%rip),%ymm2        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,21,121,176,2,0       // vbroadcastss  0x2b079(%rip),%ymm2        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
@@ -9406,17 +9444,17 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,121,110,194                     // vmovd         %edx,%xmm8
   .byte  196,66,125,88,192                   // vpbroadcastd  %xmm8,%ymm8
-  .byte  197,61,254,5,136,167,2,0            // vpaddd        0x2a788(%rip),%ymm8,%ymm8        # 2a880 <_sk_srcover_rgba_8888_sse2_lowp+0x2e4>
+  .byte  197,61,254,5,232,170,2,0            // vpaddd        0x2aae8(%rip),%ymm8,%ymm8        # 2abe0 <_sk_srcover_rgba_8888_sse2_lowp+0x2e4>
   .byte  197,121,110,201                     // vmovd         %ecx,%xmm9
   .byte  196,66,125,88,201                   // vpbroadcastd  %xmm9,%ymm9
   .byte  196,65,53,239,200                   // vpxor         %ymm8,%ymm9,%ymm9
-  .byte  196,98,125,88,21,221,172,2,0        // vpbroadcastd  0x2acdd(%rip),%ymm10        # 2adec <_sk_srcover_rgba_8888_sse2_lowp+0x850>
+  .byte  196,98,125,88,21,61,176,2,0         // vpbroadcastd  0x2b03d(%rip),%ymm10        # 2b14c <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   .byte  196,65,53,219,218                   // vpand         %ymm10,%ymm9,%ymm11
   .byte  196,193,37,114,243,5                // vpslld        $0x5,%ymm11,%ymm11
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,193,45,114,242,4                // vpslld        $0x4,%ymm10,%ymm10
-  .byte  196,98,125,88,37,194,172,2,0        // vpbroadcastd  0x2acc2(%rip),%ymm12        # 2adf0 <_sk_srcover_rgba_8888_sse2_lowp+0x854>
-  .byte  196,98,125,88,45,189,172,2,0        // vpbroadcastd  0x2acbd(%rip),%ymm13        # 2adf4 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  .byte  196,98,125,88,37,34,176,2,0         // vpbroadcastd  0x2b022(%rip),%ymm12        # 2b150 <_sk_srcover_rgba_8888_sse2_lowp+0x854>
+  .byte  196,98,125,88,45,29,176,2,0         // vpbroadcastd  0x2b01d(%rip),%ymm13        # 2b154 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   .byte  196,65,53,219,245                   // vpand         %ymm13,%ymm9,%ymm14
   .byte  196,193,13,114,246,2                // vpslld        $0x2,%ymm14,%ymm14
   .byte  196,65,37,235,222                   // vpor          %ymm14,%ymm11,%ymm11
@@ -9431,8 +9469,8 @@
   .byte  196,65,61,235,195                   // vpor          %ymm11,%ymm8,%ymm8
   .byte  196,65,61,235,193                   // vpor          %ymm9,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,111,172,2,0        // vbroadcastss  0x2ac6f(%rip),%ymm9        # 2adf8 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
-  .byte  196,98,125,24,21,106,172,2,0        // vbroadcastss  0x2ac6a(%rip),%ymm10        # 2adfc <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  .byte  196,98,125,24,13,207,175,2,0        // vbroadcastss  0x2afcf(%rip),%ymm9        # 2b158 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
+  .byte  196,98,125,24,21,202,175,2,0        // vbroadcastss  0x2afca(%rip),%ymm10        # 2b15c <_sk_srcover_rgba_8888_sse2_lowp+0x860>
   .byte  196,66,61,184,209                   // vfmadd231ps   %ymm9,%ymm8,%ymm10
   .byte  196,98,125,24,0                     // vbroadcastss  (%rax),%ymm8
   .byte  196,65,44,89,192                    // vmulps        %ymm8,%ymm10,%ymm8
@@ -9466,7 +9504,7 @@
 FUNCTION(_sk_black_color_hsw)
 _sk_black_color_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,242,171,2,0       // vbroadcastss  0x2abf2(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,82,175,2,0        // vbroadcastss  0x2af52(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -9477,7 +9515,7 @@
 FUNCTION(_sk_white_color_hsw)
 _sk_white_color_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,217,171,2,0        // vbroadcastss  0x2abd9(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,57,175,2,0         // vbroadcastss  0x2af39(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
@@ -9523,7 +9561,7 @@
 FUNCTION(_sk_srcatop_hsw)
 _sk_srcatop_hsw:
   .byte  197,252,89,199                      // vmulps        %ymm7,%ymm0,%ymm0
-  .byte  196,98,125,24,5,120,171,2,0         // vbroadcastss  0x2ab78(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,216,174,2,0         // vbroadcastss  0x2aed8(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,226,61,184,196                  // vfmadd231ps   %ymm4,%ymm8,%ymm0
   .byte  197,244,89,207                      // vmulps        %ymm7,%ymm1,%ymm1
@@ -9539,7 +9577,7 @@
 .globl _sk_dstatop_hsw
 FUNCTION(_sk_dstatop_hsw)
 _sk_dstatop_hsw:
-  .byte  196,98,125,24,5,71,171,2,0          // vbroadcastss  0x2ab47(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,167,174,2,0         // vbroadcastss  0x2aea7(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,226,101,184,196                 // vfmadd231ps   %ymm4,%ymm3,%ymm0
@@ -9578,7 +9616,7 @@
 .globl _sk_srcout_hsw
 FUNCTION(_sk_srcout_hsw)
 _sk_srcout_hsw:
-  .byte  196,98,125,24,5,234,170,2,0         // vbroadcastss  0x2aaea(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,74,174,2,0          // vbroadcastss  0x2ae4a(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -9591,7 +9629,7 @@
 .globl _sk_dstout_hsw
 FUNCTION(_sk_dstout_hsw)
 _sk_dstout_hsw:
-  .byte  196,226,125,24,5,201,170,2,0        // vbroadcastss  0x2aac9(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,41,174,2,0         // vbroadcastss  0x2ae29(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,92,219                      // vsubps        %ymm3,%ymm0,%ymm3
   .byte  197,228,89,196                      // vmulps        %ymm4,%ymm3,%ymm0
   .byte  197,228,89,205                      // vmulps        %ymm5,%ymm3,%ymm1
@@ -9604,7 +9642,7 @@
 .globl _sk_srcover_hsw
 FUNCTION(_sk_srcover_hsw)
 _sk_srcover_hsw:
-  .byte  196,98,125,24,5,168,170,2,0         // vbroadcastss  0x2aaa8(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,8,174,2,0           // vbroadcastss  0x2ae08(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,93,184,192                  // vfmadd231ps   %ymm8,%ymm4,%ymm0
   .byte  196,194,85,184,200                  // vfmadd231ps   %ymm8,%ymm5,%ymm1
@@ -9617,7 +9655,7 @@
 .globl _sk_dstover_hsw
 FUNCTION(_sk_dstover_hsw)
 _sk_dstover_hsw:
-  .byte  196,98,125,24,5,131,170,2,0         // vbroadcastss  0x2aa83(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,227,173,2,0         // vbroadcastss  0x2ade3(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  196,226,61,168,196                  // vfmadd213ps   %ymm4,%ymm8,%ymm0
   .byte  196,226,61,168,205                  // vfmadd213ps   %ymm5,%ymm8,%ymm1
@@ -9641,7 +9679,7 @@
 .globl _sk_multiply_hsw
 FUNCTION(_sk_multiply_hsw)
 _sk_multiply_hsw:
-  .byte  196,98,125,24,5,74,170,2,0          // vbroadcastss  0x2aa4a(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,170,173,2,0         // vbroadcastss  0x2adaa(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -9664,7 +9702,7 @@
 FUNCTION(_sk_plus__hsw)
 _sk_plus__hsw:
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
-  .byte  196,98,125,24,5,249,169,2,0         // vbroadcastss  0x2a9f9(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,89,173,2,0          // vbroadcastss  0x2ad59(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  197,244,88,205                      // vaddps        %ymm5,%ymm1,%ymm1
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
@@ -9694,7 +9732,7 @@
 .globl _sk_xor__hsw
 FUNCTION(_sk_xor__hsw)
 _sk_xor__hsw:
-  .byte  196,98,125,24,5,164,169,2,0         // vbroadcastss  0x2a9a4(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,4,173,2,0           // vbroadcastss  0x2ad04(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -9728,7 +9766,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,95,209                  // vmaxps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,40,169,2,0          // vbroadcastss  0x2a928(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,136,172,2,0         // vbroadcastss  0x2ac88(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -9753,7 +9791,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,211,168,2,0         // vbroadcastss  0x2a8d3(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,51,172,2,0          // vbroadcastss  0x2ac33(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -9781,7 +9819,7 @@
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,114,168,2,0         // vbroadcastss  0x2a872(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,210,171,2,0         // vbroadcastss  0x2abd2(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -9803,7 +9841,7 @@
   .byte  197,236,89,214                      // vmulps        %ymm6,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,44,168,2,0          // vbroadcastss  0x2a82c(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,140,171,2,0         // vbroadcastss  0x2ab8c(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  196,194,69,184,216                  // vfmadd231ps   %ymm8,%ymm7,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -9813,7 +9851,7 @@
 .globl _sk_colorburn_hsw
 FUNCTION(_sk_colorburn_hsw)
 _sk_colorburn_hsw:
-  .byte  196,98,125,24,5,22,168,2,0          // vbroadcastss  0x2a816(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,118,171,2,0         // vbroadcastss  0x2ab76(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,216                       // vmulps        %ymm0,%ymm9,%ymm11
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
@@ -9871,7 +9909,7 @@
 FUNCTION(_sk_colordodge_hsw)
 _sk_colordodge_hsw:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  196,98,125,24,13,38,167,2,0         // vbroadcastss  0x2a726(%rip),%ymm9        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,13,134,170,2,0        // vbroadcastss  0x2aa86(%rip),%ymm9        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,52,92,215                       // vsubps        %ymm7,%ymm9,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
@@ -9924,7 +9962,7 @@
 .globl _sk_hardlight_hsw
 FUNCTION(_sk_hardlight_hsw)
 _sk_hardlight_hsw:
-  .byte  196,98,125,24,5,64,166,2,0          // vbroadcastss  0x2a640(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,160,169,2,0         // vbroadcastss  0x2a9a0(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -9975,7 +10013,7 @@
 .globl _sk_overlay_hsw
 FUNCTION(_sk_overlay_hsw)
 _sk_overlay_hsw:
-  .byte  196,98,125,24,5,116,165,2,0         // vbroadcastss  0x2a574(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,212,168,2,0         // vbroadcastss  0x2a8d4(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -10036,10 +10074,10 @@
   .byte  196,65,20,88,197                    // vaddps        %ymm13,%ymm13,%ymm8
   .byte  196,65,60,88,192                    // vaddps        %ymm8,%ymm8,%ymm8
   .byte  196,66,61,168,192                   // vfmadd213ps   %ymm8,%ymm8,%ymm8
-  .byte  196,98,125,24,29,143,164,2,0        // vbroadcastss  0x2a48f(%rip),%ymm11        # 2ae00 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  .byte  196,98,125,24,29,239,167,2,0        // vbroadcastss  0x2a7ef(%rip),%ymm11        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   .byte  196,65,20,88,227                    // vaddps        %ymm11,%ymm13,%ymm12
   .byte  196,65,28,89,192                    // vmulps        %ymm8,%ymm12,%ymm8
-  .byte  196,98,125,24,37,128,164,2,0        // vbroadcastss  0x2a480(%rip),%ymm12        # 2ae04 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  .byte  196,98,125,24,37,224,167,2,0        // vbroadcastss  0x2a7e0(%rip),%ymm12        # 2b164 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   .byte  196,66,21,184,196                   // vfmadd231ps   %ymm12,%ymm13,%ymm8
   .byte  196,65,124,82,245                   // vrsqrtps      %ymm13,%ymm14
   .byte  196,65,124,83,246                   // vrcpps        %ymm14,%ymm14
@@ -10049,7 +10087,7 @@
   .byte  197,4,194,255,2                     // vcmpleps      %ymm7,%ymm15,%ymm15
   .byte  196,67,13,74,240,240                // vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   .byte  197,116,88,249                      // vaddps        %ymm1,%ymm1,%ymm15
-  .byte  196,98,125,24,5,47,164,2,0          // vbroadcastss  0x2a42f(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,143,167,2,0         // vbroadcastss  0x2a78f(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,65,60,92,237                    // vsubps        %ymm13,%ymm8,%ymm13
   .byte  197,132,92,195                      // vsubps        %ymm3,%ymm15,%ymm0
   .byte  196,98,125,168,235                  // vfmadd213ps   %ymm3,%ymm0,%ymm13
@@ -10162,11 +10200,11 @@
   .byte  196,65,28,89,210                    // vmulps        %ymm10,%ymm12,%ymm10
   .byte  196,65,44,94,214                    // vdivps        %ymm14,%ymm10,%ymm10
   .byte  196,67,45,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  .byte  196,98,125,24,53,71,162,2,0         // vbroadcastss  0x2a247(%rip),%ymm14        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  .byte  196,98,125,24,61,66,162,2,0         // vbroadcastss  0x2a242(%rip),%ymm15        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,53,167,165,2,0        // vbroadcastss  0x2a5a7(%rip),%ymm14        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,61,162,165,2,0        // vbroadcastss  0x2a5a2(%rip),%ymm15        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,66,93,184,238                   // vfmadd231ps   %ymm14,%ymm4,%ymm13
-  .byte  196,226,125,24,5,51,162,2,0         // vbroadcastss  0x2a233(%rip),%ymm0        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,226,125,24,5,147,165,2,0        // vbroadcastss  0x2a593(%rip),%ymm0        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  196,98,77,184,232                   // vfmadd231ps   %ymm0,%ymm6,%ymm13
   .byte  196,65,116,89,215                   // vmulps        %ymm15,%ymm1,%ymm10
   .byte  196,66,53,184,214                   // vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -10221,7 +10259,7 @@
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
   .byte  196,65,36,95,200                    // vmaxps        %ymm8,%ymm11,%ymm9
   .byte  196,65,116,95,192                   // vmaxps        %ymm8,%ymm1,%ymm8
-  .byte  196,226,125,24,13,244,160,2,0       // vbroadcastss  0x2a0f4(%rip),%ymm1        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,13,84,164,2,0        // vbroadcastss  0x2a454(%rip),%ymm1        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,116,92,215                      // vsubps        %ymm7,%ymm1,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,116,92,219                      // vsubps        %ymm3,%ymm1,%ymm11
@@ -10275,11 +10313,11 @@
   .byte  196,65,28,89,210                    // vmulps        %ymm10,%ymm12,%ymm10
   .byte  196,65,44,94,214                    // vdivps        %ymm14,%ymm10,%ymm10
   .byte  196,67,45,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  .byte  196,98,125,24,53,39,160,2,0         // vbroadcastss  0x2a027(%rip),%ymm14        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  .byte  196,98,125,24,61,34,160,2,0         // vbroadcastss  0x2a022(%rip),%ymm15        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,53,135,163,2,0        // vbroadcastss  0x2a387(%rip),%ymm14        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,61,130,163,2,0        // vbroadcastss  0x2a382(%rip),%ymm15        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,66,93,184,238                   // vfmadd231ps   %ymm14,%ymm4,%ymm13
-  .byte  196,226,125,24,5,19,160,2,0         // vbroadcastss  0x2a013(%rip),%ymm0        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,226,125,24,5,115,163,2,0        // vbroadcastss  0x2a373(%rip),%ymm0        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  196,98,77,184,232                   // vfmadd231ps   %ymm0,%ymm6,%ymm13
   .byte  196,65,116,89,215                   // vmulps        %ymm15,%ymm1,%ymm10
   .byte  196,66,53,184,214                   // vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -10334,7 +10372,7 @@
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
   .byte  196,65,36,95,200                    // vmaxps        %ymm8,%ymm11,%ymm9
   .byte  196,65,116,95,192                   // vmaxps        %ymm8,%ymm1,%ymm8
-  .byte  196,226,125,24,13,212,158,2,0       // vbroadcastss  0x29ed4(%rip),%ymm1        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,13,52,162,2,0        // vbroadcastss  0x2a234(%rip),%ymm1        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,116,92,215                      // vsubps        %ymm7,%ymm1,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,116,92,219                      // vsubps        %ymm3,%ymm1,%ymm11
@@ -10362,11 +10400,11 @@
   .byte  197,108,89,199                      // vmulps        %ymm7,%ymm2,%ymm8
   .byte  197,116,89,215                      // vmulps        %ymm7,%ymm1,%ymm10
   .byte  197,52,89,223                       // vmulps        %ymm7,%ymm9,%ymm11
-  .byte  196,98,125,24,45,137,158,2,0        // vbroadcastss  0x29e89(%rip),%ymm13        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  .byte  196,98,125,24,53,132,158,2,0        // vbroadcastss  0x29e84(%rip),%ymm14        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,45,233,161,2,0        // vbroadcastss  0x2a1e9(%rip),%ymm13        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,53,228,161,2,0        // vbroadcastss  0x2a1e4(%rip),%ymm14        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,84,89,230                    // vmulps        %ymm14,%ymm5,%ymm12
   .byte  196,66,93,184,229                   // vfmadd231ps   %ymm13,%ymm4,%ymm12
-  .byte  196,98,125,24,61,117,158,2,0        // vbroadcastss  0x29e75(%rip),%ymm15        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,98,125,24,61,213,161,2,0        // vbroadcastss  0x2a1d5(%rip),%ymm15        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  196,66,77,184,231                   // vfmadd231ps   %ymm15,%ymm6,%ymm12
   .byte  196,65,44,89,206                    // vmulps        %ymm14,%ymm10,%ymm9
   .byte  196,66,61,184,205                   // vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -10422,7 +10460,7 @@
   .byte  196,193,116,95,206                  // vmaxps        %ymm14,%ymm1,%ymm1
   .byte  196,65,44,95,198                    // vmaxps        %ymm14,%ymm10,%ymm8
   .byte  196,65,124,95,206                   // vmaxps        %ymm14,%ymm0,%ymm9
-  .byte  196,226,125,24,5,43,157,2,0         // vbroadcastss  0x29d2b(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,139,160,2,0        // vbroadcastss  0x2a08b(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -10450,11 +10488,11 @@
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
   .byte  197,100,89,213                      // vmulps        %ymm5,%ymm3,%ymm10
   .byte  197,100,89,222                      // vmulps        %ymm6,%ymm3,%ymm11
-  .byte  196,98,125,24,45,224,156,2,0        // vbroadcastss  0x29ce0(%rip),%ymm13        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  .byte  196,98,125,24,53,219,156,2,0        // vbroadcastss  0x29cdb(%rip),%ymm14        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,45,64,160,2,0         // vbroadcastss  0x2a040(%rip),%ymm13        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,53,59,160,2,0         // vbroadcastss  0x2a03b(%rip),%ymm14        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,116,89,230                   // vmulps        %ymm14,%ymm1,%ymm12
   .byte  196,66,109,184,229                  // vfmadd231ps   %ymm13,%ymm2,%ymm12
-  .byte  196,98,125,24,61,204,156,2,0        // vbroadcastss  0x29ccc(%rip),%ymm15        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,98,125,24,61,44,160,2,0         // vbroadcastss  0x2a02c(%rip),%ymm15        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  196,66,53,184,231                   // vfmadd231ps   %ymm15,%ymm9,%ymm12
   .byte  196,65,44,89,206                    // vmulps        %ymm14,%ymm10,%ymm9
   .byte  196,66,61,184,205                   // vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -10510,7 +10548,7 @@
   .byte  196,193,116,95,206                  // vmaxps        %ymm14,%ymm1,%ymm1
   .byte  196,65,44,95,198                    // vmaxps        %ymm14,%ymm10,%ymm8
   .byte  196,65,124,95,206                   // vmaxps        %ymm14,%ymm0,%ymm9
-  .byte  196,226,125,24,5,130,155,2,0        // vbroadcastss  0x29b82(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,226,158,2,0        // vbroadcastss  0x29ee2(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -10541,17 +10579,17 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  15,133,179,0,0,0                    // jne           137b <_sk_srcover_rgba_8888_hsw+0xd3>
   .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,202,149,2,0          // vpand         0x295ca(%rip),%ymm7,%ymm4        # 2a8a0 <_sk_srcover_rgba_8888_sse2_lowp+0x304>
+  .byte  197,197,219,37,42,153,2,0           // vpand         0x2992a(%rip),%ymm7,%ymm4        # 2ac00 <_sk_srcover_rgba_8888_sse2_lowp+0x304>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,69,0,45,221,149,2,0         // vpshufb       0x295dd(%rip),%ymm7,%ymm5        # 2a8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x324>
+  .byte  196,226,69,0,45,61,153,2,0          // vpshufb       0x2993d(%rip),%ymm7,%ymm5        # 2ac20 <_sk_srcover_rgba_8888_sse2_lowp+0x324>
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,69,0,53,240,149,2,0         // vpshufb       0x295f0(%rip),%ymm7,%ymm6        # 2a8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x344>
+  .byte  196,226,69,0,53,80,153,2,0          // vpshufb       0x29950(%rip),%ymm7,%ymm6        # 2ac40 <_sk_srcover_rgba_8888_sse2_lowp+0x344>
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,5,226,154,2,0         // vbroadcastss  0x29ae2(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,66,158,2,0          // vbroadcastss  0x29e42(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
-  .byte  196,98,125,24,13,1,155,2,0          // vbroadcastss  0x29b01(%rip),%ymm9        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,13,97,158,2,0         // vbroadcastss  0x29e61(%rip),%ymm9        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  196,194,93,184,192                  // vfmadd231ps   %ymm8,%ymm4,%ymm0
   .byte  196,193,116,89,201                  // vmulps        %ymm9,%ymm1,%ymm1
@@ -10679,7 +10717,7 @@
 .globl _sk_clamp_1_hsw
 FUNCTION(_sk_clamp_1_hsw)
 _sk_clamp_1_hsw:
-  .byte  196,98,125,24,5,238,152,2,0         // vbroadcastss  0x298ee(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,78,156,2,0          // vbroadcastss  0x29c4e(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
@@ -10691,7 +10729,7 @@
 .globl _sk_clamp_a_hsw
 FUNCTION(_sk_clamp_a_hsw)
 _sk_clamp_a_hsw:
-  .byte  196,98,125,24,5,205,152,2,0         // vbroadcastss  0x298cd(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,45,156,2,0          // vbroadcastss  0x29c2d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  197,252,93,195                      // vminps        %ymm3,%ymm0,%ymm0
   .byte  197,244,93,203                      // vminps        %ymm3,%ymm1,%ymm1
@@ -10703,7 +10741,7 @@
 .globl _sk_clamp_a_dst_hsw
 FUNCTION(_sk_clamp_a_dst_hsw)
 _sk_clamp_a_dst_hsw:
-  .byte  196,98,125,24,5,175,152,2,0         // vbroadcastss  0x298af(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,15,156,2,0          // vbroadcastss  0x29c0f(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,68,93,248                   // vminps        %ymm8,%ymm7,%ymm7
   .byte  197,220,93,231                      // vminps        %ymm7,%ymm4,%ymm4
   .byte  197,212,93,239                      // vminps        %ymm7,%ymm5,%ymm5
@@ -10736,7 +10774,7 @@
 .globl _sk_invert_hsw
 FUNCTION(_sk_invert_hsw)
 _sk_invert_hsw:
-  .byte  196,98,125,24,5,106,152,2,0         // vbroadcastss  0x2986a(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,202,155,2,0         // vbroadcastss  0x29bca(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  197,188,92,201                      // vsubps        %ymm1,%ymm8,%ymm1
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
@@ -10792,7 +10830,7 @@
 _sk_unpremul_hsw:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,65,100,194,200,0                // vcmpeqps      %ymm8,%ymm3,%ymm9
-  .byte  196,98,125,24,21,250,151,2,0        // vbroadcastss  0x297fa(%rip),%ymm10        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,21,90,155,2,0         // vbroadcastss  0x29b5a(%rip),%ymm10        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,44,94,211                       // vdivps        %ymm3,%ymm10,%ymm10
   .byte  196,67,45,74,192,144                // vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
@@ -10805,16 +10843,16 @@
 .globl _sk_from_srgb_hsw
 FUNCTION(_sk_from_srgb_hsw)
 _sk_from_srgb_hsw:
-  .byte  196,98,125,24,5,7,152,2,0           // vbroadcastss  0x29807(%rip),%ymm8        # 2ae18 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  .byte  196,98,125,24,5,103,155,2,0         // vbroadcastss  0x29b67(%rip),%ymm8        # 2b178 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  197,124,89,208                      // vmulps        %ymm0,%ymm0,%ymm10
-  .byte  196,98,125,24,29,249,151,2,0        // vbroadcastss  0x297f9(%rip),%ymm11        # 2ae1c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
-  .byte  196,98,125,24,37,220,151,2,0        // vbroadcastss  0x297dc(%rip),%ymm12        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,29,89,155,2,0         // vbroadcastss  0x29b59(%rip),%ymm11        # 2b17c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
+  .byte  196,98,125,24,37,60,155,2,0         // vbroadcastss  0x29b3c(%rip),%ymm12        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,125,168,235                  // vfmadd213ps   %ymm11,%ymm0,%ymm13
-  .byte  196,98,125,24,53,225,151,2,0        // vbroadcastss  0x297e1(%rip),%ymm14        # 2ae20 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
+  .byte  196,98,125,24,53,65,155,2,0         // vbroadcastss  0x29b41(%rip),%ymm14        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
   .byte  196,66,45,168,238                   // vfmadd213ps   %ymm14,%ymm10,%ymm13
-  .byte  196,98,125,24,21,215,151,2,0        // vbroadcastss  0x297d7(%rip),%ymm10        # 2ae24 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  .byte  196,98,125,24,21,55,155,2,0         // vbroadcastss  0x29b37(%rip),%ymm10        # 2b184 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
   .byte  196,193,124,194,194,1               // vcmpltps      %ymm10,%ymm0,%ymm0
   .byte  196,195,21,74,193,0                 // vblendvps     %ymm0,%ymm9,%ymm13,%ymm0
   .byte  196,65,116,89,200                   // vmulps        %ymm8,%ymm1,%ymm9
@@ -10837,16 +10875,16 @@
 .globl _sk_from_srgb_dst_hsw
 FUNCTION(_sk_from_srgb_dst_hsw)
 _sk_from_srgb_dst_hsw:
-  .byte  196,98,125,24,5,111,151,2,0         // vbroadcastss  0x2976f(%rip),%ymm8        # 2ae18 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  .byte  196,98,125,24,5,207,154,2,0         // vbroadcastss  0x29acf(%rip),%ymm8        # 2b178 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   .byte  196,65,92,89,200                    // vmulps        %ymm8,%ymm4,%ymm9
   .byte  197,92,89,212                       // vmulps        %ymm4,%ymm4,%ymm10
-  .byte  196,98,125,24,29,97,151,2,0         // vbroadcastss  0x29761(%rip),%ymm11        # 2ae1c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
-  .byte  196,98,125,24,37,68,151,2,0         // vbroadcastss  0x29744(%rip),%ymm12        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,29,193,154,2,0        // vbroadcastss  0x29ac1(%rip),%ymm11        # 2b17c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
+  .byte  196,98,125,24,37,164,154,2,0        // vbroadcastss  0x29aa4(%rip),%ymm12        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,93,168,235                   // vfmadd213ps   %ymm11,%ymm4,%ymm13
-  .byte  196,98,125,24,53,73,151,2,0         // vbroadcastss  0x29749(%rip),%ymm14        # 2ae20 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
+  .byte  196,98,125,24,53,169,154,2,0        // vbroadcastss  0x29aa9(%rip),%ymm14        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
   .byte  196,66,45,168,238                   // vfmadd213ps   %ymm14,%ymm10,%ymm13
-  .byte  196,98,125,24,21,63,151,2,0         // vbroadcastss  0x2973f(%rip),%ymm10        # 2ae24 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  .byte  196,98,125,24,21,159,154,2,0        // vbroadcastss  0x29a9f(%rip),%ymm10        # 2b184 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
   .byte  196,193,92,194,226,1                // vcmpltps      %ymm10,%ymm4,%ymm4
   .byte  196,195,21,74,225,64                // vblendvps     %ymm4,%ymm9,%ymm13,%ymm4
   .byte  196,65,84,89,200                    // vmulps        %ymm8,%ymm5,%ymm9
@@ -10870,19 +10908,19 @@
 FUNCTION(_sk_to_srgb_hsw)
 _sk_to_srgb_hsw:
   .byte  197,124,82,200                      // vrsqrtps      %ymm0,%ymm9
-  .byte  196,98,125,24,5,227,150,2,0         // vbroadcastss  0x296e3(%rip),%ymm8        # 2ae28 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
+  .byte  196,98,125,24,5,67,154,2,0          // vbroadcastss  0x29a43(%rip),%ymm8        # 2b188 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
   .byte  196,65,124,89,208                   // vmulps        %ymm8,%ymm0,%ymm10
-  .byte  196,98,125,24,29,217,150,2,0        // vbroadcastss  0x296d9(%rip),%ymm11        # 2ae2c <_sk_srcover_rgba_8888_sse2_lowp+0x890>
-  .byte  196,98,125,24,37,212,150,2,0        // vbroadcastss  0x296d4(%rip),%ymm12        # 2ae30 <_sk_srcover_rgba_8888_sse2_lowp+0x894>
+  .byte  196,98,125,24,29,57,154,2,0         // vbroadcastss  0x29a39(%rip),%ymm11        # 2b18c <_sk_srcover_rgba_8888_sse2_lowp+0x890>
+  .byte  196,98,125,24,37,52,154,2,0         // vbroadcastss  0x29a34(%rip),%ymm12        # 2b190 <_sk_srcover_rgba_8888_sse2_lowp+0x894>
   .byte  196,65,124,40,236                   // vmovaps       %ymm12,%ymm13
   .byte  196,66,53,168,235                   // vfmadd213ps   %ymm11,%ymm9,%ymm13
-  .byte  196,98,125,24,53,197,150,2,0        // vbroadcastss  0x296c5(%rip),%ymm14        # 2ae34 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
+  .byte  196,98,125,24,53,37,154,2,0         // vbroadcastss  0x29a25(%rip),%ymm14        # 2b194 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
   .byte  196,66,53,168,238                   // vfmadd213ps   %ymm14,%ymm9,%ymm13
-  .byte  196,98,125,24,61,187,150,2,0        // vbroadcastss  0x296bb(%rip),%ymm15        # 2ae38 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
+  .byte  196,98,125,24,61,27,154,2,0         // vbroadcastss  0x29a1b(%rip),%ymm15        # 2b198 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
   .byte  196,65,52,88,207                    // vaddps        %ymm15,%ymm9,%ymm9
   .byte  196,65,124,83,201                   // vrcpps        %ymm9,%ymm9
   .byte  196,65,20,89,201                    // vmulps        %ymm9,%ymm13,%ymm9
-  .byte  196,98,125,24,45,167,150,2,0        // vbroadcastss  0x296a7(%rip),%ymm13        # 2ae3c <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
+  .byte  196,98,125,24,45,7,154,2,0          // vbroadcastss  0x29a07(%rip),%ymm13        # 2b19c <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
   .byte  196,193,124,194,197,1               // vcmpltps      %ymm13,%ymm0,%ymm0
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  197,124,82,201                      // vrsqrtps      %ymm1,%ymm9
@@ -10916,26 +10954,26 @@
   .byte  197,116,93,202                      // vminps        %ymm2,%ymm1,%ymm9
   .byte  196,65,124,93,201                   // vminps        %ymm9,%ymm0,%ymm9
   .byte  196,65,60,92,209                    // vsubps        %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,29,194,149,2,0        // vbroadcastss  0x295c2(%rip),%ymm11        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,29,34,153,2,0         // vbroadcastss  0x29922(%rip),%ymm11        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,65,36,94,218                    // vdivps        %ymm10,%ymm11,%ymm11
   .byte  197,116,92,226                      // vsubps        %ymm2,%ymm1,%ymm12
   .byte  197,116,194,234,1                   // vcmpltps      %ymm2,%ymm1,%ymm13
-  .byte  196,98,125,24,53,3,150,2,0          // vbroadcastss  0x29603(%rip),%ymm14        # 2ae40 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  .byte  196,98,125,24,53,99,153,2,0         // vbroadcastss  0x29963(%rip),%ymm14        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   .byte  196,65,4,87,255                     // vxorps        %ymm15,%ymm15,%ymm15
   .byte  196,67,5,74,238,208                 // vblendvps     %ymm13,%ymm14,%ymm15,%ymm13
   .byte  196,66,37,168,229                   // vfmadd213ps   %ymm13,%ymm11,%ymm12
   .byte  197,236,92,208                      // vsubps        %ymm0,%ymm2,%ymm2
   .byte  197,124,92,233                      // vsubps        %ymm1,%ymm0,%ymm13
-  .byte  196,98,125,24,53,234,149,2,0        // vbroadcastss  0x295ea(%rip),%ymm14        # 2ae48 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
+  .byte  196,98,125,24,53,74,153,2,0         // vbroadcastss  0x2994a(%rip),%ymm14        # 2b1a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
   .byte  196,66,37,168,238                   // vfmadd213ps   %ymm14,%ymm11,%ymm13
-  .byte  196,98,125,24,53,216,149,2,0        // vbroadcastss  0x295d8(%rip),%ymm14        # 2ae44 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
+  .byte  196,98,125,24,53,56,153,2,0         // vbroadcastss  0x29938(%rip),%ymm14        # 2b1a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   .byte  196,194,37,168,214                  // vfmadd213ps   %ymm14,%ymm11,%ymm2
   .byte  197,188,194,201,0                   // vcmpeqps      %ymm1,%ymm8,%ymm1
   .byte  196,227,21,74,202,16                // vblendvps     %ymm1,%ymm2,%ymm13,%ymm1
   .byte  197,188,194,192,0                   // vcmpeqps      %ymm0,%ymm8,%ymm0
   .byte  196,195,117,74,196,0                // vblendvps     %ymm0,%ymm12,%ymm1,%ymm0
   .byte  196,193,60,88,201                   // vaddps        %ymm9,%ymm8,%ymm1
-  .byte  196,98,125,24,29,79,149,2,0         // vbroadcastss  0x2954f(%rip),%ymm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,29,175,152,2,0        // vbroadcastss  0x298af(%rip),%ymm11        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,116,89,211                  // vmulps        %ymm11,%ymm1,%ymm2
   .byte  197,36,194,218,1                    // vcmpltps      %ymm2,%ymm11,%ymm11
   .byte  196,65,12,92,224                    // vsubps        %ymm8,%ymm14,%ymm12
@@ -10945,7 +10983,7 @@
   .byte  197,172,94,201                      // vdivps        %ymm1,%ymm10,%ymm1
   .byte  196,195,125,74,199,128              // vblendvps     %ymm8,%ymm15,%ymm0,%ymm0
   .byte  196,195,117,74,207,128              // vblendvps     %ymm8,%ymm15,%ymm1,%ymm1
-  .byte  196,98,125,24,5,126,149,2,0         // vbroadcastss  0x2957e(%rip),%ymm8        # 2ae4c <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  .byte  196,98,125,24,5,222,152,2,0         // vbroadcastss  0x298de(%rip),%ymm8        # 2b1ac <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -10962,30 +11000,30 @@
   .byte  197,252,17,92,36,128                // vmovups       %ymm3,-0x80(%rsp)
   .byte  197,252,40,233                      // vmovaps       %ymm1,%ymm5
   .byte  197,252,40,224                      // vmovaps       %ymm0,%ymm4
-  .byte  196,98,125,24,5,219,148,2,0         // vbroadcastss  0x294db(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,59,152,2,0          // vbroadcastss  0x2983b(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,60,194,202,2                    // vcmpleps      %ymm2,%ymm8,%ymm9
   .byte  197,84,89,210                       // vmulps        %ymm2,%ymm5,%ymm10
   .byte  196,65,84,92,218                    // vsubps        %ymm10,%ymm5,%ymm11
   .byte  196,67,45,74,203,144                // vblendvps     %ymm9,%ymm11,%ymm10,%ymm9
   .byte  197,52,88,210                       // vaddps        %ymm2,%ymm9,%ymm10
-  .byte  196,98,125,24,13,26,149,2,0         // vbroadcastss  0x2951a(%rip),%ymm9        # 2ae44 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
+  .byte  196,98,125,24,13,122,152,2,0        // vbroadcastss  0x2987a(%rip),%ymm9        # 2b1a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   .byte  196,66,109,170,202                  // vfmsub213ps   %ymm10,%ymm2,%ymm9
-  .byte  196,98,125,24,29,24,149,2,0         // vbroadcastss  0x29518(%rip),%ymm11        # 2ae50 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  .byte  196,98,125,24,29,120,152,2,0        // vbroadcastss  0x29878(%rip),%ymm11        # 2b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   .byte  196,65,92,88,219                    // vaddps        %ymm11,%ymm4,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,252                    // vsubps        %ymm12,%ymm11,%ymm15
   .byte  196,65,44,92,217                    // vsubps        %ymm9,%ymm10,%ymm11
-  .byte  196,98,125,24,45,234,148,2,0        // vbroadcastss  0x294ea(%rip),%ymm13        # 2ae40 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  .byte  196,98,125,24,45,74,152,2,0         // vbroadcastss  0x2984a(%rip),%ymm13        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   .byte  196,193,4,89,197                    // vmulps        %ymm13,%ymm15,%ymm0
-  .byte  196,98,125,24,53,228,148,2,0        // vbroadcastss  0x294e4(%rip),%ymm14        # 2ae48 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
+  .byte  196,98,125,24,53,68,152,2,0         // vbroadcastss  0x29844(%rip),%ymm14        # 2b1a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
   .byte  197,12,92,224                       // vsubps        %ymm0,%ymm14,%ymm12
   .byte  196,66,37,168,225                   // vfmadd213ps   %ymm9,%ymm11,%ymm12
-  .byte  196,226,125,24,29,222,148,2,0       // vbroadcastss  0x294de(%rip),%ymm3        # 2ae54 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  .byte  196,226,125,24,29,62,152,2,0        // vbroadcastss  0x2983e(%rip),%ymm3        # 2b1b4 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   .byte  196,193,100,194,255,2               // vcmpleps      %ymm15,%ymm3,%ymm7
   .byte  196,195,29,74,249,112               // vblendvps     %ymm7,%ymm9,%ymm12,%ymm7
   .byte  196,65,60,194,231,2                 // vcmpleps      %ymm15,%ymm8,%ymm12
   .byte  196,227,45,74,255,192               // vblendvps     %ymm12,%ymm7,%ymm10,%ymm7
-  .byte  196,98,125,24,37,181,148,2,0        // vbroadcastss  0x294b5(%rip),%ymm12        # 2ae4c <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  .byte  196,98,125,24,37,21,152,2,0         // vbroadcastss  0x29815(%rip),%ymm12        # 2b1ac <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
   .byte  196,65,28,194,255,2                 // vcmpleps      %ymm15,%ymm12,%ymm15
   .byte  196,194,37,168,193                  // vfmadd213ps   %ymm9,%ymm11,%ymm0
   .byte  196,99,125,74,255,240               // vblendvps     %ymm15,%ymm7,%ymm0,%ymm15
@@ -11001,7 +11039,7 @@
   .byte  197,156,194,192,2                   // vcmpleps      %ymm0,%ymm12,%ymm0
   .byte  196,194,37,168,249                  // vfmadd213ps   %ymm9,%ymm11,%ymm7
   .byte  196,227,69,74,201,0                 // vblendvps     %ymm0,%ymm1,%ymm7,%ymm1
-  .byte  196,226,125,24,5,105,148,2,0        // vbroadcastss  0x29469(%rip),%ymm0        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,226,125,24,5,201,151,2,0        // vbroadcastss  0x297c9(%rip),%ymm0        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   .byte  197,220,88,192                      // vaddps        %ymm0,%ymm4,%ymm0
   .byte  196,227,125,8,224,1                 // vroundps      $0x1,%ymm0,%ymm4
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
@@ -11055,10 +11093,10 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  117,58                              // jne           1ade <_sk_scale_u8_hsw+0x52>
   .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,206,148,2,0            // vpand         0x294ce(%rip),%xmm8,%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,57,219,5,46,152,2,0             // vpand         0x2982e(%rip),%xmm8,%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,151,147,2,0        // vbroadcastss  0x29397(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,247,150,2,0        // vbroadcastss  0x296f7(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -11107,7 +11145,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf001b88 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd75ec>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf001b88 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd728c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -11133,20 +11171,20 @@
   .byte  15,133,161,0,0,0                    // jne           1c54 <_sk_scale_565_hsw+0xc0>
   .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
-  .byte  196,98,125,88,13,153,146,2,0        // vpbroadcastd  0x29299(%rip),%ymm9        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,98,125,88,13,249,149,2,0        // vpbroadcastd  0x295f9(%rip),%ymm9        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  196,65,61,219,201                   // vpand         %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,138,146,2,0        // vbroadcastss  0x2928a(%rip),%ymm10        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,98,125,24,21,234,149,2,0        // vbroadcastss  0x295ea(%rip),%ymm10        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,88,21,128,146,2,0        // vpbroadcastd  0x29280(%rip),%ymm10        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,98,125,88,21,224,149,2,0        // vpbroadcastd  0x295e0(%rip),%ymm10        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,113,146,2,0        // vbroadcastss  0x29271(%rip),%ymm11        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,98,125,24,29,209,149,2,0        // vbroadcastss  0x295d1(%rip),%ymm11        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,88,29,103,146,2,0        // vpbroadcastd  0x29267(%rip),%ymm11        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,98,125,88,29,199,149,2,0        // vpbroadcastd  0x295c7(%rip),%ymm11        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  196,65,61,219,195                   // vpand         %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,88,146,2,0         // vbroadcastss  0x29258(%rip),%ymm11        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,98,125,24,29,184,149,2,0        // vbroadcastss  0x295b8(%rip),%ymm11        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -11237,10 +11275,10 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  117,78                              // jne           1d8d <_sk_lerp_u8_hsw+0x66>
   .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,51,146,2,0             // vpand         0x29233(%rip),%xmm8,%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,57,219,5,147,149,2,0            // vpand         0x29593(%rip),%xmm8,%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,252,144,2,0        // vbroadcastss  0x290fc(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,92,148,2,0         // vbroadcastss  0x2945c(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
   .byte  196,226,61,168,196                  // vfmadd213ps   %ymm4,%ymm8,%ymm0
@@ -11292,7 +11330,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde001e38 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd789c>
+  .byte  232,255,255,255,221                 // callq         ffffffffde001e38 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd753c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,210                             // callq         *%rdx
@@ -11318,20 +11356,20 @@
   .byte  15,133,181,0,0,0                    // jne           1f18 <_sk_lerp_565_hsw+0xd4>
   .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
   .byte  196,66,125,51,192                   // vpmovzxwd     %xmm8,%ymm8
-  .byte  196,98,125,88,13,233,143,2,0        // vpbroadcastd  0x28fe9(%rip),%ymm9        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,98,125,88,13,73,147,2,0         // vpbroadcastd  0x29349(%rip),%ymm9        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  196,65,61,219,201                   // vpand         %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,218,143,2,0        // vbroadcastss  0x28fda(%rip),%ymm10        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,98,125,24,21,58,147,2,0         // vbroadcastss  0x2933a(%rip),%ymm10        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,88,21,208,143,2,0        // vpbroadcastd  0x28fd0(%rip),%ymm10        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,98,125,88,21,48,147,2,0         // vpbroadcastd  0x29330(%rip),%ymm10        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  196,65,61,219,210                   // vpand         %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,193,143,2,0        // vbroadcastss  0x28fc1(%rip),%ymm11        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,98,125,24,29,33,147,2,0         // vbroadcastss  0x29321(%rip),%ymm11        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,88,29,183,143,2,0        // vpbroadcastd  0x28fb7(%rip),%ymm11        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,98,125,88,29,23,147,2,0         // vpbroadcastd  0x29317(%rip),%ymm11        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  196,65,61,219,195                   // vpand         %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,168,143,2,0        // vbroadcastss  0x28fa8(%rip),%ymm11        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,98,125,24,29,8,147,2,0          // vbroadcastss  0x29308(%rip),%ymm11        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -11405,7 +11443,7 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  117,116                             // jne           203a <_sk_load_tables_hsw+0x7e>
   .byte  196,193,126,111,28,144              // vmovdqu       (%r8,%rdx,4),%ymm3
-  .byte  197,229,219,13,44,137,2,0           // vpand         0x2892c(%rip),%ymm3,%ymm1        # 2a900 <_sk_srcover_rgba_8888_sse2_lowp+0x364>
+  .byte  197,229,219,13,140,140,2,0          // vpand         0x28c8c(%rip),%ymm3,%ymm1        # 2ac60 <_sk_srcover_rgba_8888_sse2_lowp+0x364>
   .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  76,139,72,16                        // mov           0x10(%rax),%r9
@@ -11413,16 +11451,16 @@
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
   .byte  196,194,53,146,4,136                // vgatherdps    %ymm9,(%r8,%ymm1,4),%ymm0
-  .byte  196,98,101,0,13,35,137,2,0          // vpshufb       0x28923(%rip),%ymm3,%ymm9        # 2a920 <_sk_srcover_rgba_8888_sse2_lowp+0x384>
+  .byte  196,98,101,0,13,131,140,2,0         // vpshufb       0x28c83(%rip),%ymm3,%ymm9        # 2ac80 <_sk_srcover_rgba_8888_sse2_lowp+0x384>
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,65,45,118,210                   // vpcmpeqd      %ymm10,%ymm10,%ymm10
   .byte  196,130,45,146,12,137               // vgatherdps    %ymm10,(%r9,%ymm9,4),%ymm1
   .byte  72,139,64,24                        // mov           0x18(%rax),%rax
-  .byte  196,98,101,0,13,39,137,2,0          // vpshufb       0x28927(%rip),%ymm3,%ymm9        # 2a940 <_sk_srcover_rgba_8888_sse2_lowp+0x3a4>
+  .byte  196,98,101,0,13,135,140,2,0         // vpshufb       0x28c87(%rip),%ymm3,%ymm9        # 2aca0 <_sk_srcover_rgba_8888_sse2_lowp+0x3a4>
   .byte  196,162,61,146,20,136               // vgatherdps    %ymm8,(%rax,%ymm9,4),%ymm2
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,43,142,2,0          // vbroadcastss  0x28e2b(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,139,145,2,0         // vbroadcastss  0x2918b(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -11503,7 +11541,7 @@
   .byte  197,185,108,200                     // vpunpcklqdq   %xmm0,%xmm8,%xmm1
   .byte  197,57,109,192                      // vpunpckhqdq   %xmm0,%xmm8,%xmm8
   .byte  196,65,49,108,214                   // vpunpcklqdq   %xmm14,%xmm9,%xmm10
-  .byte  197,121,111,29,20,142,2,0           // vmovdqa       0x28e14(%rip),%xmm11        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,121,111,29,116,145,2,0          // vmovdqa       0x29174(%rip),%xmm11        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,193,113,219,195                 // vpand         %xmm11,%xmm1,%xmm0
   .byte  196,226,125,51,200                  // vpmovzxwd     %xmm0,%ymm1
   .byte  196,65,29,118,228                   // vpcmpeqd      %ymm12,%ymm12,%ymm12
@@ -11528,7 +11566,7 @@
   .byte  197,185,235,219                     // vpor          %xmm3,%xmm8,%xmm3
   .byte  196,226,125,51,219                  // vpmovzxwd     %xmm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,144,140,2,0         // vbroadcastss  0x28c90(%rip),%ymm8        # 2ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  .byte  196,98,125,24,5,240,143,2,0         // vbroadcastss  0x28ff0(%rip),%ymm8        # 2b1d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -11588,7 +11626,7 @@
   .byte  197,105,108,192                     // vpunpcklqdq   %xmm0,%xmm2,%xmm8
   .byte  197,241,108,195                     // vpunpcklqdq   %xmm3,%xmm1,%xmm0
   .byte  197,241,109,203                     // vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  .byte  197,249,111,29,148,140,2,0          // vmovdqa       0x28c94(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,249,111,29,244,143,2,0          // vmovdqa       0x28ff4(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  197,249,219,195                     // vpand         %xmm3,%xmm0,%xmm0
   .byte  196,98,125,51,200                   // vpmovzxwd     %xmm0,%ymm9
   .byte  196,65,45,118,210                   // vpcmpeqd      %ymm10,%ymm10,%ymm10
@@ -11608,7 +11646,7 @@
   .byte  196,226,125,51,219                  // vpmovzxwd     %xmm3,%ymm3
   .byte  196,226,45,146,20,152               // vgatherdps    %ymm10,(%rax,%ymm3,4),%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,157,138,2,0       // vbroadcastss  0x28a9d(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,253,141,2,0       // vbroadcastss  0x28dfd(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,4,72                // vmovd         (%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
@@ -11677,7 +11715,7 @@
 FUNCTION(_sk_byte_tables_hsw)
 _sk_byte_tables_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,146,137,2,0         // vbroadcastss  0x28992(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,242,140,2,0         // vbroadcastss  0x28cf2(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,125,91,200                      // vcvtps2dq     %ymm0,%ymm9
   .byte  196,65,249,126,200                  // vmovq         %xmm9,%r8
@@ -11807,7 +11845,7 @@
   .byte  67,15,182,4,17                      // movzbl        (%r9,%r10,1),%eax
   .byte  196,194,125,49,193                  // vpmovzxbd     %xmm9,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,96,135,2,0          // vbroadcastss  0x28760(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,192,138,2,0         // vbroadcastss  0x28ac0(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,226,125,49,201                  // vpmovzxbd     %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
@@ -11929,7 +11967,7 @@
   .byte  67,15,182,4,17                      // movzbl        (%r9,%r10,1),%eax
   .byte  196,194,125,49,193                  // vpmovzxbd     %xmm9,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,52,133,2,0          // vbroadcastss  0x28534(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,148,136,2,0         // vbroadcastss  0x28894(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,226,125,49,201                  // vpmovzxbd     %xmm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
@@ -12032,33 +12070,33 @@
   .byte  196,66,125,168,211                  // vfmadd213ps   %ymm11,%ymm0,%ymm10
   .byte  196,226,125,24,0                    // vbroadcastss  (%rax),%ymm0
   .byte  196,65,124,91,218                   // vcvtdq2ps     %ymm10,%ymm11
-  .byte  196,98,125,24,37,26,132,2,0         // vbroadcastss  0x2841a(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
-  .byte  196,98,125,24,45,21,132,2,0         // vbroadcastss  0x28415(%rip),%ymm13        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,122,135,2,0        // vbroadcastss  0x2877a(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,45,117,135,2,0        // vbroadcastss  0x28775(%rip),%ymm13        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,65,44,84,213                    // vandps        %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,107,131,2,0        // vbroadcastss  0x2836b(%rip),%ymm13        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,45,203,134,2,0        // vbroadcastss  0x286cb(%rip),%ymm13        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,44,86,213                    // vorps         %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,253,131,2,0        // vbroadcastss  0x283fd(%rip),%ymm13        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,45,93,135,2,0         // vbroadcastss  0x2875d(%rip),%ymm13        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,66,37,184,236                   // vfmadd231ps   %ymm12,%ymm11,%ymm13
-  .byte  196,98,125,24,29,243,131,2,0        // vbroadcastss  0x283f3(%rip),%ymm11        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,29,83,135,2,0         // vbroadcastss  0x28753(%rip),%ymm11        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,66,45,172,221                   // vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  .byte  196,98,125,24,37,233,131,2,0        // vbroadcastss  0x283e9(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,73,135,2,0         // vbroadcastss  0x28749(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,223,131,2,0        // vbroadcastss  0x283df(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,63,135,2,0         // vbroadcastss  0x2873f(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  196,65,28,94,210                    // vdivps        %ymm10,%ymm12,%ymm10
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  196,99,125,8,208,1                  // vroundps      $0x1,%ymm0,%ymm10
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  196,98,125,24,29,192,131,2,0        // vbroadcastss  0x283c0(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,32,135,2,0         // vbroadcastss  0x28720(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,124,88,195                  // vaddps        %ymm11,%ymm0,%ymm0
-  .byte  196,98,125,24,29,182,131,2,0        // vbroadcastss  0x283b6(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,22,135,2,0         // vbroadcastss  0x28716(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,98,45,172,216                   // vfnmadd213ps  %ymm0,%ymm10,%ymm11
-  .byte  196,226,125,24,5,172,131,2,0        // vbroadcastss  0x283ac(%rip),%ymm0        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,226,125,24,5,12,135,2,0         // vbroadcastss  0x2870c(%rip),%ymm0        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,193,124,92,194                  // vsubps        %ymm10,%ymm0,%ymm0
-  .byte  196,98,125,24,21,162,131,2,0        // vbroadcastss  0x283a2(%rip),%ymm10        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,21,2,135,2,0          // vbroadcastss  0x28702(%rip),%ymm10        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  197,172,94,192                      // vdivps        %ymm0,%ymm10,%ymm0
   .byte  197,164,88,192                      // vaddps        %ymm0,%ymm11,%ymm0
-  .byte  196,98,125,24,21,149,131,2,0        // vbroadcastss  0x28395(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,245,134,2,0        // vbroadcastss  0x286f5(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -12066,7 +12104,7 @@
   .byte  196,195,125,74,193,128              // vblendvps     %ymm8,%ymm9,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,173,130,2,0         // vbroadcastss  0x282ad(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,13,134,2,0          // vbroadcastss  0x2860d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -12086,33 +12124,33 @@
   .byte  196,66,117,168,211                  // vfmadd213ps   %ymm11,%ymm1,%ymm10
   .byte  196,226,125,24,8                    // vbroadcastss  (%rax),%ymm1
   .byte  196,65,124,91,218                   // vcvtdq2ps     %ymm10,%ymm11
-  .byte  196,98,125,24,37,245,130,2,0        // vbroadcastss  0x282f5(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
-  .byte  196,98,125,24,45,240,130,2,0        // vbroadcastss  0x282f0(%rip),%ymm13        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,85,134,2,0         // vbroadcastss  0x28655(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,45,80,134,2,0         // vbroadcastss  0x28650(%rip),%ymm13        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,65,44,84,213                    // vandps        %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,70,130,2,0         // vbroadcastss  0x28246(%rip),%ymm13        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,45,166,133,2,0        // vbroadcastss  0x285a6(%rip),%ymm13        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,44,86,213                    // vorps         %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,216,130,2,0        // vbroadcastss  0x282d8(%rip),%ymm13        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,45,56,134,2,0         // vbroadcastss  0x28638(%rip),%ymm13        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,66,37,184,236                   // vfmadd231ps   %ymm12,%ymm11,%ymm13
-  .byte  196,98,125,24,29,206,130,2,0        // vbroadcastss  0x282ce(%rip),%ymm11        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,29,46,134,2,0         // vbroadcastss  0x2862e(%rip),%ymm11        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,66,45,172,221                   // vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  .byte  196,98,125,24,37,196,130,2,0        // vbroadcastss  0x282c4(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,36,134,2,0         // vbroadcastss  0x28624(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,186,130,2,0        // vbroadcastss  0x282ba(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,26,134,2,0         // vbroadcastss  0x2861a(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  196,65,28,94,210                    // vdivps        %ymm10,%ymm12,%ymm10
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
   .byte  196,99,125,8,209,1                  // vroundps      $0x1,%ymm1,%ymm10
   .byte  196,65,116,92,210                   // vsubps        %ymm10,%ymm1,%ymm10
-  .byte  196,98,125,24,29,155,130,2,0        // vbroadcastss  0x2829b(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,251,133,2,0        // vbroadcastss  0x285fb(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,145,130,2,0        // vbroadcastss  0x28291(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,241,133,2,0        // vbroadcastss  0x285f1(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,98,45,172,217                   // vfnmadd213ps  %ymm1,%ymm10,%ymm11
-  .byte  196,226,125,24,13,135,130,2,0       // vbroadcastss  0x28287(%rip),%ymm1        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,226,125,24,13,231,133,2,0       // vbroadcastss  0x285e7(%rip),%ymm1        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,193,116,92,202                  // vsubps        %ymm10,%ymm1,%ymm1
-  .byte  196,98,125,24,21,125,130,2,0        // vbroadcastss  0x2827d(%rip),%ymm10        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,21,221,133,2,0        // vbroadcastss  0x285dd(%rip),%ymm10        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  197,172,94,201                      // vdivps        %ymm1,%ymm10,%ymm1
   .byte  197,164,88,201                      // vaddps        %ymm1,%ymm11,%ymm1
-  .byte  196,98,125,24,21,112,130,2,0        // vbroadcastss  0x28270(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,208,133,2,0        // vbroadcastss  0x285d0(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
   .byte  197,253,91,201                      // vcvtps2dq     %ymm1,%ymm1
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -12120,7 +12158,7 @@
   .byte  196,195,117,74,201,128              // vblendvps     %ymm8,%ymm9,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,116,95,200                  // vmaxps        %ymm8,%ymm1,%ymm1
-  .byte  196,98,125,24,5,136,129,2,0         // vbroadcastss  0x28188(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,232,132,2,0         // vbroadcastss  0x284e8(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -12140,33 +12178,33 @@
   .byte  196,66,109,168,211                  // vfmadd213ps   %ymm11,%ymm2,%ymm10
   .byte  196,226,125,24,16                   // vbroadcastss  (%rax),%ymm2
   .byte  196,65,124,91,218                   // vcvtdq2ps     %ymm10,%ymm11
-  .byte  196,98,125,24,37,208,129,2,0        // vbroadcastss  0x281d0(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
-  .byte  196,98,125,24,45,203,129,2,0        // vbroadcastss  0x281cb(%rip),%ymm13        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,48,133,2,0         // vbroadcastss  0x28530(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,45,43,133,2,0         // vbroadcastss  0x2852b(%rip),%ymm13        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,65,44,84,213                    // vandps        %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,33,129,2,0         // vbroadcastss  0x28121(%rip),%ymm13        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,45,129,132,2,0        // vbroadcastss  0x28481(%rip),%ymm13        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,44,86,213                    // vorps         %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,179,129,2,0        // vbroadcastss  0x281b3(%rip),%ymm13        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,45,19,133,2,0         // vbroadcastss  0x28513(%rip),%ymm13        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,66,37,184,236                   // vfmadd231ps   %ymm12,%ymm11,%ymm13
-  .byte  196,98,125,24,29,169,129,2,0        // vbroadcastss  0x281a9(%rip),%ymm11        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,29,9,133,2,0          // vbroadcastss  0x28509(%rip),%ymm11        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,66,45,172,221                   // vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  .byte  196,98,125,24,37,159,129,2,0        // vbroadcastss  0x2819f(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,255,132,2,0        // vbroadcastss  0x284ff(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,149,129,2,0        // vbroadcastss  0x28195(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,245,132,2,0        // vbroadcastss  0x284f5(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  196,65,28,94,210                    // vdivps        %ymm10,%ymm12,%ymm10
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
   .byte  196,193,108,89,210                  // vmulps        %ymm10,%ymm2,%ymm2
   .byte  196,99,125,8,210,1                  // vroundps      $0x1,%ymm2,%ymm10
   .byte  196,65,108,92,210                   // vsubps        %ymm10,%ymm2,%ymm10
-  .byte  196,98,125,24,29,118,129,2,0        // vbroadcastss  0x28176(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,214,132,2,0        // vbroadcastss  0x284d6(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
-  .byte  196,98,125,24,29,108,129,2,0        // vbroadcastss  0x2816c(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,204,132,2,0        // vbroadcastss  0x284cc(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,98,45,172,218                   // vfnmadd213ps  %ymm2,%ymm10,%ymm11
-  .byte  196,226,125,24,21,98,129,2,0        // vbroadcastss  0x28162(%rip),%ymm2        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,226,125,24,21,194,132,2,0       // vbroadcastss  0x284c2(%rip),%ymm2        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,193,108,92,210                  // vsubps        %ymm10,%ymm2,%ymm2
-  .byte  196,98,125,24,21,88,129,2,0         // vbroadcastss  0x28158(%rip),%ymm10        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,21,184,132,2,0        // vbroadcastss  0x284b8(%rip),%ymm10        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  197,172,94,210                      // vdivps        %ymm2,%ymm10,%ymm2
   .byte  197,164,88,210                      // vaddps        %ymm2,%ymm11,%ymm2
-  .byte  196,98,125,24,21,75,129,2,0         // vbroadcastss  0x2814b(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,171,132,2,0        // vbroadcastss  0x284ab(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,108,89,210                  // vmulps        %ymm10,%ymm2,%ymm2
   .byte  197,253,91,210                      // vcvtps2dq     %ymm2,%ymm2
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -12174,7 +12212,7 @@
   .byte  196,195,109,74,209,128              // vblendvps     %ymm8,%ymm9,%ymm2,%ymm2
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,108,95,208                  // vmaxps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,99,128,2,0          // vbroadcastss  0x28063(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,195,131,2,0         // vbroadcastss  0x283c3(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -12194,33 +12232,33 @@
   .byte  196,66,101,168,211                  // vfmadd213ps   %ymm11,%ymm3,%ymm10
   .byte  196,226,125,24,24                   // vbroadcastss  (%rax),%ymm3
   .byte  196,65,124,91,218                   // vcvtdq2ps     %ymm10,%ymm11
-  .byte  196,98,125,24,37,171,128,2,0        // vbroadcastss  0x280ab(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
-  .byte  196,98,125,24,45,166,128,2,0        // vbroadcastss  0x280a6(%rip),%ymm13        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,11,132,2,0         // vbroadcastss  0x2840b(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,45,6,132,2,0          // vbroadcastss  0x28406(%rip),%ymm13        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,65,44,84,213                    // vandps        %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,252,127,2,0        // vbroadcastss  0x27ffc(%rip),%ymm13        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,45,92,131,2,0         // vbroadcastss  0x2835c(%rip),%ymm13        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,44,86,213                    // vorps         %ymm13,%ymm10,%ymm10
-  .byte  196,98,125,24,45,142,128,2,0        // vbroadcastss  0x2808e(%rip),%ymm13        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,45,238,131,2,0        // vbroadcastss  0x283ee(%rip),%ymm13        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,66,37,184,236                   // vfmadd231ps   %ymm12,%ymm11,%ymm13
-  .byte  196,98,125,24,29,132,128,2,0        // vbroadcastss  0x28084(%rip),%ymm11        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,29,228,131,2,0        // vbroadcastss  0x283e4(%rip),%ymm11        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,66,45,172,221                   // vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  .byte  196,98,125,24,37,122,128,2,0        // vbroadcastss  0x2807a(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,218,131,2,0        // vbroadcastss  0x283da(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,112,128,2,0        // vbroadcastss  0x28070(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,208,131,2,0        // vbroadcastss  0x283d0(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  196,65,28,94,210                    // vdivps        %ymm10,%ymm12,%ymm10
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
   .byte  196,193,100,89,218                  // vmulps        %ymm10,%ymm3,%ymm3
   .byte  196,99,125,8,211,1                  // vroundps      $0x1,%ymm3,%ymm10
   .byte  196,65,100,92,210                   // vsubps        %ymm10,%ymm3,%ymm10
-  .byte  196,98,125,24,29,81,128,2,0         // vbroadcastss  0x28051(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,177,131,2,0        // vbroadcastss  0x283b1(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,100,88,219                  // vaddps        %ymm11,%ymm3,%ymm3
-  .byte  196,98,125,24,29,71,128,2,0         // vbroadcastss  0x28047(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,167,131,2,0        // vbroadcastss  0x283a7(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,98,45,172,219                   // vfnmadd213ps  %ymm3,%ymm10,%ymm11
-  .byte  196,226,125,24,29,61,128,2,0        // vbroadcastss  0x2803d(%rip),%ymm3        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,226,125,24,29,157,131,2,0       // vbroadcastss  0x2839d(%rip),%ymm3        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,193,100,92,218                  // vsubps        %ymm10,%ymm3,%ymm3
-  .byte  196,98,125,24,21,51,128,2,0         // vbroadcastss  0x28033(%rip),%ymm10        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,21,147,131,2,0        // vbroadcastss  0x28393(%rip),%ymm10        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  197,172,94,219                      // vdivps        %ymm3,%ymm10,%ymm3
   .byte  197,164,88,219                      // vaddps        %ymm3,%ymm11,%ymm3
-  .byte  196,98,125,24,21,38,128,2,0         // vbroadcastss  0x28026(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,134,131,2,0        // vbroadcastss  0x28386(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,100,89,218                  // vmulps        %ymm10,%ymm3,%ymm3
   .byte  197,253,91,219                      // vcvtps2dq     %ymm3,%ymm3
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -12228,7 +12266,7 @@
   .byte  196,195,101,74,217,128              // vblendvps     %ymm8,%ymm9,%ymm3,%ymm3
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,100,95,216                  // vmaxps        %ymm8,%ymm3,%ymm3
-  .byte  196,98,125,24,5,62,127,2,0          // vbroadcastss  0x27f3e(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,158,130,2,0         // vbroadcastss  0x2829e(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -12247,35 +12285,35 @@
   .byte  197,252,40,241                      // vmovaps       %ymm1,%ymm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,124,91,208                      // vcvtdq2ps     %ymm0,%ymm10
-  .byte  196,98,125,24,29,145,127,2,0        // vbroadcastss  0x27f91(%rip),%ymm11        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
-  .byte  196,226,125,24,45,140,127,2,0       // vbroadcastss  0x27f8c(%rip),%ymm5        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,29,241,130,2,0        // vbroadcastss  0x282f1(%rip),%ymm11        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,226,125,24,45,236,130,2,0       // vbroadcastss  0x282ec(%rip),%ymm5        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  197,124,84,205                      // vandps        %ymm5,%ymm0,%ymm9
-  .byte  196,226,125,24,37,227,126,2,0       // vbroadcastss  0x27ee3(%rip),%ymm4        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,37,67,130,2,0        // vbroadcastss  0x28243(%rip),%ymm4        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,52,86,228                       // vorps         %ymm4,%ymm9,%ymm12
-  .byte  196,98,125,24,45,118,127,2,0        // vbroadcastss  0x27f76(%rip),%ymm13        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,45,214,130,2,0        // vbroadcastss  0x282d6(%rip),%ymm13        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,66,37,168,213                   // vfmadd213ps   %ymm13,%ymm11,%ymm10
-  .byte  196,98,125,24,13,108,127,2,0        // vbroadcastss  0x27f6c(%rip),%ymm9        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,13,204,130,2,0        // vbroadcastss  0x282cc(%rip),%ymm9        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,66,29,188,209                   // vfnmadd231ps  %ymm9,%ymm12,%ymm10
   .byte  197,124,91,246                      // vcvtdq2ps     %ymm6,%ymm14
   .byte  196,66,37,168,245                   // vfmadd213ps   %ymm13,%ymm11,%ymm14
   .byte  197,124,91,255                      // vcvtdq2ps     %ymm7,%ymm15
   .byte  196,66,37,168,253                   // vfmadd213ps   %ymm13,%ymm11,%ymm15
-  .byte  196,98,125,24,29,80,127,2,0         // vbroadcastss  0x27f50(%rip),%ymm11        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,29,176,130,2,0        // vbroadcastss  0x282b0(%rip),%ymm11        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,65,28,88,227                    // vaddps        %ymm11,%ymm12,%ymm12
-  .byte  196,98,125,24,45,70,127,2,0         // vbroadcastss  0x27f46(%rip),%ymm13        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,45,166,130,2,0        // vbroadcastss  0x282a6(%rip),%ymm13        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  196,65,20,94,228                    // vdivps        %ymm12,%ymm13,%ymm12
   .byte  196,65,44,92,212                    // vsubps        %ymm12,%ymm10,%ymm10
   .byte  196,98,125,24,32                    // vbroadcastss  (%rax),%ymm12
   .byte  196,65,44,89,212                    // vmulps        %ymm12,%ymm10,%ymm10
   .byte  196,67,125,8,194,1                  // vroundps      $0x1,%ymm10,%ymm8
   .byte  196,65,44,92,192                    // vsubps        %ymm8,%ymm10,%ymm8
-  .byte  196,226,125,24,21,34,127,2,0        // vbroadcastss  0x27f22(%rip),%ymm2        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,226,125,24,21,130,130,2,0       // vbroadcastss  0x28282(%rip),%ymm2        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  197,44,88,210                       // vaddps        %ymm2,%ymm10,%ymm10
-  .byte  196,226,125,24,29,25,127,2,0        // vbroadcastss  0x27f19(%rip),%ymm3        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,226,125,24,29,121,130,2,0       // vbroadcastss  0x28279(%rip),%ymm3        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,98,61,188,211                   // vfnmadd231ps  %ymm3,%ymm8,%ymm10
-  .byte  196,226,125,24,13,15,127,2,0        // vbroadcastss  0x27f0f(%rip),%ymm1        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,226,125,24,13,111,130,2,0       // vbroadcastss  0x2826f(%rip),%ymm1        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,65,116,92,192                   // vsubps        %ymm8,%ymm1,%ymm8
-  .byte  196,226,125,24,5,5,127,2,0          // vbroadcastss  0x27f05(%rip),%ymm0        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,226,125,24,5,101,130,2,0        // vbroadcastss  0x28265(%rip),%ymm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  196,65,124,94,192                   // vdivps        %ymm8,%ymm0,%ymm8
   .byte  196,65,44,88,192                    // vaddps        %ymm8,%ymm10,%ymm8
   .byte  197,204,84,245                      // vandps        %ymm5,%ymm6,%ymm6
@@ -12306,7 +12344,7 @@
   .byte  197,244,92,205                      // vsubps        %ymm5,%ymm1,%ymm1
   .byte  197,252,94,193                      // vdivps        %ymm1,%ymm0,%ymm0
   .byte  197,236,88,192                      // vaddps        %ymm0,%ymm2,%ymm0
-  .byte  196,226,125,24,13,118,126,2,0       // vbroadcastss  0x27e76(%rip),%ymm1        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,226,125,24,13,214,129,2,0       // vbroadcastss  0x281d6(%rip),%ymm1        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  197,188,89,209                      // vmulps        %ymm1,%ymm8,%ymm2
   .byte  197,204,89,217                      // vmulps        %ymm1,%ymm6,%ymm3
   .byte  197,252,89,225                      // vmulps        %ymm1,%ymm0,%ymm4
@@ -12326,26 +12364,26 @@
 .globl _sk_lab_to_xyz_hsw
 FUNCTION(_sk_lab_to_xyz_hsw)
 _sk_lab_to_xyz_hsw:
-  .byte  196,98,125,24,5,52,126,2,0          // vbroadcastss  0x27e34(%rip),%ymm8        # 2aea8 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
-  .byte  196,98,125,24,13,151,125,2,0        // vbroadcastss  0x27d97(%rip),%ymm9        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  196,98,125,24,21,38,126,2,0         // vbroadcastss  0x27e26(%rip),%ymm10        # 2aeac <_sk_srcover_rgba_8888_sse2_lowp+0x910>
+  .byte  196,98,125,24,5,148,129,2,0         // vbroadcastss  0x28194(%rip),%ymm8        # 2b208 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
+  .byte  196,98,125,24,13,247,128,2,0        // vbroadcastss  0x280f7(%rip),%ymm9        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,21,134,129,2,0        // vbroadcastss  0x28186(%rip),%ymm10        # 2b20c <_sk_srcover_rgba_8888_sse2_lowp+0x910>
   .byte  196,194,53,168,202                  // vfmadd213ps   %ymm10,%ymm9,%ymm1
   .byte  196,194,53,168,210                  // vfmadd213ps   %ymm10,%ymm9,%ymm2
-  .byte  196,98,125,24,13,23,126,2,0         // vbroadcastss  0x27e17(%rip),%ymm9        # 2aeb0 <_sk_srcover_rgba_8888_sse2_lowp+0x914>
+  .byte  196,98,125,24,13,119,129,2,0        // vbroadcastss  0x28177(%rip),%ymm9        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0x914>
   .byte  196,66,125,184,200                  // vfmadd231ps   %ymm8,%ymm0,%ymm9
-  .byte  196,226,125,24,5,13,126,2,0         // vbroadcastss  0x27e0d(%rip),%ymm0        # 2aeb4 <_sk_srcover_rgba_8888_sse2_lowp+0x918>
+  .byte  196,226,125,24,5,109,129,2,0        // vbroadcastss  0x2816d(%rip),%ymm0        # 2b214 <_sk_srcover_rgba_8888_sse2_lowp+0x918>
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
-  .byte  196,98,125,24,5,4,126,2,0           // vbroadcastss  0x27e04(%rip),%ymm8        # 2aeb8 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
+  .byte  196,98,125,24,5,100,129,2,0         // vbroadcastss  0x28164(%rip),%ymm8        # 2b218 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
   .byte  196,98,117,168,192                  // vfmadd213ps   %ymm0,%ymm1,%ymm8
-  .byte  196,98,125,24,13,250,125,2,0        // vbroadcastss  0x27dfa(%rip),%ymm9        # 2aebc <_sk_srcover_rgba_8888_sse2_lowp+0x920>
+  .byte  196,98,125,24,13,90,129,2,0         // vbroadcastss  0x2815a(%rip),%ymm9        # 2b21c <_sk_srcover_rgba_8888_sse2_lowp+0x920>
   .byte  196,98,109,172,200                  // vfnmadd213ps  %ymm0,%ymm2,%ymm9
   .byte  196,193,60,89,200                   // vmulps        %ymm8,%ymm8,%ymm1
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
-  .byte  196,226,125,24,21,231,125,2,0       // vbroadcastss  0x27de7(%rip),%ymm2        # 2aec0 <_sk_srcover_rgba_8888_sse2_lowp+0x924>
+  .byte  196,226,125,24,21,71,129,2,0        // vbroadcastss  0x28147(%rip),%ymm2        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0x924>
   .byte  197,108,194,209,1                   // vcmpltps      %ymm1,%ymm2,%ymm10
-  .byte  196,98,125,24,29,221,125,2,0        // vbroadcastss  0x27ddd(%rip),%ymm11        # 2aec4 <_sk_srcover_rgba_8888_sse2_lowp+0x928>
+  .byte  196,98,125,24,29,61,129,2,0         // vbroadcastss  0x2813d(%rip),%ymm11        # 2b224 <_sk_srcover_rgba_8888_sse2_lowp+0x928>
   .byte  196,65,60,88,195                    // vaddps        %ymm11,%ymm8,%ymm8
-  .byte  196,98,125,24,37,211,125,2,0        // vbroadcastss  0x27dd3(%rip),%ymm12        # 2aec8 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
+  .byte  196,98,125,24,37,51,129,2,0         // vbroadcastss  0x28133(%rip),%ymm12        # 2b228 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
   .byte  196,65,60,89,196                    // vmulps        %ymm12,%ymm8,%ymm8
   .byte  196,99,61,74,193,160                // vblendvps     %ymm10,%ymm1,%ymm8,%ymm8
   .byte  197,252,89,200                      // vmulps        %ymm0,%ymm0,%ymm1
@@ -12360,9 +12398,9 @@
   .byte  196,65,52,88,203                    // vaddps        %ymm11,%ymm9,%ymm9
   .byte  196,65,52,89,204                    // vmulps        %ymm12,%ymm9,%ymm9
   .byte  196,227,53,74,208,32                // vblendvps     %ymm2,%ymm0,%ymm9,%ymm2
-  .byte  196,226,125,24,5,136,125,2,0        // vbroadcastss  0x27d88(%rip),%ymm0        # 2aecc <_sk_srcover_rgba_8888_sse2_lowp+0x930>
+  .byte  196,226,125,24,5,232,128,2,0        // vbroadcastss  0x280e8(%rip),%ymm0        # 2b22c <_sk_srcover_rgba_8888_sse2_lowp+0x930>
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,127,125,2,0         // vbroadcastss  0x27d7f(%rip),%ymm8        # 2aed0 <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  .byte  196,98,125,24,5,223,128,2,0         // vbroadcastss  0x280df(%rip),%ymm8        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0x934>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -12380,10 +12418,10 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  117,52                              // jne           31a6 <_sk_load_a8_hsw+0x4c>
   .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,0,126,2,0             // vpand         0x27e00(%rip),%xmm0,%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,249,219,5,96,129,2,0            // vpand         0x28160(%rip),%xmm0,%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,202,124,2,0       // vbroadcastss  0x27cca(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,42,128,2,0        // vbroadcastss  0x2802a(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -12456,10 +12494,10 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  117,52                              // jne           32a4 <_sk_load_a8_dst_hsw+0x4c>
   .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,2,125,2,0            // vpand         0x27d02(%rip),%xmm4,%xmm4        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,217,219,37,98,128,2,0           // vpand         0x28062(%rip),%xmm4,%xmm4        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,125,51,228                  // vpmovzxwd     %xmm4,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,204,123,2,0       // vbroadcastss  0x27bcc(%rip),%ymm5        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,45,44,127,2,0        // vbroadcastss  0x27f2c(%rip),%ymm5        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,220,89,253                      // vmulps        %ymm5,%ymm4,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
@@ -12507,7 +12545,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde00334c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd8db0>
+  .byte  232,255,255,255,221                 // callq         ffffffffde00334c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd8a50>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,210                             // callq         *%rdx
@@ -12527,6 +12565,16 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
@@ -12564,7 +12612,7 @@
   .byte  196,227,121,32,192,7                // vpinsrb       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,49,192                  // vpmovzxbd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,64,122,2,0        // vbroadcastss  0x27a40(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,115,125,2,0       // vbroadcastss  0x27d73(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -12586,14 +12634,14 @@
   .byte  77,15,175,193                       // imul          %r9,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,193,121,2,0         // vbroadcastss  0x279c1(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,244,124,2,0         // vbroadcastss  0x27cf4(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,65,100,89,192                   // vmulps        %ymm8,%ymm3,%ymm8
   .byte  196,65,125,91,192                   // vcvtps2dq     %ymm8,%ymm8
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  197,57,103,192                      // vpackuswb     %xmm0,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           347b <_sk_store_a8_hsw+0x44>
+  .byte  117,10                              // jne           34a8 <_sk_store_a8_hsw+0x44>
   .byte  196,1,121,214,4,24                  // vmovq         %xmm8,(%r8,%r11,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -12601,41 +12649,42 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            3477 <_sk_store_a8_hsw+0x40>
+  .byte  119,236                             // ja            34a4 <_sk_store_a8_hsw+0x40>
   .byte  196,66,121,48,192                   // vpmovzxbw     %xmm8,%xmm8
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,85,0,0,0                  // lea           0x55(%rip),%r10        # 34f0 <_sk_store_a8_hsw+0xb9>
+  .byte  76,141,21,88,0,0,0                  // lea           0x58(%rip),%r10        # 3520 <_sk_store_a8_hsw+0xbc>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,3,121,20,4,24,0                 // vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,202                             // jmp           3477 <_sk_store_a8_hsw+0x40>
+  .byte  235,202                             // jmp           34a4 <_sk_store_a8_hsw+0x40>
   .byte  196,3,121,20,68,24,2,4              // vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  .byte  196,98,57,0,5,210,122,2,0           // vpshufb       0x27ad2(%rip),%xmm8,%xmm8        # 2af90 <_sk_srcover_rgba_8888_sse2_lowp+0x9f4>
+  .byte  196,98,57,0,5,5,126,2,0             // vpshufb       0x27e05(%rip),%xmm8,%xmm8        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0x9f4>
   .byte  196,3,121,21,4,24,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,176                             // jmp           3477 <_sk_store_a8_hsw+0x40>
+  .byte  235,176                             // jmp           34a4 <_sk_store_a8_hsw+0x40>
   .byte  196,3,121,20,68,24,6,12             // vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
   .byte  196,3,121,20,68,24,5,10             // vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
   .byte  196,3,121,20,68,24,4,8              // vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  .byte  196,98,57,0,5,184,122,2,0           // vpshufb       0x27ab8(%rip),%xmm8,%xmm8        # 2afa0 <_sk_srcover_rgba_8888_sse2_lowp+0xa04>
+  .byte  196,98,57,0,5,235,125,2,0           // vpshufb       0x27deb(%rip),%xmm8,%xmm8        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xa04>
   .byte  196,1,121,126,4,24                  // vmovd         %xmm8,(%r8,%r11,1)
-  .byte  235,135                             // jmp           3477 <_sk_store_a8_hsw+0x40>
-  .byte  180,255                             // mov           $0xff,%ah
+  .byte  235,135                             // jmp           34a4 <_sk_store_a8_hsw+0x40>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  177,255                             // mov           $0xff,%cl
   .byte  255                                 // (bad)
-  .byte  255,197                             // inc           %ebp
+  .byte  255,194                             // inc           %edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  189,255,255,255,239                 // mov           $0xefffffff,%ebp
+  .byte  186,255,255,255,236                 // mov           $0xecffffff,%edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,231                             // jmpq          *%rdi
+  .byte  255,228                             // jmpq          *%rsp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
+  .byte  220,255                             // fdivr         %st,%st(7)
   .byte  255                                 // (bad)
-  .byte  255,215                             // callq         *%rdi
+  .byte  255,212                             // callq         *%rsp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -12651,15 +12700,15 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,57                              // jne           355d <_sk_load_g8_hsw+0x51>
+  .byte  117,57                              // jne           358d <_sk_load_g8_hsw+0x51>
   .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,78,122,2,0            // vpand         0x27a4e(%rip),%xmm0,%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,249,219,5,126,125,2,0           // vpand         0x27d7e(%rip),%xmm0,%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,24,121,2,0        // vbroadcastss  0x27918(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,72,124,2,0        // vbroadcastss  0x27c48(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,149,120,2,0       // vbroadcastss  0x27895(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,197,123,2,0       // vbroadcastss  0x27bc5(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
@@ -12668,15 +12717,15 @@
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,185                             // ja            352a <_sk_load_g8_hsw+0x1e>
+  .byte  119,185                             // ja            355a <_sk_load_g8_hsw+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # 35f4 <_sk_load_g8_hsw+0xe8>
+  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # 3624 <_sk_load_g8_hsw+0xe8>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,154                             // jmp           352a <_sk_load_g8_hsw+0x1e>
+  .byte  235,154                             // jmp           355a <_sk_load_g8_hsw+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
@@ -12684,7 +12733,7 @@
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,114,255,255,255                 // jmpq          352a <_sk_load_g8_hsw+0x1e>
+  .byte  233,114,255,255,255                 // jmpq          355a <_sk_load_g8_hsw+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
@@ -12695,7 +12744,7 @@
   .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,55,255,255,255                  // jmpq          352a <_sk_load_g8_hsw+0x1e>
+  .byte  233,55,255,255,255                  // jmpq          355a <_sk_load_g8_hsw+0x1e>
   .byte  144                                 // nop
   .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
@@ -12704,7 +12753,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf003604 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd9068>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf003634 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd8d38>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -12726,15 +12775,15 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,57                              // jne           3661 <_sk_load_g8_dst_hsw+0x51>
+  .byte  117,57                              // jne           3691 <_sk_load_g8_dst_hsw+0x51>
   .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,74,121,2,0           // vpand         0x2794a(%rip),%xmm4,%xmm4        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,217,219,37,122,124,2,0          // vpand         0x27c7a(%rip),%xmm4,%xmm4        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,125,51,228                  // vpmovzxwd     %xmm4,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,20,120,2,0        // vbroadcastss  0x27814(%rip),%ymm5        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,45,68,123,2,0        // vbroadcastss  0x27b44(%rip),%ymm5        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,145,119,2,0       // vbroadcastss  0x27791(%rip),%ymm7        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,61,193,122,2,0       // vbroadcastss  0x27ac1(%rip),%ymm7        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,236                      // vmovaps       %ymm4,%ymm5
   .byte  197,252,40,244                      // vmovaps       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
@@ -12743,15 +12792,15 @@
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,185                             // ja            362e <_sk_load_g8_dst_hsw+0x1e>
+  .byte  119,185                             // ja            365e <_sk_load_g8_dst_hsw+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # 36f8 <_sk_load_g8_dst_hsw+0xe8>
+  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # 3728 <_sk_load_g8_dst_hsw+0xe8>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,154                             // jmp           362e <_sk_load_g8_dst_hsw+0x1e>
+  .byte  235,154                             // jmp           365e <_sk_load_g8_dst_hsw+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
@@ -12759,7 +12808,7 @@
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,114,255,255,255                 // jmpq          362e <_sk_load_g8_dst_hsw+0x1e>
+  .byte  233,114,255,255,255                 // jmpq          365e <_sk_load_g8_dst_hsw+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
@@ -12770,7 +12819,7 @@
   .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,55,255,255,255                  // jmpq          362e <_sk_load_g8_dst_hsw+0x1e>
+  .byte  233,55,255,255,255                  // jmpq          365e <_sk_load_g8_dst_hsw+0x1e>
   .byte  144                                 // nop
   .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
@@ -12779,7 +12828,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf003708 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd916c>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf003738 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd8e3c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -12799,6 +12848,16 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
@@ -12836,10 +12895,10 @@
   .byte  196,227,121,32,192,7                // vpinsrb       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,49,192                  // vpmovzxbd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,132,118,2,0       // vbroadcastss  0x27684(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,135,121,2,0       // vbroadcastss  0x27987(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,1,118,2,0         // vbroadcastss  0x27601(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,4,121,2,0         // vbroadcastss  0x27904(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  91                                  // pop           %rbx
@@ -12860,72 +12919,69 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,114                             // jne           3885 <_sk_load_565_hsw+0x8d>
+  .byte  117,114                             // jne           38e2 <_sk_load_565_hsw+0x8d>
   .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
   .byte  196,226,125,51,208                  // vpmovzxwd     %xmm0,%ymm2
-  .byte  196,226,125,88,5,57,118,2,0         // vpbroadcastd  0x27639(%rip),%ymm0        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,226,125,88,5,60,121,2,0         // vpbroadcastd  0x2793c(%rip),%ymm0        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  197,237,219,192                     // vpand         %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,44,118,2,0        // vbroadcastss  0x2762c(%rip),%ymm1        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,226,125,24,13,47,121,2,0        // vbroadcastss  0x2792f(%rip),%ymm1        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,35,118,2,0        // vpbroadcastd  0x27623(%rip),%ymm1        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,226,125,88,13,38,121,2,0        // vpbroadcastd  0x27926(%rip),%ymm1        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,22,118,2,0        // vbroadcastss  0x27616(%rip),%ymm3        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,226,125,24,29,25,121,2,0        // vbroadcastss  0x27919(%rip),%ymm3        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,88,29,13,118,2,0        // vpbroadcastd  0x2760d(%rip),%ymm3        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,226,125,88,29,16,121,2,0        // vpbroadcastd  0x27910(%rip),%ymm3        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,0,118,2,0         // vbroadcastss  0x27600(%rip),%ymm3        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,226,125,24,29,3,121,2,0         // vbroadcastss  0x27903(%rip),%ymm3        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,101,117,2,0       // vbroadcastss  0x27565(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,104,120,2,0       // vbroadcastss  0x27868(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,128                             // ja            3819 <_sk_load_565_hsw+0x21>
+  .byte  119,128                             // ja            3876 <_sk_load_565_hsw+0x21>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3908 <_sk_load_565_hsw+0x110>
+  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 3964 <_sk_load_565_hsw+0x10f>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,94,255,255,255                  // jmpq          3819 <_sk_load_565_hsw+0x21>
+  .byte  233,94,255,255,255                  // jmpq          3876 <_sk_load_565_hsw+0x21>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,65,255,255,255                  // jmpq          3819 <_sk_load_565_hsw+0x21>
+  .byte  233,65,255,255,255                  // jmpq          3876 <_sk_load_565_hsw+0x21>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,20,255,255,255                  // jmpq          3819 <_sk_load_565_hsw+0x21>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
+  .byte  233,20,255,255,255                  // jmpq          3876 <_sk_load_565_hsw+0x21>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,192                             // inc           %eax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,180,255,255,255,237,255         // pushq         -0x120001(%rdi,%rdi,8)
+  .byte  255                                 // (bad)
+  .byte  255,229                             // jmpq          *%rbp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  191,255,255,255,179                 // mov           $0xb3ffffff,%edi
+  .byte  221,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  236                                 // in            (%dx),%al
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255,209                             // callq         *%rcx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -12942,53 +12998,53 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,114                             // jne           39b1 <_sk_load_565_dst_hsw+0x8d>
+  .byte  117,114                             // jne           3a0d <_sk_load_565_dst_hsw+0x8d>
   .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
   .byte  196,226,125,51,244                  // vpmovzxwd     %xmm4,%ymm6
-  .byte  196,226,125,88,37,13,117,2,0        // vpbroadcastd  0x2750d(%rip),%ymm4        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,226,125,88,37,17,120,2,0        // vpbroadcastd  0x27811(%rip),%ymm4        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  197,205,219,228                     // vpand         %ymm4,%ymm6,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,0,117,2,0         // vbroadcastss  0x27500(%rip),%ymm5        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,226,125,24,45,4,120,2,0         // vbroadcastss  0x27804(%rip),%ymm5        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,88,45,247,116,2,0       // vpbroadcastd  0x274f7(%rip),%ymm5        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,226,125,88,45,251,119,2,0       // vpbroadcastd  0x277fb(%rip),%ymm5        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  197,205,219,237                     // vpand         %ymm5,%ymm6,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,61,234,116,2,0       // vbroadcastss  0x274ea(%rip),%ymm7        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,226,125,24,61,238,119,2,0       // vbroadcastss  0x277ee(%rip),%ymm7        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  197,212,89,239                      // vmulps        %ymm7,%ymm5,%ymm5
-  .byte  196,226,125,88,61,225,116,2,0       // vpbroadcastd  0x274e1(%rip),%ymm7        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,226,125,88,61,229,119,2,0       // vpbroadcastd  0x277e5(%rip),%ymm7        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  197,205,219,247                     // vpand         %ymm7,%ymm6,%ymm6
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,226,125,24,61,212,116,2,0       // vbroadcastss  0x274d4(%rip),%ymm7        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,226,125,24,61,216,119,2,0       // vbroadcastss  0x277d8(%rip),%ymm7        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  197,204,89,247                      // vmulps        %ymm7,%ymm6,%ymm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,57,116,2,0        // vbroadcastss  0x27439(%rip),%ymm7        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,61,61,119,2,0        // vbroadcastss  0x2773d(%rip),%ymm7        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,128                             // ja            3945 <_sk_load_565_dst_hsw+0x21>
+  .byte  119,128                             // ja            39a1 <_sk_load_565_dst_hsw+0x21>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3a34 <_sk_load_565_dst_hsw+0x110>
+  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3a90 <_sk_load_565_dst_hsw+0x110>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,94,255,255,255                  // jmpq          3945 <_sk_load_565_dst_hsw+0x21>
+  .byte  233,94,255,255,255                  // jmpq          39a1 <_sk_load_565_dst_hsw+0x21>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,65,255,255,255                  // jmpq          3945 <_sk_load_565_dst_hsw+0x21>
+  .byte  233,65,255,255,255                  // jmpq          39a1 <_sk_load_565_dst_hsw+0x21>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,20,255,255,255                  // jmpq          3945 <_sk_load_565_dst_hsw+0x21>
+  .byte  233,20,255,255,255                  // jmpq          39a1 <_sk_load_565_dst_hsw+0x21>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -13021,6 +13077,16 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
@@ -13057,23 +13123,23 @@
   .byte  65,15,183,4,88                      // movzwl        (%r8,%rbx,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,51,208                  // vpmovzxwd     %xmm0,%ymm2
-  .byte  196,226,125,88,5,85,115,2,0         // vpbroadcastd  0x27355(%rip),%ymm0        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,226,125,88,5,44,118,2,0         // vpbroadcastd  0x2762c(%rip),%ymm0        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  197,237,219,192                     // vpand         %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,72,115,2,0        // vbroadcastss  0x27348(%rip),%ymm1        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,226,125,24,13,31,118,2,0        // vbroadcastss  0x2761f(%rip),%ymm1        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,63,115,2,0        // vpbroadcastd  0x2733f(%rip),%ymm1        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,226,125,88,13,22,118,2,0        // vpbroadcastd  0x27616(%rip),%ymm1        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,50,115,2,0        // vbroadcastss  0x27332(%rip),%ymm3        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,226,125,24,29,9,118,2,0         // vbroadcastss  0x27609(%rip),%ymm3        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,88,29,41,115,2,0        // vpbroadcastd  0x27329(%rip),%ymm3        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,226,125,88,29,0,118,2,0         // vpbroadcastd  0x27600(%rip),%ymm3        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,28,115,2,0        // vbroadcastss  0x2731c(%rip),%ymm3        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,226,125,24,29,243,117,2,0       // vbroadcastss  0x275f3(%rip),%ymm3        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,129,114,2,0       // vbroadcastss  0x27281(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,88,117,2,0        // vbroadcastss  0x27558(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -13091,11 +13157,11 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,69,115,2,0          // vbroadcastss  0x27345(%rip),%ymm8        # 2aed4 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  .byte  196,98,125,24,5,28,118,2,0          // vbroadcastss  0x2761c(%rip),%ymm8        # 2b234 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,53,114,241,11               // vpslld        $0xb,%ymm9,%ymm9
-  .byte  196,98,125,24,21,48,115,2,0         // vbroadcastss  0x27330(%rip),%ymm10        # 2aed8 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  .byte  196,98,125,24,21,7,118,2,0          // vbroadcastss  0x27607(%rip),%ymm10        # 2b238 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   .byte  196,65,116,89,210                   // vmulps        %ymm10,%ymm1,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
   .byte  196,193,45,114,242,5                // vpslld        $0x5,%ymm10,%ymm10
@@ -13106,7 +13172,7 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           3be6 <_sk_store_565_hsw+0x76>
+  .byte  117,10                              // jne           3c6f <_sk_store_565_hsw+0x76>
   .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13114,44 +13180,41 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            3be2 <_sk_store_565_hsw+0x72>
+  .byte  119,236                             // ja            3c6b <_sk_store_565_hsw+0x72>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,67,0,0,0                  // lea           0x43(%rip),%r10        # 3c44 <_sk_store_565_hsw+0xd4>
+  .byte  76,141,21,66,0,0,0                  // lea           0x42(%rip),%r10        # 3ccc <_sk_store_565_hsw+0xd3>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           3be2 <_sk_store_565_hsw+0x72>
+  .byte  235,207                             // jmp           3c6b <_sk_store_565_hsw+0x72>
   .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           3be2 <_sk_store_565_hsw+0x72>
+  .byte  235,191                             // jmp           3c6b <_sk_store_565_hsw+0x72>
   .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           3be2 <_sk_store_565_hsw+0x72>
-  .byte  144                                 // nop
-  .byte  198                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,215                             // callq         *%rdi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,247                             // push          %rdi
+  .byte  235,159                             // jmp           3c6b <_sk_store_565_hsw+0x72>
+  .byte  199                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  239                                 // out           %eax,(%dx)
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,231                             // jmpq          *%rdi
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
+  .byte  248                                 // clc
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,240                             // push          %rax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  232,255,255,255,224                 // callq         ffffffffe1003ce4 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fd93e8>
+  .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -13167,28 +13230,28 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,138,0,0,0                    // jne           3d09 <_sk_load_4444_hsw+0xa9>
+  .byte  15,133,138,0,0,0                    // jne           3d91 <_sk_load_4444_hsw+0xa9>
   .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
   .byte  196,226,125,51,216                  // vpmovzxwd     %xmm0,%ymm3
-  .byte  196,226,125,88,5,73,114,2,0         // vpbroadcastd  0x27249(%rip),%ymm0        # 2aedc <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  .byte  196,226,125,88,5,33,117,2,0         // vpbroadcastd  0x27521(%rip),%ymm0        # 2b23c <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   .byte  197,229,219,192                     // vpand         %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,60,114,2,0        // vbroadcastss  0x2723c(%rip),%ymm1        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  .byte  196,226,125,24,13,20,117,2,0        // vbroadcastss  0x27514(%rip),%ymm1        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,51,114,2,0        // vpbroadcastd  0x27233(%rip),%ymm1        # 2aee4 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  .byte  196,226,125,88,13,11,117,2,0        // vpbroadcastd  0x2750b(%rip),%ymm1        # 2b244 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   .byte  197,229,219,201                     // vpand         %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,38,114,2,0        // vbroadcastss  0x27226(%rip),%ymm2        # 2aee8 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  .byte  196,226,125,24,21,254,116,2,0       // vbroadcastss  0x274fe(%rip),%ymm2        # 2b248 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,88,21,29,114,2,0        // vpbroadcastd  0x2721d(%rip),%ymm2        # 2aeec <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  .byte  196,226,125,88,21,245,116,2,0       // vpbroadcastd  0x274f5(%rip),%ymm2        # 2b24c <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   .byte  197,229,219,210                     // vpand         %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,16,114,2,0          // vbroadcastss  0x27210(%rip),%ymm8        # 2aef0 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  .byte  196,98,125,24,5,232,116,2,0         // vbroadcastss  0x274e8(%rip),%ymm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,88,5,6,114,2,0           // vpbroadcastd  0x27206(%rip),%ymm8        # 2aef4 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  .byte  196,98,125,88,5,222,116,2,0         // vpbroadcastd  0x274de(%rip),%ymm8        # 2b254 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   .byte  196,193,101,219,216                 // vpand         %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,248,113,2,0         // vbroadcastss  0x271f8(%rip),%ymm8        # 2aef8 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  .byte  196,98,125,24,5,208,116,2,0         // vbroadcastss  0x274d0(%rip),%ymm8        # 2b258 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13197,27 +13260,27 @@
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,100,255,255,255              // ja            3c85 <_sk_load_4444_hsw+0x25>
+  .byte  15,135,100,255,255,255              // ja            3d0d <_sk_load_4444_hsw+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3d90 <_sk_load_4444_hsw+0x130>
+  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3e18 <_sk_load_4444_hsw+0x130>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,66,255,255,255                  // jmpq          3c85 <_sk_load_4444_hsw+0x25>
+  .byte  233,66,255,255,255                  // jmpq          3d0d <_sk_load_4444_hsw+0x25>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,37,255,255,255                  // jmpq          3c85 <_sk_load_4444_hsw+0x25>
+  .byte  233,37,255,255,255                  // jmpq          3d0d <_sk_load_4444_hsw+0x25>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  233,248,254,255,255                 // jmpq          3c85 <_sk_load_4444_hsw+0x25>
+  .byte  233,248,254,255,255                 // jmpq          3d0d <_sk_load_4444_hsw+0x25>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -13253,28 +13316,28 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,138,0,0,0                    // jne           3e55 <_sk_load_4444_dst_hsw+0xa9>
+  .byte  15,133,138,0,0,0                    // jne           3edd <_sk_load_4444_dst_hsw+0xa9>
   .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
   .byte  196,226,125,51,252                  // vpmovzxwd     %xmm4,%ymm7
-  .byte  196,226,125,88,37,253,112,2,0       // vpbroadcastd  0x270fd(%rip),%ymm4        # 2aedc <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  .byte  196,226,125,88,37,213,115,2,0       // vpbroadcastd  0x273d5(%rip),%ymm4        # 2b23c <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   .byte  197,197,219,228                     // vpand         %ymm4,%ymm7,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,240,112,2,0       // vbroadcastss  0x270f0(%rip),%ymm5        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  .byte  196,226,125,24,45,200,115,2,0       // vbroadcastss  0x273c8(%rip),%ymm5        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,88,45,231,112,2,0       // vpbroadcastd  0x270e7(%rip),%ymm5        # 2aee4 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  .byte  196,226,125,88,45,191,115,2,0       // vpbroadcastd  0x273bf(%rip),%ymm5        # 2b244 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   .byte  197,197,219,237                     // vpand         %ymm5,%ymm7,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,53,218,112,2,0       // vbroadcastss  0x270da(%rip),%ymm6        # 2aee8 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  .byte  196,226,125,24,53,178,115,2,0       // vbroadcastss  0x273b2(%rip),%ymm6        # 2b248 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   .byte  197,212,89,238                      // vmulps        %ymm6,%ymm5,%ymm5
-  .byte  196,226,125,88,53,209,112,2,0       // vpbroadcastd  0x270d1(%rip),%ymm6        # 2aeec <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  .byte  196,226,125,88,53,169,115,2,0       // vpbroadcastd  0x273a9(%rip),%ymm6        # 2b24c <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   .byte  197,197,219,246                     // vpand         %ymm6,%ymm7,%ymm6
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,98,125,24,5,196,112,2,0         // vbroadcastss  0x270c4(%rip),%ymm8        # 2aef0 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  .byte  196,98,125,24,5,156,115,2,0         // vbroadcastss  0x2739c(%rip),%ymm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   .byte  196,193,76,89,240                   // vmulps        %ymm8,%ymm6,%ymm6
-  .byte  196,98,125,88,5,186,112,2,0         // vpbroadcastd  0x270ba(%rip),%ymm8        # 2aef4 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  .byte  196,98,125,88,5,146,115,2,0         // vpbroadcastd  0x27392(%rip),%ymm8        # 2b254 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   .byte  196,193,69,219,248                  // vpand         %ymm8,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,5,172,112,2,0         // vbroadcastss  0x270ac(%rip),%ymm8        # 2aef8 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  .byte  196,98,125,24,5,132,115,2,0         // vbroadcastss  0x27384(%rip),%ymm8        # 2b258 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13283,27 +13346,27 @@
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,100,255,255,255              // ja            3dd1 <_sk_load_4444_dst_hsw+0x25>
+  .byte  15,135,100,255,255,255              // ja            3e59 <_sk_load_4444_dst_hsw+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3edc <_sk_load_4444_dst_hsw+0x130>
+  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # 3f64 <_sk_load_4444_dst_hsw+0x130>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,66,255,255,255                  // jmpq          3dd1 <_sk_load_4444_dst_hsw+0x25>
+  .byte  233,66,255,255,255                  // jmpq          3e59 <_sk_load_4444_dst_hsw+0x25>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,37,255,255,255                  // jmpq          3dd1 <_sk_load_4444_dst_hsw+0x25>
+  .byte  233,37,255,255,255                  // jmpq          3e59 <_sk_load_4444_dst_hsw+0x25>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  233,248,254,255,255                 // jmpq          3dd1 <_sk_load_4444_dst_hsw+0x25>
+  .byte  233,248,254,255,255                 // jmpq          3e59 <_sk_load_4444_dst_hsw+0x25>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -13336,6 +13399,16 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
@@ -13372,25 +13445,25 @@
   .byte  65,15,183,4,88                      // movzwl        (%r8,%rbx,2),%eax
   .byte  197,249,196,192,7                   // vpinsrw       $0x7,%eax,%xmm0,%xmm0
   .byte  196,226,125,51,216                  // vpmovzxwd     %xmm0,%ymm3
-  .byte  196,226,125,88,5,41,111,2,0         // vpbroadcastd  0x26f29(%rip),%ymm0        # 2aedc <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  .byte  196,226,125,88,5,212,113,2,0        // vpbroadcastd  0x271d4(%rip),%ymm0        # 2b23c <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   .byte  197,229,219,192                     // vpand         %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,28,111,2,0        // vbroadcastss  0x26f1c(%rip),%ymm1        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  .byte  196,226,125,24,13,199,113,2,0       // vbroadcastss  0x271c7(%rip),%ymm1        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,88,13,19,111,2,0        // vpbroadcastd  0x26f13(%rip),%ymm1        # 2aee4 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  .byte  196,226,125,88,13,190,113,2,0       // vpbroadcastd  0x271be(%rip),%ymm1        # 2b244 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   .byte  197,229,219,201                     // vpand         %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,6,111,2,0         // vbroadcastss  0x26f06(%rip),%ymm2        # 2aee8 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  .byte  196,226,125,24,21,177,113,2,0       // vbroadcastss  0x271b1(%rip),%ymm2        # 2b248 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,88,21,253,110,2,0       // vpbroadcastd  0x26efd(%rip),%ymm2        # 2aeec <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  .byte  196,226,125,88,21,168,113,2,0       // vpbroadcastd  0x271a8(%rip),%ymm2        # 2b24c <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   .byte  197,229,219,210                     // vpand         %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,240,110,2,0         // vbroadcastss  0x26ef0(%rip),%ymm8        # 2aef0 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  .byte  196,98,125,24,5,155,113,2,0         // vbroadcastss  0x2719b(%rip),%ymm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,88,5,230,110,2,0         // vpbroadcastd  0x26ee6(%rip),%ymm8        # 2aef4 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  .byte  196,98,125,88,5,145,113,2,0         // vpbroadcastd  0x27191(%rip),%ymm8        # 2b254 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   .byte  196,193,101,219,216                 // vpand         %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,216,110,2,0         // vbroadcastss  0x26ed8(%rip),%ymm8        # 2aef8 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  .byte  196,98,125,24,5,131,113,2,0         // vbroadcastss  0x27183(%rip),%ymm8        # 2b258 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
@@ -13410,7 +13483,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,173,110,2,0         // vbroadcastss  0x26ead(%rip),%ymm8        # 2aefc <_sk_srcover_rgba_8888_sse2_lowp+0x960>
+  .byte  196,98,125,24,5,88,113,2,0          // vbroadcastss  0x27158(%rip),%ymm8        # 2b25c <_sk_srcover_rgba_8888_sse2_lowp+0x960>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,53,114,241,12               // vpslld        $0xc,%ymm9,%ymm9
@@ -13428,7 +13501,7 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           40b2 <_sk_store_4444_hsw+0x82>
+  .byte  117,10                              // jne           4167 <_sk_store_4444_hsw+0x82>
   .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13436,44 +13509,41 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            40ae <_sk_store_4444_hsw+0x7e>
+  .byte  119,236                             // ja            4163 <_sk_store_4444_hsw+0x7e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,67,0,0,0                  // lea           0x43(%rip),%r10        # 4110 <_sk_store_4444_hsw+0xe0>
+  .byte  76,141,21,66,0,0,0                  // lea           0x42(%rip),%r10        # 41c4 <_sk_store_4444_hsw+0xdf>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           40ae <_sk_store_4444_hsw+0x7e>
+  .byte  235,207                             // jmp           4163 <_sk_store_4444_hsw+0x7e>
   .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           40ae <_sk_store_4444_hsw+0x7e>
+  .byte  235,191                             // jmp           4163 <_sk_store_4444_hsw+0x7e>
   .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           40ae <_sk_store_4444_hsw+0x7e>
-  .byte  144                                 // nop
-  .byte  198                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,215                             // callq         *%rdi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,207                             // dec           %edi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,247                             // push          %rdi
+  .byte  235,159                             // jmp           4163 <_sk_store_4444_hsw+0x7e>
+  .byte  199                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  239                                 // out           %eax,(%dx)
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,231                             // jmpq          *%rdi
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  223,255                             // (bad)
+  .byte  248                                 // clc
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,240                             // push          %rax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  232,255,255,255,224                 // callq         ffffffffe10041dc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fd98e0>
+  .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -13489,16 +13559,16 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           419e <_sk_load_8888_hsw+0x72>
+  .byte  117,86                              // jne           4252 <_sk_load_8888_hsw+0x72>
   .byte  196,129,126,111,28,152              // vmovdqu       (%r8,%r11,4),%ymm3
-  .byte  197,229,219,5,10,104,2,0            // vpand         0x2680a(%rip),%ymm3,%ymm0        # 2a960 <_sk_srcover_rgba_8888_sse2_lowp+0x3c4>
+  .byte  197,229,219,5,182,106,2,0           // vpand         0x26ab6(%rip),%ymm3,%ymm0        # 2acc0 <_sk_srcover_rgba_8888_sse2_lowp+0x3c4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,249,108,2,0         // vbroadcastss  0x26cf9(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,165,111,2,0         // vbroadcastss  0x26fa5(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,226,101,0,13,15,104,2,0         // vpshufb       0x2680f(%rip),%ymm3,%ymm1        # 2a980 <_sk_srcover_rgba_8888_sse2_lowp+0x3e4>
+  .byte  196,226,101,0,13,187,106,2,0        // vpshufb       0x26abb(%rip),%ymm3,%ymm1        # 2ace0 <_sk_srcover_rgba_8888_sse2_lowp+0x3e4>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
-  .byte  196,226,101,0,21,29,104,2,0         // vpshufb       0x2681d(%rip),%ymm3,%ymm2        # 2a9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x404>
+  .byte  196,226,101,0,21,201,106,2,0        // vpshufb       0x26ac9(%rip),%ymm3,%ymm2        # 2ad00 <_sk_srcover_rgba_8888_sse2_lowp+0x404>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
@@ -13511,21 +13581,21 @@
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            414e <_sk_load_8888_hsw+0x22>
+  .byte  119,156                             // ja            4202 <_sk_load_8888_hsw+0x22>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 4244 <_sk_load_8888_hsw+0x118>
+  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 42f8 <_sk_load_8888_hsw+0x118>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,28,152              // vmovd         (%r8,%r11,4),%xmm3
-  .byte  235,128                             // jmp           414e <_sk_load_8888_hsw+0x22>
+  .byte  235,128                             // jmp           4202 <_sk_load_8888_hsw+0x22>
   .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,4                 // vpblendd      $0x4,%ymm0,%ymm1,%ymm3
   .byte  196,129,122,126,4,152               // vmovq         (%r8,%r11,4),%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,89,255,255,255                  // jmpq          414e <_sk_load_8888_hsw+0x22>
+  .byte  233,89,255,255,255                  // jmpq          4202 <_sk_load_8888_hsw+0x22>
   .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -13538,7 +13608,7 @@
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,129,122,111,4,152               // vmovdqu       (%r8,%r11,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,10,255,255,255                  // jmpq          414e <_sk_load_8888_hsw+0x22>
+  .byte  233,10,255,255,255                  // jmpq          4202 <_sk_load_8888_hsw+0x22>
   .byte  130                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -13572,16 +13642,16 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           42d2 <_sk_load_8888_dst_hsw+0x72>
+  .byte  117,86                              // jne           4386 <_sk_load_8888_dst_hsw+0x72>
   .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,54,103,2,0           // vpand         0x26736(%rip),%ymm7,%ymm4        # 2a9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x424>
+  .byte  197,197,219,37,226,105,2,0          // vpand         0x269e2(%rip),%ymm7,%ymm4        # 2ad20 <_sk_srcover_rgba_8888_sse2_lowp+0x424>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,197,107,2,0         // vbroadcastss  0x26bc5(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,113,110,2,0         // vbroadcastss  0x26e71(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
-  .byte  196,226,69,0,45,59,103,2,0          // vpshufb       0x2673b(%rip),%ymm7,%ymm5        # 2a9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x444>
+  .byte  196,226,69,0,45,231,105,2,0         // vpshufb       0x269e7(%rip),%ymm7,%ymm5        # 2ad40 <_sk_srcover_rgba_8888_sse2_lowp+0x444>
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
   .byte  196,193,84,89,232                   // vmulps        %ymm8,%ymm5,%ymm5
-  .byte  196,226,69,0,53,73,103,2,0          // vpshufb       0x26749(%rip),%ymm7,%ymm6        # 2aa00 <_sk_srcover_rgba_8888_sse2_lowp+0x464>
+  .byte  196,226,69,0,53,245,105,2,0         // vpshufb       0x269f5(%rip),%ymm7,%ymm6        # 2ad60 <_sk_srcover_rgba_8888_sse2_lowp+0x464>
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
   .byte  196,193,76,89,240                   // vmulps        %ymm8,%ymm6,%ymm6
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
@@ -13594,21 +13664,21 @@
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            4282 <_sk_load_8888_dst_hsw+0x22>
+  .byte  119,156                             // ja            4336 <_sk_load_8888_dst_hsw+0x22>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 4378 <_sk_load_8888_dst_hsw+0x118>
+  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 442c <_sk_load_8888_dst_hsw+0x118>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  235,128                             // jmp           4282 <_sk_load_8888_dst_hsw+0x22>
+  .byte  235,128                             // jmp           4336 <_sk_load_8888_dst_hsw+0x22>
   .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,4                  // vpblendd      $0x4,%ymm4,%ymm5,%ymm7
   .byte  196,129,122,126,36,152              // vmovq         (%r8,%r11,4),%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,89,255,255,255                  // jmpq          4282 <_sk_load_8888_dst_hsw+0x22>
+  .byte  233,89,255,255,255                  // jmpq          4336 <_sk_load_8888_dst_hsw+0x22>
   .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -13621,7 +13691,7 @@
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,10,255,255,255                  // jmpq          4282 <_sk_load_8888_dst_hsw+0x22>
+  .byte  233,10,255,255,255                  // jmpq          4336 <_sk_load_8888_dst_hsw+0x22>
   .byte  130                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -13648,28 +13718,36 @@
 FUNCTION(_sk_gather_8888_hsw)
 _sk_gather_8888_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
   .byte  196,226,109,64,201                  // vpmulld       %ymm1,%ymm2,%ymm1
   .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
   .byte  197,245,254,192                     // vpaddd        %ymm0,%ymm1,%ymm0
-  .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
-  .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  196,194,117,144,28,128              // vpgatherdd    %ymm1,(%r8,%ymm0,4),%ymm3
-  .byte  197,229,219,5,90,102,2,0            // vpand         0x2665a(%rip),%ymm3,%ymm0        # 2aa20 <_sk_srcover_rgba_8888_sse2_lowp+0x484>
+  .byte  196,66,101,144,4,128                // vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
+  .byte  197,189,219,5,225,104,2,0           // vpand         0x268e1(%rip),%ymm8,%ymm0        # 2ad80 <_sk_srcover_rgba_8888_sse2_lowp+0x484>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,137,106,2,0         // vbroadcastss  0x26a89(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
-  .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,226,101,0,13,95,102,2,0         // vpshufb       0x2665f(%rip),%ymm3,%ymm1        # 2aa40 <_sk_srcover_rgba_8888_sse2_lowp+0x4a4>
+  .byte  196,226,125,24,29,16,109,2,0        // vbroadcastss  0x26d10(%rip),%ymm3        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
+  .byte  196,226,61,0,13,231,104,2,0         // vpshufb       0x268e7(%rip),%ymm8,%ymm1        # 2ada0 <_sk_srcover_rgba_8888_sse2_lowp+0x4a4>
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
-  .byte  196,226,101,0,21,109,102,2,0        // vpshufb       0x2666d(%rip),%ymm3,%ymm2        # 2aa60 <_sk_srcover_rgba_8888_sse2_lowp+0x4c4>
+  .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
+  .byte  196,226,61,0,21,246,104,2,0         // vpshufb       0x268f6(%rip),%ymm8,%ymm2        # 2adc0 <_sk_srcover_rgba_8888_sse2_lowp+0x4c4>
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
-  .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
+  .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
+  .byte  196,193,61,114,208,24               // vpsrld        $0x18,%ymm8,%ymm8
+  .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
+  .byte  197,188,89,219                      // vmulps        %ymm3,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -13684,7 +13762,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,230,105,2,0         // vbroadcastss  0x269e6(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,111,108,2,0         // vbroadcastss  0x26c6f(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,65,116,89,208                   // vmulps        %ymm8,%ymm1,%ymm10
@@ -13700,7 +13778,7 @@
   .byte  196,65,45,235,192                   // vpor          %ymm8,%ymm10,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           4486 <_sk_store_8888_hsw+0x78>
+  .byte  117,10                              // jne           455d <_sk_store_8888_hsw+0x78>
   .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13708,17 +13786,17 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            4482 <_sk_store_8888_hsw+0x74>
+  .byte  119,236                             // ja            4559 <_sk_store_8888_hsw+0x74>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,83,0,0,0                  // lea           0x53(%rip),%r10        # 44f4 <_sk_store_8888_hsw+0xe6>
+  .byte  76,141,21,84,0,0,0                  // lea           0x54(%rip),%r10        # 45cc <_sk_store_8888_hsw+0xe7>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           4482 <_sk_store_8888_hsw+0x74>
+  .byte  235,208                             // jmp           4559 <_sk_store_8888_hsw+0x74>
   .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           4482 <_sk_store_8888_hsw+0x74>
+  .byte  235,192                             // jmp           4559 <_sk_store_8888_hsw+0x74>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -13726,25 +13804,22 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
   .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           4482 <_sk_store_8888_hsw+0x74>
-  .byte  144                                 // nop
-  .byte  182,255                             // mov           $0xff,%dh
+  .byte  235,143                             // jmp           4559 <_sk_store_8888_hsw+0x74>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  181,255                             // mov           $0xff,%ch
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
+  .byte  189,255,255,255,246                 // mov           $0xf6ffffff,%ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  233,255,255,255,219                 // jmpq          ffffffffdc0045e0 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdbfd9ce4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -13761,16 +13836,16 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           4582 <_sk_load_bgra_hsw+0x72>
+  .byte  117,86                              // jne           465a <_sk_load_bgra_hsw+0x72>
   .byte  196,129,126,111,28,152              // vmovdqu       (%r8,%r11,4),%ymm3
-  .byte  197,229,219,5,70,101,2,0            // vpand         0x26546(%rip),%ymm3,%ymm0        # 2aa80 <_sk_srcover_rgba_8888_sse2_lowp+0x4e4>
+  .byte  197,229,219,5,206,103,2,0           // vpand         0x267ce(%rip),%ymm3,%ymm0        # 2ade0 <_sk_srcover_rgba_8888_sse2_lowp+0x4e4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,21,105,2,0          // vbroadcastss  0x26915(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,157,107,2,0         // vbroadcastss  0x26b9d(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,208                  // vmulps        %ymm8,%ymm0,%ymm2
-  .byte  196,226,101,0,5,75,101,2,0          // vpshufb       0x2654b(%rip),%ymm3,%ymm0        # 2aaa0 <_sk_srcover_rgba_8888_sse2_lowp+0x504>
+  .byte  196,226,101,0,5,211,103,2,0         // vpshufb       0x267d3(%rip),%ymm3,%ymm0        # 2ae00 <_sk_srcover_rgba_8888_sse2_lowp+0x504>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  196,193,124,89,200                  // vmulps        %ymm8,%ymm0,%ymm1
-  .byte  196,226,101,0,5,89,101,2,0          // vpshufb       0x26559(%rip),%ymm3,%ymm0        # 2aac0 <_sk_srcover_rgba_8888_sse2_lowp+0x524>
+  .byte  196,226,101,0,5,225,103,2,0         // vpshufb       0x267e1(%rip),%ymm3,%ymm0        # 2ae20 <_sk_srcover_rgba_8888_sse2_lowp+0x524>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
@@ -13783,21 +13858,21 @@
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            4532 <_sk_load_bgra_hsw+0x22>
+  .byte  119,156                             // ja            460a <_sk_load_bgra_hsw+0x22>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 4628 <_sk_load_bgra_hsw+0x118>
+  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 4700 <_sk_load_bgra_hsw+0x118>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,28,152              // vmovd         (%r8,%r11,4),%xmm3
-  .byte  235,128                             // jmp           4532 <_sk_load_bgra_hsw+0x22>
+  .byte  235,128                             // jmp           460a <_sk_load_bgra_hsw+0x22>
   .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
   .byte  196,227,117,2,216,4                 // vpblendd      $0x4,%ymm0,%ymm1,%ymm3
   .byte  196,129,122,126,4,152               // vmovq         (%r8,%r11,4),%xmm0
   .byte  196,227,101,2,216,3                 // vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  .byte  233,89,255,255,255                  // jmpq          4532 <_sk_load_bgra_hsw+0x22>
+  .byte  233,89,255,255,255                  // jmpq          460a <_sk_load_bgra_hsw+0x22>
   .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -13810,7 +13885,7 @@
   .byte  196,227,101,56,216,1                // vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   .byte  196,129,122,111,4,152               // vmovdqu       (%r8,%r11,4),%xmm0
   .byte  196,227,125,2,219,240               // vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  .byte  233,10,255,255,255                  // jmpq          4532 <_sk_load_bgra_hsw+0x22>
+  .byte  233,10,255,255,255                  // jmpq          460a <_sk_load_bgra_hsw+0x22>
   .byte  130                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -13844,16 +13919,16 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,86                              // jne           46b6 <_sk_load_bgra_dst_hsw+0x72>
+  .byte  117,86                              // jne           478e <_sk_load_bgra_dst_hsw+0x72>
   .byte  196,129,126,111,60,152              // vmovdqu       (%r8,%r11,4),%ymm7
-  .byte  197,197,219,37,114,100,2,0          // vpand         0x26472(%rip),%ymm7,%ymm4        # 2aae0 <_sk_srcover_rgba_8888_sse2_lowp+0x544>
+  .byte  197,197,219,37,250,102,2,0          // vpand         0x266fa(%rip),%ymm7,%ymm4        # 2ae40 <_sk_srcover_rgba_8888_sse2_lowp+0x544>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,225,103,2,0         // vbroadcastss  0x267e1(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,105,106,2,0         // vbroadcastss  0x26a69(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,92,89,240                   // vmulps        %ymm8,%ymm4,%ymm6
-  .byte  196,226,69,0,37,119,100,2,0         // vpshufb       0x26477(%rip),%ymm7,%ymm4        # 2ab00 <_sk_srcover_rgba_8888_sse2_lowp+0x564>
+  .byte  196,226,69,0,37,255,102,2,0         // vpshufb       0x266ff(%rip),%ymm7,%ymm4        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x564>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  196,193,92,89,232                   // vmulps        %ymm8,%ymm4,%ymm5
-  .byte  196,226,69,0,37,133,100,2,0         // vpshufb       0x26485(%rip),%ymm7,%ymm4        # 2ab20 <_sk_srcover_rgba_8888_sse2_lowp+0x584>
+  .byte  196,226,69,0,37,13,103,2,0          // vpshufb       0x2670d(%rip),%ymm7,%ymm4        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x584>
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
   .byte  197,197,114,215,24                  // vpsrld        $0x18,%ymm7,%ymm7
@@ -13866,21 +13941,21 @@
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,156                             // ja            4666 <_sk_load_bgra_dst_hsw+0x22>
+  .byte  119,156                             // ja            473e <_sk_load_bgra_dst_hsw+0x22>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 475c <_sk_load_bgra_dst_hsw+0x118>
+  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 4834 <_sk_load_bgra_dst_hsw+0x118>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,129,121,110,60,152              // vmovd         (%r8,%r11,4),%xmm7
-  .byte  235,128                             // jmp           4666 <_sk_load_bgra_dst_hsw+0x22>
+  .byte  235,128                             // jmp           473e <_sk_load_bgra_dst_hsw+0x22>
   .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  196,227,85,2,252,4                  // vpblendd      $0x4,%ymm4,%ymm5,%ymm7
   .byte  196,129,122,126,36,152              // vmovq         (%r8,%r11,4),%xmm4
   .byte  196,227,69,2,252,3                  // vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  .byte  233,89,255,255,255                  // jmpq          4666 <_sk_load_bgra_dst_hsw+0x22>
+  .byte  233,89,255,255,255                  // jmpq          473e <_sk_load_bgra_dst_hsw+0x22>
   .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -13893,7 +13968,7 @@
   .byte  196,227,69,56,252,1                 // vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   .byte  196,129,122,111,36,152              // vmovdqu       (%r8,%r11,4),%xmm4
   .byte  196,227,93,2,255,240                // vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  .byte  233,10,255,255,255                  // jmpq          4666 <_sk_load_bgra_dst_hsw+0x22>
+  .byte  233,10,255,255,255                  // jmpq          473e <_sk_load_bgra_dst_hsw+0x22>
   .byte  130                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -13920,28 +13995,36 @@
 FUNCTION(_sk_gather_bgra_hsw)
 _sk_gather_bgra_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
   .byte  196,226,109,64,201                  // vpmulld       %ymm1,%ymm2,%ymm1
   .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
   .byte  197,245,254,192                     // vpaddd        %ymm0,%ymm1,%ymm0
-  .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
-  .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  196,194,117,144,28,128              // vpgatherdd    %ymm1,(%r8,%ymm0,4),%ymm3
-  .byte  197,229,219,5,150,99,2,0            // vpand         0x26396(%rip),%ymm3,%ymm0        # 2ab40 <_sk_srcover_rgba_8888_sse2_lowp+0x5a4>
+  .byte  196,66,101,144,4,128                // vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
+  .byte  197,189,219,5,249,101,2,0           // vpand         0x265f9(%rip),%ymm8,%ymm0        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x5a4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,165,102,2,0         // vbroadcastss  0x266a5(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
-  .byte  196,193,124,89,208                  // vmulps        %ymm8,%ymm0,%ymm2
-  .byte  196,226,101,0,5,155,99,2,0          // vpshufb       0x2639b(%rip),%ymm3,%ymm0        # 2ab60 <_sk_srcover_rgba_8888_sse2_lowp+0x5c4>
+  .byte  196,226,125,24,29,8,105,2,0         // vbroadcastss  0x26908(%rip),%ymm3        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  197,252,89,211                      // vmulps        %ymm3,%ymm0,%ymm2
+  .byte  196,226,61,0,5,255,101,2,0          // vpshufb       0x265ff(%rip),%ymm8,%ymm0        # 2aec0 <_sk_srcover_rgba_8888_sse2_lowp+0x5c4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,193,124,89,200                  // vmulps        %ymm8,%ymm0,%ymm1
-  .byte  196,226,101,0,5,169,99,2,0          // vpshufb       0x263a9(%rip),%ymm3,%ymm0        # 2ab80 <_sk_srcover_rgba_8888_sse2_lowp+0x5e4>
+  .byte  197,252,89,203                      // vmulps        %ymm3,%ymm0,%ymm1
+  .byte  196,226,61,0,5,14,102,2,0           // vpshufb       0x2660e(%rip),%ymm8,%ymm0        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x5e4>
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  197,229,114,211,24                  // vpsrld        $0x18,%ymm3,%ymm3
-  .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
+  .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
+  .byte  196,193,61,114,208,24               // vpsrld        $0x18,%ymm8,%ymm8
+  .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
+  .byte  197,188,89,219                      // vmulps        %ymm3,%ymm8,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -13956,7 +14039,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,2,102,2,0           // vbroadcastss  0x26602(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,103,104,2,0         // vbroadcastss  0x26867(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,65,108,89,200                   // vmulps        %ymm8,%ymm2,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,65,116,89,208                   // vmulps        %ymm8,%ymm1,%ymm10
@@ -13972,7 +14055,7 @@
   .byte  196,65,45,235,192                   // vpor          %ymm8,%ymm10,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           486a <_sk_store_bgra_hsw+0x78>
+  .byte  117,10                              // jne           4965 <_sk_store_bgra_hsw+0x78>
   .byte  196,1,126,127,4,152                 // vmovdqu       %ymm8,(%r8,%r11,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -13980,17 +14063,17 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            4866 <_sk_store_bgra_hsw+0x74>
+  .byte  119,236                             // ja            4961 <_sk_store_bgra_hsw+0x74>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,83,0,0,0                  // lea           0x53(%rip),%r10        # 48d8 <_sk_store_bgra_hsw+0xe6>
+  .byte  76,141,21,84,0,0,0                  // lea           0x54(%rip),%r10        # 49d4 <_sk_store_bgra_hsw+0xe7>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           4866 <_sk_store_bgra_hsw+0x74>
+  .byte  235,208                             // jmp           4961 <_sk_store_bgra_hsw+0x74>
   .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           4866 <_sk_store_bgra_hsw+0x74>
+  .byte  235,192                             // jmp           4961 <_sk_store_bgra_hsw+0x74>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -13998,25 +14081,22 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,1,121,126,76,152,16             // vmovd         %xmm9,0x10(%r8,%r11,4)
   .byte  196,1,122,127,4,152                 // vmovdqu       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           4866 <_sk_store_bgra_hsw+0x74>
-  .byte  144                                 // nop
-  .byte  182,255                             // mov           $0xff,%dh
+  .byte  235,143                             // jmp           4961 <_sk_store_bgra_hsw+0x74>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  181,255                             // mov           $0xff,%ch
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,197                             // inc           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
+  .byte  189,255,255,255,246                 // mov           $0xf6ffffff,%ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  233,255,255,255,219                 // jmpq          ffffffffdc0049e8 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdbfda0ec>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,205                             // dec           %ebp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -14033,7 +14113,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,101                             // jne           4975 <_sk_load_f16_hsw+0x81>
+  .byte  117,101                             // jne           4a71 <_sk_load_f16_hsw+0x81>
   .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
   .byte  196,193,121,16,84,192,16            // vmovupd       0x10(%r8,%rax,8),%xmm2
   .byte  196,193,121,16,92,192,32            // vmovupd       0x20(%r8,%rax,8),%xmm3
@@ -14059,29 +14139,29 @@
   .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            49db <_sk_load_f16_hsw+0xe7>
+  .byte  116,85                              // je            4ad7 <_sk_load_f16_hsw+0xe7>
   .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            49db <_sk_load_f16_hsw+0xe7>
+  .byte  114,72                              // jb            4ad7 <_sk_load_f16_hsw+0xe7>
   .byte  196,193,123,16,84,192,16            // vmovsd        0x10(%r8,%rax,8),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            49e8 <_sk_load_f16_hsw+0xf4>
+  .byte  116,72                              // je            4ae4 <_sk_load_f16_hsw+0xf4>
   .byte  196,193,105,22,84,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            49e8 <_sk_load_f16_hsw+0xf4>
+  .byte  114,59                              // jb            4ae4 <_sk_load_f16_hsw+0xf4>
   .byte  196,193,123,16,92,192,32            // vmovsd        0x20(%r8,%rax,8),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,109,255,255,255              // je            492b <_sk_load_f16_hsw+0x37>
+  .byte  15,132,109,255,255,255              // je            4a27 <_sk_load_f16_hsw+0x37>
   .byte  196,193,97,22,92,192,40             // vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,92,255,255,255               // jb            492b <_sk_load_f16_hsw+0x37>
+  .byte  15,130,92,255,255,255               // jb            4a27 <_sk_load_f16_hsw+0x37>
   .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,80,255,255,255                  // jmpq          492b <_sk_load_f16_hsw+0x37>
+  .byte  233,80,255,255,255                  // jmpq          4a27 <_sk_load_f16_hsw+0x37>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,67,255,255,255                  // jmpq          492b <_sk_load_f16_hsw+0x37>
+  .byte  233,67,255,255,255                  // jmpq          4a27 <_sk_load_f16_hsw+0x37>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,58,255,255,255                  // jmpq          492b <_sk_load_f16_hsw+0x37>
+  .byte  233,58,255,255,255                  // jmpq          4a27 <_sk_load_f16_hsw+0x37>
 
 HIDDEN _sk_load_f16_dst_hsw
 .globl _sk_load_f16_dst_hsw
@@ -14095,7 +14175,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,101                             // jne           4a72 <_sk_load_f16_dst_hsw+0x81>
+  .byte  117,101                             // jne           4b6e <_sk_load_f16_dst_hsw+0x81>
   .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
   .byte  196,193,121,16,116,192,16           // vmovupd       0x10(%r8,%rax,8),%xmm6
   .byte  196,193,121,16,124,192,32           // vmovupd       0x20(%r8,%rax,8),%xmm7
@@ -14121,35 +14201,45 @@
   .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            4ad8 <_sk_load_f16_dst_hsw+0xe7>
+  .byte  116,85                              // je            4bd4 <_sk_load_f16_dst_hsw+0xe7>
   .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            4ad8 <_sk_load_f16_dst_hsw+0xe7>
+  .byte  114,72                              // jb            4bd4 <_sk_load_f16_dst_hsw+0xe7>
   .byte  196,193,123,16,116,192,16           // vmovsd        0x10(%r8,%rax,8),%xmm6
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            4ae5 <_sk_load_f16_dst_hsw+0xf4>
+  .byte  116,72                              // je            4be1 <_sk_load_f16_dst_hsw+0xf4>
   .byte  196,193,73,22,116,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            4ae5 <_sk_load_f16_dst_hsw+0xf4>
+  .byte  114,59                              // jb            4be1 <_sk_load_f16_dst_hsw+0xf4>
   .byte  196,193,123,16,124,192,32           // vmovsd        0x20(%r8,%rax,8),%xmm7
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,109,255,255,255              // je            4a28 <_sk_load_f16_dst_hsw+0x37>
+  .byte  15,132,109,255,255,255              // je            4b24 <_sk_load_f16_dst_hsw+0x37>
   .byte  196,193,65,22,124,192,40            // vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,92,255,255,255               // jb            4a28 <_sk_load_f16_dst_hsw+0x37>
+  .byte  15,130,92,255,255,255               // jb            4b24 <_sk_load_f16_dst_hsw+0x37>
   .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,80,255,255,255                  // jmpq          4a28 <_sk_load_f16_dst_hsw+0x37>
+  .byte  233,80,255,255,255                  // jmpq          4b24 <_sk_load_f16_dst_hsw+0x37>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
   .byte  197,201,87,246                      // vxorpd        %xmm6,%xmm6,%xmm6
-  .byte  233,67,255,255,255                  // jmpq          4a28 <_sk_load_f16_dst_hsw+0x37>
+  .byte  233,67,255,255,255                  // jmpq          4b24 <_sk_load_f16_dst_hsw+0x37>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
-  .byte  233,58,255,255,255                  // jmpq          4a28 <_sk_load_f16_dst_hsw+0x37>
+  .byte  233,58,255,255,255                  // jmpq          4b24 <_sk_load_f16_dst_hsw+0x37>
 
 HIDDEN _sk_gather_f16_hsw
 .globl _sk_gather_f16_hsw
 FUNCTION(_sk_gather_f16_hsw)
 _sk_gather_f16_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,88,80,12                // vpbroadcastd  0xc(%rax),%ymm2
+  .byte  197,229,118,219                     // vpcmpeqd      %ymm3,%ymm3,%ymm3
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
+  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,88,80,16                // vpbroadcastd  0x10(%rax),%ymm2
+  .byte  197,237,254,211                     // vpaddd        %ymm3,%ymm2,%ymm2
+  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  196,226,125,88,80,8                 // vpbroadcastd  0x8(%rax),%ymm2
@@ -14158,28 +14248,26 @@
   .byte  197,245,254,192                     // vpaddd        %ymm0,%ymm1,%ymm0
   .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
   .byte  197,237,239,210                     // vpxor         %ymm2,%ymm2,%ymm2
-  .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
-  .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
-  .byte  196,194,189,144,28,192              // vpgatherdq    %ymm8,(%r8,%xmm0,8),%ymm3
-  .byte  196,227,125,57,192,1                // vextracti128  $0x1,%ymm0,%xmm0
   .byte  196,194,245,144,20,192              // vpgatherdq    %ymm1,(%r8,%xmm0,8),%ymm2
-  .byte  196,227,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm0
-  .byte  196,227,125,57,209,1                // vextracti128  $0x1,%ymm2,%xmm1
+  .byte  196,227,125,57,192,1                // vextracti128  $0x1,%ymm0,%xmm0
+  .byte  196,66,229,144,4,192                // vpgatherdq    %ymm3,(%r8,%xmm0,8),%ymm8
+  .byte  196,227,125,57,208,1                // vextracti128  $0x1,%ymm2,%xmm0
+  .byte  196,99,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm1
+  .byte  197,233,97,216                      // vpunpcklwd    %xmm0,%xmm2,%xmm3
+  .byte  197,233,105,192                     // vpunpckhwd    %xmm0,%xmm2,%xmm0
+  .byte  197,185,97,209                      // vpunpcklwd    %xmm1,%xmm8,%xmm2
+  .byte  197,185,105,201                     // vpunpckhwd    %xmm1,%xmm8,%xmm1
   .byte  197,97,97,192                       // vpunpcklwd    %xmm0,%xmm3,%xmm8
-  .byte  197,225,105,192                     // vpunpckhwd    %xmm0,%xmm3,%xmm0
+  .byte  197,97,105,200                      // vpunpckhwd    %xmm0,%xmm3,%xmm9
   .byte  197,233,97,217                      // vpunpcklwd    %xmm1,%xmm2,%xmm3
-  .byte  197,233,105,201                     // vpunpckhwd    %xmm1,%xmm2,%xmm1
-  .byte  197,57,97,200                       // vpunpcklwd    %xmm0,%xmm8,%xmm9
-  .byte  197,57,105,192                      // vpunpckhwd    %xmm0,%xmm8,%xmm8
-  .byte  197,225,97,209                      // vpunpcklwd    %xmm1,%xmm3,%xmm2
-  .byte  197,225,105,217                     // vpunpckhwd    %xmm1,%xmm3,%xmm3
-  .byte  197,177,108,194                     // vpunpcklqdq   %xmm2,%xmm9,%xmm0
+  .byte  197,105,105,209                     // vpunpckhwd    %xmm1,%xmm2,%xmm10
+  .byte  197,185,108,195                     // vpunpcklqdq   %xmm3,%xmm8,%xmm0
   .byte  196,226,125,19,192                  // vcvtph2ps     %xmm0,%ymm0
-  .byte  197,177,109,202                     // vpunpckhqdq   %xmm2,%xmm9,%xmm1
+  .byte  197,185,109,203                     // vpunpckhqdq   %xmm3,%xmm8,%xmm1
   .byte  196,226,125,19,201                  // vcvtph2ps     %xmm1,%ymm1
-  .byte  197,185,108,211                     // vpunpcklqdq   %xmm3,%xmm8,%xmm2
+  .byte  196,193,49,108,210                  // vpunpcklqdq   %xmm10,%xmm9,%xmm2
   .byte  196,226,125,19,210                  // vcvtph2ps     %xmm2,%ymm2
-  .byte  197,185,109,219                     // vpunpckhqdq   %xmm3,%xmm8,%xmm3
+  .byte  196,193,49,109,218                  // vpunpckhqdq   %xmm10,%xmm9,%xmm3
   .byte  196,226,125,19,219                  // vcvtph2ps     %xmm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -14208,7 +14296,7 @@
   .byte  196,65,57,98,205                    // vpunpckldq    %xmm13,%xmm8,%xmm9
   .byte  196,65,57,106,197                   // vpunpckhdq    %xmm13,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           4bfc <_sk_store_f16_hsw+0x7b>
+  .byte  117,31                              // jne           4d1e <_sk_store_f16_hsw+0x7b>
   .byte  196,65,122,127,28,192               // vmovdqu       %xmm11,(%r8,%rax,8)
   .byte  196,65,122,127,84,192,16            // vmovdqu       %xmm10,0x10(%r8,%rax,8)
   .byte  196,65,122,127,76,192,32            // vmovdqu       %xmm9,0x20(%r8,%rax,8)
@@ -14217,22 +14305,22 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,214,28,192               // vmovq         %xmm11,(%r8,%rax,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  116,240                             // je            4d1a <_sk_store_f16_hsw+0x77>
   .byte  196,65,121,23,92,192,8              // vmovhpd       %xmm11,0x8(%r8,%rax,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  114,227                             // jb            4d1a <_sk_store_f16_hsw+0x77>
   .byte  196,65,121,214,84,192,16            // vmovq         %xmm10,0x10(%r8,%rax,8)
-  .byte  116,218                             // je            4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  116,218                             // je            4d1a <_sk_store_f16_hsw+0x77>
   .byte  196,65,121,23,84,192,24             // vmovhpd       %xmm10,0x18(%r8,%rax,8)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  114,205                             // jb            4d1a <_sk_store_f16_hsw+0x77>
   .byte  196,65,121,214,76,192,32            // vmovq         %xmm9,0x20(%r8,%rax,8)
-  .byte  116,196                             // je            4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  116,196                             // je            4d1a <_sk_store_f16_hsw+0x77>
   .byte  196,65,121,23,76,192,40             // vmovhpd       %xmm9,0x28(%r8,%rax,8)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  114,183                             // jb            4d1a <_sk_store_f16_hsw+0x77>
   .byte  196,65,121,214,68,192,48            // vmovq         %xmm8,0x30(%r8,%rax,8)
-  .byte  235,174                             // jmp           4bf8 <_sk_store_f16_hsw+0x77>
+  .byte  235,174                             // jmp           4d1a <_sk_store_f16_hsw+0x77>
 
 HIDDEN _sk_load_u16_be_hsw
 .globl _sk_load_u16_be_hsw
@@ -14247,7 +14335,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,204,0,0,0                    // jne           4d3d <_sk_load_u16_be_hsw+0xf3>
+  .byte  15,133,204,0,0,0                    // jne           4e5f <_sk_load_u16_be_hsw+0xf3>
   .byte  196,65,121,16,4,64                  // vmovupd       (%r8,%rax,2),%xmm8
   .byte  196,193,121,16,84,64,16             // vmovupd       0x10(%r8,%rax,2),%xmm2
   .byte  196,193,121,16,92,64,32             // vmovupd       0x20(%r8,%rax,2),%xmm3
@@ -14266,7 +14354,7 @@
   .byte  197,241,235,192                     // vpor          %xmm0,%xmm1,%xmm0
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,21,166,97,2,0         // vbroadcastss  0x261a6(%rip),%ymm10        # 2ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  .byte  196,98,125,24,21,228,99,2,0         // vbroadcastss  0x263e4(%rip),%ymm10        # 2b1d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,185,109,202                     // vpunpckhqdq   %xmm2,%xmm8,%xmm1
   .byte  197,233,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm2
@@ -14294,29 +14382,29 @@
   .byte  196,65,123,16,4,64                  // vmovsd        (%r8,%rax,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            4da3 <_sk_load_u16_be_hsw+0x159>
+  .byte  116,85                              // je            4ec5 <_sk_load_u16_be_hsw+0x159>
   .byte  196,65,57,22,68,64,8                // vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            4da3 <_sk_load_u16_be_hsw+0x159>
+  .byte  114,72                              // jb            4ec5 <_sk_load_u16_be_hsw+0x159>
   .byte  196,193,123,16,84,64,16             // vmovsd        0x10(%r8,%rax,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            4db0 <_sk_load_u16_be_hsw+0x166>
+  .byte  116,72                              // je            4ed2 <_sk_load_u16_be_hsw+0x166>
   .byte  196,193,105,22,84,64,24             // vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            4db0 <_sk_load_u16_be_hsw+0x166>
+  .byte  114,59                              // jb            4ed2 <_sk_load_u16_be_hsw+0x166>
   .byte  196,193,123,16,92,64,32             // vmovsd        0x20(%r8,%rax,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,6,255,255,255                // je            4c8c <_sk_load_u16_be_hsw+0x42>
+  .byte  15,132,6,255,255,255                // je            4dae <_sk_load_u16_be_hsw+0x42>
   .byte  196,193,97,22,92,64,40              // vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,245,254,255,255              // jb            4c8c <_sk_load_u16_be_hsw+0x42>
+  .byte  15,130,245,254,255,255              // jb            4dae <_sk_load_u16_be_hsw+0x42>
   .byte  196,65,122,126,76,64,48             // vmovq         0x30(%r8,%rax,2),%xmm9
-  .byte  233,233,254,255,255                 // jmpq          4c8c <_sk_load_u16_be_hsw+0x42>
+  .byte  233,233,254,255,255                 // jmpq          4dae <_sk_load_u16_be_hsw+0x42>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,220,254,255,255                 // jmpq          4c8c <_sk_load_u16_be_hsw+0x42>
+  .byte  233,220,254,255,255                 // jmpq          4dae <_sk_load_u16_be_hsw+0x42>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,211,254,255,255                 // jmpq          4c8c <_sk_load_u16_be_hsw+0x42>
+  .byte  233,211,254,255,255                 // jmpq          4dae <_sk_load_u16_be_hsw+0x42>
 
 HIDDEN _sk_load_rgb_u16_be_hsw
 .globl _sk_load_rgb_u16_be_hsw
@@ -14333,7 +14421,7 @@
   .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
   .byte  72,193,248,32                       // sar           $0x20,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,205,0,0,0                    // jne           4eb1 <_sk_load_rgb_u16_be_hsw+0xf8>
+  .byte  15,133,205,0,0,0                    // jne           4fd3 <_sk_load_rgb_u16_be_hsw+0xf8>
   .byte  196,65,122,111,28,64                // vmovdqu       (%r8,%rax,2),%xmm11
   .byte  196,193,122,111,92,64,12            // vmovdqu       0xc(%r8,%rax,2),%xmm3
   .byte  196,193,122,111,84,64,24            // vmovdqu       0x18(%r8,%rax,2),%xmm2
@@ -14358,7 +14446,7 @@
   .byte  197,241,235,192                     // vpor          %xmm0,%xmm1,%xmm0
   .byte  196,226,125,51,192                  // vpmovzxwd     %xmm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,21,96,2,0          // vbroadcastss  0x26015(%rip),%ymm9        # 2ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  .byte  196,98,125,24,13,83,98,2,0          // vbroadcastss  0x26253(%rip),%ymm9        # 2b1d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,185,109,203                     // vpunpckhqdq   %xmm3,%xmm8,%xmm1
   .byte  197,225,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm3
@@ -14374,69 +14462,69 @@
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,57,95,2,0         // vbroadcastss  0x25f39(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,119,97,2,0        // vbroadcastss  0x26177(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,4,64                // vmovd         (%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,65,121,196,92,64,4,2            // vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           4ee9 <_sk_load_rgb_u16_be_hsw+0x130>
+  .byte  117,31                              // jne           500b <_sk_load_rgb_u16_be_hsw+0x130>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,48,255,255,255                  // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,48,255,255,255                  // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
   .byte  196,193,121,110,68,64,6             // vmovd         0x6(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,65,121,196,68,64,10,2           // vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            4f33 <_sk_load_rgb_u16_be_hsw+0x17a>
+  .byte  114,48                              // jb            5055 <_sk_load_rgb_u16_be_hsw+0x17a>
   .byte  196,193,121,110,68,64,12            // vmovd         0xc(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,92,64,16,2          // vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           4f4d <_sk_load_rgb_u16_be_hsw+0x194>
+  .byte  117,48                              // jne           506f <_sk_load_rgb_u16_be_hsw+0x194>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,230,254,255,255                 // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,230,254,255,255                 // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,204,254,255,255                 // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,204,254,255,255                 // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
   .byte  196,193,121,110,68,64,18            // vmovd         0x12(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,65,121,196,84,64,22,2           // vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            4f8e <_sk_load_rgb_u16_be_hsw+0x1d5>
+  .byte  114,39                              // jb            50b0 <_sk_load_rgb_u16_be_hsw+0x1d5>
   .byte  196,193,121,110,68,64,24            // vmovd         0x18(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,84,64,28,2          // vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           4f9f <_sk_load_rgb_u16_be_hsw+0x1e6>
+  .byte  117,30                              // jne           50c1 <_sk_load_rgb_u16_be_hsw+0x1e6>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,139,254,255,255                 // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,139,254,255,255                 // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,122,254,255,255                 // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,122,254,255,255                 // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
   .byte  196,193,121,110,68,64,30            // vmovd         0x1e(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,76,64,34,2          // vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            4fd2 <_sk_load_rgb_u16_be_hsw+0x219>
+  .byte  114,25                              // jb            50f4 <_sk_load_rgb_u16_be_hsw+0x219>
   .byte  196,193,121,110,68,64,36            // vmovd         0x24(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,68,64,40,2          // vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  .byte  233,71,254,255,255                  // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,71,254,255,255                  // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,62,254,255,255                  // jmpq          4e19 <_sk_load_rgb_u16_be_hsw+0x60>
+  .byte  233,62,254,255,255                  // jmpq          4f3b <_sk_load_rgb_u16_be_hsw+0x60>
 
 HIDDEN _sk_store_u16_be_hsw
 .globl _sk_store_u16_be_hsw
@@ -14450,7 +14538,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  196,98,125,24,5,254,94,2,0          // vbroadcastss  0x25efe(%rip),%ymm8        # 2af00 <_sk_srcover_rgba_8888_sse2_lowp+0x964>
+  .byte  196,98,125,24,5,60,97,2,0           // vbroadcastss  0x2613c(%rip),%ymm8        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0x964>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,67,125,25,202,1                 // vextractf128  $0x1,%ymm9,%xmm10
@@ -14488,7 +14576,7 @@
   .byte  196,65,17,98,200                    // vpunpckldq    %xmm8,%xmm13,%xmm9
   .byte  196,65,17,106,192                   // vpunpckhdq    %xmm8,%xmm13,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           50e6 <_sk_store_u16_be_hsw+0x10b>
+  .byte  117,31                              // jne           5208 <_sk_store_u16_be_hsw+0x10b>
   .byte  196,65,122,127,28,64                // vmovdqu       %xmm11,(%r8,%rax,2)
   .byte  196,65,122,127,84,64,16             // vmovdqu       %xmm10,0x10(%r8,%rax,2)
   .byte  196,65,122,127,76,64,32             // vmovdqu       %xmm9,0x20(%r8,%rax,2)
@@ -14497,22 +14585,22 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,214,28,64                // vmovq         %xmm11,(%r8,%rax,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  116,240                             // je            5204 <_sk_store_u16_be_hsw+0x107>
   .byte  196,65,121,23,92,64,8               // vmovhpd       %xmm11,0x8(%r8,%rax,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  114,227                             // jb            5204 <_sk_store_u16_be_hsw+0x107>
   .byte  196,65,121,214,84,64,16             // vmovq         %xmm10,0x10(%r8,%rax,2)
-  .byte  116,218                             // je            50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  116,218                             // je            5204 <_sk_store_u16_be_hsw+0x107>
   .byte  196,65,121,23,84,64,24              // vmovhpd       %xmm10,0x18(%r8,%rax,2)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  114,205                             // jb            5204 <_sk_store_u16_be_hsw+0x107>
   .byte  196,65,121,214,76,64,32             // vmovq         %xmm9,0x20(%r8,%rax,2)
-  .byte  116,196                             // je            50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  116,196                             // je            5204 <_sk_store_u16_be_hsw+0x107>
   .byte  196,65,121,23,76,64,40              // vmovhpd       %xmm9,0x28(%r8,%rax,2)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  114,183                             // jb            5204 <_sk_store_u16_be_hsw+0x107>
   .byte  196,65,121,214,68,64,48             // vmovq         %xmm8,0x30(%r8,%rax,2)
-  .byte  235,174                             // jmp           50e2 <_sk_store_u16_be_hsw+0x107>
+  .byte  235,174                             // jmp           5204 <_sk_store_u16_be_hsw+0x107>
 
 HIDDEN _sk_load_f32_hsw
 .globl _sk_load_f32_hsw
@@ -14521,7 +14609,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            52a5 <_sk_load_f32_hsw+0x171>
+  .byte  15,135,97,1,0,0                     // ja            53c7 <_sk_load_f32_hsw+0x171>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,100,36,128               // vmovupd       %ymm4,-0x80(%rsp)
   .byte  197,253,17,108,36,160               // vmovupd       %ymm5,-0x60(%rsp)
@@ -14534,7 +14622,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # 52b4 <_sk_load_f32_hsw+0x180>
+  .byte  76,141,21,50,1,0,0                  // lea           0x132(%rip),%r10        # 53d8 <_sk_load_f32_hsw+0x182>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
@@ -14597,21 +14685,19 @@
   .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
-  .byte  235,203                             // jmp           527f <_sk_load_f32_hsw+0x14b>
-  .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
+  .byte  235,203                             // jmp           53a1 <_sk_load_f32_hsw+0x14b>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  27,255                              // sbb           %edi,%edi
+  .byte  255                                 // (bad)
+  .byte  255,161,255,255,255,140             // jmpq          *-0x73000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,142,255,255,255,121             // decl          0x79ffffff(%rsi)
+  .byte  255,119,255                         // pushq         -0x1(%rdi)
   .byte  255                                 // (bad)
+  .byte  255,92,255,255                      // lcall         *-0x1(%rdi,%rdi,8)
+  .byte  255,70,255                          // incl          -0x1(%rsi)
   .byte  255                                 // (bad)
-  .byte  255,94,255                          // lcall         *-0x1(%rsi)
-  .byte  255                                 // (bad)
-  .byte  255,72,255                          // decl          -0x1(%rax)
-  .byte  255                                 // (bad)
-  .byte  255,55                              // pushq         (%rdi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,42                              // ljmp          *(%rdx)
+  .byte  255,53,255,255,255,40               // pushq         0x28ffffff(%rip)        # 290053f4 <_sk_srcover_rgba_8888_sse2_lowp+0x28fdaaf8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -14623,7 +14709,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            5445 <_sk_load_f32_dst_hsw+0x171>
+  .byte  15,135,97,1,0,0                     // ja            5569 <_sk_load_f32_dst_hsw+0x171>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,68,36,128                // vmovupd       %ymm0,-0x80(%rsp)
   .byte  197,253,17,76,36,160                // vmovupd       %ymm1,-0x60(%rsp)
@@ -14636,7 +14722,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # 5454 <_sk_load_f32_dst_hsw+0x180>
+  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # 5578 <_sk_load_f32_dst_hsw+0x180>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
@@ -14699,7 +14785,7 @@
   .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
-  .byte  235,203                             // jmp           541f <_sk_load_f32_dst_hsw+0x14b>
+  .byte  235,203                             // jmp           5543 <_sk_load_f32_dst_hsw+0x14b>
   .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -14739,7 +14825,7 @@
   .byte  196,65,37,20,196                    // vunpcklpd     %ymm12,%ymm11,%ymm8
   .byte  196,65,37,21,220                    // vunpckhpd     %ymm12,%ymm11,%ymm11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,55                              // jne           54f3 <_sk_store_f32_hsw+0x7f>
+  .byte  117,55                              // jne           5617 <_sk_store_f32_hsw+0x7f>
   .byte  196,67,45,24,225,1                  // vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   .byte  196,67,61,24,235,1                  // vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   .byte  196,67,45,6,201,49                  // vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
@@ -14752,50 +14838,22 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,17,20,128                // vmovupd       %xmm10,(%r8,%rax,4)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            54ef <_sk_store_f32_hsw+0x7b>
+  .byte  116,240                             // je            5613 <_sk_store_f32_hsw+0x7b>
   .byte  196,65,121,17,76,128,16             // vmovupd       %xmm9,0x10(%r8,%rax,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            54ef <_sk_store_f32_hsw+0x7b>
+  .byte  114,227                             // jb            5613 <_sk_store_f32_hsw+0x7b>
   .byte  196,65,121,17,68,128,32             // vmovupd       %xmm8,0x20(%r8,%rax,4)
-  .byte  116,218                             // je            54ef <_sk_store_f32_hsw+0x7b>
+  .byte  116,218                             // je            5613 <_sk_store_f32_hsw+0x7b>
   .byte  196,65,121,17,92,128,48             // vmovupd       %xmm11,0x30(%r8,%rax,4)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            54ef <_sk_store_f32_hsw+0x7b>
+  .byte  114,205                             // jb            5613 <_sk_store_f32_hsw+0x7b>
   .byte  196,67,125,25,84,128,64,1           // vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  .byte  116,195                             // je            54ef <_sk_store_f32_hsw+0x7b>
+  .byte  116,195                             // je            5613 <_sk_store_f32_hsw+0x7b>
   .byte  196,67,125,25,76,128,80,1           // vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,181                             // jb            54ef <_sk_store_f32_hsw+0x7b>
+  .byte  114,181                             // jb            5613 <_sk_store_f32_hsw+0x7b>
   .byte  196,67,125,25,68,128,96,1           // vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  .byte  235,171                             // jmp           54ef <_sk_store_f32_hsw+0x7b>
-
-HIDDEN _sk_clamp_x_hsw
-.globl _sk_clamp_x_hsw
-FUNCTION(_sk_clamp_x_hsw)
-_sk_clamp_x_hsw:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,88,0                     // vpbroadcastd  (%rax),%ymm8
-  .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
-  .byte  196,65,61,254,193                   // vpaddd        %ymm9,%ymm8,%ymm8
-  .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  255,224                             // jmpq          *%rax
-
-HIDDEN _sk_clamp_y_hsw
-.globl _sk_clamp_y_hsw
-FUNCTION(_sk_clamp_y_hsw)
-_sk_clamp_y_hsw:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
-  .byte  196,98,125,88,0                     // vpbroadcastd  (%rax),%ymm8
-  .byte  196,65,53,118,201                   // vpcmpeqd      %ymm9,%ymm9,%ymm9
-  .byte  196,65,61,254,193                   // vpaddd        %ymm9,%ymm8,%ymm8
-  .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  255,224                             // jmpq          *%rax
+  .byte  235,171                             // jmp           5613 <_sk_store_f32_hsw+0x7b>
 
 HIDDEN _sk_repeat_x_hsw
 .globl _sk_repeat_x_hsw
@@ -14806,12 +14864,7 @@
   .byte  197,60,89,192                       // vmulps        %ymm0,%ymm8,%ymm8
   .byte  196,67,125,8,192,1                  // vroundps      $0x1,%ymm8,%ymm8
   .byte  196,98,125,24,8                     // vbroadcastss  (%rax),%ymm9
-  .byte  196,98,53,172,192                   // vfnmadd213ps  %ymm0,%ymm9,%ymm8
-  .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
-  .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
-  .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
-  .byte  196,65,53,254,192                   // vpaddd        %ymm8,%ymm9,%ymm8
-  .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
+  .byte  196,194,61,188,193                  // vfnmadd231ps  %ymm9,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -14824,12 +14877,7 @@
   .byte  197,60,89,193                       // vmulps        %ymm1,%ymm8,%ymm8
   .byte  196,67,125,8,192,1                  // vroundps      $0x1,%ymm8,%ymm8
   .byte  196,98,125,24,8                     // vbroadcastss  (%rax),%ymm9
-  .byte  196,98,53,172,193                   // vfnmadd213ps  %ymm1,%ymm9,%ymm8
-  .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
-  .byte  196,193,116,95,200                  // vmaxps        %ymm8,%ymm1,%ymm1
-  .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
-  .byte  196,65,53,254,192                   // vpaddd        %ymm8,%ymm9,%ymm8
-  .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
+  .byte  196,194,61,188,201                  // vfnmadd231ps  %ymm9,%ymm8,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -14844,19 +14892,15 @@
   .byte  196,65,124,92,218                   // vsubps        %ymm10,%ymm0,%ymm11
   .byte  196,193,58,88,192                   // vaddss        %xmm8,%xmm8,%xmm0
   .byte  196,98,125,24,192                   // vbroadcastss  %xmm0,%ymm8
-  .byte  197,178,89,5,195,87,2,0             // vmulss        0x257c3(%rip),%xmm9,%xmm0        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,178,89,5,117,90,2,0             // vmulss        0x25a75(%rip),%xmm9,%xmm0        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,226,125,24,192                  // vbroadcastss  %xmm0,%ymm0
   .byte  197,164,89,192                      // vmulps        %ymm0,%ymm11,%ymm0
   .byte  196,227,125,8,192,1                 // vroundps      $0x1,%ymm0,%ymm0
   .byte  196,194,61,172,195                  // vfnmadd213ps  %ymm11,%ymm8,%ymm0
   .byte  196,193,124,92,194                  // vsubps        %ymm10,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,92,200                       // vsubps        %ymm0,%ymm8,%ymm9
-  .byte  197,180,84,192                      // vandps        %ymm0,%ymm9,%ymm0
-  .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
-  .byte  196,65,45,254,192                   // vpaddd        %ymm8,%ymm10,%ymm8
-  .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
+  .byte  197,60,92,192                       // vsubps        %ymm0,%ymm8,%ymm8
+  .byte  197,188,84,192                      // vandps        %ymm0,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -14871,19 +14915,15 @@
   .byte  196,65,116,92,218                   // vsubps        %ymm10,%ymm1,%ymm11
   .byte  196,193,58,88,200                   // vaddss        %xmm8,%xmm8,%xmm1
   .byte  196,98,125,24,193                   // vbroadcastss  %xmm1,%ymm8
-  .byte  197,178,89,13,95,87,2,0             // vmulss        0x2575f(%rip),%xmm9,%xmm1        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,178,89,13,36,90,2,0             // vmulss        0x25a24(%rip),%xmm9,%xmm1        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,226,125,24,201                  // vbroadcastss  %xmm1,%ymm1
   .byte  197,164,89,201                      // vmulps        %ymm1,%ymm11,%ymm1
   .byte  196,227,125,8,201,1                 // vroundps      $0x1,%ymm1,%ymm1
   .byte  196,194,61,172,203                  // vfnmadd213ps  %ymm11,%ymm8,%ymm1
   .byte  196,193,116,92,202                  // vsubps        %ymm10,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,92,201                       // vsubps        %ymm1,%ymm8,%ymm9
-  .byte  197,180,84,201                      // vandps        %ymm1,%ymm9,%ymm1
-  .byte  197,188,95,201                      // vmaxps        %ymm1,%ymm8,%ymm1
-  .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
-  .byte  196,65,45,254,192                   // vpaddd        %ymm8,%ymm10,%ymm8
-  .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
+  .byte  197,60,92,193                       // vsubps        %ymm1,%ymm8,%ymm8
+  .byte  197,188,84,201                      // vandps        %ymm1,%ymm8,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -14893,7 +14933,7 @@
 _sk_clamp_x_1_hsw:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,20,87,2,0           // vbroadcastss  0x25714(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,236,89,2,0          // vbroadcastss  0x259ec(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -14911,9 +14951,9 @@
 .globl _sk_mirror_x_1_hsw
 FUNCTION(_sk_mirror_x_1_hsw)
 _sk_mirror_x_1_hsw:
-  .byte  196,98,125,24,5,11,87,2,0           // vbroadcastss  0x2570b(%rip),%ymm8        # 2ae00 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  .byte  196,98,125,24,5,227,89,2,0          // vbroadcastss  0x259e3(%rip),%ymm8        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,13,225,86,2,0         // vbroadcastss  0x256e1(%rip),%ymm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,13,185,89,2,0         // vbroadcastss  0x259b9(%rip),%ymm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,124,89,201                   // vmulps        %ymm9,%ymm0,%ymm9
   .byte  196,67,125,8,201,1                  // vroundps      $0x1,%ymm9,%ymm9
   .byte  196,65,52,88,201                    // vaddps        %ymm9,%ymm9,%ymm9
@@ -14929,11 +14969,11 @@
 .globl _sk_luminance_to_alpha_hsw
 FUNCTION(_sk_luminance_to_alpha_hsw)
 _sk_luminance_to_alpha_hsw:
-  .byte  196,226,125,24,29,205,87,2,0        // vbroadcastss  0x257cd(%rip),%ymm3        # 2af04 <_sk_srcover_rgba_8888_sse2_lowp+0x968>
-  .byte  196,98,125,24,5,200,87,2,0          // vbroadcastss  0x257c8(%rip),%ymm8        # 2af08 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
+  .byte  196,226,125,24,29,165,90,2,0        // vbroadcastss  0x25aa5(%rip),%ymm3        # 2b264 <_sk_srcover_rgba_8888_sse2_lowp+0x968>
+  .byte  196,98,125,24,5,160,90,2,0          // vbroadcastss  0x25aa0(%rip),%ymm8        # 2b268 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
   .byte  196,226,125,184,203                 // vfmadd231ps   %ymm3,%ymm0,%ymm1
-  .byte  196,226,125,24,29,185,87,2,0        // vbroadcastss  0x257b9(%rip),%ymm3        # 2af0c <_sk_srcover_rgba_8888_sse2_lowp+0x970>
+  .byte  196,226,125,24,29,145,90,2,0        // vbroadcastss  0x25a91(%rip),%ymm3        # 2b26c <_sk_srcover_rgba_8888_sse2_lowp+0x970>
   .byte  196,226,109,168,217                 // vfmadd213ps   %ymm1,%ymm2,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -15132,9 +15172,9 @@
   .byte  76,139,64,8                         // mov           0x8(%rax),%r8
   .byte  77,137,202                          // mov           %r9,%r10
   .byte  73,255,202                          // dec           %r10
-  .byte  120,7                               // js            5a4b <_sk_evenly_spaced_gradient_hsw+0x18>
+  .byte  120,7                               // js            5ad3 <_sk_evenly_spaced_gradient_hsw+0x18>
   .byte  196,193,242,42,202                  // vcvtsi2ss     %r10,%xmm1,%xmm1
-  .byte  235,22                              // jmp           5a61 <_sk_evenly_spaced_gradient_hsw+0x2e>
+  .byte  235,22                              // jmp           5ae9 <_sk_evenly_spaced_gradient_hsw+0x2e>
   .byte  77,137,211                          // mov           %r10,%r11
   .byte  73,209,235                          // shr           %r11
   .byte  65,131,226,1                        // and           $0x1,%r10d
@@ -15145,7 +15185,7 @@
   .byte  197,244,89,200                      // vmulps        %ymm0,%ymm1,%ymm1
   .byte  197,126,91,225                      // vcvttps2dq    %ymm1,%ymm12
   .byte  73,131,249,8                        // cmp           $0x8,%r9
-  .byte  119,73                              // ja            5abd <_sk_evenly_spaced_gradient_hsw+0x8a>
+  .byte  119,73                              // ja            5b45 <_sk_evenly_spaced_gradient_hsw+0x8a>
   .byte  196,66,29,22,0                      // vpermps       (%r8),%ymm12,%ymm8
   .byte  76,139,64,40                        // mov           0x28(%rax),%r8
   .byte  196,66,29,22,8                      // vpermps       (%r8),%ymm12,%ymm9
@@ -15161,7 +15201,7 @@
   .byte  196,194,29,22,24                    // vpermps       (%r8),%ymm12,%ymm3
   .byte  72,139,64,64                        // mov           0x40(%rax),%rax
   .byte  196,98,29,22,16                     // vpermps       (%rax),%ymm12,%ymm10
-  .byte  233,147,0,0,0                       // jmpq          5b50 <_sk_evenly_spaced_gradient_hsw+0x11d>
+  .byte  233,147,0,0,0                       // jmpq          5bd8 <_sk_evenly_spaced_gradient_hsw+0x11d>
   .byte  196,65,13,118,246                   // vpcmpeqd      %ymm14,%ymm14,%ymm14
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  197,245,118,201                     // vpcmpeqd      %ymm1,%ymm1,%ymm1
@@ -15205,14 +15245,14 @@
 .globl _sk_gauss_a_to_rgba_hsw
 FUNCTION(_sk_gauss_a_to_rgba_hsw)
 _sk_gauss_a_to_rgba_hsw:
-  .byte  196,226,125,24,5,155,83,2,0         // vbroadcastss  0x2539b(%rip),%ymm0        # 2af10 <_sk_srcover_rgba_8888_sse2_lowp+0x974>
-  .byte  196,226,125,24,13,150,83,2,0        // vbroadcastss  0x25396(%rip),%ymm1        # 2af14 <_sk_srcover_rgba_8888_sse2_lowp+0x978>
+  .byte  196,226,125,24,5,115,86,2,0         // vbroadcastss  0x25673(%rip),%ymm0        # 2b270 <_sk_srcover_rgba_8888_sse2_lowp+0x974>
+  .byte  196,226,125,24,13,110,86,2,0        // vbroadcastss  0x2566e(%rip),%ymm1        # 2b274 <_sk_srcover_rgba_8888_sse2_lowp+0x978>
   .byte  196,226,101,168,200                 // vfmadd213ps   %ymm0,%ymm3,%ymm1
-  .byte  196,226,125,24,5,140,83,2,0         // vbroadcastss  0x2538c(%rip),%ymm0        # 2af18 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
+  .byte  196,226,125,24,5,100,86,2,0         // vbroadcastss  0x25664(%rip),%ymm0        # 2b278 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
   .byte  196,226,101,184,193                 // vfmadd231ps   %ymm1,%ymm3,%ymm0
-  .byte  196,226,125,24,13,130,83,2,0        // vbroadcastss  0x25382(%rip),%ymm1        # 2af1c <_sk_srcover_rgba_8888_sse2_lowp+0x980>
+  .byte  196,226,125,24,13,90,86,2,0         // vbroadcastss  0x2565a(%rip),%ymm1        # 2b27c <_sk_srcover_rgba_8888_sse2_lowp+0x980>
   .byte  196,226,101,184,200                 // vfmadd231ps   %ymm0,%ymm3,%ymm1
-  .byte  196,226,125,24,5,120,83,2,0         // vbroadcastss  0x25378(%rip),%ymm0        # 2af20 <_sk_srcover_rgba_8888_sse2_lowp+0x984>
+  .byte  196,226,125,24,5,80,86,2,0          // vbroadcastss  0x25650(%rip),%ymm0        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0x984>
   .byte  196,226,101,184,193                 // vfmadd231ps   %ymm1,%ymm3,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
@@ -15227,11 +15267,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  73,131,248,1                        // cmp           $0x1,%r8
-  .byte  15,134,220,0,0,0                    // jbe           5ca8 <_sk_gradient_hsw+0xeb>
+  .byte  15,134,220,0,0,0                    // jbe           5d30 <_sk_gradient_hsw+0xeb>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  65,186,1,0,0,0                      // mov           $0x1,%r10d
-  .byte  196,226,125,24,21,9,82,2,0          // vbroadcastss  0x25209(%rip),%ymm2        # 2adec <_sk_srcover_rgba_8888_sse2_lowp+0x850>
+  .byte  196,226,125,24,21,225,84,2,0        // vbroadcastss  0x254e1(%rip),%ymm2        # 2b14c <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   .byte  196,65,53,239,201                   // vpxor         %ymm9,%ymm9,%ymm9
   .byte  196,130,125,24,28,145               // vbroadcastss  (%r9,%r10,4),%ymm3
   .byte  197,228,194,216,2                   // vcmpleps      %ymm0,%ymm3,%ymm3
@@ -15239,10 +15279,10 @@
   .byte  197,53,254,203                      // vpaddd        %ymm3,%ymm9,%ymm9
   .byte  73,255,194                          // inc           %r10
   .byte  77,57,208                           // cmp           %r10,%r8
-  .byte  117,227                             // jne           5be8 <_sk_gradient_hsw+0x2b>
+  .byte  117,227                             // jne           5c70 <_sk_gradient_hsw+0x2b>
   .byte  76,139,72,8                         // mov           0x8(%rax),%r9
   .byte  73,131,248,8                        // cmp           $0x8,%r8
-  .byte  15,134,158,0,0,0                    // jbe           5cb1 <_sk_gradient_hsw+0xf4>
+  .byte  15,134,158,0,0,0                    // jbe           5d39 <_sk_gradient_hsw+0xf4>
   .byte  196,65,13,118,246                   // vpcmpeqd      %ymm14,%ymm14,%ymm14
   .byte  196,65,36,87,219                    // vxorps        %ymm11,%ymm11,%ymm11
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -15274,7 +15314,7 @@
   .byte  196,130,5,146,28,136                // vgatherdps    %ymm15,(%r8,%ymm9,4),%ymm3
   .byte  72,139,64,64                        // mov           0x40(%rax),%rax
   .byte  196,34,13,146,28,136                // vgatherdps    %ymm14,(%rax,%ymm9,4),%ymm11
-  .byte  235,77                              // jmp           5cf5 <_sk_gradient_hsw+0x138>
+  .byte  235,77                              // jmp           5d7d <_sk_gradient_hsw+0x138>
   .byte  76,139,72,8                         // mov           0x8(%rax),%r9
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  196,66,53,22,1                      // vpermps       (%r9),%ymm9,%ymm8
@@ -15334,24 +15374,24 @@
   .byte  196,65,52,95,226                    // vmaxps        %ymm10,%ymm9,%ymm12
   .byte  196,65,36,94,220                    // vdivps        %ymm12,%ymm11,%ymm11
   .byte  196,65,36,89,227                    // vmulps        %ymm11,%ymm11,%ymm12
-  .byte  196,98,125,24,45,148,81,2,0         // vbroadcastss  0x25194(%rip),%ymm13        # 2af24 <_sk_srcover_rgba_8888_sse2_lowp+0x988>
-  .byte  196,98,125,24,53,143,81,2,0         // vbroadcastss  0x2518f(%rip),%ymm14        # 2af28 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
+  .byte  196,98,125,24,45,108,84,2,0         // vbroadcastss  0x2546c(%rip),%ymm13        # 2b284 <_sk_srcover_rgba_8888_sse2_lowp+0x988>
+  .byte  196,98,125,24,53,103,84,2,0         // vbroadcastss  0x25467(%rip),%ymm14        # 2b288 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
   .byte  196,66,29,184,245                   // vfmadd231ps   %ymm13,%ymm12,%ymm14
-  .byte  196,98,125,24,45,133,81,2,0         // vbroadcastss  0x25185(%rip),%ymm13        # 2af2c <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  .byte  196,98,125,24,45,93,84,2,0          // vbroadcastss  0x2545d(%rip),%ymm13        # 2b28c <_sk_srcover_rgba_8888_sse2_lowp+0x990>
   .byte  196,66,29,184,238                   // vfmadd231ps   %ymm14,%ymm12,%ymm13
-  .byte  196,98,125,24,53,123,81,2,0         // vbroadcastss  0x2517b(%rip),%ymm14        # 2af30 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
+  .byte  196,98,125,24,53,83,84,2,0          // vbroadcastss  0x25453(%rip),%ymm14        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   .byte  196,66,29,184,245                   // vfmadd231ps   %ymm13,%ymm12,%ymm14
   .byte  196,65,36,89,222                    // vmulps        %ymm14,%ymm11,%ymm11
   .byte  196,65,52,194,202,1                 // vcmpltps      %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,102,81,2,0         // vbroadcastss  0x25166(%rip),%ymm10        # 2af34 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  .byte  196,98,125,24,21,62,84,2,0          // vbroadcastss  0x2543e(%rip),%ymm10        # 2b294 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
   .byte  196,65,44,92,211                    // vsubps        %ymm11,%ymm10,%ymm10
   .byte  196,67,37,74,202,144                // vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   .byte  196,193,124,194,192,1               // vcmpltps      %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,21,252,79,2,0         // vbroadcastss  0x24ffc(%rip),%ymm10        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,21,212,82,2,0         // vbroadcastss  0x252d4(%rip),%ymm10        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,44,92,209                    // vsubps        %ymm9,%ymm10,%ymm10
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  196,65,116,194,200,1                // vcmpltps      %ymm8,%ymm1,%ymm9
-  .byte  196,98,125,24,21,230,79,2,0         // vbroadcastss  0x24fe6(%rip),%ymm10        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,21,190,82,2,0         // vbroadcastss  0x252be(%rip),%ymm10        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,44,92,208                       // vsubps        %ymm0,%ymm10,%ymm10
   .byte  196,195,125,74,194,144              // vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   .byte  196,65,124,194,200,3                // vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -15379,23 +15419,23 @@
   .byte  197,50,89,80,44                     // vmulss        0x2c(%rax),%xmm9,%xmm10
   .byte  196,66,125,24,210                   // vbroadcastss  %xmm10,%ymm10
   .byte  197,44,88,208                       // vaddps        %ymm0,%ymm10,%ymm10
-  .byte  196,98,125,24,29,230,80,2,0         // vbroadcastss  0x250e6(%rip),%ymm11        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  .byte  196,98,125,24,29,190,83,2,0         // vbroadcastss  0x253be(%rip),%ymm11        # 2b298 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
   .byte  197,116,89,217                      // vmulps        %ymm1,%ymm1,%ymm11
   .byte  196,98,125,184,216                  // vfmadd231ps   %ymm0,%ymm0,%ymm11
   .byte  196,193,50,89,193                   // vmulss        %xmm9,%xmm9,%xmm0
   .byte  196,226,125,24,192                  // vbroadcastss  %xmm0,%ymm0
   .byte  197,164,92,192                      // vsubps        %ymm0,%ymm11,%ymm0
-  .byte  196,98,125,24,13,197,80,2,0         // vbroadcastss  0x250c5(%rip),%ymm9        # 2af3c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  .byte  196,98,125,24,13,157,83,2,0         // vbroadcastss  0x2539d(%rip),%ymm9        # 2b29c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,194,45,184,194                  // vfmadd231ps   %ymm10,%ymm10,%ymm0
   .byte  197,252,81,192                      // vsqrtps       %ymm0,%ymm0
   .byte  196,98,125,24,64,36                 // vbroadcastss  0x24(%rax),%ymm8
-  .byte  196,98,125,24,13,168,80,2,0         // vbroadcastss  0x250a8(%rip),%ymm9        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,13,128,83,2,0         // vbroadcastss  0x25380(%rip),%ymm9        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,65,44,87,201                    // vxorps        %ymm9,%ymm10,%ymm9
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  196,98,125,24,29,57,79,2,0          // vbroadcastss  0x24f39(%rip),%ymm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,29,17,82,2,0          // vbroadcastss  0x25211(%rip),%ymm11        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  196,65,44,89,208                    // vmulps        %ymm8,%ymm10,%ymm10
   .byte  197,180,92,192                      // vsubps        %ymm0,%ymm9,%ymm0
@@ -15414,23 +15454,23 @@
   .byte  197,50,89,80,44                     // vmulss        0x2c(%rax),%xmm9,%xmm10
   .byte  196,66,125,24,210                   // vbroadcastss  %xmm10,%ymm10
   .byte  197,44,88,208                       // vaddps        %ymm0,%ymm10,%ymm10
-  .byte  196,98,125,24,29,78,80,2,0          // vbroadcastss  0x2504e(%rip),%ymm11        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  .byte  196,98,125,24,29,38,83,2,0          // vbroadcastss  0x25326(%rip),%ymm11        # 2b298 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
   .byte  197,116,89,217                      // vmulps        %ymm1,%ymm1,%ymm11
   .byte  196,98,125,184,216                  // vfmadd231ps   %ymm0,%ymm0,%ymm11
   .byte  196,193,50,89,193                   // vmulss        %xmm9,%xmm9,%xmm0
   .byte  196,226,125,24,192                  // vbroadcastss  %xmm0,%ymm0
   .byte  197,164,92,192                      // vsubps        %ymm0,%ymm11,%ymm0
-  .byte  196,98,125,24,13,45,80,2,0          // vbroadcastss  0x2502d(%rip),%ymm9        # 2af3c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  .byte  196,98,125,24,13,5,83,2,0           // vbroadcastss  0x25305(%rip),%ymm9        # 2b29c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,194,45,184,194                  // vfmadd231ps   %ymm10,%ymm10,%ymm0
   .byte  197,252,81,192                      // vsqrtps       %ymm0,%ymm0
   .byte  196,98,125,24,64,36                 // vbroadcastss  0x24(%rax),%ymm8
-  .byte  196,98,125,24,13,16,80,2,0          // vbroadcastss  0x25010(%rip),%ymm9        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,13,232,82,2,0         // vbroadcastss  0x252e8(%rip),%ymm9        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,65,44,87,201                    // vxorps        %ymm9,%ymm10,%ymm9
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  196,98,125,24,29,161,78,2,0         // vbroadcastss  0x24ea1(%rip),%ymm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,29,121,81,2,0         // vbroadcastss  0x25179(%rip),%ymm11        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  196,65,44,89,208                    // vmulps        %ymm8,%ymm10,%ymm10
   .byte  197,180,92,192                      // vsubps        %ymm0,%ymm9,%ymm0
@@ -15448,14 +15488,14 @@
   .byte  197,58,89,72,44                     // vmulss        0x2c(%rax),%xmm8,%xmm9
   .byte  196,66,125,24,201                   // vbroadcastss  %xmm9,%ymm9
   .byte  197,52,88,200                       // vaddps        %ymm0,%ymm9,%ymm9
-  .byte  196,98,125,24,21,188,79,2,0         // vbroadcastss  0x24fbc(%rip),%ymm10        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  .byte  196,98,125,24,21,148,82,2,0         // vbroadcastss  0x25294(%rip),%ymm10        # 2b298 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
   .byte  197,116,89,209                      // vmulps        %ymm1,%ymm1,%ymm10
   .byte  196,98,125,184,208                  // vfmadd231ps   %ymm0,%ymm0,%ymm10
   .byte  196,193,58,89,192                   // vmulss        %xmm8,%xmm8,%xmm0
   .byte  196,226,125,24,192                  // vbroadcastss  %xmm0,%ymm0
   .byte  197,172,92,192                      // vsubps        %ymm0,%ymm10,%ymm0
-  .byte  196,98,125,24,5,159,79,2,0          // vbroadcastss  0x24f9f(%rip),%ymm8        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,5,119,82,2,0          // vbroadcastss  0x25277(%rip),%ymm8        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,193,124,87,192                  // vxorps        %ymm8,%ymm0,%ymm0
   .byte  196,193,124,94,193                  // vdivps        %ymm9,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15495,7 +15535,7 @@
 FUNCTION(_sk_save_xy_hsw)
 _sk_save_xy_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,223,77,2,0          // vbroadcastss  0x24ddf(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,183,80,2,0          // vbroadcastss  0x250b7(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,124,88,200                   // vaddps        %ymm8,%ymm0,%ymm9
   .byte  196,67,125,8,209,1                  // vroundps      $0x1,%ymm9,%ymm10
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
@@ -15529,9 +15569,9 @@
 FUNCTION(_sk_bilinear_nx_hsw)
 _sk_bilinear_nx_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,207,78,2,0         // vbroadcastss  0x24ecf(%rip),%ymm0        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,5,167,81,2,0         // vbroadcastss  0x251a7(%rip),%ymm0        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,102,77,2,0          // vbroadcastss  0x24d66(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,62,80,2,0           // vbroadcastss  0x2503e(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,64                     // vsubps        0x40(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15542,7 +15582,7 @@
 FUNCTION(_sk_bilinear_px_hsw)
 _sk_bilinear_px_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,70,77,2,0          // vbroadcastss  0x24d46(%rip),%ymm0        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,5,30,80,2,0          // vbroadcastss  0x2501e(%rip),%ymm0        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,64,64                    // vmovups       0x40(%rax),%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
@@ -15554,9 +15594,9 @@
 FUNCTION(_sk_bilinear_ny_hsw)
 _sk_bilinear_ny_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,134,78,2,0        // vbroadcastss  0x24e86(%rip),%ymm1        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,13,94,81,2,0         // vbroadcastss  0x2515e(%rip),%ymm1        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,28,77,2,0           // vbroadcastss  0x24d1c(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,244,79,2,0          // vbroadcastss  0x24ff4(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,96                     // vsubps        0x60(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15567,7 +15607,7 @@
 FUNCTION(_sk_bilinear_py_hsw)
 _sk_bilinear_py_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,252,76,2,0        // vbroadcastss  0x24cfc(%rip),%ymm1        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,13,212,79,2,0        // vbroadcastss  0x24fd4(%rip),%ymm1        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
   .byte  197,124,16,64,96                    // vmovups       0x60(%rax),%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
@@ -15579,13 +15619,13 @@
 FUNCTION(_sk_bicubic_n3x_hsw)
 _sk_bicubic_n3x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,63,78,2,0          // vbroadcastss  0x24e3f(%rip),%ymm0        # 2af48 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  .byte  196,226,125,24,5,23,81,2,0          // vbroadcastss  0x25117(%rip),%ymm0        # 2b2a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,210,76,2,0          // vbroadcastss  0x24cd2(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,170,79,2,0          // vbroadcastss  0x24faa(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,64                     // vsubps        0x40(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,47,77,2,0          // vbroadcastss  0x24d2f(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
-  .byte  196,98,125,24,29,26,78,2,0          // vbroadcastss  0x24e1a(%rip),%ymm11        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,7,80,2,0           // vbroadcastss  0x25007(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,29,242,80,2,0         // vbroadcastss  0x250f2(%rip),%ymm11        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,36,89,193                    // vmulps        %ymm9,%ymm11,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
@@ -15597,16 +15637,16 @@
 FUNCTION(_sk_bicubic_n1x_hsw)
 _sk_bicubic_n1x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,241,77,2,0         // vbroadcastss  0x24df1(%rip),%ymm0        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,5,201,80,2,0         // vbroadcastss  0x250c9(%rip),%ymm0        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,136,76,2,0          // vbroadcastss  0x24c88(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,96,79,2,0           // vbroadcastss  0x24f60(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,64                     // vsubps        0x40(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,226,77,2,0         // vbroadcastss  0x24de2(%rip),%ymm9        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
-  .byte  196,98,125,24,21,221,77,2,0         // vbroadcastss  0x24ddd(%rip),%ymm10        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,13,186,80,2,0         // vbroadcastss  0x250ba(%rip),%ymm9        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,21,181,80,2,0         // vbroadcastss  0x250b5(%rip),%ymm10        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,66,61,168,209                   // vfmadd213ps   %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,13,95,76,2,0          // vbroadcastss  0x24c5f(%rip),%ymm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,13,55,79,2,0          // vbroadcastss  0x24f37(%rip),%ymm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,66,61,184,202                   // vfmadd231ps   %ymm10,%ymm8,%ymm9
-  .byte  196,98,125,24,21,197,77,2,0         // vbroadcastss  0x24dc5(%rip),%ymm10        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,21,157,80,2,0         // vbroadcastss  0x2509d(%rip),%ymm10        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,66,61,184,209                   // vfmadd231ps   %ymm9,%ymm8,%ymm10
   .byte  197,124,17,144,128,0,0,0            // vmovups       %ymm10,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15617,14 +15657,14 @@
 FUNCTION(_sk_bicubic_p1x_hsw)
 _sk_bicubic_p1x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,53,76,2,0           // vbroadcastss  0x24c35(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,13,79,2,0           // vbroadcastss  0x24f0d(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,188,88,0                        // vaddps        (%rax),%ymm8,%ymm0
   .byte  197,124,16,72,64                    // vmovups       0x40(%rax),%ymm9
-  .byte  196,98,125,24,21,143,77,2,0         // vbroadcastss  0x24d8f(%rip),%ymm10        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
-  .byte  196,98,125,24,29,138,77,2,0         // vbroadcastss  0x24d8a(%rip),%ymm11        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,21,103,80,2,0         // vbroadcastss  0x25067(%rip),%ymm10        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,29,98,80,2,0          // vbroadcastss  0x25062(%rip),%ymm11        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,66,53,168,218                   // vfmadd213ps   %ymm10,%ymm9,%ymm11
   .byte  196,66,53,168,216                   // vfmadd213ps   %ymm8,%ymm9,%ymm11
-  .byte  196,98,125,24,5,123,77,2,0          // vbroadcastss  0x24d7b(%rip),%ymm8        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,5,83,80,2,0           // vbroadcastss  0x25053(%rip),%ymm8        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,66,53,184,195                   // vfmadd231ps   %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15635,12 +15675,12 @@
 FUNCTION(_sk_bicubic_p3x_hsw)
 _sk_bicubic_p3x_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,87,77,2,0          // vbroadcastss  0x24d57(%rip),%ymm0        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,226,125,24,5,47,80,2,0          // vbroadcastss  0x2502f(%rip),%ymm0        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,64,64                    // vmovups       0x40(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,72,76,2,0          // vbroadcastss  0x24c48(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
-  .byte  196,98,125,24,29,51,77,2,0          // vbroadcastss  0x24d33(%rip),%ymm11        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,32,79,2,0          // vbroadcastss  0x24f20(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,29,11,80,2,0          // vbroadcastss  0x2500b(%rip),%ymm11        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,52,89,195                    // vmulps        %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
@@ -15652,13 +15692,13 @@
 FUNCTION(_sk_bicubic_n3y_hsw)
 _sk_bicubic_n3y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,14,77,2,0         // vbroadcastss  0x24d0e(%rip),%ymm1        # 2af48 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  .byte  196,226,125,24,13,230,79,2,0        // vbroadcastss  0x24fe6(%rip),%ymm1        # 2b2a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,160,75,2,0          // vbroadcastss  0x24ba0(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,120,78,2,0          // vbroadcastss  0x24e78(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,96                     // vsubps        0x60(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,253,75,2,0         // vbroadcastss  0x24bfd(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
-  .byte  196,98,125,24,29,232,76,2,0         // vbroadcastss  0x24ce8(%rip),%ymm11        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,213,78,2,0         // vbroadcastss  0x24ed5(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,29,192,79,2,0         // vbroadcastss  0x24fc0(%rip),%ymm11        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,36,89,193                    // vmulps        %ymm9,%ymm11,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
@@ -15670,16 +15710,16 @@
 FUNCTION(_sk_bicubic_n1y_hsw)
 _sk_bicubic_n1y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,191,76,2,0        // vbroadcastss  0x24cbf(%rip),%ymm1        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,13,151,79,2,0        // vbroadcastss  0x24f97(%rip),%ymm1        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,85,75,2,0           // vbroadcastss  0x24b55(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,45,78,2,0           // vbroadcastss  0x24e2d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,96                     // vsubps        0x60(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,175,76,2,0         // vbroadcastss  0x24caf(%rip),%ymm9        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
-  .byte  196,98,125,24,21,170,76,2,0         // vbroadcastss  0x24caa(%rip),%ymm10        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,13,135,79,2,0         // vbroadcastss  0x24f87(%rip),%ymm9        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,21,130,79,2,0         // vbroadcastss  0x24f82(%rip),%ymm10        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,66,61,168,209                   // vfmadd213ps   %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,13,44,75,2,0          // vbroadcastss  0x24b2c(%rip),%ymm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,13,4,78,2,0           // vbroadcastss  0x24e04(%rip),%ymm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,66,61,184,202                   // vfmadd231ps   %ymm10,%ymm8,%ymm9
-  .byte  196,98,125,24,21,146,76,2,0         // vbroadcastss  0x24c92(%rip),%ymm10        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,21,106,79,2,0         // vbroadcastss  0x24f6a(%rip),%ymm10        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,66,61,184,209                   // vfmadd231ps   %ymm9,%ymm8,%ymm10
   .byte  197,124,17,144,160,0,0,0            // vmovups       %ymm10,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15690,14 +15730,14 @@
 FUNCTION(_sk_bicubic_p1y_hsw)
 _sk_bicubic_p1y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,2,75,2,0            // vbroadcastss  0x24b02(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,218,77,2,0          // vbroadcastss  0x24dda(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,188,88,72,32                    // vaddps        0x20(%rax),%ymm8,%ymm1
   .byte  197,124,16,72,96                    // vmovups       0x60(%rax),%ymm9
-  .byte  196,98,125,24,21,91,76,2,0          // vbroadcastss  0x24c5b(%rip),%ymm10        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
-  .byte  196,98,125,24,29,86,76,2,0          // vbroadcastss  0x24c56(%rip),%ymm11        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,21,51,79,2,0          // vbroadcastss  0x24f33(%rip),%ymm10        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,29,46,79,2,0          // vbroadcastss  0x24f2e(%rip),%ymm11        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,66,53,168,218                   // vfmadd213ps   %ymm10,%ymm9,%ymm11
   .byte  196,66,53,168,216                   // vfmadd213ps   %ymm8,%ymm9,%ymm11
-  .byte  196,98,125,24,5,71,76,2,0           // vbroadcastss  0x24c47(%rip),%ymm8        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,5,31,79,2,0           // vbroadcastss  0x24f1f(%rip),%ymm8        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,66,53,184,195                   // vfmadd231ps   %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -15708,12 +15748,12 @@
 FUNCTION(_sk_bicubic_p3y_hsw)
 _sk_bicubic_p3y_hsw:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,35,76,2,0         // vbroadcastss  0x24c23(%rip),%ymm1        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,226,125,24,13,251,78,2,0        // vbroadcastss  0x24efb(%rip),%ymm1        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
   .byte  197,124,16,64,96                    // vmovups       0x60(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,19,75,2,0          // vbroadcastss  0x24b13(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
-  .byte  196,98,125,24,29,254,75,2,0         // vbroadcastss  0x24bfe(%rip),%ymm11        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,235,77,2,0         // vbroadcastss  0x24deb(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,29,214,78,2,0         // vbroadcastss  0x24ed6(%rip),%ymm11        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,66,61,168,218                   // vfmadd213ps   %ymm10,%ymm8,%ymm11
   .byte  196,65,52,89,195                    // vmulps        %ymm11,%ymm9,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
@@ -15853,7 +15893,7 @@
   .byte  196,98,93,64,218                    // vpmulld       %ymm2,%ymm4,%ymm11
   .byte  72,139,0                            // mov           (%rax),%rax
   .byte  197,165,254,193                     // vpaddd        %ymm1,%ymm11,%ymm0
-  .byte  196,98,125,88,61,192,73,2,0         // vpbroadcastd  0x249c0(%rip),%ymm15        # 2af60 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
+  .byte  196,98,125,88,61,152,76,2,0         // vpbroadcastd  0x24c98(%rip),%ymm15        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   .byte  196,194,125,64,199                  // vpmulld       %ymm15,%ymm0,%ymm0
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
   .byte  197,237,118,210                     // vpcmpeqd      %ymm2,%ymm2,%ymm2
@@ -15865,13 +15905,13 @@
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,226,85,146,60,144               // vgatherdps    %ymm5,(%rax,%ymm2,4),%ymm7
   .byte  197,252,17,188,36,0,2,0,0           // vmovups       %ymm7,0x200(%rsp)
-  .byte  196,226,125,88,61,14,72,2,0         // vpbroadcastd  0x2480e(%rip),%ymm7        # 2adf4 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  .byte  196,226,125,88,61,230,74,2,0        // vpbroadcastd  0x24ae6(%rip),%ymm7        # 2b154 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   .byte  197,253,254,199                     // vpaddd        %ymm7,%ymm0,%ymm0
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,226,85,146,20,128               // vgatherdps    %ymm5,(%rax,%ymm0,4),%ymm2
   .byte  197,252,17,148,36,32,1,0,0          // vmovups       %ymm2,0x120(%rsp)
-  .byte  196,226,125,24,5,82,73,2,0          // vbroadcastss  0x24952(%rip),%ymm0        # 2af5c <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  .byte  196,226,125,24,5,42,76,2,0          // vbroadcastss  0x24c2a(%rip),%ymm0        # 2b2bc <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
   .byte  197,172,88,232                      // vaddps        %ymm0,%ymm10,%ymm5
   .byte  197,254,91,237                      // vcvttps2dq    %ymm5,%ymm5
   .byte  196,226,93,64,213                   // vpmulld       %ymm5,%ymm4,%ymm2
@@ -16133,7 +16173,7 @@
   .byte  197,254,127,132,36,0,1,0,0          // vmovdqu       %ymm0,0x100(%rsp)
   .byte  196,98,109,64,200                   // vpmulld       %ymm0,%ymm2,%ymm9
   .byte  197,181,254,199                     // vpaddd        %ymm7,%ymm9,%ymm0
-  .byte  196,98,125,88,21,235,67,2,0         // vpbroadcastd  0x243eb(%rip),%ymm10        # 2af60 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
+  .byte  196,98,125,88,21,195,70,2,0         // vpbroadcastd  0x246c3(%rip),%ymm10        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   .byte  196,194,125,64,194                  // vpmulld       %ymm10,%ymm0,%ymm0
   .byte  197,213,118,237                     // vpcmpeqd      %ymm5,%ymm5,%ymm5
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
@@ -16145,13 +16185,13 @@
   .byte  196,65,36,87,219                    // vxorps        %ymm11,%ymm11,%ymm11
   .byte  196,98,61,146,28,168                // vgatherdps    %ymm8,(%rax,%ymm5,4),%ymm11
   .byte  197,124,17,156,36,192,0,0,0         // vmovups       %ymm11,0xc0(%rsp)
-  .byte  196,98,125,88,29,54,66,2,0          // vpbroadcastd  0x24236(%rip),%ymm11        # 2adf4 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  .byte  196,98,125,88,29,14,69,2,0          // vpbroadcastd  0x2450e(%rip),%ymm11        # 2b154 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   .byte  196,193,125,254,195                 // vpaddd        %ymm11,%ymm0,%ymm0
   .byte  196,65,61,118,192                   // vpcmpeqd      %ymm8,%ymm8,%ymm8
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,226,61,146,44,128               // vgatherdps    %ymm8,(%rax,%ymm0,4),%ymm5
   .byte  197,252,17,108,36,32                // vmovups       %ymm5,0x20(%rsp)
-  .byte  196,226,125,24,5,123,67,2,0         // vbroadcastss  0x2437b(%rip),%ymm0        # 2af5c <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  .byte  196,226,125,24,5,83,70,2,0          // vbroadcastss  0x24653(%rip),%ymm0        # 2b2bc <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
   .byte  197,116,88,192                      // vaddps        %ymm0,%ymm1,%ymm8
   .byte  196,65,126,91,192                   // vcvttps2dq    %ymm8,%ymm8
   .byte  196,194,109,64,232                  // vpmulld       %ymm8,%ymm2,%ymm5
@@ -16584,7 +16624,7 @@
   .byte  196,193,100,92,210                  // vsubps        %ymm10,%ymm3,%ymm2
   .byte  196,194,77,168,210                  // vfmadd213ps   %ymm10,%ymm6,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,89,56,2,0         // vbroadcastss  0x23859(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,49,59,2,0         // vbroadcastss  0x23b31(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,16,164,36,96,6,0,0          // vmovups       0x660(%rsp),%ymm4
   .byte  197,252,16,172,36,128,6,0,0         // vmovups       0x680(%rsp),%ymm5
   .byte  197,252,16,180,36,160,6,0,0         // vmovups       0x6a0(%rsp),%ymm6
@@ -16613,13 +16653,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  115,83                              // jae           763e <_sk_start_pipeline_avx+0x82>
+  .byte  115,83                              // jae           76c6 <_sk_start_pipeline_avx+0x82>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
-  .byte  119,35                              // ja            7624 <_sk_start_pipeline_avx+0x68>
+  .byte  119,35                              // ja            76ac <_sk_start_pipeline_avx+0x68>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  76,137,246                          // mov           %r14,%rsi
@@ -16630,16 +16670,16 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,225                             // jbe           7605 <_sk_start_pipeline_avx+0x49>
+  .byte  118,225                             // jbe           768d <_sk_start_pipeline_avx+0x49>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,9                               // je            7635 <_sk_start_pipeline_avx+0x79>
+  .byte  116,9                               // je            76bd <_sk_start_pipeline_avx+0x79>
   .byte  76,137,246                          // mov           %r14,%rsi
   .byte  72,137,217                          // mov           %rbx,%rcx
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,185                             // jne           75f7 <_sk_start_pipeline_avx+0x3b>
+  .byte  117,185                             // jne           767f <_sk_start_pipeline_avx+0x3b>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -16664,15 +16704,15 @@
   .byte  197,249,112,192,0                   // vpshufd       $0x0,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  197,252,88,5,52,53,2,0              // vaddps        0x23534(%rip),%ymm0,%ymm0        # 2aba0 <_sk_srcover_rgba_8888_sse2_lowp+0x604>
+  .byte  197,252,88,5,12,56,2,0              // vaddps        0x2380c(%rip),%ymm0,%ymm0        # 2af00 <_sk_srcover_rgba_8888_sse2_lowp+0x604>
   .byte  197,249,110,201                     // vmovd         %ecx,%xmm1
   .byte  197,249,112,201,0                   // vpshufd       $0x0,%xmm1,%xmm1
   .byte  196,227,117,24,201,1                // vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,92,55,2,0         // vbroadcastss  0x2375c(%rip),%ymm2        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,21,52,58,2,0         // vbroadcastss  0x23a34(%rip),%ymm2        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,244,88,202                      // vaddps        %ymm2,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,21,81,55,2,0         // vbroadcastss  0x23751(%rip),%ymm2        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,21,41,58,2,0         // vbroadcastss  0x23a29(%rip),%ymm2        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,228,87,219                      // vxorps        %ymm3,%ymm3,%ymm3
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
@@ -16686,46 +16726,46 @@
 _sk_dither_avx:
   .byte  197,121,110,194                     // vmovd         %edx,%xmm8
   .byte  196,65,121,112,192,0                // vpshufd       $0x0,%xmm8,%xmm8
-  .byte  197,57,254,13,241,56,2,0            // vpaddd        0x238f1(%rip),%xmm8,%xmm9        # 2afb0 <_sk_srcover_rgba_8888_sse2_lowp+0xa14>
-  .byte  197,57,254,5,249,56,2,0             // vpaddd        0x238f9(%rip),%xmm8,%xmm8        # 2afc0 <_sk_srcover_rgba_8888_sse2_lowp+0xa24>
+  .byte  197,57,254,13,201,59,2,0            // vpaddd        0x23bc9(%rip),%xmm8,%xmm9        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xa14>
+  .byte  197,57,254,5,209,59,2,0             // vpaddd        0x23bd1(%rip),%xmm8,%xmm8        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xa24>
   .byte  196,67,53,24,208,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm10
   .byte  197,121,110,217                     // vmovd         %ecx,%xmm11
   .byte  196,65,121,112,219,0                // vpshufd       $0x0,%xmm11,%xmm11
   .byte  196,67,37,24,219,1                  // vinsertf128   $0x1,%xmm11,%ymm11,%ymm11
   .byte  196,65,36,87,218                    // vxorps        %ymm10,%ymm11,%ymm11
-  .byte  196,98,125,24,21,1,55,2,0           // vbroadcastss  0x23701(%rip),%ymm10        # 2adec <_sk_srcover_rgba_8888_sse2_lowp+0x850>
+  .byte  196,98,125,24,21,217,57,2,0         // vbroadcastss  0x239d9(%rip),%ymm10        # 2b14c <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   .byte  196,65,36,84,210                    // vandps        %ymm10,%ymm11,%ymm10
   .byte  196,193,25,114,242,5                // vpslld        $0x5,%xmm10,%xmm12
   .byte  196,67,125,25,210,1                 // vextractf128  $0x1,%ymm10,%xmm10
   .byte  196,193,41,114,242,5                // vpslld        $0x5,%xmm10,%xmm10
   .byte  196,67,29,24,210,1                  // vinsertf128   $0x1,%xmm10,%ymm12,%ymm10
-  .byte  197,123,18,37,176,64,2,0            // vmovddup      0x240b0(%rip),%xmm12        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0x1224>
+  .byte  197,123,18,37,136,67,2,0            // vmovddup      0x24388(%rip),%xmm12        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0x1224>
   .byte  196,65,49,219,236                   // vpand         %xmm12,%xmm9,%xmm13
   .byte  196,193,17,114,245,4                // vpslld        $0x4,%xmm13,%xmm13
   .byte  196,65,57,219,228                   // vpand         %xmm12,%xmm8,%xmm12
   .byte  196,193,25,114,244,4                // vpslld        $0x4,%xmm12,%xmm12
   .byte  196,67,21,24,228,1                  // vinsertf128   $0x1,%xmm12,%ymm13,%ymm12
-  .byte  196,98,125,24,45,191,54,2,0         // vbroadcastss  0x236bf(%rip),%ymm13        # 2adf4 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  .byte  196,98,125,24,45,151,57,2,0         // vbroadcastss  0x23997(%rip),%ymm13        # 2b154 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   .byte  196,65,36,84,237                    // vandps        %ymm13,%ymm11,%ymm13
   .byte  196,193,9,114,245,2                 // vpslld        $0x2,%xmm13,%xmm14
   .byte  196,67,125,25,237,1                 // vextractf128  $0x1,%ymm13,%xmm13
   .byte  196,193,17,114,245,2                // vpslld        $0x2,%xmm13,%xmm13
   .byte  196,67,13,24,237,1                  // vinsertf128   $0x1,%xmm13,%ymm14,%ymm13
-  .byte  197,123,18,53,110,64,2,0            // vmovddup      0x2406e(%rip),%xmm14        # 2b7c8 <_sk_srcover_rgba_8888_sse2_lowp+0x122c>
+  .byte  197,123,18,53,70,67,2,0             // vmovddup      0x24346(%rip),%xmm14        # 2bb28 <_sk_srcover_rgba_8888_sse2_lowp+0x122c>
   .byte  196,65,49,219,254                   // vpand         %xmm14,%xmm9,%xmm15
   .byte  196,65,1,254,255                    // vpaddd        %xmm15,%xmm15,%xmm15
   .byte  196,65,57,219,246                   // vpand         %xmm14,%xmm8,%xmm14
   .byte  196,65,9,254,246                    // vpaddd        %xmm14,%xmm14,%xmm14
   .byte  196,67,5,24,246,1                   // vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
   .byte  196,65,12,86,228                    // vorps         %ymm12,%ymm14,%ymm12
-  .byte  196,98,125,24,53,110,54,2,0         // vbroadcastss  0x2366e(%rip),%ymm14        # 2adf0 <_sk_srcover_rgba_8888_sse2_lowp+0x854>
+  .byte  196,98,125,24,53,70,57,2,0          // vbroadcastss  0x23946(%rip),%ymm14        # 2b150 <_sk_srcover_rgba_8888_sse2_lowp+0x854>
   .byte  196,65,36,84,222                    // vandps        %ymm14,%ymm11,%ymm11
   .byte  196,193,9,114,211,1                 // vpsrld        $0x1,%xmm11,%xmm14
   .byte  196,67,125,25,219,1                 // vextractf128  $0x1,%ymm11,%xmm11
   .byte  196,193,33,114,211,1                // vpsrld        $0x1,%xmm11,%xmm11
   .byte  196,67,13,24,219,1                  // vinsertf128   $0x1,%xmm11,%ymm14,%ymm11
   .byte  196,65,20,86,219                    // vorps         %ymm11,%ymm13,%ymm11
-  .byte  197,123,18,45,36,64,2,0             // vmovddup      0x24024(%rip),%xmm13        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0x1234>
+  .byte  197,123,18,45,252,66,2,0            // vmovddup      0x242fc(%rip),%xmm13        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0x1234>
   .byte  196,65,49,219,205                   // vpand         %xmm13,%xmm9,%xmm9
   .byte  196,65,57,219,197                   // vpand         %xmm13,%xmm8,%xmm8
   .byte  196,193,49,114,209,2                // vpsrld        $0x2,%xmm9,%xmm9
@@ -16736,9 +16776,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  196,65,60,86,195                    // vorps         %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,17,54,2,0          // vbroadcastss  0x23611(%rip),%ymm9        # 2adf8 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
+  .byte  196,98,125,24,13,233,56,2,0         // vbroadcastss  0x238e9(%rip),%ymm9        # 2b158 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,7,54,2,0           // vbroadcastss  0x23607(%rip),%ymm9        # 2adfc <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  .byte  196,98,125,24,13,223,56,2,0         // vbroadcastss  0x238df(%rip),%ymm9        # 2b15c <_sk_srcover_rgba_8888_sse2_lowp+0x860>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  196,98,125,24,8                     // vbroadcastss  (%rax),%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
@@ -16772,7 +16812,7 @@
 FUNCTION(_sk_black_color_avx)
 _sk_black_color_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,143,53,2,0        // vbroadcastss  0x2358f(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,103,56,2,0        // vbroadcastss  0x23867(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -16783,7 +16823,7 @@
 FUNCTION(_sk_white_color_avx)
 _sk_white_color_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,118,53,2,0         // vbroadcastss  0x23576(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,78,56,2,0          // vbroadcastss  0x2384e(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
@@ -16829,7 +16869,7 @@
 FUNCTION(_sk_srcatop_avx)
 _sk_srcatop_avx:
   .byte  197,252,89,199                      // vmulps        %ymm7,%ymm0,%ymm0
-  .byte  196,98,125,24,5,21,53,2,0           // vbroadcastss  0x23515(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,237,55,2,0          // vbroadcastss  0x237ed(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,204                       // vmulps        %ymm4,%ymm8,%ymm9
   .byte  197,180,88,192                      // vaddps        %ymm0,%ymm9,%ymm0
@@ -16850,7 +16890,7 @@
 FUNCTION(_sk_dstatop_avx)
 _sk_dstatop_avx:
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
-  .byte  196,98,125,24,13,211,52,2,0         // vbroadcastss  0x234d3(%rip),%ymm9        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,13,171,55,2,0         // vbroadcastss  0x237ab(%rip),%ymm9        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,52,92,207                       // vsubps        %ymm7,%ymm9,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,188,88,192                      // vaddps        %ymm0,%ymm8,%ymm0
@@ -16892,7 +16932,7 @@
 .globl _sk_srcout_avx
 FUNCTION(_sk_srcout_avx)
 _sk_srcout_avx:
-  .byte  196,98,125,24,5,110,52,2,0          // vbroadcastss  0x2346e(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,70,55,2,0           // vbroadcastss  0x23746(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -16905,7 +16945,7 @@
 .globl _sk_dstout_avx
 FUNCTION(_sk_dstout_avx)
 _sk_dstout_avx:
-  .byte  196,226,125,24,5,77,52,2,0          // vbroadcastss  0x2344d(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,37,55,2,0          // vbroadcastss  0x23725(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,92,219                      // vsubps        %ymm3,%ymm0,%ymm3
   .byte  197,228,89,196                      // vmulps        %ymm4,%ymm3,%ymm0
   .byte  197,228,89,205                      // vmulps        %ymm5,%ymm3,%ymm1
@@ -16918,7 +16958,7 @@
 .globl _sk_srcover_avx
 FUNCTION(_sk_srcover_avx)
 _sk_srcover_avx:
-  .byte  196,98,125,24,5,44,52,2,0           // vbroadcastss  0x2342c(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,4,55,2,0            // vbroadcastss  0x23704(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,204                       // vmulps        %ymm4,%ymm8,%ymm9
   .byte  197,180,88,192                      // vaddps        %ymm0,%ymm9,%ymm0
@@ -16935,7 +16975,7 @@
 .globl _sk_dstover_avx
 FUNCTION(_sk_dstover_avx)
 _sk_dstover_avx:
-  .byte  196,98,125,24,5,251,51,2,0          // vbroadcastss  0x233fb(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,211,54,2,0          // vbroadcastss  0x236d3(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,199                       // vsubps        %ymm7,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
@@ -16963,7 +17003,7 @@
 .globl _sk_multiply_avx
 FUNCTION(_sk_multiply_avx)
 _sk_multiply_avx:
-  .byte  196,98,125,24,5,182,51,2,0          // vbroadcastss  0x233b6(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,142,54,2,0          // vbroadcastss  0x2368e(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,208                       // vmulps        %ymm0,%ymm9,%ymm10
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -16994,7 +17034,7 @@
 FUNCTION(_sk_plus__avx)
 _sk_plus__avx:
   .byte  197,252,88,196                      // vaddps        %ymm4,%ymm0,%ymm0
-  .byte  196,98,125,24,5,69,51,2,0           // vbroadcastss  0x23345(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,29,54,2,0           // vbroadcastss  0x2361d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  197,244,88,205                      // vaddps        %ymm5,%ymm1,%ymm1
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
@@ -17028,7 +17068,7 @@
 .globl _sk_xor__avx
 FUNCTION(_sk_xor__avx)
 _sk_xor__avx:
-  .byte  196,98,125,24,5,228,50,2,0          // vbroadcastss  0x232e4(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,188,53,2,0          // vbroadcastss  0x235bc(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,192                      // vmulps        %ymm0,%ymm9,%ymm0
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -17065,7 +17105,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,95,209                  // vmaxps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,96,50,2,0           // vbroadcastss  0x23260(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,56,53,2,0           // vbroadcastss  0x23538(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -17091,7 +17131,7 @@
   .byte  197,100,89,206                      // vmulps        %ymm6,%ymm3,%ymm9
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,8,50,2,0            // vbroadcastss  0x23208(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,224,52,2,0          // vbroadcastss  0x234e0(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -17120,7 +17160,7 @@
   .byte  196,193,108,93,209                  // vminps        %ymm9,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,164,49,2,0          // vbroadcastss  0x231a4(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,124,52,2,0          // vbroadcastss  0x2347c(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -17143,7 +17183,7 @@
   .byte  197,236,89,214                      // vmulps        %ymm6,%ymm2,%ymm2
   .byte  197,236,88,210                      // vaddps        %ymm2,%ymm2,%ymm2
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
-  .byte  196,98,125,24,5,91,49,2,0           // vbroadcastss  0x2315b(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,51,52,2,0           // vbroadcastss  0x23433(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
   .byte  197,60,89,199                       // vmulps        %ymm7,%ymm8,%ymm8
   .byte  197,188,88,219                      // vaddps        %ymm3,%ymm8,%ymm3
@@ -17154,7 +17194,7 @@
 .globl _sk_colorburn_avx
 FUNCTION(_sk_colorburn_avx)
 _sk_colorburn_avx:
-  .byte  196,98,125,24,5,66,49,2,0           // vbroadcastss  0x23142(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,26,52,2,0           // vbroadcastss  0x2341a(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,52,89,216                       // vmulps        %ymm0,%ymm9,%ymm11
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
@@ -17216,7 +17256,7 @@
 FUNCTION(_sk_colordodge_avx)
 _sk_colordodge_avx:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  196,98,125,24,13,70,48,2,0          // vbroadcastss  0x23046(%rip),%ymm9        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,13,30,51,2,0          // vbroadcastss  0x2331e(%rip),%ymm9        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,52,92,215                       // vsubps        %ymm7,%ymm9,%ymm10
   .byte  197,44,89,216                       // vmulps        %ymm0,%ymm10,%ymm11
   .byte  197,52,92,203                       // vsubps        %ymm3,%ymm9,%ymm9
@@ -17273,7 +17313,7 @@
 .globl _sk_hardlight_avx
 FUNCTION(_sk_hardlight_avx)
 _sk_hardlight_avx:
-  .byte  196,98,125,24,5,81,47,2,0           // vbroadcastss  0x22f51(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,41,50,2,0           // vbroadcastss  0x23229(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,200                       // vmulps        %ymm0,%ymm10,%ymm9
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -17328,7 +17368,7 @@
 .globl _sk_overlay_avx
 FUNCTION(_sk_overlay_avx)
 _sk_overlay_avx:
-  .byte  196,98,125,24,5,118,46,2,0          // vbroadcastss  0x22e76(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,78,49,2,0           // vbroadcastss  0x2314e(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,215                       // vsubps        %ymm7,%ymm8,%ymm10
   .byte  197,44,89,200                       // vmulps        %ymm0,%ymm10,%ymm9
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -17394,10 +17434,10 @@
   .byte  196,65,60,88,192                    // vaddps        %ymm8,%ymm8,%ymm8
   .byte  196,65,60,89,216                    // vmulps        %ymm8,%ymm8,%ymm11
   .byte  196,65,60,88,195                    // vaddps        %ymm11,%ymm8,%ymm8
-  .byte  196,98,125,24,29,125,45,2,0         // vbroadcastss  0x22d7d(%rip),%ymm11        # 2ae00 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  .byte  196,98,125,24,29,85,48,2,0          // vbroadcastss  0x23055(%rip),%ymm11        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   .byte  196,65,28,88,235                    // vaddps        %ymm11,%ymm12,%ymm13
   .byte  196,65,20,89,192                    // vmulps        %ymm8,%ymm13,%ymm8
-  .byte  196,98,125,24,45,110,45,2,0         // vbroadcastss  0x22d6e(%rip),%ymm13        # 2ae04 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  .byte  196,98,125,24,45,70,48,2,0          // vbroadcastss  0x23046(%rip),%ymm13        # 2b164 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   .byte  196,65,28,89,245                    // vmulps        %ymm13,%ymm12,%ymm14
   .byte  196,65,12,88,192                    // vaddps        %ymm8,%ymm14,%ymm8
   .byte  196,65,124,82,244                   // vrsqrtps      %ymm12,%ymm14
@@ -17408,7 +17448,7 @@
   .byte  197,4,194,255,2                     // vcmpleps      %ymm7,%ymm15,%ymm15
   .byte  196,67,13,74,240,240                // vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   .byte  197,116,88,249                      // vaddps        %ymm1,%ymm1,%ymm15
-  .byte  196,98,125,24,5,24,45,2,0           // vbroadcastss  0x22d18(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,240,47,2,0          // vbroadcastss  0x22ff0(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,65,60,92,228                    // vsubps        %ymm12,%ymm8,%ymm12
   .byte  197,132,92,195                      // vsubps        %ymm3,%ymm15,%ymm0
   .byte  196,65,124,89,228                   // vmulps        %ymm12,%ymm0,%ymm12
@@ -17535,12 +17575,12 @@
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,65,36,94,222                    // vdivps        %ymm14,%ymm11,%ymm11
   .byte  196,67,37,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  .byte  196,98,125,24,53,251,42,2,0         // vbroadcastss  0x22afb(%rip),%ymm14        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,53,211,45,2,0         // vbroadcastss  0x22dd3(%rip),%ymm14        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,92,89,222                    // vmulps        %ymm14,%ymm4,%ymm11
-  .byte  196,98,125,24,61,241,42,2,0         // vbroadcastss  0x22af1(%rip),%ymm15        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,61,201,45,2,0         // vbroadcastss  0x22dc9(%rip),%ymm15        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,226,125,24,5,226,42,2,0         // vbroadcastss  0x22ae2(%rip),%ymm0        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,226,125,24,5,186,45,2,0         // vbroadcastss  0x22dba(%rip),%ymm0        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  197,76,89,232                       // vmulps        %ymm0,%ymm6,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
   .byte  196,65,52,89,238                    // vmulps        %ymm14,%ymm9,%ymm13
@@ -17601,7 +17641,7 @@
   .byte  196,65,36,95,208                    // vmaxps        %ymm8,%ymm11,%ymm10
   .byte  196,195,109,74,209,240              // vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   .byte  196,193,108,95,208                  // vmaxps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,143,41,2,0          // vbroadcastss  0x2298f(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,103,44,2,0          // vbroadcastss  0x22c67(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,201                      // vmulps        %ymm1,%ymm9,%ymm1
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -17658,12 +17698,12 @@
   .byte  196,65,28,89,219                    // vmulps        %ymm11,%ymm12,%ymm11
   .byte  196,65,36,94,222                    // vdivps        %ymm14,%ymm11,%ymm11
   .byte  196,67,37,74,224,240                // vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  .byte  196,98,125,24,53,185,40,2,0         // vbroadcastss  0x228b9(%rip),%ymm14        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,53,145,43,2,0         // vbroadcastss  0x22b91(%rip),%ymm14        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,92,89,222                    // vmulps        %ymm14,%ymm4,%ymm11
-  .byte  196,98,125,24,61,175,40,2,0         // vbroadcastss  0x228af(%rip),%ymm15        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,61,135,43,2,0         // vbroadcastss  0x22b87(%rip),%ymm15        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,84,89,239                    // vmulps        %ymm15,%ymm5,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
-  .byte  196,226,125,24,5,160,40,2,0         // vbroadcastss  0x228a0(%rip),%ymm0        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,226,125,24,5,120,43,2,0         // vbroadcastss  0x22b78(%rip),%ymm0        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  197,76,89,232                       // vmulps        %ymm0,%ymm6,%ymm13
   .byte  196,65,36,88,221                    // vaddps        %ymm13,%ymm11,%ymm11
   .byte  196,65,52,89,238                    // vmulps        %ymm14,%ymm9,%ymm13
@@ -17724,7 +17764,7 @@
   .byte  196,65,36,95,208                    // vmaxps        %ymm8,%ymm11,%ymm10
   .byte  196,195,109,74,209,240              // vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   .byte  196,193,108,95,208                  // vmaxps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,77,39,2,0           // vbroadcastss  0x2274d(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,37,42,2,0           // vbroadcastss  0x22a25(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,207                       // vsubps        %ymm7,%ymm8,%ymm9
   .byte  197,180,89,201                      // vmulps        %ymm1,%ymm9,%ymm1
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
@@ -17753,12 +17793,12 @@
   .byte  197,252,17,68,36,168                // vmovups       %ymm0,-0x58(%rsp)
   .byte  197,124,89,199                      // vmulps        %ymm7,%ymm0,%ymm8
   .byte  197,116,89,207                      // vmulps        %ymm7,%ymm1,%ymm9
-  .byte  196,98,125,24,45,255,38,2,0         // vbroadcastss  0x226ff(%rip),%ymm13        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,45,215,41,2,0         // vbroadcastss  0x229d7(%rip),%ymm13        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,92,89,213                    // vmulps        %ymm13,%ymm4,%ymm10
-  .byte  196,98,125,24,53,245,38,2,0         // vbroadcastss  0x226f5(%rip),%ymm14        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,53,205,41,2,0         // vbroadcastss  0x229cd(%rip),%ymm14        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,84,89,222                    // vmulps        %ymm14,%ymm5,%ymm11
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,61,230,38,2,0         // vbroadcastss  0x226e6(%rip),%ymm15        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,98,125,24,61,190,41,2,0         // vbroadcastss  0x229be(%rip),%ymm15        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  196,65,76,89,223                    // vmulps        %ymm15,%ymm6,%ymm11
   .byte  196,193,44,88,195                   // vaddps        %ymm11,%ymm10,%ymm0
   .byte  196,65,60,89,221                    // vmulps        %ymm13,%ymm8,%ymm11
@@ -17821,7 +17861,7 @@
   .byte  196,65,44,95,207                    // vmaxps        %ymm15,%ymm10,%ymm9
   .byte  196,195,37,74,192,0                 // vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   .byte  196,65,124,95,199                   // vmaxps        %ymm15,%ymm0,%ymm8
-  .byte  196,226,125,24,5,129,37,2,0         // vbroadcastss  0x22581(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,89,40,2,0          // vbroadcastss  0x22859(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,84,36,168                // vmulps        -0x58(%rsp),%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -17851,12 +17891,12 @@
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  197,100,89,196                      // vmulps        %ymm4,%ymm3,%ymm8
   .byte  197,100,89,205                      // vmulps        %ymm5,%ymm3,%ymm9
-  .byte  196,98,125,24,45,47,37,2,0          // vbroadcastss  0x2252f(%rip),%ymm13        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,45,7,40,2,0           // vbroadcastss  0x22807(%rip),%ymm13        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,108,89,213                   // vmulps        %ymm13,%ymm2,%ymm10
-  .byte  196,98,125,24,53,37,37,2,0          // vbroadcastss  0x22525(%rip),%ymm14        # 2ae0c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  .byte  196,98,125,24,53,253,39,2,0         // vbroadcastss  0x227fd(%rip),%ymm14        # 2b16c <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   .byte  196,65,116,89,222                   // vmulps        %ymm14,%ymm1,%ymm11
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,61,22,37,2,0          // vbroadcastss  0x22516(%rip),%ymm15        # 2ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  .byte  196,98,125,24,61,238,39,2,0         // vbroadcastss  0x227ee(%rip),%ymm15        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   .byte  196,65,28,89,223                    // vmulps        %ymm15,%ymm12,%ymm11
   .byte  196,193,44,88,195                   // vaddps        %ymm11,%ymm10,%ymm0
   .byte  196,65,60,89,221                    // vmulps        %ymm13,%ymm8,%ymm11
@@ -17919,7 +17959,7 @@
   .byte  196,65,44,95,207                    // vmaxps        %ymm15,%ymm10,%ymm9
   .byte  196,195,37,74,192,0                 // vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   .byte  196,65,124,95,199                   // vmaxps        %ymm15,%ymm0,%ymm8
-  .byte  196,226,125,24,5,177,35,2,0         // vbroadcastss  0x223b1(%rip),%ymm0        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,5,137,38,2,0         // vbroadcastss  0x22689(%rip),%ymm0        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,124,92,215                      // vsubps        %ymm7,%ymm0,%ymm10
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  197,124,92,219                      // vsubps        %ymm3,%ymm0,%ymm11
@@ -17951,9 +17991,9 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,42,1,0,0                     // jne           8bcc <_sk_srcover_rgba_8888_avx+0x14a>
+  .byte  15,133,42,1,0,0                     // jne           8c54 <_sk_srcover_rgba_8888_avx+0x14a>
   .byte  196,1,125,16,4,152                  // vmovupd       (%r8,%r11,4),%ymm8
-  .byte  197,125,40,13,16,33,2,0             // vmovapd       0x22110(%rip),%ymm9        # 2abc0 <_sk_srcover_rgba_8888_sse2_lowp+0x624>
+  .byte  197,125,40,13,232,35,2,0            // vmovapd       0x223e8(%rip),%ymm9        # 2af20 <_sk_srcover_rgba_8888_sse2_lowp+0x624>
   .byte  196,193,61,84,225                   // vandpd        %ymm9,%ymm8,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
   .byte  196,193,81,114,208,8                // vpsrld        $0x8,%xmm8,%xmm5
@@ -17971,9 +18011,9 @@
   .byte  197,193,114,215,24                  // vpsrld        $0x18,%xmm7,%xmm7
   .byte  196,227,61,24,255,1                 // vinsertf128   $0x1,%xmm7,%ymm8,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,5,215,34,2,0          // vbroadcastss  0x222d7(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,175,37,2,0          // vbroadcastss  0x225af(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,195                       // vsubps        %ymm3,%ymm8,%ymm8
-  .byte  196,98,125,24,13,246,34,2,0         // vbroadcastss  0x222f6(%rip),%ymm9        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,13,206,37,2,0         // vbroadcastss  0x225ce(%rip),%ymm9        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,60,89,212                       // vmulps        %ymm4,%ymm8,%ymm10
   .byte  196,193,124,88,194                  // vaddps        %ymm10,%ymm0,%ymm0
@@ -18006,7 +18046,7 @@
   .byte  196,65,53,86,202                    // vorpd         %ymm10,%ymm9,%ymm9
   .byte  196,65,61,86,193                    // vorpd         %ymm9,%ymm8,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           8c04 <_sk_srcover_rgba_8888_avx+0x182>
+  .byte  117,66                              // jne           8c8c <_sk_srcover_rgba_8888_avx+0x182>
   .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -18015,33 +18055,33 @@
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,195,254,255,255              // ja            8aa8 <_sk_srcover_rgba_8888_avx+0x26>
+  .byte  15,135,195,254,255,255              // ja            8b30 <_sk_srcover_rgba_8888_avx+0x26>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,4,1,0,0                   // lea           0x104(%rip),%r10        # 8cf4 <_sk_srcover_rgba_8888_avx+0x272>
+  .byte  76,141,21,4,1,0,0                   // lea           0x104(%rip),%r10        # 8d7c <_sk_srcover_rgba_8888_avx+0x272>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,122,16,4,152                  // vmovss        (%r8,%r11,4),%xmm8
-  .byte  233,164,254,255,255                 // jmpq          8aa8 <_sk_srcover_rgba_8888_avx+0x26>
+  .byte  233,164,254,255,255                 // jmpq          8b30 <_sk_srcover_rgba_8888_avx+0x26>
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,180                             // ja            8bc8 <_sk_srcover_rgba_8888_avx+0x146>
+  .byte  119,180                             // ja            8c50 <_sk_srcover_rgba_8888_avx+0x146>
   .byte  65,15,182,193                       // movzbl        %r9b,%eax
-  .byte  76,141,13,241,0,0,0                 // lea           0xf1(%rip),%r9        # 8d10 <_sk_srcover_rgba_8888_avx+0x28e>
+  .byte  76,141,13,241,0,0,0                 // lea           0xf1(%rip),%r9        # 8d98 <_sk_srcover_rgba_8888_avx+0x28e>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,152                             // jmp           8bc8 <_sk_srcover_rgba_8888_avx+0x146>
+  .byte  235,152                             // jmp           8c50 <_sk_srcover_rgba_8888_avx+0x146>
   .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,196,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm8
   .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
   .byte  196,99,61,13,196,1                  // vblendpd      $0x1,%ymm4,%ymm8,%ymm8
-  .byte  233,81,254,255,255                  // jmpq          8aa8 <_sk_srcover_rgba_8888_avx+0x26>
+  .byte  233,81,254,255,255                  // jmpq          8b30 <_sk_srcover_rgba_8888_avx+0x26>
   .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
@@ -18055,10 +18095,10 @@
   .byte  196,99,61,24,196,1                  // vinsertf128   $0x1,%xmm4,%ymm8,%ymm8
   .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
   .byte  196,67,93,13,192,12                 // vblendpd      $0xc,%ymm8,%ymm4,%ymm8
-  .byte  233,252,253,255,255                 // jmpq          8aa8 <_sk_srcover_rgba_8888_avx+0x26>
+  .byte  233,252,253,255,255                 // jmpq          8b30 <_sk_srcover_rgba_8888_avx+0x26>
   .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  233,9,255,255,255                   // jmpq          8bc8 <_sk_srcover_rgba_8888_avx+0x146>
+  .byte  233,9,255,255,255                   // jmpq          8c50 <_sk_srcover_rgba_8888_avx+0x146>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
@@ -18066,7 +18106,7 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,1,122,17,76,152,16              // vmovss        %xmm9,0x10(%r8,%r11,4)
   .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  233,213,254,255,255                 // jmpq          8bc8 <_sk_srcover_rgba_8888_avx+0x146>
+  .byte  233,213,254,255,255                 // jmpq          8c50 <_sk_srcover_rgba_8888_avx+0x146>
   .byte  144                                 // nop
   .byte  5,255,255,255,82                    // add           $0x52ffffff,%eax
   .byte  255                                 // (bad)
@@ -18078,7 +18118,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            8d09 <_sk_srcover_rgba_8888_avx+0x287>
+  .byte  127,255                             // jg            8d91 <_sk_srcover_rgba_8888_avx+0x287>
   .byte  255                                 // (bad)
   .byte  255,99,255                          // jmpq          *-0x1(%rbx)
   .byte  255                                 // (bad)
@@ -18115,7 +18155,7 @@
 .globl _sk_clamp_1_avx
 FUNCTION(_sk_clamp_1_avx)
 _sk_clamp_1_avx:
-  .byte  196,98,125,24,5,150,32,2,0          // vbroadcastss  0x22096(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,110,35,2,0          // vbroadcastss  0x2236e(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
@@ -18127,7 +18167,7 @@
 .globl _sk_clamp_a_avx
 FUNCTION(_sk_clamp_a_avx)
 _sk_clamp_a_avx:
-  .byte  196,98,125,24,5,117,32,2,0          // vbroadcastss  0x22075(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,77,35,2,0           // vbroadcastss  0x2234d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  197,252,93,195                      // vminps        %ymm3,%ymm0,%ymm0
   .byte  197,244,93,203                      // vminps        %ymm3,%ymm1,%ymm1
@@ -18139,7 +18179,7 @@
 .globl _sk_clamp_a_dst_avx
 FUNCTION(_sk_clamp_a_dst_avx)
 _sk_clamp_a_dst_avx:
-  .byte  196,98,125,24,5,87,32,2,0           // vbroadcastss  0x22057(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,47,35,2,0           // vbroadcastss  0x2232f(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,68,93,248                   // vminps        %ymm8,%ymm7,%ymm7
   .byte  197,220,93,231                      // vminps        %ymm7,%ymm4,%ymm4
   .byte  197,212,93,239                      // vminps        %ymm7,%ymm5,%ymm5
@@ -18172,7 +18212,7 @@
 .globl _sk_invert_avx
 FUNCTION(_sk_invert_avx)
 _sk_invert_avx:
-  .byte  196,98,125,24,5,18,32,2,0           // vbroadcastss  0x22012(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,234,34,2,0          // vbroadcastss  0x222ea(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,188,92,192                      // vsubps        %ymm0,%ymm8,%ymm0
   .byte  197,188,92,201                      // vsubps        %ymm1,%ymm8,%ymm1
   .byte  197,188,92,210                      // vsubps        %ymm2,%ymm8,%ymm2
@@ -18228,7 +18268,7 @@
 _sk_unpremul_avx:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,65,100,194,200,0                // vcmpeqps      %ymm8,%ymm3,%ymm9
-  .byte  196,98,125,24,21,162,31,2,0         // vbroadcastss  0x21fa2(%rip),%ymm10        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,21,122,34,2,0         // vbroadcastss  0x2227a(%rip),%ymm10        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,44,94,211                       // vdivps        %ymm3,%ymm10,%ymm10
   .byte  196,67,45,74,192,144                // vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
@@ -18241,17 +18281,17 @@
 .globl _sk_from_srgb_avx
 FUNCTION(_sk_from_srgb_avx)
 _sk_from_srgb_avx:
-  .byte  196,98,125,24,5,175,31,2,0          // vbroadcastss  0x21faf(%rip),%ymm8        # 2ae18 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  .byte  196,98,125,24,5,135,34,2,0          // vbroadcastss  0x22287(%rip),%ymm8        # 2b178 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  197,124,89,208                      // vmulps        %ymm0,%ymm0,%ymm10
-  .byte  196,98,125,24,29,141,31,2,0         // vbroadcastss  0x21f8d(%rip),%ymm11        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,29,101,34,2,0         // vbroadcastss  0x22265(%rip),%ymm11        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,124,89,227                   // vmulps        %ymm11,%ymm0,%ymm12
-  .byte  196,98,125,24,45,147,31,2,0         // vbroadcastss  0x21f93(%rip),%ymm13        # 2ae1c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
+  .byte  196,98,125,24,45,107,34,2,0         // vbroadcastss  0x2226b(%rip),%ymm13        # 2b17c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,44,89,212                    // vmulps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,132,31,2,0         // vbroadcastss  0x21f84(%rip),%ymm12        # 2ae20 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
+  .byte  196,98,125,24,37,92,34,2,0          // vbroadcastss  0x2225c(%rip),%ymm12        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,53,122,31,2,0         // vbroadcastss  0x21f7a(%rip),%ymm14        # 2ae24 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  .byte  196,98,125,24,53,82,34,2,0          // vbroadcastss  0x22252(%rip),%ymm14        # 2b184 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
   .byte  196,193,124,194,198,1               // vcmpltps      %ymm14,%ymm0,%ymm0
   .byte  196,195,45,74,193,0                 // vblendvps     %ymm0,%ymm9,%ymm10,%ymm0
   .byte  196,65,116,89,200                   // vmulps        %ymm8,%ymm1,%ymm9
@@ -18277,17 +18317,17 @@
 .globl _sk_from_srgb_dst_avx
 FUNCTION(_sk_from_srgb_dst_avx)
 _sk_from_srgb_dst_avx:
-  .byte  196,98,125,24,5,3,31,2,0            // vbroadcastss  0x21f03(%rip),%ymm8        # 2ae18 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  .byte  196,98,125,24,5,219,33,2,0          // vbroadcastss  0x221db(%rip),%ymm8        # 2b178 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   .byte  196,65,92,89,200                    // vmulps        %ymm8,%ymm4,%ymm9
   .byte  197,92,89,212                       // vmulps        %ymm4,%ymm4,%ymm10
-  .byte  196,98,125,24,29,225,30,2,0         // vbroadcastss  0x21ee1(%rip),%ymm11        # 2ae08 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  .byte  196,98,125,24,29,185,33,2,0         // vbroadcastss  0x221b9(%rip),%ymm11        # 2b168 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   .byte  196,65,92,89,227                    // vmulps        %ymm11,%ymm4,%ymm12
-  .byte  196,98,125,24,45,231,30,2,0         // vbroadcastss  0x21ee7(%rip),%ymm13        # 2ae1c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
+  .byte  196,98,125,24,45,191,33,2,0         // vbroadcastss  0x221bf(%rip),%ymm13        # 2b17c <_sk_srcover_rgba_8888_sse2_lowp+0x880>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,44,89,212                    // vmulps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,37,216,30,2,0         // vbroadcastss  0x21ed8(%rip),%ymm12        # 2ae20 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
+  .byte  196,98,125,24,37,176,33,2,0         // vbroadcastss  0x221b0(%rip),%ymm12        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
   .byte  196,65,44,88,212                    // vaddps        %ymm12,%ymm10,%ymm10
-  .byte  196,98,125,24,53,206,30,2,0         // vbroadcastss  0x21ece(%rip),%ymm14        # 2ae24 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  .byte  196,98,125,24,53,166,33,2,0         // vbroadcastss  0x221a6(%rip),%ymm14        # 2b184 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
   .byte  196,193,92,194,230,1                // vcmpltps      %ymm14,%ymm4,%ymm4
   .byte  196,195,45,74,225,64                // vblendvps     %ymm4,%ymm9,%ymm10,%ymm4
   .byte  196,65,84,89,200                    // vmulps        %ymm8,%ymm5,%ymm9
@@ -18314,20 +18354,20 @@
 FUNCTION(_sk_to_srgb_avx)
 _sk_to_srgb_avx:
   .byte  197,124,82,200                      // vrsqrtps      %ymm0,%ymm9
-  .byte  196,98,125,24,5,99,30,2,0           // vbroadcastss  0x21e63(%rip),%ymm8        # 2ae28 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
+  .byte  196,98,125,24,5,59,33,2,0           // vbroadcastss  0x2213b(%rip),%ymm8        # 2b188 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
   .byte  196,65,124,89,208                   // vmulps        %ymm8,%ymm0,%ymm10
-  .byte  196,98,125,24,29,93,30,2,0          // vbroadcastss  0x21e5d(%rip),%ymm11        # 2ae30 <_sk_srcover_rgba_8888_sse2_lowp+0x894>
+  .byte  196,98,125,24,29,53,33,2,0          // vbroadcastss  0x22135(%rip),%ymm11        # 2b190 <_sk_srcover_rgba_8888_sse2_lowp+0x894>
   .byte  196,65,52,89,227                    // vmulps        %ymm11,%ymm9,%ymm12
-  .byte  196,98,125,24,45,75,30,2,0          // vbroadcastss  0x21e4b(%rip),%ymm13        # 2ae2c <_sk_srcover_rgba_8888_sse2_lowp+0x890>
+  .byte  196,98,125,24,45,35,33,2,0          // vbroadcastss  0x22123(%rip),%ymm13        # 2b18c <_sk_srcover_rgba_8888_sse2_lowp+0x890>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,52,89,228                    // vmulps        %ymm12,%ymm9,%ymm12
-  .byte  196,98,125,24,53,64,30,2,0          // vbroadcastss  0x21e40(%rip),%ymm14        # 2ae34 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
+  .byte  196,98,125,24,53,24,33,2,0          // vbroadcastss  0x22118(%rip),%ymm14        # 2b194 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
   .byte  196,65,28,88,230                    // vaddps        %ymm14,%ymm12,%ymm12
-  .byte  196,98,125,24,61,54,30,2,0          // vbroadcastss  0x21e36(%rip),%ymm15        # 2ae38 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
+  .byte  196,98,125,24,61,14,33,2,0          // vbroadcastss  0x2210e(%rip),%ymm15        # 2b198 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
   .byte  196,65,52,88,207                    // vaddps        %ymm15,%ymm9,%ymm9
   .byte  196,65,124,83,201                   // vrcpps        %ymm9,%ymm9
   .byte  196,65,52,89,204                    // vmulps        %ymm12,%ymm9,%ymm9
-  .byte  196,98,125,24,37,34,30,2,0          // vbroadcastss  0x21e22(%rip),%ymm12        # 2ae3c <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
+  .byte  196,98,125,24,37,250,32,2,0         // vbroadcastss  0x220fa(%rip),%ymm12        # 2b19c <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
   .byte  196,193,124,194,196,1               // vcmpltps      %ymm12,%ymm0,%ymm0
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  197,124,82,201                      // vrsqrtps      %ymm1,%ymm9
@@ -18364,7 +18404,7 @@
   .byte  197,116,93,202                      // vminps        %ymm2,%ymm1,%ymm9
   .byte  196,65,124,93,201                   // vminps        %ymm9,%ymm0,%ymm9
   .byte  196,65,60,92,209                    // vsubps        %ymm9,%ymm8,%ymm10
-  .byte  196,98,125,24,29,46,29,2,0          // vbroadcastss  0x21d2e(%rip),%ymm11        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,29,6,32,2,0           // vbroadcastss  0x22006(%rip),%ymm11        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,65,36,94,218                    // vdivps        %ymm10,%ymm11,%ymm11
   .byte  197,116,92,226                      // vsubps        %ymm2,%ymm1,%ymm12
   .byte  196,65,28,89,227                    // vmulps        %ymm11,%ymm12,%ymm12
@@ -18374,19 +18414,19 @@
   .byte  196,193,108,89,211                  // vmulps        %ymm11,%ymm2,%ymm2
   .byte  197,252,92,201                      // vsubps        %ymm1,%ymm0,%ymm1
   .byte  196,193,116,89,203                  // vmulps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,91,29,2,0          // vbroadcastss  0x21d5b(%rip),%ymm11        # 2ae48 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
+  .byte  196,98,125,24,29,51,32,2,0          // vbroadcastss  0x22033(%rip),%ymm11        # 2b1a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,73,29,2,0          // vbroadcastss  0x21d49(%rip),%ymm11        # 2ae44 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
+  .byte  196,98,125,24,29,33,32,2,0          // vbroadcastss  0x22021(%rip),%ymm11        # 2b1a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
   .byte  196,227,117,74,202,224              // vblendvps     %ymm14,%ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,49,29,2,0         // vbroadcastss  0x21d31(%rip),%ymm2        # 2ae40 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  .byte  196,226,125,24,21,9,32,2,0          // vbroadcastss  0x22009(%rip),%ymm2        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   .byte  196,65,12,87,246                    // vxorps        %ymm14,%ymm14,%ymm14
   .byte  196,227,13,74,210,208               // vblendvps     %ymm13,%ymm2,%ymm14,%ymm2
   .byte  197,188,194,192,0                   // vcmpeqps      %ymm0,%ymm8,%ymm0
   .byte  196,193,108,88,212                  // vaddps        %ymm12,%ymm2,%ymm2
   .byte  196,227,117,74,194,0                // vblendvps     %ymm0,%ymm2,%ymm1,%ymm0
   .byte  196,193,60,88,201                   // vaddps        %ymm9,%ymm8,%ymm1
-  .byte  196,98,125,24,37,172,28,2,0         // vbroadcastss  0x21cac(%rip),%ymm12        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,37,132,31,2,0         // vbroadcastss  0x21f84(%rip),%ymm12        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,116,89,212                  // vmulps        %ymm12,%ymm1,%ymm2
   .byte  197,28,194,226,1                    // vcmpltps      %ymm2,%ymm12,%ymm12
   .byte  196,65,36,92,216                    // vsubps        %ymm8,%ymm11,%ymm11
@@ -18396,7 +18436,7 @@
   .byte  197,172,94,201                      // vdivps        %ymm1,%ymm10,%ymm1
   .byte  196,195,125,74,198,128              // vblendvps     %ymm8,%ymm14,%ymm0,%ymm0
   .byte  196,195,117,74,206,128              // vblendvps     %ymm8,%ymm14,%ymm1,%ymm1
-  .byte  196,98,125,24,5,219,28,2,0          // vbroadcastss  0x21cdb(%rip),%ymm8        # 2ae4c <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  .byte  196,98,125,24,5,179,31,2,0          // vbroadcastss  0x21fb3(%rip),%ymm8        # 2b1ac <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -18413,7 +18453,7 @@
   .byte  197,252,17,92,36,128                // vmovups       %ymm3,-0x80(%rsp)
   .byte  197,252,40,225                      // vmovaps       %ymm1,%ymm4
   .byte  197,252,40,216                      // vmovaps       %ymm0,%ymm3
-  .byte  196,98,125,24,5,56,28,2,0           // vbroadcastss  0x21c38(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,16,31,2,0           // vbroadcastss  0x21f10(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,60,194,202,2                    // vcmpleps      %ymm2,%ymm8,%ymm9
   .byte  197,92,89,210                       // vmulps        %ymm2,%ymm4,%ymm10
   .byte  196,65,92,92,218                    // vsubps        %ymm10,%ymm4,%ymm11
@@ -18421,23 +18461,23 @@
   .byte  197,52,88,210                       // vaddps        %ymm2,%ymm9,%ymm10
   .byte  197,108,88,202                      // vaddps        %ymm2,%ymm2,%ymm9
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,29,122,28,2,0         // vbroadcastss  0x21c7a(%rip),%ymm11        # 2ae50 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  .byte  196,98,125,24,29,82,31,2,0          // vbroadcastss  0x21f52(%rip),%ymm11        # 2b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   .byte  196,65,100,88,219                   // vaddps        %ymm11,%ymm3,%ymm11
   .byte  196,67,125,8,227,1                  // vroundps      $0x1,%ymm11,%ymm12
   .byte  196,65,36,92,252                    // vsubps        %ymm12,%ymm11,%ymm15
   .byte  196,65,44,92,217                    // vsubps        %ymm9,%ymm10,%ymm11
-  .byte  196,98,125,24,37,76,28,2,0          // vbroadcastss  0x21c4c(%rip),%ymm12        # 2ae40 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  .byte  196,98,125,24,37,36,31,2,0          // vbroadcastss  0x21f24(%rip),%ymm12        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   .byte  196,193,4,89,196                    // vmulps        %ymm12,%ymm15,%ymm0
-  .byte  196,98,125,24,45,70,28,2,0          // vbroadcastss  0x21c46(%rip),%ymm13        # 2ae48 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
+  .byte  196,98,125,24,45,30,31,2,0          // vbroadcastss  0x21f1e(%rip),%ymm13        # 2b1a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
   .byte  197,20,92,240                       // vsubps        %ymm0,%ymm13,%ymm14
   .byte  196,65,36,89,246                    // vmulps        %ymm14,%ymm11,%ymm14
   .byte  196,65,52,88,246                    // vaddps        %ymm14,%ymm9,%ymm14
-  .byte  196,226,125,24,13,59,28,2,0         // vbroadcastss  0x21c3b(%rip),%ymm1        # 2ae54 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  .byte  196,226,125,24,13,19,31,2,0         // vbroadcastss  0x21f13(%rip),%ymm1        # 2b1b4 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   .byte  196,193,116,194,255,2               // vcmpleps      %ymm15,%ymm1,%ymm7
   .byte  196,195,13,74,249,112               // vblendvps     %ymm7,%ymm9,%ymm14,%ymm7
   .byte  196,65,60,194,247,2                 // vcmpleps      %ymm15,%ymm8,%ymm14
   .byte  196,227,45,74,255,224               // vblendvps     %ymm14,%ymm7,%ymm10,%ymm7
-  .byte  196,98,125,24,53,18,28,2,0          // vbroadcastss  0x21c12(%rip),%ymm14        # 2ae4c <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  .byte  196,98,125,24,53,234,30,2,0         // vbroadcastss  0x21eea(%rip),%ymm14        # 2b1ac <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
   .byte  196,65,12,194,255,2                 // vcmpleps      %ymm15,%ymm14,%ymm15
   .byte  196,193,124,89,195                  // vmulps        %ymm11,%ymm0,%ymm0
   .byte  197,180,88,192                      // vaddps        %ymm0,%ymm9,%ymm0
@@ -18456,7 +18496,7 @@
   .byte  197,164,89,247                      // vmulps        %ymm7,%ymm11,%ymm6
   .byte  197,180,88,246                      // vaddps        %ymm6,%ymm9,%ymm6
   .byte  196,227,77,74,237,0                 // vblendvps     %ymm0,%ymm5,%ymm6,%ymm5
-  .byte  196,226,125,24,5,188,27,2,0         // vbroadcastss  0x21bbc(%rip),%ymm0        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,226,125,24,5,148,30,2,0         // vbroadcastss  0x21e94(%rip),%ymm0        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   .byte  197,228,88,192                      // vaddps        %ymm0,%ymm3,%ymm0
   .byte  196,227,125,8,216,1                 // vroundps      $0x1,%ymm0,%ymm3
   .byte  197,252,92,195                      // vsubps        %ymm3,%ymm0,%ymm0
@@ -18510,15 +18550,15 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,75                              // jne           93a2 <_sk_scale_u8_avx+0x63>
+  .byte  117,75                              // jne           942a <_sk_scale_u8_avx+0x63>
   .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,27,28,2,0              // vpand         0x21c1b(%rip),%xmm8,%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,57,219,5,243,30,2,0             // vpand         0x21ef3(%rip),%xmm8,%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,211,26,2,0         // vbroadcastss  0x21ad3(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,171,29,2,0         // vbroadcastss  0x21dab(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  197,188,89,201                      // vmulps        %ymm1,%ymm8,%ymm1
@@ -18531,15 +18571,15 @@
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,166                             // ja            935d <_sk_scale_u8_avx+0x1e>
+  .byte  119,166                             // ja            93e5 <_sk_scale_u8_avx+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,122,0,0,0                 // lea           0x7a(%rip),%r10        # 943c <_sk_scale_u8_avx+0xfd>
+  .byte  76,141,21,122,0,0,0                 // lea           0x7a(%rip),%r10        # 94c4 <_sk_scale_u8_avx+0xfd>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  235,135                             // jmp           935d <_sk_scale_u8_avx+0x1e>
+  .byte  235,135                             // jmp           93e5 <_sk_scale_u8_avx+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
@@ -18547,7 +18587,7 @@
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,94,255,255,255                  // jmpq          935d <_sk_scale_u8_avx+0x1e>
+  .byte  233,94,255,255,255                  // jmpq          93e5 <_sk_scale_u8_avx+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
@@ -18558,7 +18598,7 @@
   .byte  196,1,121,110,12,24                 // vmovd         (%r8,%r11,1),%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,34,255,255,255                  // jmpq          935d <_sk_scale_u8_avx+0x1e>
+  .byte  233,34,255,255,255                  // jmpq          93e5 <_sk_scale_u8_avx+0x1e>
   .byte  144                                 // nop
   .byte  143                                 // (bad)
   .byte  255                                 // (bad)
@@ -18567,7 +18607,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00944c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefdeeb0>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf0094d4 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefdebd8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -18590,26 +18630,26 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,178,0,0,0                    // jne           9529 <_sk_scale_565_avx+0xd1>
+  .byte  15,133,178,0,0,0                    // jne           95b1 <_sk_scale_565_avx+0xd1>
   .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,196,25,2,0         // vbroadcastss  0x219c4(%rip),%ymm9        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,98,125,24,13,156,28,2,0         // vbroadcastss  0x21c9c(%rip),%ymm9        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  196,65,60,84,201                    // vandps        %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,181,25,2,0         // vbroadcastss  0x219b5(%rip),%ymm10        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,98,125,24,21,141,28,2,0         // vbroadcastss  0x21c8d(%rip),%ymm10        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,171,25,2,0         // vbroadcastss  0x219ab(%rip),%ymm10        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,98,125,24,21,131,28,2,0         // vbroadcastss  0x21c83(%rip),%ymm10        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  196,65,60,84,210                    // vandps        %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,156,25,2,0         // vbroadcastss  0x2199c(%rip),%ymm11        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,98,125,24,29,116,28,2,0         // vbroadcastss  0x21c74(%rip),%ymm11        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,29,146,25,2,0         // vbroadcastss  0x21992(%rip),%ymm11        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,98,125,24,29,106,28,2,0         // vbroadcastss  0x21c6a(%rip),%ymm11        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  196,65,60,84,195                    // vandps        %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,131,25,2,0         // vbroadcastss  0x21983(%rip),%ymm11        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,98,125,24,29,91,28,2,0          // vbroadcastss  0x21c5b(%rip),%ymm11        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -18628,27 +18668,27 @@
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,59,255,255,255               // ja            947d <_sk_scale_565_avx+0x25>
+  .byte  15,135,59,255,255,255               // ja            9505 <_sk_scale_565_avx+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 95b0 <_sk_scale_565_avx+0x158>
+  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 9638 <_sk_scale_565_avx+0x158>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,25,255,255,255                  // jmpq          947d <_sk_scale_565_avx+0x25>
+  .byte  233,25,255,255,255                  // jmpq          9505 <_sk_scale_565_avx+0x25>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,121,110,12,88                 // vmovd         (%r8,%r11,2),%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,251,254,255,255                 // jmpq          947d <_sk_scale_565_avx+0x25>
+  .byte  233,251,254,255,255                 // jmpq          9505 <_sk_scale_565_avx+0x25>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,122,126,12,88                 // vmovq         (%r8,%r11,2),%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,205,254,255,255                 // jmpq          947d <_sk_scale_565_avx+0x25>
+  .byte  233,205,254,255,255                 // jmpq          9505 <_sk_scale_565_avx+0x25>
   .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -18700,15 +18740,15 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,111                             // jne           9692 <_sk_lerp_u8_avx+0x87>
+  .byte  117,111                             // jne           971a <_sk_lerp_u8_avx+0x87>
   .byte  196,2,121,48,4,24                   // vpmovzxbw     (%r8,%r11,1),%xmm8
-  .byte  197,57,219,5,79,25,2,0              // vpand         0x2194f(%rip),%xmm8,%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,57,219,5,39,28,2,0              // vpand         0x21c27(%rip),%xmm8,%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,13,7,24,2,0           // vbroadcastss  0x21807(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,223,26,2,0         // vbroadcastss  0x21adf(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,252,92,196                      // vsubps        %ymm4,%ymm0,%ymm0
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
@@ -18729,15 +18769,15 @@
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,130                             // ja            9629 <_sk_lerp_u8_avx+0x1e>
+  .byte  119,130                             // ja            96b1 <_sk_lerp_u8_avx+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,126,0,0,0                 // lea           0x7e(%rip),%r10        # 9730 <_sk_lerp_u8_avx+0x125>
+  .byte  76,141,21,126,0,0,0                 // lea           0x7e(%rip),%r10        # 97b8 <_sk_lerp_u8_avx+0x125>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,96,255,255,255                  // jmpq          9629 <_sk_lerp_u8_avx+0x1e>
+  .byte  233,96,255,255,255                  // jmpq          96b1 <_sk_lerp_u8_avx+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,2                    // vpinsrw       $0x2,%eax,%xmm8,%xmm8
@@ -18745,7 +18785,7 @@
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,55,255,255,255                  // jmpq          9629 <_sk_lerp_u8_avx+0x1e>
+  .byte  233,55,255,255,255                  // jmpq          96b1 <_sk_lerp_u8_avx+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  197,57,196,192,6                    // vpinsrw       $0x6,%eax,%xmm8,%xmm8
@@ -18756,7 +18796,7 @@
   .byte  196,1,121,110,12,24                 // vmovd         (%r8,%r11,1),%xmm9
   .byte  196,66,121,48,201                   // vpmovzxbw     %xmm9,%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,251,254,255,255                 // jmpq          9629 <_sk_lerp_u8_avx+0x1e>
+  .byte  233,251,254,255,255                 // jmpq          96b1 <_sk_lerp_u8_avx+0x1e>
   .byte  102,144                             // xchg          %ax,%ax
   .byte  139,255                             // mov           %edi,%edi
   .byte  255                                 // (bad)
@@ -18764,7 +18804,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde009740 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfdf1a4>
+  .byte  232,255,255,255,221                 // callq         ffffffffde0097c8 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfdeecc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,210                             // callq         *%rdx
@@ -18787,26 +18827,26 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,214,0,0,0                    // jne           9841 <_sk_lerp_565_avx+0xf5>
+  .byte  15,133,214,0,0,0                    // jne           98c9 <_sk_lerp_565_avx+0xf5>
   .byte  196,1,122,111,4,88                  // vmovdqu       (%r8,%r11,2),%xmm8
   .byte  196,66,121,51,200                   // vpmovzxwd     %xmm8,%xmm9
   .byte  196,65,121,112,192,78               // vpshufd       $0x4e,%xmm8,%xmm8
   .byte  196,66,121,51,192                   // vpmovzxwd     %xmm8,%xmm8
   .byte  196,67,53,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,208,22,2,0         // vbroadcastss  0x216d0(%rip),%ymm9        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,98,125,24,13,168,25,2,0         // vbroadcastss  0x219a8(%rip),%ymm9        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  196,65,60,84,201                    // vandps        %ymm9,%ymm8,%ymm9
   .byte  196,65,124,91,201                   // vcvtdq2ps     %ymm9,%ymm9
-  .byte  196,98,125,24,21,193,22,2,0         // vbroadcastss  0x216c1(%rip),%ymm10        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,98,125,24,21,153,25,2,0         // vbroadcastss  0x21999(%rip),%ymm10        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,183,22,2,0         // vbroadcastss  0x216b7(%rip),%ymm10        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,98,125,24,21,143,25,2,0         // vbroadcastss  0x2198f(%rip),%ymm10        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  196,65,60,84,210                    // vandps        %ymm10,%ymm8,%ymm10
   .byte  196,65,124,91,210                   // vcvtdq2ps     %ymm10,%ymm10
-  .byte  196,98,125,24,29,168,22,2,0         // vbroadcastss  0x216a8(%rip),%ymm11        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,98,125,24,29,128,25,2,0         // vbroadcastss  0x21980(%rip),%ymm11        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,24,29,158,22,2,0         // vbroadcastss  0x2169e(%rip),%ymm11        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,98,125,24,29,118,25,2,0         // vbroadcastss  0x21976(%rip),%ymm11        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  196,65,60,84,195                    // vandps        %ymm11,%ymm8,%ymm8
   .byte  196,65,124,91,192                   // vcvtdq2ps     %ymm8,%ymm8
-  .byte  196,98,125,24,29,143,22,2,0         // vbroadcastss  0x2168f(%rip),%ymm11        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,98,125,24,29,103,25,2,0         // vbroadcastss  0x21967(%rip),%ymm11        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  197,100,194,223,1                   // vcmpltps      %ymm7,%ymm3,%ymm11
   .byte  196,65,44,93,224                    // vminps        %ymm8,%ymm10,%ymm12
@@ -18833,27 +18873,27 @@
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,23,255,255,255               // ja            9771 <_sk_lerp_565_avx+0x25>
+  .byte  15,135,23,255,255,255               // ja            97f9 <_sk_lerp_565_avx+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 98c8 <_sk_lerp_565_avx+0x17c>
+  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # 9950 <_sk_lerp_565_avx+0x17c>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,245,254,255,255                 // jmpq          9771 <_sk_lerp_565_avx+0x25>
+  .byte  233,245,254,255,255                 // jmpq          97f9 <_sk_lerp_565_avx+0x25>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,1,57,196,68,88,4,2              // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,121,110,12,88                 // vmovd         (%r8,%r11,2),%xmm9
   .byte  196,67,57,14,193,3                  // vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  .byte  233,215,254,255,255                 // jmpq          9771 <_sk_lerp_565_avx+0x25>
+  .byte  233,215,254,255,255                 // jmpq          97f9 <_sk_lerp_565_avx+0x25>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,1,57,196,68,88,12,6             // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,57,196,68,88,10,5             // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,57,196,68,88,8,4              // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
   .byte  196,1,122,126,12,88                 // vmovq         (%r8,%r11,2),%xmm9
   .byte  196,67,49,14,192,240                // vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  .byte  233,169,254,255,255                 // jmpq          9771 <_sk_lerp_565_avx+0x25>
+  .byte  233,169,254,255,255                 // jmpq          97f9 <_sk_lerp_565_avx+0x25>
   .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -18881,9 +18921,9 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,4,2,0,0                      // jne           9afc <_sk_load_tables_avx+0x218>
+  .byte  15,133,4,2,0,0                      // jne           9b84 <_sk_load_tables_avx+0x218>
   .byte  196,65,125,16,20,144                // vmovupd       (%r8,%rdx,4),%ymm10
-  .byte  197,125,40,13,218,18,2,0            // vmovapd       0x212da(%rip),%ymm9        # 2abe0 <_sk_srcover_rgba_8888_sse2_lowp+0x644>
+  .byte  197,125,40,13,178,21,2,0            // vmovapd       0x215b2(%rip),%ymm9        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x644>
   .byte  196,193,45,84,201                   // vandpd        %ymm9,%ymm10,%ymm1
   .byte  196,227,125,25,200,1                // vextractf128  $0x1,%ymm1,%xmm0
   .byte  196,193,249,126,192                 // vmovq         %xmm0,%r8
@@ -18975,7 +19015,7 @@
   .byte  196,193,65,114,213,24               // vpsrld        $0x18,%xmm13,%xmm7
   .byte  196,227,101,24,223,1                // vinsertf128   $0x1,%xmm7,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,226,125,24,61,110,19,2,0        // vbroadcastss  0x2136e(%rip),%ymm7        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,61,70,22,2,0         // vbroadcastss  0x21646(%rip),%ymm7        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,228,89,223                      // vmulps        %ymm7,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,124,36,200               // vmovups       -0x38(%rsp),%ymm7
@@ -18985,21 +19025,21 @@
   .byte  196,65,44,87,210                    // vxorps        %ymm10,%ymm10,%ymm10
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,233,253,255,255              // ja            98fe <_sk_load_tables_avx+0x1a>
+  .byte  15,135,233,253,255,255              // ja            9986 <_sk_load_tables_avx+0x1a>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,148,0,0,0                 // lea           0x94(%rip),%r10        # 9bb4 <_sk_load_tables_avx+0x2d0>
+  .byte  76,141,21,148,0,0,0                 // lea           0x94(%rip),%r10        # 9c3c <_sk_load_tables_avx+0x2d0>
   .byte  79,99,12,138                        // movslq        (%r10,%r9,4),%r9
   .byte  77,1,209                            // add           %r10,%r9
   .byte  65,255,225                          // jmpq          *%r9
   .byte  196,65,122,16,20,144                // vmovss        (%r8,%rdx,4),%xmm10
-  .byte  233,201,253,255,255                 // jmpq          98fe <_sk_load_tables_avx+0x1a>
+  .byte  233,201,253,255,255                 // jmpq          9986 <_sk_load_tables_avx+0x1a>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,208,4                 // vblendps      $0x4,%ymm0,%ymm1,%ymm10
   .byte  196,193,123,16,4,144                // vmovsd        (%r8,%rdx,4),%xmm0
   .byte  196,99,45,13,208,1                  // vblendpd      $0x1,%ymm0,%ymm10,%ymm10
-  .byte  233,162,253,255,255                 // jmpq          98fe <_sk_load_tables_avx+0x1a>
+  .byte  233,162,253,255,255                 // jmpq          9986 <_sk_load_tables_avx+0x1a>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -19013,9 +19053,9 @@
   .byte  196,99,45,24,208,1                  // vinsertf128   $0x1,%xmm0,%ymm10,%ymm10
   .byte  196,193,121,16,4,144                // vmovupd       (%r8,%rdx,4),%xmm0
   .byte  196,67,125,13,210,12                // vblendpd      $0xc,%ymm10,%ymm0,%ymm10
-  .byte  233,77,253,255,255                  // jmpq          98fe <_sk_load_tables_avx+0x1a>
+  .byte  233,77,253,255,255                  // jmpq          9986 <_sk_load_tables_avx+0x1a>
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  118,255                             // jbe           9bb5 <_sk_load_tables_avx+0x2d1>
+  .byte  118,255                             // jbe           9c3d <_sk_load_tables_avx+0x2d1>
   .byte  255                                 // (bad)
   .byte  255,151,255,255,255,129             // callq         *-0x7e000001(%rdi)
   .byte  255                                 // (bad)
@@ -19045,7 +19085,7 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  197,252,17,124,36,200               // vmovups       %ymm7,-0x38(%rsp)
   .byte  197,252,17,116,36,168               // vmovups       %ymm6,-0x58(%rsp)
-  .byte  15,133,75,2,0,0                     // jne           9e3d <_sk_load_tables_u16_be_avx+0x26d>
+  .byte  15,133,75,2,0,0                     // jne           9ec5 <_sk_load_tables_u16_be_avx+0x26d>
   .byte  196,1,121,16,4,72                   // vmovupd       (%r8,%r9,2),%xmm8
   .byte  196,129,121,16,84,72,16             // vmovupd       0x10(%r8,%r9,2),%xmm2
   .byte  196,129,121,16,92,72,32             // vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -19061,7 +19101,7 @@
   .byte  197,177,108,208                     // vpunpcklqdq   %xmm0,%xmm9,%xmm2
   .byte  197,49,109,232                      // vpunpckhqdq   %xmm0,%xmm9,%xmm13
   .byte  196,65,57,108,212                   // vpunpcklqdq   %xmm12,%xmm8,%xmm10
-  .byte  197,121,111,29,60,19,2,0            // vmovdqa       0x2133c(%rip),%xmm11        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,121,111,29,20,22,2,0            // vmovdqa       0x21614(%rip),%xmm11        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,193,105,219,195                 // vpand         %xmm11,%xmm2,%xmm0
   .byte  197,249,112,208,78                  // vpshufd       $0x4e,%xmm0,%xmm2
   .byte  196,226,121,51,210                  // vpmovzxwd     %xmm2,%xmm2
@@ -19155,7 +19195,7 @@
   .byte  196,226,121,51,219                  // vpmovzxwd     %xmm3,%xmm3
   .byte  196,227,77,24,219,1                 // vinsertf128   $0x1,%xmm3,%ymm6,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,226,125,24,53,79,16,2,0         // vbroadcastss  0x2104f(%rip),%ymm6        # 2ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  .byte  196,226,125,24,53,39,19,2,0         // vbroadcastss  0x21327(%rip),%ymm6        # 2b1d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   .byte  197,228,89,222                      // vmulps        %ymm6,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,16,116,36,168               // vmovups       -0x58(%rsp),%ymm6
@@ -19164,29 +19204,29 @@
   .byte  196,1,123,16,4,72                   // vmovsd        (%r8,%r9,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            9ea3 <_sk_load_tables_u16_be_avx+0x2d3>
+  .byte  116,85                              // je            9f2b <_sk_load_tables_u16_be_avx+0x2d3>
   .byte  196,1,57,22,68,72,8                 // vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            9ea3 <_sk_load_tables_u16_be_avx+0x2d3>
+  .byte  114,72                              // jb            9f2b <_sk_load_tables_u16_be_avx+0x2d3>
   .byte  196,129,123,16,84,72,16             // vmovsd        0x10(%r8,%r9,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            9eb0 <_sk_load_tables_u16_be_avx+0x2e0>
+  .byte  116,72                              // je            9f38 <_sk_load_tables_u16_be_avx+0x2e0>
   .byte  196,129,105,22,84,72,24             // vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            9eb0 <_sk_load_tables_u16_be_avx+0x2e0>
+  .byte  114,59                              // jb            9f38 <_sk_load_tables_u16_be_avx+0x2e0>
   .byte  196,129,123,16,92,72,32             // vmovsd        0x20(%r8,%r9,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,135,253,255,255              // je            9c0d <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  15,132,135,253,255,255              // je            9c95 <_sk_load_tables_u16_be_avx+0x3d>
   .byte  196,129,97,22,92,72,40              // vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,118,253,255,255              // jb            9c0d <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  15,130,118,253,255,255              // jb            9c95 <_sk_load_tables_u16_be_avx+0x3d>
   .byte  196,1,122,126,76,72,48              // vmovq         0x30(%r8,%r9,2),%xmm9
-  .byte  233,106,253,255,255                 // jmpq          9c0d <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  233,106,253,255,255                 // jmpq          9c95 <_sk_load_tables_u16_be_avx+0x3d>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,93,253,255,255                  // jmpq          9c0d <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  233,93,253,255,255                  // jmpq          9c95 <_sk_load_tables_u16_be_avx+0x3d>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,84,253,255,255                  // jmpq          9c0d <_sk_load_tables_u16_be_avx+0x3d>
+  .byte  233,84,253,255,255                  // jmpq          9c95 <_sk_load_tables_u16_be_avx+0x3d>
 
 HIDDEN _sk_load_tables_rgb_u16_be_avx
 .globl _sk_load_tables_rgb_u16_be_avx
@@ -19198,7 +19238,7 @@
   .byte  72,133,255                          // test          %rdi,%rdi
   .byte  197,252,17,124,36,200               // vmovups       %ymm7,-0x38(%rsp)
   .byte  197,252,17,116,36,168               // vmovups       %ymm6,-0x58(%rsp)
-  .byte  15,133,54,2,0,0                     // jne           a10d <_sk_load_tables_rgb_u16_be_avx+0x254>
+  .byte  15,133,54,2,0,0                     // jne           a195 <_sk_load_tables_rgb_u16_be_avx+0x254>
   .byte  196,1,122,111,28,72                 // vmovdqu       (%r8,%r9,2),%xmm11
   .byte  196,129,122,111,92,72,12            // vmovdqu       0xc(%r8,%r9,2),%xmm3
   .byte  196,129,122,111,84,72,24            // vmovdqu       0x18(%r8,%r9,2),%xmm2
@@ -19219,7 +19259,7 @@
   .byte  197,105,108,216                     // vpunpcklqdq   %xmm0,%xmm2,%xmm11
   .byte  197,241,108,211                     // vpunpcklqdq   %xmm3,%xmm1,%xmm2
   .byte  197,241,109,203                     // vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  .byte  197,121,111,53,60,16,2,0            // vmovdqa       0x2103c(%rip),%xmm14        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,121,111,53,20,19,2,0            // vmovdqa       0x21314(%rip),%xmm14        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,193,105,219,214                 // vpand         %xmm14,%xmm2,%xmm2
   .byte  197,249,112,218,78                  // vpshufd       $0x4e,%xmm2,%xmm3
   .byte  196,226,121,51,219                  // vpmovzxwd     %xmm3,%xmm3
@@ -19305,7 +19345,7 @@
   .byte  196,227,105,33,215,48               // vinsertps     $0x30,%xmm7,%xmm2,%xmm2
   .byte  196,227,77,24,210,1                 // vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,233,12,2,0        // vbroadcastss  0x20ce9(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,193,15,2,0        // vbroadcastss  0x20fc1(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,16,116,36,168               // vmovups       -0x58(%rsp),%ymm6
   .byte  197,252,16,124,36,200               // vmovups       -0x38(%rsp),%ymm7
   .byte  255,224                             // jmpq          *%rax
@@ -19313,70 +19353,70 @@
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,92,72,4,2             // vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           a145 <_sk_load_tables_rgb_u16_be_avx+0x28c>
+  .byte  117,31                              // jne           a1cd <_sk_load_tables_rgb_u16_be_avx+0x28c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,199,253,255,255                 // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,199,253,255,255                 // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  196,129,121,110,68,72,6             // vmovd         0x6(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,68,72,10,2            // vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            a18f <_sk_load_tables_rgb_u16_be_avx+0x2d6>
+  .byte  114,48                              // jb            a217 <_sk_load_tables_rgb_u16_be_avx+0x2d6>
   .byte  196,129,121,110,68,72,12            // vmovd         0xc(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,92,72,16,2          // vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           a1a9 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
+  .byte  117,48                              // jne           a231 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,125,253,255,255                 // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,125,253,255,255                 // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,99,253,255,255                  // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,99,253,255,255                  // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  196,129,121,110,68,72,18            // vmovd         0x12(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,1,121,196,84,72,22,2            // vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            a1ea <_sk_load_tables_rgb_u16_be_avx+0x331>
+  .byte  114,39                              // jb            a272 <_sk_load_tables_rgb_u16_be_avx+0x331>
   .byte  196,129,121,110,68,72,24            // vmovd         0x18(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,84,72,28,2          // vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           a1fb <_sk_load_tables_rgb_u16_be_avx+0x342>
+  .byte  117,30                              // jne           a283 <_sk_load_tables_rgb_u16_be_avx+0x342>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,34,253,255,255                  // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,34,253,255,255                  // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,17,253,255,255                  // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,17,253,255,255                  // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  196,129,121,110,68,72,30            // vmovd         0x1e(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,76,72,34,2          // vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            a22e <_sk_load_tables_rgb_u16_be_avx+0x375>
+  .byte  114,25                              // jb            a2b6 <_sk_load_tables_rgb_u16_be_avx+0x375>
   .byte  196,129,121,110,68,72,36            // vmovd         0x24(%r8,%r9,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,129,121,196,68,72,40,2          // vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  .byte  233,222,252,255,255                 // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,222,252,255,255                 // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,213,252,255,255                 // jmpq          9f0c <_sk_load_tables_rgb_u16_be_avx+0x53>
+  .byte  233,213,252,255,255                 // jmpq          9f94 <_sk_load_tables_rgb_u16_be_avx+0x53>
 
 HIDDEN _sk_byte_tables_avx
 .globl _sk_byte_tables_avx
 FUNCTION(_sk_byte_tables_avx)
 _sk_byte_tables_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,210,11,2,0          // vbroadcastss  0x20bd2(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,170,14,2,0          // vbroadcastss  0x20eaa(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  197,125,91,200                      // vcvtps2dq     %ymm0,%ymm9
   .byte  196,65,249,126,200                  // vmovq         %xmm9,%r8
@@ -19511,7 +19551,7 @@
   .byte  196,194,121,49,204                  // vpmovzxbd     %xmm12,%xmm1
   .byte  196,194,121,49,213                  // vpmovzxbd     %xmm13,%xmm2
   .byte  196,227,117,24,202,1                // vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
-  .byte  196,98,125,24,13,138,9,2,0          // vbroadcastss  0x2098a(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,98,12,2,0          // vbroadcastss  0x20c62(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
   .byte  196,193,116,89,201                  // vmulps        %ymm9,%ymm1,%ymm1
@@ -19639,7 +19679,7 @@
   .byte  196,194,121,49,203                  // vpmovzxbd     %xmm11,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,63,7,2,0           // vbroadcastss  0x2073f(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,23,10,2,0          // vbroadcastss  0x20a17(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  196,194,121,49,202                  // vpmovzxbd     %xmm10,%xmm1
   .byte  196,194,121,49,212                  // vpmovzxbd     %xmm12,%xmm2
@@ -19876,36 +19916,36 @@
   .byte  196,193,124,88,195                  // vaddps        %ymm11,%ymm0,%ymm0
   .byte  196,98,125,24,16                    // vbroadcastss  (%rax),%ymm10
   .byte  197,124,91,216                      // vcvtdq2ps     %ymm0,%ymm11
-  .byte  196,98,125,24,37,208,3,2,0          // vbroadcastss  0x203d0(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,37,168,6,2,0          // vbroadcastss  0x206a8(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,198,3,2,0          // vbroadcastss  0x203c6(%rip),%ymm12        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,158,6,2,0          // vbroadcastss  0x2069e(%rip),%ymm12        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,193,124,84,196                  // vandps        %ymm12,%ymm0,%ymm0
-  .byte  196,98,125,24,37,28,3,2,0           // vbroadcastss  0x2031c(%rip),%ymm12        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,37,244,5,2,0          // vbroadcastss  0x205f4(%rip),%ymm12        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,124,86,196                  // vorps         %ymm12,%ymm0,%ymm0
-  .byte  196,98,125,24,37,174,3,2,0          // vbroadcastss  0x203ae(%rip),%ymm12        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,37,134,6,2,0          // vbroadcastss  0x20686(%rip),%ymm12        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,164,3,2,0          // vbroadcastss  0x203a4(%rip),%ymm12        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,37,124,6,2,0          // vbroadcastss  0x2067c(%rip),%ymm12        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,65,124,89,228                   // vmulps        %ymm12,%ymm0,%ymm12
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,149,3,2,0          // vbroadcastss  0x20395(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,109,6,2,0          // vbroadcastss  0x2066d(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,193,124,88,196                  // vaddps        %ymm12,%ymm0,%ymm0
-  .byte  196,98,125,24,37,139,3,2,0          // vbroadcastss  0x2038b(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,99,6,2,0           // vbroadcastss  0x20663(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  197,156,94,192                      // vdivps        %ymm0,%ymm12,%ymm0
   .byte  197,164,92,192                      // vsubps        %ymm0,%ymm11,%ymm0
   .byte  197,172,89,192                      // vmulps        %ymm0,%ymm10,%ymm0
   .byte  196,99,125,8,208,1                  // vroundps      $0x1,%ymm0,%ymm10
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  196,98,125,24,29,111,3,2,0          // vbroadcastss  0x2036f(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,71,6,2,0           // vbroadcastss  0x20647(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,124,88,195                  // vaddps        %ymm11,%ymm0,%ymm0
-  .byte  196,98,125,24,29,101,3,2,0          // vbroadcastss  0x20365(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,61,6,2,0           // vbroadcastss  0x2063d(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,65,44,89,219                    // vmulps        %ymm11,%ymm10,%ymm11
   .byte  196,193,124,92,195                  // vsubps        %ymm11,%ymm0,%ymm0
-  .byte  196,98,125,24,29,86,3,2,0           // vbroadcastss  0x20356(%rip),%ymm11        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,98,125,24,29,46,6,2,0           // vbroadcastss  0x2062e(%rip),%ymm11        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
-  .byte  196,98,125,24,29,76,3,2,0           // vbroadcastss  0x2034c(%rip),%ymm11        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,29,36,6,2,0           // vbroadcastss  0x20624(%rip),%ymm11        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  196,65,36,94,210                    // vdivps        %ymm10,%ymm11,%ymm10
   .byte  196,193,124,88,194                  // vaddps        %ymm10,%ymm0,%ymm0
-  .byte  196,98,125,24,21,61,3,2,0           // vbroadcastss  0x2033d(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,21,6,2,0           // vbroadcastss  0x20615(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,124,89,194                  // vmulps        %ymm10,%ymm0,%ymm0
   .byte  197,253,91,192                      // vcvtps2dq     %ymm0,%ymm0
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -19913,7 +19953,7 @@
   .byte  196,195,125,74,193,128              // vblendvps     %ymm8,%ymm9,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,124,95,192                  // vmaxps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,85,2,2,0            // vbroadcastss  0x20255(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,45,5,2,0            // vbroadcastss  0x2052d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19935,36 +19975,36 @@
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
   .byte  196,98,125,24,16                    // vbroadcastss  (%rax),%ymm10
   .byte  197,124,91,217                      // vcvtdq2ps     %ymm1,%ymm11
-  .byte  196,98,125,24,37,150,2,2,0          // vbroadcastss  0x20296(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,37,110,5,2,0          // vbroadcastss  0x2056e(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,140,2,2,0          // vbroadcastss  0x2028c(%rip),%ymm12        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,100,5,2,0          // vbroadcastss  0x20564(%rip),%ymm12        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,193,116,84,204                  // vandps        %ymm12,%ymm1,%ymm1
-  .byte  196,98,125,24,37,226,1,2,0          // vbroadcastss  0x201e2(%rip),%ymm12        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,37,186,4,2,0          // vbroadcastss  0x204ba(%rip),%ymm12        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,116,86,204                  // vorps         %ymm12,%ymm1,%ymm1
-  .byte  196,98,125,24,37,116,2,2,0          // vbroadcastss  0x20274(%rip),%ymm12        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,37,76,5,2,0           // vbroadcastss  0x2054c(%rip),%ymm12        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,106,2,2,0          // vbroadcastss  0x2026a(%rip),%ymm12        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,37,66,5,2,0           // vbroadcastss  0x20542(%rip),%ymm12        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,65,116,89,228                   // vmulps        %ymm12,%ymm1,%ymm12
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,91,2,2,0           // vbroadcastss  0x2025b(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,51,5,2,0           // vbroadcastss  0x20533(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,193,116,88,204                  // vaddps        %ymm12,%ymm1,%ymm1
-  .byte  196,98,125,24,37,81,2,2,0           // vbroadcastss  0x20251(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,41,5,2,0           // vbroadcastss  0x20529(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  197,156,94,201                      // vdivps        %ymm1,%ymm12,%ymm1
   .byte  197,164,92,201                      // vsubps        %ymm1,%ymm11,%ymm1
   .byte  197,172,89,201                      // vmulps        %ymm1,%ymm10,%ymm1
   .byte  196,99,125,8,209,1                  // vroundps      $0x1,%ymm1,%ymm10
   .byte  196,65,116,92,210                   // vsubps        %ymm10,%ymm1,%ymm10
-  .byte  196,98,125,24,29,53,2,2,0           // vbroadcastss  0x20235(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,13,5,2,0           // vbroadcastss  0x2050d(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,43,2,2,0           // vbroadcastss  0x2022b(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,3,5,2,0            // vbroadcastss  0x20503(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,65,44,89,219                    // vmulps        %ymm11,%ymm10,%ymm11
   .byte  196,193,116,92,203                  // vsubps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,29,28,2,2,0           // vbroadcastss  0x2021c(%rip),%ymm11        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,98,125,24,29,244,4,2,0          // vbroadcastss  0x204f4(%rip),%ymm11        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
-  .byte  196,98,125,24,29,18,2,2,0           // vbroadcastss  0x20212(%rip),%ymm11        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,29,234,4,2,0          // vbroadcastss  0x204ea(%rip),%ymm11        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  196,65,36,94,210                    // vdivps        %ymm10,%ymm11,%ymm10
   .byte  196,193,116,88,202                  // vaddps        %ymm10,%ymm1,%ymm1
-  .byte  196,98,125,24,21,3,2,2,0            // vbroadcastss  0x20203(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,219,4,2,0          // vbroadcastss  0x204db(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,116,89,202                  // vmulps        %ymm10,%ymm1,%ymm1
   .byte  197,253,91,201                      // vcvtps2dq     %ymm1,%ymm1
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -19972,7 +20012,7 @@
   .byte  196,195,117,74,201,128              // vblendvps     %ymm8,%ymm9,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,116,95,200                  // vmaxps        %ymm8,%ymm1,%ymm1
-  .byte  196,98,125,24,5,27,1,2,0            // vbroadcastss  0x2011b(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,243,3,2,0           // vbroadcastss  0x203f3(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,116,93,200                  // vminps        %ymm8,%ymm1,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -19994,36 +20034,36 @@
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
   .byte  196,98,125,24,16                    // vbroadcastss  (%rax),%ymm10
   .byte  197,124,91,218                      // vcvtdq2ps     %ymm2,%ymm11
-  .byte  196,98,125,24,37,92,1,2,0           // vbroadcastss  0x2015c(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,37,52,4,2,0           // vbroadcastss  0x20434(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,82,1,2,0           // vbroadcastss  0x20152(%rip),%ymm12        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,42,4,2,0           // vbroadcastss  0x2042a(%rip),%ymm12        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,193,108,84,212                  // vandps        %ymm12,%ymm2,%ymm2
-  .byte  196,98,125,24,37,168,0,2,0          // vbroadcastss  0x200a8(%rip),%ymm12        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,37,128,3,2,0          // vbroadcastss  0x20380(%rip),%ymm12        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,108,86,212                  // vorps         %ymm12,%ymm2,%ymm2
-  .byte  196,98,125,24,37,58,1,2,0           // vbroadcastss  0x2013a(%rip),%ymm12        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,37,18,4,2,0           // vbroadcastss  0x20412(%rip),%ymm12        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,48,1,2,0           // vbroadcastss  0x20130(%rip),%ymm12        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,37,8,4,2,0            // vbroadcastss  0x20408(%rip),%ymm12        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,65,108,89,228                   // vmulps        %ymm12,%ymm2,%ymm12
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,33,1,2,0           // vbroadcastss  0x20121(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,249,3,2,0          // vbroadcastss  0x203f9(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,193,108,88,212                  // vaddps        %ymm12,%ymm2,%ymm2
-  .byte  196,98,125,24,37,23,1,2,0           // vbroadcastss  0x20117(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,239,3,2,0          // vbroadcastss  0x203ef(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  197,156,94,210                      // vdivps        %ymm2,%ymm12,%ymm2
   .byte  197,164,92,210                      // vsubps        %ymm2,%ymm11,%ymm2
   .byte  197,172,89,210                      // vmulps        %ymm2,%ymm10,%ymm2
   .byte  196,99,125,8,210,1                  // vroundps      $0x1,%ymm2,%ymm10
   .byte  196,65,108,92,210                   // vsubps        %ymm10,%ymm2,%ymm10
-  .byte  196,98,125,24,29,251,0,2,0          // vbroadcastss  0x200fb(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,211,3,2,0          // vbroadcastss  0x203d3(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
-  .byte  196,98,125,24,29,241,0,2,0          // vbroadcastss  0x200f1(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,201,3,2,0          // vbroadcastss  0x203c9(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,65,44,89,219                    // vmulps        %ymm11,%ymm10,%ymm11
   .byte  196,193,108,92,211                  // vsubps        %ymm11,%ymm2,%ymm2
-  .byte  196,98,125,24,29,226,0,2,0          // vbroadcastss  0x200e2(%rip),%ymm11        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,98,125,24,29,186,3,2,0          // vbroadcastss  0x203ba(%rip),%ymm11        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
-  .byte  196,98,125,24,29,216,0,2,0          // vbroadcastss  0x200d8(%rip),%ymm11        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,29,176,3,2,0          // vbroadcastss  0x203b0(%rip),%ymm11        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  196,65,36,94,210                    // vdivps        %ymm10,%ymm11,%ymm10
   .byte  196,193,108,88,210                  // vaddps        %ymm10,%ymm2,%ymm2
-  .byte  196,98,125,24,21,201,0,2,0          // vbroadcastss  0x200c9(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,161,3,2,0          // vbroadcastss  0x203a1(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,108,89,210                  // vmulps        %ymm10,%ymm2,%ymm2
   .byte  197,253,91,210                      // vcvtps2dq     %ymm2,%ymm2
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -20031,7 +20071,7 @@
   .byte  196,195,109,74,209,128              // vblendvps     %ymm8,%ymm9,%ymm2,%ymm2
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,108,95,208                  // vmaxps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,225,255,1,0         // vbroadcastss  0x1ffe1(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,185,2,2,0           // vbroadcastss  0x202b9(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,108,93,208                  // vminps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -20053,36 +20093,36 @@
   .byte  196,193,100,88,219                  // vaddps        %ymm11,%ymm3,%ymm3
   .byte  196,98,125,24,16                    // vbroadcastss  (%rax),%ymm10
   .byte  197,124,91,219                      // vcvtdq2ps     %ymm3,%ymm11
-  .byte  196,98,125,24,37,34,0,2,0           // vbroadcastss  0x20022(%rip),%ymm12        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,37,250,2,2,0          // vbroadcastss  0x202fa(%rip),%ymm12        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,24,0,2,0           // vbroadcastss  0x20018(%rip),%ymm12        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,37,240,2,2,0          // vbroadcastss  0x202f0(%rip),%ymm12        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,193,100,84,220                  // vandps        %ymm12,%ymm3,%ymm3
-  .byte  196,98,125,24,37,110,255,1,0        // vbroadcastss  0x1ff6e(%rip),%ymm12        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,37,70,2,2,0           // vbroadcastss  0x20246(%rip),%ymm12        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,100,86,220                  // vorps         %ymm12,%ymm3,%ymm3
-  .byte  196,98,125,24,37,0,0,2,0            // vbroadcastss  0x20000(%rip),%ymm12        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,37,216,2,2,0          // vbroadcastss  0x202d8(%rip),%ymm12        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,65,36,88,220                    // vaddps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,246,255,1,0        // vbroadcastss  0x1fff6(%rip),%ymm12        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,37,206,2,2,0          // vbroadcastss  0x202ce(%rip),%ymm12        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,65,100,89,228                   // vmulps        %ymm12,%ymm3,%ymm12
   .byte  196,65,36,92,220                    // vsubps        %ymm12,%ymm11,%ymm11
-  .byte  196,98,125,24,37,231,255,1,0        // vbroadcastss  0x1ffe7(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,191,2,2,0          // vbroadcastss  0x202bf(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,193,100,88,220                  // vaddps        %ymm12,%ymm3,%ymm3
-  .byte  196,98,125,24,37,221,255,1,0        // vbroadcastss  0x1ffdd(%rip),%ymm12        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,37,181,2,2,0          // vbroadcastss  0x202b5(%rip),%ymm12        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  197,156,94,219                      // vdivps        %ymm3,%ymm12,%ymm3
   .byte  197,164,92,219                      // vsubps        %ymm3,%ymm11,%ymm3
   .byte  197,172,89,219                      // vmulps        %ymm3,%ymm10,%ymm3
   .byte  196,99,125,8,211,1                  // vroundps      $0x1,%ymm3,%ymm10
   .byte  196,65,100,92,210                   // vsubps        %ymm10,%ymm3,%ymm10
-  .byte  196,98,125,24,29,193,255,1,0        // vbroadcastss  0x1ffc1(%rip),%ymm11        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,29,153,2,2,0          // vbroadcastss  0x20299(%rip),%ymm11        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,100,88,219                  // vaddps        %ymm11,%ymm3,%ymm3
-  .byte  196,98,125,24,29,183,255,1,0        // vbroadcastss  0x1ffb7(%rip),%ymm11        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,98,125,24,29,143,2,2,0          // vbroadcastss  0x2028f(%rip),%ymm11        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  196,65,44,89,219                    // vmulps        %ymm11,%ymm10,%ymm11
   .byte  196,193,100,92,219                  // vsubps        %ymm11,%ymm3,%ymm3
-  .byte  196,98,125,24,29,168,255,1,0        // vbroadcastss  0x1ffa8(%rip),%ymm11        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,98,125,24,29,128,2,2,0          // vbroadcastss  0x20280(%rip),%ymm11        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  196,65,36,92,210                    // vsubps        %ymm10,%ymm11,%ymm10
-  .byte  196,98,125,24,29,158,255,1,0        // vbroadcastss  0x1ff9e(%rip),%ymm11        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,98,125,24,29,118,2,2,0          // vbroadcastss  0x20276(%rip),%ymm11        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  196,65,36,94,210                    // vdivps        %ymm10,%ymm11,%ymm10
   .byte  196,193,100,88,218                  // vaddps        %ymm10,%ymm3,%ymm3
-  .byte  196,98,125,24,21,143,255,1,0        // vbroadcastss  0x1ff8f(%rip),%ymm10        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,98,125,24,21,103,2,2,0          // vbroadcastss  0x20267(%rip),%ymm10        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  196,193,100,89,218                  // vmulps        %ymm10,%ymm3,%ymm3
   .byte  197,253,91,219                      // vcvtps2dq     %ymm3,%ymm3
   .byte  196,98,125,24,80,20                 // vbroadcastss  0x14(%rax),%ymm10
@@ -20090,7 +20130,7 @@
   .byte  196,195,101,74,217,128              // vblendvps     %ymm8,%ymm9,%ymm3,%ymm3
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  196,193,100,95,216                  // vmaxps        %ymm8,%ymm3,%ymm3
-  .byte  196,98,125,24,5,167,254,1,0         // vbroadcastss  0x1fea7(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,127,1,2,0           // vbroadcastss  0x2017f(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,100,93,216                  // vminps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -20109,34 +20149,34 @@
   .byte  197,252,40,233                      // vmovaps       %ymm1,%ymm5
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,91,200                      // vcvtdq2ps     %ymm0,%ymm1
-  .byte  196,98,125,24,5,250,254,1,0         // vbroadcastss  0x1fefa(%rip),%ymm8        # 2ae7c <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  .byte  196,98,125,24,5,210,1,2,0           // vbroadcastss  0x201d2(%rip),%ymm8        # 2b1dc <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
-  .byte  196,98,125,24,13,240,254,1,0        // vbroadcastss  0x1fef0(%rip),%ymm9        # 2ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  .byte  196,98,125,24,13,200,1,2,0          // vbroadcastss  0x201c8(%rip),%ymm9        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   .byte  196,193,124,84,193                  // vandps        %ymm9,%ymm0,%ymm0
-  .byte  196,226,125,24,37,70,254,1,0        // vbroadcastss  0x1fe46(%rip),%ymm4        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,37,30,1,2,0          // vbroadcastss  0x2011e(%rip),%ymm4        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,252,86,196                      // vorps         %ymm4,%ymm0,%ymm0
-  .byte  196,98,125,24,21,217,254,1,0        // vbroadcastss  0x1fed9(%rip),%ymm10        # 2ae84 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  .byte  196,98,125,24,21,177,1,2,0          // vbroadcastss  0x201b1(%rip),%ymm10        # 2b1e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   .byte  196,193,116,88,202                  // vaddps        %ymm10,%ymm1,%ymm1
-  .byte  196,98,125,24,29,207,254,1,0        // vbroadcastss  0x1fecf(%rip),%ymm11        # 2ae88 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  .byte  196,98,125,24,29,167,1,2,0          // vbroadcastss  0x201a7(%rip),%ymm11        # 2b1e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   .byte  196,193,124,89,211                  // vmulps        %ymm11,%ymm0,%ymm2
   .byte  197,244,92,202                      // vsubps        %ymm2,%ymm1,%ymm1
-  .byte  196,98,125,24,37,193,254,1,0        // vbroadcastss  0x1fec1(%rip),%ymm12        # 2ae8c <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  .byte  196,98,125,24,37,153,1,2,0          // vbroadcastss  0x20199(%rip),%ymm12        # 2b1ec <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   .byte  196,193,124,88,196                  // vaddps        %ymm12,%ymm0,%ymm0
-  .byte  196,98,125,24,45,183,254,1,0        // vbroadcastss  0x1feb7(%rip),%ymm13        # 2ae90 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  .byte  196,98,125,24,45,143,1,2,0          // vbroadcastss  0x2018f(%rip),%ymm13        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   .byte  197,148,94,192                      // vdivps        %ymm0,%ymm13,%ymm0
   .byte  197,244,92,192                      // vsubps        %ymm0,%ymm1,%ymm0
   .byte  196,98,125,24,48                    // vbroadcastss  (%rax),%ymm14
   .byte  196,193,124,89,198                  // vmulps        %ymm14,%ymm0,%ymm0
   .byte  196,227,125,8,200,1                 // vroundps      $0x1,%ymm0,%ymm1
   .byte  197,252,92,241                      // vsubps        %ymm1,%ymm0,%ymm6
-  .byte  196,98,125,24,61,150,254,1,0        // vbroadcastss  0x1fe96(%rip),%ymm15        # 2ae94 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  .byte  196,98,125,24,61,110,1,2,0          // vbroadcastss  0x2016e(%rip),%ymm15        # 2b1f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   .byte  196,193,124,88,199                  // vaddps        %ymm15,%ymm0,%ymm0
-  .byte  196,226,125,24,29,140,254,1,0       // vbroadcastss  0x1fe8c(%rip),%ymm3        # 2ae98 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  .byte  196,226,125,24,29,100,1,2,0         // vbroadcastss  0x20164(%rip),%ymm3        # 2b1f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   .byte  197,204,89,203                      // vmulps        %ymm3,%ymm6,%ymm1
   .byte  197,252,92,201                      // vsubps        %ymm1,%ymm0,%ymm1
-  .byte  196,226,125,24,21,127,254,1,0       // vbroadcastss  0x1fe7f(%rip),%ymm2        # 2ae9c <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  .byte  196,226,125,24,21,87,1,2,0          // vbroadcastss  0x20157(%rip),%ymm2        # 2b1fc <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   .byte  197,236,92,198                      // vsubps        %ymm6,%ymm2,%ymm0
-  .byte  196,226,125,24,53,118,254,1,0       // vbroadcastss  0x1fe76(%rip),%ymm6        # 2aea0 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  .byte  196,226,125,24,53,78,1,2,0          // vbroadcastss  0x2014e(%rip),%ymm6        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   .byte  197,204,94,192                      // vdivps        %ymm0,%ymm6,%ymm0
   .byte  197,244,88,192                      // vaddps        %ymm0,%ymm1,%ymm0
   .byte  197,252,17,68,36,128                // vmovups       %ymm0,-0x80(%rsp)
@@ -20178,7 +20218,7 @@
   .byte  197,236,92,212                      // vsubps        %ymm4,%ymm2,%ymm2
   .byte  197,204,94,210                      // vdivps        %ymm2,%ymm6,%ymm2
   .byte  197,244,88,202                      // vaddps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,185,253,1,0       // vbroadcastss  0x1fdb9(%rip),%ymm2        # 2aea4 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  .byte  196,226,125,24,21,145,0,2,0         // vbroadcastss  0x20091(%rip),%ymm2        # 2b204 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   .byte  197,236,89,92,36,128                // vmulps        -0x80(%rsp),%ymm2,%ymm3
   .byte  197,252,89,226                      // vmulps        %ymm2,%ymm0,%ymm4
   .byte  197,244,89,210                      // vmulps        %ymm2,%ymm1,%ymm2
@@ -20198,31 +20238,31 @@
 .globl _sk_lab_to_xyz_avx
 FUNCTION(_sk_lab_to_xyz_avx)
 _sk_lab_to_xyz_avx:
-  .byte  196,98,125,24,5,117,253,1,0         // vbroadcastss  0x1fd75(%rip),%ymm8        # 2aea8 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
+  .byte  196,98,125,24,5,77,0,2,0            // vbroadcastss  0x2004d(%rip),%ymm8        # 2b208 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,211,252,1,0         // vbroadcastss  0x1fcd3(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,171,255,1,0         // vbroadcastss  0x1ffab(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
-  .byte  196,98,125,24,13,93,253,1,0         // vbroadcastss  0x1fd5d(%rip),%ymm9        # 2aeac <_sk_srcover_rgba_8888_sse2_lowp+0x910>
+  .byte  196,98,125,24,13,53,0,2,0           // vbroadcastss  0x20035(%rip),%ymm9        # 2b20c <_sk_srcover_rgba_8888_sse2_lowp+0x910>
   .byte  196,193,116,88,201                  // vaddps        %ymm9,%ymm1,%ymm1
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  196,193,108,88,209                  // vaddps        %ymm9,%ymm2,%ymm2
-  .byte  196,98,125,24,5,73,253,1,0          // vbroadcastss  0x1fd49(%rip),%ymm8        # 2aeb0 <_sk_srcover_rgba_8888_sse2_lowp+0x914>
+  .byte  196,98,125,24,5,33,0,2,0            // vbroadcastss  0x20021(%rip),%ymm8        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0x914>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,63,253,1,0          // vbroadcastss  0x1fd3f(%rip),%ymm8        # 2aeb4 <_sk_srcover_rgba_8888_sse2_lowp+0x918>
+  .byte  196,98,125,24,5,23,0,2,0            // vbroadcastss  0x20017(%rip),%ymm8        # 2b214 <_sk_srcover_rgba_8888_sse2_lowp+0x918>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,5,53,253,1,0          // vbroadcastss  0x1fd35(%rip),%ymm8        # 2aeb8 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
+  .byte  196,98,125,24,5,13,0,2,0            // vbroadcastss  0x2000d(%rip),%ymm8        # 2b218 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
   .byte  196,193,116,89,200                  // vmulps        %ymm8,%ymm1,%ymm1
   .byte  197,252,88,201                      // vaddps        %ymm1,%ymm0,%ymm1
-  .byte  196,98,125,24,5,39,253,1,0          // vbroadcastss  0x1fd27(%rip),%ymm8        # 2aebc <_sk_srcover_rgba_8888_sse2_lowp+0x920>
+  .byte  196,98,125,24,5,255,255,1,0         // vbroadcastss  0x1ffff(%rip),%ymm8        # 2b21c <_sk_srcover_rgba_8888_sse2_lowp+0x920>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  197,252,92,210                      // vsubps        %ymm2,%ymm0,%ymm2
   .byte  197,116,89,193                      // vmulps        %ymm1,%ymm1,%ymm8
   .byte  196,65,116,89,192                   // vmulps        %ymm8,%ymm1,%ymm8
-  .byte  196,98,125,24,13,16,253,1,0         // vbroadcastss  0x1fd10(%rip),%ymm9        # 2aec0 <_sk_srcover_rgba_8888_sse2_lowp+0x924>
+  .byte  196,98,125,24,13,232,255,1,0        // vbroadcastss  0x1ffe8(%rip),%ymm9        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0x924>
   .byte  196,65,52,194,208,1                 // vcmpltps      %ymm8,%ymm9,%ymm10
-  .byte  196,98,125,24,29,5,253,1,0          // vbroadcastss  0x1fd05(%rip),%ymm11        # 2aec4 <_sk_srcover_rgba_8888_sse2_lowp+0x928>
+  .byte  196,98,125,24,29,221,255,1,0        // vbroadcastss  0x1ffdd(%rip),%ymm11        # 2b224 <_sk_srcover_rgba_8888_sse2_lowp+0x928>
   .byte  196,193,116,88,203                  // vaddps        %ymm11,%ymm1,%ymm1
-  .byte  196,98,125,24,37,251,252,1,0        // vbroadcastss  0x1fcfb(%rip),%ymm12        # 2aec8 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
+  .byte  196,98,125,24,37,211,255,1,0        // vbroadcastss  0x1ffd3(%rip),%ymm12        # 2b228 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
   .byte  196,193,116,89,204                  // vmulps        %ymm12,%ymm1,%ymm1
   .byte  196,67,117,74,192,160               // vblendvps     %ymm10,%ymm8,%ymm1,%ymm8
   .byte  197,252,89,200                      // vmulps        %ymm0,%ymm0,%ymm1
@@ -20237,9 +20277,9 @@
   .byte  196,193,108,88,211                  // vaddps        %ymm11,%ymm2,%ymm2
   .byte  196,193,108,89,212                  // vmulps        %ymm12,%ymm2,%ymm2
   .byte  196,227,109,74,208,144              // vblendvps     %ymm9,%ymm0,%ymm2,%ymm2
-  .byte  196,226,125,24,5,177,252,1,0        // vbroadcastss  0x1fcb1(%rip),%ymm0        # 2aecc <_sk_srcover_rgba_8888_sse2_lowp+0x930>
+  .byte  196,226,125,24,5,137,255,1,0        // vbroadcastss  0x1ff89(%rip),%ymm0        # 2b22c <_sk_srcover_rgba_8888_sse2_lowp+0x930>
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,168,252,1,0         // vbroadcastss  0x1fca8(%rip),%ymm8        # 2aed0 <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  .byte  196,98,125,24,5,128,255,1,0         // vbroadcastss  0x1ff80(%rip),%ymm8        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0x934>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -20255,15 +20295,15 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,68                              // jne           b28d <_sk_load_a8_avx+0x5c>
+  .byte  117,68                              // jne           b315 <_sk_load_a8_avx+0x5c>
   .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,41,253,1,0            // vpand         0x1fd29(%rip),%xmm0,%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,249,219,5,1,0,2,0               // vpand         0x20001(%rip),%xmm0,%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,227,251,1,0       // vbroadcastss  0x1fbe3(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,187,254,1,0       // vbroadcastss  0x1febb(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -20275,15 +20315,15 @@
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,174                             // ja            b24f <_sk_load_a8_avx+0x1e>
+  .byte  119,174                             // ja            b2d7 <_sk_load_a8_avx+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b324 <_sk_load_a8_avx+0xf3>
+  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b3ac <_sk_load_a8_avx+0xf3>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,143                             // jmp           b24f <_sk_load_a8_avx+0x1e>
+  .byte  235,143                             // jmp           b2d7 <_sk_load_a8_avx+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
@@ -20291,7 +20331,7 @@
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,103,255,255,255                 // jmpq          b24f <_sk_load_a8_avx+0x1e>
+  .byte  233,103,255,255,255                 // jmpq          b2d7 <_sk_load_a8_avx+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
@@ -20302,7 +20342,7 @@
   .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,44,255,255,255                  // jmpq          b24f <_sk_load_a8_avx+0x1e>
+  .byte  233,44,255,255,255                  // jmpq          b2d7 <_sk_load_a8_avx+0x1e>
   .byte  144                                 // nop
   .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
@@ -20311,7 +20351,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b334 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0d98>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b3bc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0ac0>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -20333,15 +20373,15 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,68                              // jne           b39c <_sk_load_a8_dst_avx+0x5c>
+  .byte  117,68                              // jne           b424 <_sk_load_a8_dst_avx+0x5c>
   .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,26,252,1,0           // vpand         0x1fc1a(%rip),%xmm4,%xmm4        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,217,219,37,242,254,1,0          // vpand         0x1fef2(%rip),%xmm4,%xmm4        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
   .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,212,250,1,0       // vbroadcastss  0x1fad4(%rip),%ymm5        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,45,172,253,1,0       // vbroadcastss  0x1fdac(%rip),%ymm5        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,220,89,253                      // vmulps        %ymm5,%ymm4,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
@@ -20353,15 +20393,15 @@
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,174                             // ja            b35e <_sk_load_a8_dst_avx+0x1e>
+  .byte  119,174                             // ja            b3e6 <_sk_load_a8_dst_avx+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # b434 <_sk_load_a8_dst_avx+0xf4>
+  .byte  76,141,21,121,0,0,0                 // lea           0x79(%rip),%r10        # b4bc <_sk_load_a8_dst_avx+0xf4>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,143                             // jmp           b35e <_sk_load_a8_dst_avx+0x1e>
+  .byte  235,143                             // jmp           b3e6 <_sk_load_a8_dst_avx+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
@@ -20369,7 +20409,7 @@
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,103,255,255,255                 // jmpq          b35e <_sk_load_a8_dst_avx+0x1e>
+  .byte  233,103,255,255,255                 // jmpq          b3e6 <_sk_load_a8_dst_avx+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
@@ -20380,7 +20420,7 @@
   .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,44,255,255,255                  // jmpq          b35e <_sk_load_a8_dst_avx+0x1e>
+  .byte  233,44,255,255,255                  // jmpq          b3e6 <_sk_load_a8_dst_avx+0x1e>
   .byte  102,144                             // xchg          %ax,%ax
   .byte  144                                 // nop
   .byte  255                                 // (bad)
@@ -20389,7 +20429,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,255,255,255,221                 // callq         ffffffffde00b444 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfe0ea8>
+  .byte  232,255,255,255,221                 // callq         ffffffffde00b4cc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfe0bd0>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,210                             // callq         *%rdx
@@ -20410,23 +20450,39 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  197,254,91,209                      // vcvttps2dq    %ymm1,%ymm2
-  .byte  197,249,110,72,8                    // vmovd         0x8(%rax),%xmm1
-  .byte  197,249,112,217,0                   // vpshufd       $0x0,%xmm1,%xmm3
-  .byte  196,226,97,64,202                   // vpmulld       %xmm2,%xmm3,%xmm1
-  .byte  196,227,125,25,210,1                // vextractf128  $0x1,%ymm2,%xmm2
-  .byte  196,226,97,64,210                   // vpmulld       %xmm2,%xmm3,%xmm2
-  .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,57,118,192                   // vpcmpeqd      %xmm8,%xmm8,%xmm8
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
+  .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
+  .byte  197,252,93,210                      // vminps        %ymm2,%ymm0,%ymm2
+  .byte  196,226,125,24,64,16                // vbroadcastss  0x10(%rax),%ymm0
   .byte  196,227,125,25,195,1                // vextractf128  $0x1,%ymm0,%xmm3
-  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
-  .byte  196,227,249,22,208,1                // vpextrq       $0x1,%xmm2,%rax
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,121,254,192                 // vpaddd        %xmm8,%xmm0,%xmm0
+  .byte  196,227,125,24,195,1                // vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
+  .byte  197,244,93,192                      // vminps        %ymm0,%ymm1,%ymm0
+  .byte  76,139,0                            // mov           (%rax),%r8
+  .byte  197,254,91,200                      // vcvttps2dq    %ymm0,%ymm1
+  .byte  197,249,110,64,8                    // vmovd         0x8(%rax),%xmm0
+  .byte  197,249,112,216,0                   // vpshufd       $0x0,%xmm0,%xmm3
+  .byte  196,226,97,64,193                   // vpmulld       %xmm1,%xmm3,%xmm0
+  .byte  196,227,125,25,201,1                // vextractf128  $0x1,%ymm1,%xmm1
+  .byte  196,226,97,64,201                   // vpmulld       %xmm1,%xmm3,%xmm1
+  .byte  197,254,91,210                      // vcvttps2dq    %ymm2,%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
+  .byte  196,227,249,22,200,1                // vpextrq       $0x1,%xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  196,193,249,126,210                 // vmovq         %xmm2,%r10
+  .byte  196,193,249,126,202                 // vmovq         %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
-  .byte  197,241,254,192                     // vpaddd        %xmm0,%xmm1,%xmm0
+  .byte  197,249,254,194                     // vpaddd        %xmm2,%xmm0,%xmm0
   .byte  196,227,249,22,195,1                // vpextrq       $0x1,%xmm0,%rbx
   .byte  65,137,222                          // mov           %ebx,%r14d
   .byte  72,193,235,32                       // shr           $0x20,%rbx
@@ -20453,7 +20509,7 @@
   .byte  196,226,121,49,201                  // vpmovzxbd     %xmm1,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,44,249,1,0        // vbroadcastss  0x1f92c(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,178,251,1,0       // vbroadcastss  0x1fbb2(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,217                      // vmulps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -20476,14 +20532,14 @@
   .byte  77,15,175,193                       // imul          %r9,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,172,248,1,0         // vbroadcastss  0x1f8ac(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,50,251,1,0          // vbroadcastss  0x1fb32(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,65,100,89,192                   // vmulps        %ymm8,%ymm3,%ymm8
   .byte  196,65,125,91,192                   // vcvtps2dq     %ymm8,%ymm8
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  197,57,103,192                      // vpackuswb     %xmm0,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           b590 <_sk_store_a8_avx+0x44>
+  .byte  117,10                              // jne           b66a <_sk_store_a8_avx+0x44>
   .byte  196,1,121,214,4,24                  // vmovq         %xmm8,(%r8,%r11,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -20491,42 +20547,42 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            b58c <_sk_store_a8_avx+0x40>
+  .byte  119,236                             // ja            b666 <_sk_store_a8_avx+0x40>
   .byte  196,66,121,48,192                   // vpmovzxbw     %xmm8,%xmm8
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,88,0,0,0                  // lea           0x58(%rip),%r10        # b608 <_sk_store_a8_avx+0xbc>
+  .byte  76,141,21,86,0,0,0                  // lea           0x56(%rip),%r10        # b6e0 <_sk_store_a8_avx+0xba>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,3,121,20,4,24,0                 // vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,202                             // jmp           b58c <_sk_store_a8_avx+0x40>
+  .byte  235,202                             // jmp           b666 <_sk_store_a8_avx+0x40>
   .byte  196,3,121,20,68,24,2,4              // vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  .byte  196,98,57,0,5,189,249,1,0           // vpshufb       0x1f9bd(%rip),%xmm8,%xmm8        # 2af90 <_sk_srcover_rgba_8888_sse2_lowp+0x9f4>
+  .byte  196,98,57,0,5,67,252,1,0            // vpshufb       0x1fc43(%rip),%xmm8,%xmm8        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0x9f4>
   .byte  196,3,121,21,4,24,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  .byte  235,176                             // jmp           b58c <_sk_store_a8_avx+0x40>
+  .byte  235,176                             // jmp           b666 <_sk_store_a8_avx+0x40>
   .byte  196,3,121,20,68,24,6,12             // vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
   .byte  196,3,121,20,68,24,5,10             // vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
   .byte  196,3,121,20,68,24,4,8              // vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  .byte  196,98,57,0,5,163,249,1,0           // vpshufb       0x1f9a3(%rip),%xmm8,%xmm8        # 2afa0 <_sk_srcover_rgba_8888_sse2_lowp+0xa04>
+  .byte  196,98,57,0,5,41,252,1,0            // vpshufb       0x1fc29(%rip),%xmm8,%xmm8        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xa04>
   .byte  196,1,121,126,4,24                  // vmovd         %xmm8,(%r8,%r11,1)
-  .byte  235,135                             // jmp           b58c <_sk_store_a8_avx+0x40>
-  .byte  15,31,0                             // nopl          (%rax)
-  .byte  177,255                             // mov           $0xff,%cl
+  .byte  235,135                             // jmp           b666 <_sk_store_a8_avx+0x40>
+  .byte  144                                 // nop
+  .byte  179,255                             // mov           $0xff,%bl
   .byte  255                                 // (bad)
-  .byte  255,194                             // inc           %edx
+  .byte  255,196                             // inc           %esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  186,255,255,255,236                 // mov           $0xecffffff,%edx
+  .byte  188,255,255,255,238                 // mov           $0xeeffffff,%esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,228                             // jmpq          *%rsp
+  .byte  255,230                             // jmpq          *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
+  .byte  222,255                             // fdivrp        %st,%st(7)
   .byte  255                                 // (bad)
-  .byte  255,212                             // callq         *%rsp
+  .byte  255,214                             // callq         *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20542,18 +20598,18 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,73                              // jne           b685 <_sk_load_g8_avx+0x61>
+  .byte  117,73                              // jne           b75d <_sk_load_g8_avx+0x61>
   .byte  196,130,121,48,4,24                 // vpmovzxbw     (%r8,%r11,1),%xmm0
-  .byte  197,249,219,5,54,249,1,0            // vpand         0x1f936(%rip),%xmm0,%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,249,219,5,190,251,1,0           // vpand         0x1fbbe(%rip),%xmm0,%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,240,247,1,0       // vbroadcastss  0x1f7f0(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,120,250,1,0       // vbroadcastss  0x1fa78(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,109,247,1,0       // vbroadcastss  0x1f76d(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,245,249,1,0       // vbroadcastss  0x1f9f5(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
@@ -20562,15 +20618,15 @@
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,169                             // ja            b642 <_sk_load_g8_avx+0x1e>
+  .byte  119,169                             // ja            b71a <_sk_load_g8_avx+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b71c <_sk_load_g8_avx+0xf8>
+  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b7f4 <_sk_load_g8_avx+0xf8>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  235,138                             // jmp           b642 <_sk_load_g8_avx+0x1e>
+  .byte  235,138                             // jmp           b71a <_sk_load_g8_avx+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,2                   // vpinsrw       $0x2,%eax,%xmm0,%xmm0
@@ -20578,7 +20634,7 @@
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,98,255,255,255                  // jmpq          b642 <_sk_load_g8_avx+0x1e>
+  .byte  233,98,255,255,255                  // jmpq          b71a <_sk_load_g8_avx+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,249,196,192,6                   // vpinsrw       $0x6,%eax,%xmm0,%xmm0
@@ -20589,7 +20645,7 @@
   .byte  196,129,121,110,12,24               // vmovd         (%r8,%r11,1),%xmm1
   .byte  196,226,121,48,201                  // vpmovzxbw     %xmm1,%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,39,255,255,255                  // jmpq          b642 <_sk_load_g8_avx+0x1e>
+  .byte  233,39,255,255,255                  // jmpq          b71a <_sk_load_g8_avx+0x1e>
   .byte  144                                 // nop
   .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
@@ -20598,7 +20654,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b72c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe1190>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b804 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0f08>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -20620,18 +20676,18 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,73                              // jne           b799 <_sk_load_g8_dst_avx+0x61>
+  .byte  117,73                              // jne           b871 <_sk_load_g8_dst_avx+0x61>
   .byte  196,130,121,48,36,24                // vpmovzxbw     (%r8,%r11,1),%xmm4
-  .byte  197,217,219,37,34,248,1,0           // vpand         0x1f822(%rip),%xmm4,%xmm4        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  197,217,219,37,170,250,1,0          // vpand         0x1faaa(%rip),%xmm4,%xmm4        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
   .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,220,246,1,0       // vbroadcastss  0x1f6dc(%rip),%ymm5        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,45,100,249,1,0       // vbroadcastss  0x1f964(%rip),%ymm5        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,89,246,1,0        // vbroadcastss  0x1f659(%rip),%ymm7        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,61,225,248,1,0       // vbroadcastss  0x1f8e1(%rip),%ymm7        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,236                      // vmovaps       %ymm4,%ymm5
   .byte  197,252,40,244                      // vmovaps       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
@@ -20640,15 +20696,15 @@
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,169                             // ja            b756 <_sk_load_g8_dst_avx+0x1e>
+  .byte  119,169                             // ja            b82e <_sk_load_g8_dst_avx+0x1e>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b830 <_sk_load_g8_dst_avx+0xf8>
+  .byte  76,141,21,120,0,0,0                 // lea           0x78(%rip),%r10        # b908 <_sk_load_g8_dst_avx+0xf8>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,182,4,24                      // movzbl        (%r8,%r11,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  235,138                             // jmp           b756 <_sk_load_g8_dst_avx+0x1e>
+  .byte  235,138                             // jmp           b82e <_sk_load_g8_dst_avx+0x1e>
   .byte  67,15,182,68,24,2                   // movzbl        0x2(%r8,%r11,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,2                   // vpinsrw       $0x2,%eax,%xmm4,%xmm4
@@ -20656,7 +20712,7 @@
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,98,255,255,255                  // jmpq          b756 <_sk_load_g8_dst_avx+0x1e>
+  .byte  233,98,255,255,255                  // jmpq          b82e <_sk_load_g8_dst_avx+0x1e>
   .byte  67,15,182,68,24,6                   // movzbl        0x6(%r8,%r11,1),%eax
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  197,217,196,224,6                   // vpinsrw       $0x6,%eax,%xmm4,%xmm4
@@ -20667,7 +20723,7 @@
   .byte  196,129,121,110,44,24               // vmovd         (%r8,%r11,1),%xmm5
   .byte  196,226,121,48,237                  // vpmovzxbw     %xmm5,%xmm5
   .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,39,255,255,255                  // jmpq          b756 <_sk_load_g8_dst_avx+0x1e>
+  .byte  233,39,255,255,255                  // jmpq          b82e <_sk_load_g8_dst_avx+0x1e>
   .byte  144                                 // nop
   .byte  145                                 // xchg          %eax,%ecx
   .byte  255                                 // (bad)
@@ -20676,7 +20732,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b840 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe12a4>
+  .byte  233,255,255,255,222                 // jmpq          ffffffffdf00b918 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe101c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,211                             // callq         *%rbx
@@ -20697,23 +20753,39 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  197,254,91,209                      // vcvttps2dq    %ymm1,%ymm2
-  .byte  197,249,110,72,8                    // vmovd         0x8(%rax),%xmm1
-  .byte  197,249,112,217,0                   // vpshufd       $0x0,%xmm1,%xmm3
-  .byte  196,226,97,64,202                   // vpmulld       %xmm2,%xmm3,%xmm1
-  .byte  196,227,125,25,210,1                // vextractf128  $0x1,%ymm2,%xmm2
-  .byte  196,226,97,64,210                   // vpmulld       %xmm2,%xmm3,%xmm2
-  .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,57,118,192                   // vpcmpeqd      %xmm8,%xmm8,%xmm8
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
+  .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
+  .byte  197,252,93,210                      // vminps        %ymm2,%ymm0,%ymm2
+  .byte  196,226,125,24,64,16                // vbroadcastss  0x10(%rax),%ymm0
   .byte  196,227,125,25,195,1                // vextractf128  $0x1,%ymm0,%xmm3
-  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
-  .byte  196,227,249,22,208,1                // vpextrq       $0x1,%xmm2,%rax
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,121,254,192                 // vpaddd        %xmm8,%xmm0,%xmm0
+  .byte  196,227,125,24,195,1                // vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
+  .byte  197,244,93,192                      // vminps        %ymm0,%ymm1,%ymm0
+  .byte  76,139,0                            // mov           (%rax),%r8
+  .byte  197,254,91,200                      // vcvttps2dq    %ymm0,%ymm1
+  .byte  197,249,110,64,8                    // vmovd         0x8(%rax),%xmm0
+  .byte  197,249,112,216,0                   // vpshufd       $0x0,%xmm0,%xmm3
+  .byte  196,226,97,64,193                   // vpmulld       %xmm1,%xmm3,%xmm0
+  .byte  196,227,125,25,201,1                // vextractf128  $0x1,%ymm1,%xmm1
+  .byte  196,226,97,64,201                   // vpmulld       %xmm1,%xmm3,%xmm1
+  .byte  197,254,91,210                      // vcvttps2dq    %ymm2,%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
+  .byte  196,227,249,22,200,1                // vpextrq       $0x1,%xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  196,193,249,126,210                 // vmovq         %xmm2,%r10
+  .byte  196,193,249,126,202                 // vmovq         %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
-  .byte  197,241,254,192                     // vpaddd        %xmm0,%xmm1,%xmm0
+  .byte  197,249,254,194                     // vpaddd        %xmm2,%xmm0,%xmm0
   .byte  196,227,249,22,195,1                // vpextrq       $0x1,%xmm0,%rbx
   .byte  65,137,222                          // mov           %ebx,%r14d
   .byte  72,193,235,32                       // shr           $0x20,%rbx
@@ -20740,10 +20812,10 @@
   .byte  196,226,121,49,201                  // vpmovzxbd     %xmm1,%xmm1
   .byte  196,227,125,24,193,1                // vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,48,245,1,0        // vbroadcastss  0x1f530(%rip),%ymm1        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,226,125,24,13,102,247,1,0       // vbroadcastss  0x1f766(%rip),%ymm1        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,173,244,1,0       // vbroadcastss  0x1f4ad(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,227,246,1,0       // vbroadcastss  0x1f6e3(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
   .byte  197,252,40,208                      // vmovaps       %ymm0,%ymm2
   .byte  91                                  // pop           %rbx
@@ -20765,72 +20837,71 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,130,0,0,0                    // jne           b9ee <_sk_load_565_avx+0xa1>
+  .byte  15,133,130,0,0,0                    // jne           bb18 <_sk_load_565_avx+0xa1>
   .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,208,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  .byte  196,226,125,24,5,208,244,1,0        // vbroadcastss  0x1f4d0(%rip),%ymm0        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,226,125,24,5,6,247,1,0          // vbroadcastss  0x1f706(%rip),%ymm0        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  197,236,84,192                      // vandps        %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,195,244,1,0       // vbroadcastss  0x1f4c3(%rip),%ymm1        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,226,125,24,13,249,246,1,0       // vbroadcastss  0x1f6f9(%rip),%ymm1        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,186,244,1,0       // vbroadcastss  0x1f4ba(%rip),%ymm1        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,226,125,24,13,240,246,1,0       // vbroadcastss  0x1f6f0(%rip),%ymm1        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  197,236,84,201                      // vandps        %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,173,244,1,0       // vbroadcastss  0x1f4ad(%rip),%ymm3        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,226,125,24,29,227,246,1,0       // vbroadcastss  0x1f6e3(%rip),%ymm3        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,24,29,164,244,1,0       // vbroadcastss  0x1f4a4(%rip),%ymm3        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,226,125,24,29,218,246,1,0       // vbroadcastss  0x1f6da(%rip),%ymm3        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  197,236,84,211                      // vandps        %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,151,244,1,0       // vbroadcastss  0x1f497(%rip),%ymm3        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,226,125,24,29,205,246,1,0       // vbroadcastss  0x1f6cd(%rip),%ymm3        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,252,243,1,0       // vbroadcastss  0x1f3fc(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,50,246,1,0        // vbroadcastss  0x1f632(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,108,255,255,255              // ja            b972 <_sk_load_565_avx+0x25>
+  .byte  15,135,108,255,255,255              // ja            ba9c <_sk_load_565_avx+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,99,0,0,0                  // lea           0x63(%rip),%r10        # ba74 <_sk_load_565_avx+0x127>
+  .byte  76,141,21,97,0,0,0                  // lea           0x61(%rip),%r10        # bb9c <_sk_load_565_avx+0x125>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,74,255,255,255                  // jmpq          b972 <_sk_load_565_avx+0x25>
+  .byte  233,74,255,255,255                  // jmpq          ba9c <_sk_load_565_avx+0x25>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,45,255,255,255                  // jmpq          b972 <_sk_load_565_avx+0x25>
+  .byte  233,45,255,255,255                  // jmpq          ba9c <_sk_load_565_avx+0x25>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,0,255,255,255                   // jmpq          b972 <_sk_load_565_avx+0x25>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  166                                 // cmpsb         %es:(%rdi),%ds:(%rsi)
+  .byte  233,0,255,255,255                   // jmpq          ba9c <_sk_load_565_avx+0x25>
+  .byte  168,255                             // test          $0xff,%al
+  .byte  255                                 // (bad)
+  .byte  255,194                             // inc           %edx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,192                             // inc           %eax
+  .byte  255,182,255,255,255,239             // pushq         -0x10000001(%rsi)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,180,255,255,255,237,255         // pushq         -0x120001(%rdi,%rdi,8)
-  .byte  255                                 // (bad)
-  .byte  255,229                             // jmpq          *%rbp
+  .byte  255,231                             // jmpq          *%rdi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  221,255                             // (bad)
+  .byte  223,255                             // (bad)
   .byte  255                                 // (bad)
-  .byte  255,209                             // callq         *%rcx
+  .byte  255,211                             // callq         *%rbx
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -20847,56 +20918,56 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,130,0,0,0                    // jne           bb31 <_sk_load_565_dst_avx+0xa1>
+  .byte  15,133,130,0,0,0                    // jne           bc59 <_sk_load_565_dst_avx+0xa1>
   .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
   .byte  196,227,85,24,244,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm6
-  .byte  196,226,125,24,37,141,243,1,0       // vbroadcastss  0x1f38d(%rip),%ymm4        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,226,125,24,37,197,245,1,0       // vbroadcastss  0x1f5c5(%rip),%ymm4        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  197,204,84,228                      // vandps        %ymm4,%ymm6,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,128,243,1,0       // vbroadcastss  0x1f380(%rip),%ymm5        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,226,125,24,45,184,245,1,0       // vbroadcastss  0x1f5b8(%rip),%ymm5        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,24,45,119,243,1,0       // vbroadcastss  0x1f377(%rip),%ymm5        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,226,125,24,45,175,245,1,0       // vbroadcastss  0x1f5af(%rip),%ymm5        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  197,204,84,237                      // vandps        %ymm5,%ymm6,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,61,106,243,1,0       // vbroadcastss  0x1f36a(%rip),%ymm7        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,226,125,24,61,162,245,1,0       // vbroadcastss  0x1f5a2(%rip),%ymm7        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  197,212,89,239                      // vmulps        %ymm7,%ymm5,%ymm5
-  .byte  196,226,125,24,61,97,243,1,0        // vbroadcastss  0x1f361(%rip),%ymm7        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,226,125,24,61,153,245,1,0       // vbroadcastss  0x1f599(%rip),%ymm7        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  197,204,84,247                      // vandps        %ymm7,%ymm6,%ymm6
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,226,125,24,61,84,243,1,0        // vbroadcastss  0x1f354(%rip),%ymm7        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,226,125,24,61,140,245,1,0       // vbroadcastss  0x1f58c(%rip),%ymm7        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  197,204,89,247                      // vmulps        %ymm7,%ymm6,%ymm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,61,185,242,1,0       // vbroadcastss  0x1f2b9(%rip),%ymm7        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,61,241,244,1,0       // vbroadcastss  0x1f4f1(%rip),%ymm7        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,108,255,255,255              // ja            bab5 <_sk_load_565_dst_avx+0x25>
+  .byte  15,135,108,255,255,255              // ja            bbdd <_sk_load_565_dst_avx+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # bbb8 <_sk_load_565_dst_avx+0x128>
+  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # bce0 <_sk_load_565_dst_avx+0x128>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,74,255,255,255                  // jmpq          bab5 <_sk_load_565_dst_avx+0x25>
+  .byte  233,74,255,255,255                  // jmpq          bbdd <_sk_load_565_dst_avx+0x25>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
   .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,45,255,255,255                  // jmpq          bab5 <_sk_load_565_dst_avx+0x25>
+  .byte  233,45,255,255,255                  // jmpq          bbdd <_sk_load_565_dst_avx+0x25>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
   .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,0,255,255,255                   // jmpq          bab5 <_sk_load_565_dst_avx+0x25>
+  .byte  233,0,255,255,255                   // jmpq          bbdd <_sk_load_565_dst_avx+0x25>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -20930,23 +21001,39 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  197,254,91,209                      // vcvttps2dq    %ymm1,%ymm2
-  .byte  197,249,110,72,8                    // vmovd         0x8(%rax),%xmm1
-  .byte  197,249,112,217,0                   // vpshufd       $0x0,%xmm1,%xmm3
-  .byte  196,226,97,64,202                   // vpmulld       %xmm2,%xmm3,%xmm1
-  .byte  196,227,125,25,210,1                // vextractf128  $0x1,%ymm2,%xmm2
-  .byte  196,226,97,64,210                   // vpmulld       %xmm2,%xmm3,%xmm2
-  .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,57,118,192                   // vpcmpeqd      %xmm8,%xmm8,%xmm8
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
+  .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
+  .byte  197,252,93,210                      // vminps        %ymm2,%ymm0,%ymm2
+  .byte  196,226,125,24,64,16                // vbroadcastss  0x10(%rax),%ymm0
   .byte  196,227,125,25,195,1                // vextractf128  $0x1,%ymm0,%xmm3
-  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
-  .byte  196,227,249,22,208,1                // vpextrq       $0x1,%xmm2,%rax
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,121,254,192                 // vpaddd        %xmm8,%xmm0,%xmm0
+  .byte  196,227,125,24,195,1                // vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
+  .byte  197,244,93,192                      // vminps        %ymm0,%ymm1,%ymm0
+  .byte  76,139,0                            // mov           (%rax),%r8
+  .byte  197,254,91,200                      // vcvttps2dq    %ymm0,%ymm1
+  .byte  197,249,110,64,8                    // vmovd         0x8(%rax),%xmm0
+  .byte  197,249,112,216,0                   // vpshufd       $0x0,%xmm0,%xmm3
+  .byte  196,226,97,64,193                   // vpmulld       %xmm1,%xmm3,%xmm0
+  .byte  196,227,125,25,201,1                // vextractf128  $0x1,%ymm1,%xmm1
+  .byte  196,226,97,64,201                   // vpmulld       %xmm1,%xmm3,%xmm1
+  .byte  197,254,91,210                      // vcvttps2dq    %ymm2,%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
+  .byte  196,227,249,22,200,1                // vpextrq       $0x1,%xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  196,193,249,126,210                 // vmovq         %xmm2,%r10
+  .byte  196,193,249,126,202                 // vmovq         %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
-  .byte  197,241,254,192                     // vpaddd        %xmm0,%xmm1,%xmm0
+  .byte  197,249,254,194                     // vpaddd        %xmm2,%xmm0,%xmm0
   .byte  196,227,249,22,195,1                // vpextrq       $0x1,%xmm0,%rbx
   .byte  65,137,222                          // mov           %ebx,%r14d
   .byte  72,193,235,32                       // shr           $0x20,%rbx
@@ -20973,23 +21060,23 @@
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,208,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  .byte  196,226,125,24,5,175,241,1,0        // vbroadcastss  0x1f1af(%rip),%ymm0        # 2ae60 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  .byte  196,226,125,24,5,149,243,1,0        // vbroadcastss  0x1f395(%rip),%ymm0        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   .byte  197,236,84,192                      // vandps        %ymm0,%ymm2,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,162,241,1,0       // vbroadcastss  0x1f1a2(%rip),%ymm1        # 2ae64 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  .byte  196,226,125,24,13,136,243,1,0       // vbroadcastss  0x1f388(%rip),%ymm1        # 2b1c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,153,241,1,0       // vbroadcastss  0x1f199(%rip),%ymm1        # 2ae68 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  .byte  196,226,125,24,13,127,243,1,0       // vbroadcastss  0x1f37f(%rip),%ymm1        # 2b1c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   .byte  197,236,84,201                      // vandps        %ymm1,%ymm2,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,29,140,241,1,0       // vbroadcastss  0x1f18c(%rip),%ymm3        # 2ae6c <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  .byte  196,226,125,24,29,114,243,1,0       // vbroadcastss  0x1f372(%rip),%ymm3        # 2b1cc <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
-  .byte  196,226,125,24,29,131,241,1,0       // vbroadcastss  0x1f183(%rip),%ymm3        # 2ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  .byte  196,226,125,24,29,105,243,1,0       // vbroadcastss  0x1f369(%rip),%ymm3        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   .byte  197,236,84,211                      // vandps        %ymm3,%ymm2,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,226,125,24,29,118,241,1,0       // vbroadcastss  0x1f176(%rip),%ymm3        # 2ae74 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  .byte  196,226,125,24,29,92,243,1,0        // vbroadcastss  0x1f35c(%rip),%ymm3        # 2b1d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   .byte  197,236,89,211                      // vmulps        %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,219,240,1,0       // vbroadcastss  0x1f0db(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,193,242,1,0       // vbroadcastss  0x1f2c1(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -21008,14 +21095,14 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,158,241,1,0         // vbroadcastss  0x1f19e(%rip),%ymm8        # 2aed4 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  .byte  196,98,125,24,5,132,243,1,0         // vbroadcastss  0x1f384(%rip),%ymm8        # 2b234 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,41,114,241,11               // vpslld        $0xb,%xmm9,%xmm10
   .byte  196,67,125,25,201,1                 // vextractf128  $0x1,%ymm9,%xmm9
   .byte  196,193,49,114,241,11               // vpslld        $0xb,%xmm9,%xmm9
   .byte  196,67,45,24,201,1                  // vinsertf128   $0x1,%xmm9,%ymm10,%ymm9
-  .byte  196,98,125,24,21,119,241,1,0        // vbroadcastss  0x1f177(%rip),%ymm10        # 2aed8 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  .byte  196,98,125,24,21,93,243,1,0         // vbroadcastss  0x1f35d(%rip),%ymm10        # 2b238 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   .byte  196,65,116,89,210                   // vmulps        %ymm10,%ymm1,%ymm10
   .byte  196,65,125,91,210                   // vcvtps2dq     %ymm10,%ymm10
   .byte  196,193,33,114,242,5                // vpslld        $0x5,%xmm10,%xmm11
@@ -21029,7 +21116,7 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           bdb1 <_sk_store_565_avx+0x9a>
+  .byte  117,10                              // jne           bf2b <_sk_store_565_avx+0x9a>
   .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -21037,42 +21124,41 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            bdad <_sk_store_565_avx+0x96>
+  .byte  119,236                             // ja            bf27 <_sk_store_565_avx+0x96>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,68,0,0,0                  // lea           0x44(%rip),%r10        # be10 <_sk_store_565_avx+0xf9>
+  .byte  76,141,21,66,0,0,0                  // lea           0x42(%rip),%r10        # bf88 <_sk_store_565_avx+0xf7>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           bdad <_sk_store_565_avx+0x96>
+  .byte  235,207                             // jmp           bf27 <_sk_store_565_avx+0x96>
   .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           bdad <_sk_store_565_avx+0x96>
+  .byte  235,191                             // jmp           bf27 <_sk_store_565_avx+0x96>
   .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           bdad <_sk_store_565_avx+0x96>
-  .byte  102,144                             // xchg          %ax,%ax
-  .byte  197,255,255                         // (bad)
-  .byte  255,214                             // callq         *%rsi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,246                             // push          %rsi
+  .byte  235,159                             // jmp           bf27 <_sk_store_565_avx+0x96>
+  .byte  199                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  238                                 // out           %al,(%dx)
+  .byte  216,255                             // fdivr         %st(7),%st
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,230                             // jmpq          *%rsi
+  .byte  255,208                             // callq         *%rax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  222,255                             // fdivrp        %st,%st(7)
+  .byte  248                                 // clc
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,240                             // push          %rax
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  232,255,255,255,224                 // callq         ffffffffe100bfa0 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fe16a4>
+  .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -21088,31 +21174,31 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,154,0,0,0                    // jne           bee5 <_sk_load_4444_avx+0xb9>
+  .byte  15,133,154,0,0,0                    // jne           c05d <_sk_load_4444_avx+0xb9>
   .byte  196,129,122,111,4,88                // vmovdqu       (%r8,%r11,2),%xmm0
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,216,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  .byte  196,226,125,24,5,109,240,1,0        // vbroadcastss  0x1f06d(%rip),%ymm0        # 2aedc <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  .byte  196,226,125,24,5,85,242,1,0         // vbroadcastss  0x1f255(%rip),%ymm0        # 2b23c <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   .byte  197,228,84,192                      // vandps        %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,96,240,1,0        // vbroadcastss  0x1f060(%rip),%ymm1        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  .byte  196,226,125,24,13,72,242,1,0        // vbroadcastss  0x1f248(%rip),%ymm1        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,87,240,1,0        // vbroadcastss  0x1f057(%rip),%ymm1        # 2aee4 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  .byte  196,226,125,24,13,63,242,1,0        // vbroadcastss  0x1f23f(%rip),%ymm1        # 2b244 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   .byte  197,228,84,201                      // vandps        %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,74,240,1,0        // vbroadcastss  0x1f04a(%rip),%ymm2        # 2aee8 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  .byte  196,226,125,24,21,50,242,1,0        // vbroadcastss  0x1f232(%rip),%ymm2        # 2b248 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,65,240,1,0        // vbroadcastss  0x1f041(%rip),%ymm2        # 2aeec <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  .byte  196,226,125,24,21,41,242,1,0        // vbroadcastss  0x1f229(%rip),%ymm2        # 2b24c <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   .byte  197,228,84,210                      // vandps        %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,52,240,1,0          // vbroadcastss  0x1f034(%rip),%ymm8        # 2aef0 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  .byte  196,98,125,24,5,28,242,1,0          // vbroadcastss  0x1f21c(%rip),%ymm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,42,240,1,0          // vbroadcastss  0x1f02a(%rip),%ymm8        # 2aef4 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  .byte  196,98,125,24,5,18,242,1,0          // vbroadcastss  0x1f212(%rip),%ymm8        # 2b254 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   .byte  196,193,100,84,216                  // vandps        %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,28,240,1,0          // vbroadcastss  0x1f01c(%rip),%ymm8        # 2aef8 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  .byte  196,98,125,24,5,4,242,1,0           // vbroadcastss  0x1f204(%rip),%ymm8        # 2b258 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -21121,27 +21207,27 @@
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,84,255,255,255               // ja            be51 <_sk_load_4444_avx+0x25>
+  .byte  15,135,84,255,255,255               // ja            bfc9 <_sk_load_4444_avx+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # bf6c <_sk_load_4444_avx+0x140>
+  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # c0e4 <_sk_load_4444_avx+0x140>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,50,255,255,255                  // jmpq          be51 <_sk_load_4444_avx+0x25>
+  .byte  233,50,255,255,255                  // jmpq          bfc9 <_sk_load_4444_avx+0x25>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,110,12,88               // vmovd         (%r8,%r11,2),%xmm1
   .byte  196,227,121,14,193,3                // vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  .byte  233,21,255,255,255                  // jmpq          be51 <_sk_load_4444_avx+0x25>
+  .byte  233,21,255,255,255                  // jmpq          bfc9 <_sk_load_4444_avx+0x25>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,129,121,196,68,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,121,196,68,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   .byte  196,129,122,126,12,88               // vmovq         (%r8,%r11,2),%xmm1
   .byte  196,227,113,14,192,240              // vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  .byte  233,232,254,255,255                 // jmpq          be51 <_sk_load_4444_avx+0x25>
+  .byte  233,232,254,255,255                 // jmpq          bfc9 <_sk_load_4444_avx+0x25>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -21177,31 +21263,31 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,154,0,0,0                    // jne           c041 <_sk_load_4444_dst_avx+0xb9>
+  .byte  15,133,154,0,0,0                    // jne           c1b9 <_sk_load_4444_dst_avx+0xb9>
   .byte  196,129,122,111,36,88               // vmovdqu       (%r8,%r11,2),%xmm4
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
   .byte  196,227,85,24,252,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm7
-  .byte  196,226,125,24,37,17,239,1,0        // vbroadcastss  0x1ef11(%rip),%ymm4        # 2aedc <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  .byte  196,226,125,24,37,249,240,1,0       // vbroadcastss  0x1f0f9(%rip),%ymm4        # 2b23c <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   .byte  197,196,84,228                      // vandps        %ymm4,%ymm7,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,226,125,24,45,4,239,1,0         // vbroadcastss  0x1ef04(%rip),%ymm5        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  .byte  196,226,125,24,45,236,240,1,0       // vbroadcastss  0x1f0ec(%rip),%ymm5        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   .byte  197,220,89,229                      // vmulps        %ymm5,%ymm4,%ymm4
-  .byte  196,226,125,24,45,251,238,1,0       // vbroadcastss  0x1eefb(%rip),%ymm5        # 2aee4 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  .byte  196,226,125,24,45,227,240,1,0       // vbroadcastss  0x1f0e3(%rip),%ymm5        # 2b244 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   .byte  197,196,84,237                      // vandps        %ymm5,%ymm7,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,226,125,24,53,238,238,1,0       // vbroadcastss  0x1eeee(%rip),%ymm6        # 2aee8 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  .byte  196,226,125,24,53,214,240,1,0       // vbroadcastss  0x1f0d6(%rip),%ymm6        # 2b248 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   .byte  197,212,89,238                      // vmulps        %ymm6,%ymm5,%ymm5
-  .byte  196,226,125,24,53,229,238,1,0       // vbroadcastss  0x1eee5(%rip),%ymm6        # 2aeec <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  .byte  196,226,125,24,53,205,240,1,0       // vbroadcastss  0x1f0cd(%rip),%ymm6        # 2b24c <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   .byte  197,196,84,246                      // vandps        %ymm6,%ymm7,%ymm6
   .byte  197,252,91,246                      // vcvtdq2ps     %ymm6,%ymm6
-  .byte  196,98,125,24,5,216,238,1,0         // vbroadcastss  0x1eed8(%rip),%ymm8        # 2aef0 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  .byte  196,98,125,24,5,192,240,1,0         // vbroadcastss  0x1f0c0(%rip),%ymm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   .byte  196,193,76,89,240                   // vmulps        %ymm8,%ymm6,%ymm6
-  .byte  196,98,125,24,5,206,238,1,0         // vbroadcastss  0x1eece(%rip),%ymm8        # 2aef4 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  .byte  196,98,125,24,5,182,240,1,0         // vbroadcastss  0x1f0b6(%rip),%ymm8        # 2b254 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   .byte  196,193,68,84,248                   // vandps        %ymm8,%ymm7,%ymm7
   .byte  197,252,91,255                      // vcvtdq2ps     %ymm7,%ymm7
-  .byte  196,98,125,24,5,192,238,1,0         // vbroadcastss  0x1eec0(%rip),%ymm8        # 2aef8 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  .byte  196,98,125,24,5,168,240,1,0         // vbroadcastss  0x1f0a8(%rip),%ymm8        # 2b258 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   .byte  196,193,68,89,248                   // vmulps        %ymm8,%ymm7,%ymm7
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -21210,27 +21296,27 @@
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,84,255,255,255               // ja            bfad <_sk_load_4444_dst_avx+0x25>
+  .byte  15,135,84,255,255,255               // ja            c125 <_sk_load_4444_dst_avx+0x25>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # c0c8 <_sk_load_4444_dst_avx+0x140>
+  .byte  76,141,21,100,0,0,0                 // lea           0x64(%rip),%r10        # c240 <_sk_load_4444_dst_avx+0x140>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  67,15,183,4,88                      // movzwl        (%r8,%r11,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,50,255,255,255                  // jmpq          bfad <_sk_load_4444_dst_avx+0x25>
+  .byte  233,50,255,255,255                  // jmpq          c125 <_sk_load_4444_dst_avx+0x25>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,4,2           // vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,121,110,44,88               // vmovd         (%r8,%r11,2),%xmm5
   .byte  196,227,89,14,229,3                 // vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  .byte  233,21,255,255,255                  // jmpq          bfad <_sk_load_4444_dst_avx+0x25>
+  .byte  233,21,255,255,255                  // jmpq          c125 <_sk_load_4444_dst_avx+0x25>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,129,89,196,100,88,12,6          // vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,10,5          // vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,89,196,100,88,8,4           // vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   .byte  196,129,122,126,44,88               // vmovq         (%r8,%r11,2),%xmm5
   .byte  196,227,81,14,228,240               // vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  .byte  233,232,254,255,255                 // jmpq          bfad <_sk_load_4444_dst_avx+0x25>
+  .byte  233,232,254,255,255                 // jmpq          c125 <_sk_load_4444_dst_avx+0x25>
   .byte  15,31,0                             // nopl          (%rax)
   .byte  165                                 // movsl         %ds:(%rsi),%es:(%rdi)
   .byte  255                                 // (bad)
@@ -21264,23 +21350,39 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  197,254,91,209                      // vcvttps2dq    %ymm1,%ymm2
-  .byte  197,249,110,72,8                    // vmovd         0x8(%rax),%xmm1
-  .byte  197,249,112,217,0                   // vpshufd       $0x0,%xmm1,%xmm3
-  .byte  196,226,97,64,202                   // vpmulld       %xmm2,%xmm3,%xmm1
-  .byte  196,227,125,25,210,1                // vextractf128  $0x1,%ymm2,%xmm2
-  .byte  196,226,97,64,210                   // vpmulld       %xmm2,%xmm3,%xmm2
-  .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,57,118,192                   // vpcmpeqd      %xmm8,%xmm8,%xmm8
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
+  .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
+  .byte  197,252,93,210                      // vminps        %ymm2,%ymm0,%ymm2
+  .byte  196,226,125,24,64,16                // vbroadcastss  0x10(%rax),%ymm0
   .byte  196,227,125,25,195,1                // vextractf128  $0x1,%ymm0,%xmm3
-  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
-  .byte  196,227,249,22,208,1                // vpextrq       $0x1,%xmm2,%rax
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,121,254,192                 // vpaddd        %xmm8,%xmm0,%xmm0
+  .byte  196,227,125,24,195,1                // vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
+  .byte  197,244,93,192                      // vminps        %ymm0,%ymm1,%ymm0
+  .byte  76,139,0                            // mov           (%rax),%r8
+  .byte  197,254,91,200                      // vcvttps2dq    %ymm0,%ymm1
+  .byte  197,249,110,64,8                    // vmovd         0x8(%rax),%xmm0
+  .byte  197,249,112,216,0                   // vpshufd       $0x0,%xmm0,%xmm3
+  .byte  196,226,97,64,193                   // vpmulld       %xmm1,%xmm3,%xmm0
+  .byte  196,227,125,25,201,1                // vextractf128  $0x1,%ymm1,%xmm1
+  .byte  196,226,97,64,201                   // vpmulld       %xmm1,%xmm3,%xmm1
+  .byte  197,254,91,210                      // vcvttps2dq    %ymm2,%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
+  .byte  196,227,249,22,200,1                // vpextrq       $0x1,%xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  196,193,249,126,210                 // vmovq         %xmm2,%r10
+  .byte  196,193,249,126,202                 // vmovq         %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
-  .byte  197,241,254,192                     // vpaddd        %xmm0,%xmm1,%xmm0
+  .byte  197,249,254,194                     // vpaddd        %xmm2,%xmm0,%xmm0
   .byte  196,227,249,22,195,1                // vpextrq       $0x1,%xmm0,%rbx
   .byte  65,137,222                          // mov           %ebx,%r14d
   .byte  72,193,235,32                       // shr           $0x20,%rbx
@@ -21307,25 +21409,25 @@
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,216,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  .byte  196,226,125,24,5,27,237,1,0         // vbroadcastss  0x1ed1b(%rip),%ymm0        # 2aedc <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  .byte  196,226,125,24,5,177,238,1,0        // vbroadcastss  0x1eeb1(%rip),%ymm0        # 2b23c <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   .byte  197,228,84,192                      // vandps        %ymm0,%ymm3,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,226,125,24,13,14,237,1,0        // vbroadcastss  0x1ed0e(%rip),%ymm1        # 2aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  .byte  196,226,125,24,13,164,238,1,0       // vbroadcastss  0x1eea4(%rip),%ymm1        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   .byte  197,252,89,193                      // vmulps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,5,237,1,0         // vbroadcastss  0x1ed05(%rip),%ymm1        # 2aee4 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  .byte  196,226,125,24,13,155,238,1,0       // vbroadcastss  0x1ee9b(%rip),%ymm1        # 2b244 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   .byte  197,228,84,201                      // vandps        %ymm1,%ymm3,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,226,125,24,21,248,236,1,0       // vbroadcastss  0x1ecf8(%rip),%ymm2        # 2aee8 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  .byte  196,226,125,24,21,142,238,1,0       // vbroadcastss  0x1ee8e(%rip),%ymm2        # 2b248 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   .byte  197,244,89,202                      // vmulps        %ymm2,%ymm1,%ymm1
-  .byte  196,226,125,24,21,239,236,1,0       // vbroadcastss  0x1ecef(%rip),%ymm2        # 2aeec <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  .byte  196,226,125,24,21,133,238,1,0       // vbroadcastss  0x1ee85(%rip),%ymm2        # 2b24c <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   .byte  197,228,84,210                      // vandps        %ymm2,%ymm3,%ymm2
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
-  .byte  196,98,125,24,5,226,236,1,0         // vbroadcastss  0x1ece2(%rip),%ymm8        # 2aef0 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  .byte  196,98,125,24,5,120,238,1,0         // vbroadcastss  0x1ee78(%rip),%ymm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   .byte  196,193,108,89,208                  // vmulps        %ymm8,%ymm2,%ymm2
-  .byte  196,98,125,24,5,216,236,1,0         // vbroadcastss  0x1ecd8(%rip),%ymm8        # 2aef4 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  .byte  196,98,125,24,5,110,238,1,0         // vbroadcastss  0x1ee6e(%rip),%ymm8        # 2b254 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   .byte  196,193,100,84,216                  // vandps        %ymm8,%ymm3,%ymm3
   .byte  197,252,91,219                      // vcvtdq2ps     %ymm3,%ymm3
-  .byte  196,98,125,24,5,202,236,1,0         // vbroadcastss  0x1ecca(%rip),%ymm8        # 2aef8 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  .byte  196,98,125,24,5,96,238,1,0          // vbroadcastss  0x1ee60(%rip),%ymm8        # 2b258 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   .byte  196,193,100,89,216                  // vmulps        %ymm8,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
@@ -21346,7 +21448,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,158,236,1,0         // vbroadcastss  0x1ec9e(%rip),%ymm8        # 2aefc <_sk_srcover_rgba_8888_sse2_lowp+0x960>
+  .byte  196,98,125,24,5,52,238,1,0          // vbroadcastss  0x1ee34(%rip),%ymm8        # 2b25c <_sk_srcover_rgba_8888_sse2_lowp+0x960>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,193,41,114,241,12               // vpslld        $0xc,%xmm9,%xmm10
@@ -21373,7 +21475,7 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,66,57,43,193                    // vpackusdw     %xmm9,%xmm8,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           c2f7 <_sk_store_4444_avx+0xb8>
+  .byte  117,10                              // jne           c4c1 <_sk_store_4444_avx+0xb8>
   .byte  196,1,122,127,4,88                  // vmovdqu       %xmm8,(%r8,%r11,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -21381,41 +21483,42 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            c2f3 <_sk_store_4444_avx+0xb4>
+  .byte  119,236                             // ja            c4bd <_sk_store_4444_avx+0xb4>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,66,0,0,0                  // lea           0x42(%rip),%r10        # c354 <_sk_store_4444_avx+0x115>
+  .byte  76,141,21,68,0,0,0                  // lea           0x44(%rip),%r10        # c520 <_sk_store_4444_avx+0x117>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,3,121,21,4,88,0                 // vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  .byte  235,207                             // jmp           c2f3 <_sk_store_4444_avx+0xb4>
+  .byte  235,207                             // jmp           c4bd <_sk_store_4444_avx+0xb4>
   .byte  196,3,121,21,68,88,4,2              // vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   .byte  196,1,121,126,4,88                  // vmovd         %xmm8,(%r8,%r11,2)
-  .byte  235,191                             // jmp           c2f3 <_sk_store_4444_avx+0xb4>
+  .byte  235,191                             // jmp           c4bd <_sk_store_4444_avx+0xb4>
   .byte  196,3,121,21,68,88,12,6             // vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   .byte  196,3,121,21,68,88,10,5             // vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   .byte  196,3,121,21,68,88,8,4              // vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   .byte  196,1,121,214,4,88                  // vmovq         %xmm8,(%r8,%r11,2)
-  .byte  235,159                             // jmp           c2f3 <_sk_store_4444_avx+0xb4>
-  .byte  199                                 // (bad)
+  .byte  235,159                             // jmp           c4bd <_sk_store_4444_avx+0xb4>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  197,255,255                         // (bad)
+  .byte  255,214                             // callq         *%rsi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,206                             // dec           %esi
+  .byte  255                                 // (bad)
+  .byte  255                                 // (bad)
+  .byte  255,246                             // push          %rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  216,255                             // fdivr         %st(7),%st
+  .byte  238                                 // out           %al,(%dx)
   .byte  255                                 // (bad)
-  .byte  255,208                             // callq         *%rax
+  .byte  255                                 // (bad)
+  .byte  255,230                             // jmpq          *%rsi
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  248                                 // clc
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,240                             // push          %rax
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  232,255,255,255,224                 // callq         ffffffffe100c36c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fe1dd0>
-  .byte  255                                 // (bad)
+  .byte  222,255                             // fdivrp        %st,%st(7)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
 
@@ -21431,12 +21534,12 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           c417 <_sk_load_8888_avx+0xa7>
+  .byte  15,133,135,0,0,0                    // jne           c5e3 <_sk_load_8888_avx+0xa7>
   .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,98,232,1,0            // vmovapd       0x1e862(%rip),%ymm10        # 2ac00 <_sk_srcover_rgba_8888_sse2_lowp+0x664>
+  .byte  197,125,40,21,246,233,1,0           // vmovapd       0x1e9f6(%rip),%ymm10        # 2af60 <_sk_srcover_rgba_8888_sse2_lowp+0x664>
   .byte  196,193,53,84,194                   // vandpd        %ymm10,%ymm9,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,5,172,234,1,0         // vbroadcastss  0x1eaac(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,64,236,1,0          // vbroadcastss  0x1ec40(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,192                  // vmulps        %ymm8,%ymm0,%ymm0
   .byte  196,193,113,114,209,8               // vpsrld        $0x8,%xmm9,%xmm1
   .byte  196,99,125,25,203,1                 // vextractf128  $0x1,%ymm9,%xmm3
@@ -21463,21 +21566,21 @@
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            c396 <_sk_load_8888_avx+0x26>
+  .byte  15,135,102,255,255,255              // ja            c562 <_sk_load_8888_avx+0x26>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # c4cc <_sk_load_8888_avx+0x15c>
+  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # c698 <_sk_load_8888_avx+0x15c>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          c396 <_sk_load_8888_avx+0x26>
+  .byte  233,71,255,255,255                  // jmpq          c562 <_sk_load_8888_avx+0x26>
   .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,200,4                 // vblendps      $0x4,%ymm0,%ymm1,%ymm9
   .byte  196,129,123,16,4,152                // vmovsd        (%r8,%r11,4),%xmm0
   .byte  196,99,53,13,200,1                  // vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          c396 <_sk_load_8888_avx+0x26>
+  .byte  233,32,255,255,255                  // jmpq          c562 <_sk_load_8888_avx+0x26>
   .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -21491,9 +21594,9 @@
   .byte  196,99,53,24,200,1                  // vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   .byte  196,129,121,16,4,152                // vmovupd       (%r8,%r11,4),%xmm0
   .byte  196,67,125,13,201,12                // vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          c396 <_sk_load_8888_avx+0x26>
+  .byte  233,203,254,255,255                 // jmpq          c562 <_sk_load_8888_avx+0x26>
   .byte  144                                 // nop
-  .byte  120,255                             // js            c4cd <_sk_load_8888_avx+0x15d>
+  .byte  120,255                             // js            c699 <_sk_load_8888_avx+0x15d>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
   .byte  255                                 // (bad)
@@ -21526,12 +21629,12 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           c58f <_sk_load_8888_dst_avx+0xa7>
+  .byte  15,133,135,0,0,0                    // jne           c75b <_sk_load_8888_dst_avx+0xa7>
   .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,10,231,1,0            // vmovapd       0x1e70a(%rip),%ymm10        # 2ac20 <_sk_srcover_rgba_8888_sse2_lowp+0x684>
+  .byte  197,125,40,21,158,232,1,0           // vmovapd       0x1e89e(%rip),%ymm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x684>
   .byte  196,193,53,84,226                   // vandpd        %ymm10,%ymm9,%ymm4
   .byte  197,252,91,228                      // vcvtdq2ps     %ymm4,%ymm4
-  .byte  196,98,125,24,5,52,233,1,0          // vbroadcastss  0x1e934(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,200,234,1,0         // vbroadcastss  0x1eac8(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,92,89,224                   // vmulps        %ymm8,%ymm4,%ymm4
   .byte  196,193,81,114,209,8                // vpsrld        $0x8,%xmm9,%xmm5
   .byte  196,99,125,25,207,1                 // vextractf128  $0x1,%ymm9,%xmm7
@@ -21558,21 +21661,21 @@
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            c50e <_sk_load_8888_dst_avx+0x26>
+  .byte  15,135,102,255,255,255              // ja            c6da <_sk_load_8888_dst_avx+0x26>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # c644 <_sk_load_8888_dst_avx+0x15c>
+  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # c810 <_sk_load_8888_dst_avx+0x15c>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          c50e <_sk_load_8888_dst_avx+0x26>
+  .byte  233,71,255,255,255                  // jmpq          c6da <_sk_load_8888_dst_avx+0x26>
   .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm9
   .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
   .byte  196,99,53,13,204,1                  // vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          c50e <_sk_load_8888_dst_avx+0x26>
+  .byte  233,32,255,255,255                  // jmpq          c6da <_sk_load_8888_dst_avx+0x26>
   .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
@@ -21586,9 +21689,9 @@
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
   .byte  196,67,93,13,201,12                 // vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          c50e <_sk_load_8888_dst_avx+0x26>
+  .byte  233,203,254,255,255                 // jmpq          c6da <_sk_load_8888_dst_avx+0x26>
   .byte  144                                 // nop
-  .byte  120,255                             // js            c645 <_sk_load_8888_dst_avx+0x15d>
+  .byte  120,255                             // js            c811 <_sk_load_8888_dst_avx+0x15d>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
   .byte  255                                 // (bad)
@@ -21618,6 +21721,22 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,57,118,192                   // vpcmpeqd      %xmm8,%xmm8,%xmm8
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
+  .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,24,80,16                // vbroadcastss  0x10(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  197,249,110,80,8                    // vmovd         0x8(%rax),%xmm2
@@ -21650,10 +21769,10 @@
   .byte  196,131,121,34,4,176,2              // vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   .byte  196,195,121,34,28,152,3             // vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   .byte  196,227,61,24,195,1                 // vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  .byte  197,124,40,21,46,229,1,0            // vmovaps       0x1e52e(%rip),%ymm10        # 2ac40 <_sk_srcover_rgba_8888_sse2_lowp+0x6a4>
+  .byte  197,124,40,21,112,230,1,0           // vmovaps       0x1e670(%rip),%ymm10        # 2afa0 <_sk_srcover_rgba_8888_sse2_lowp+0x6a4>
   .byte  196,193,124,84,194                  // vandps        %ymm10,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,56,231,1,0         // vbroadcastss  0x1e738(%rip),%ymm9        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,13,122,232,1,0        // vbroadcastss  0x1e87a(%rip),%ymm9        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  196,193,113,114,208,8               // vpsrld        $0x8,%xmm8,%xmm1
   .byte  197,233,114,211,8                   // vpsrld        $0x8,%xmm3,%xmm2
@@ -21690,7 +21809,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,104,230,1,0         // vbroadcastss  0x1e668(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,170,231,1,0         // vbroadcastss  0x1e7aa(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,65,116,89,208                   // vmulps        %ymm8,%ymm1,%ymm10
@@ -21715,7 +21834,7 @@
   .byte  196,65,45,86,192                    // vorpd         %ymm8,%ymm10,%ymm8
   .byte  196,65,53,86,192                    // vorpd         %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           c83a <_sk_store_8888_avx+0xae>
+  .byte  117,10                              // jne           ca58 <_sk_store_8888_avx+0xae>
   .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -21723,17 +21842,17 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            c836 <_sk_store_8888_avx+0xaa>
+  .byte  119,236                             // ja            ca54 <_sk_store_8888_avx+0xaa>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,83,0,0,0                  // lea           0x53(%rip),%r10        # c8a8 <_sk_store_8888_avx+0x11c>
+  .byte  76,141,21,85,0,0,0                  // lea           0x55(%rip),%r10        # cac8 <_sk_store_8888_avx+0x11e>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           c836 <_sk_store_8888_avx+0xaa>
+  .byte  235,208                             // jmp           ca54 <_sk_store_8888_avx+0xaa>
   .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           c836 <_sk_store_8888_avx+0xaa>
+  .byte  235,192                             // jmp           ca54 <_sk_store_8888_avx+0xaa>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
@@ -21741,25 +21860,22 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,1,122,17,76,152,16              // vmovss        %xmm9,0x10(%r8,%r11,4)
   .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           c836 <_sk_store_8888_avx+0xaa>
-  .byte  144                                 // nop
-  .byte  182,255                             // mov           $0xff,%dh
+  .byte  235,143                             // jmp           ca54 <_sk_store_8888_avx+0xaa>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  180,255                             // mov           $0xff,%ah
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,196                             // inc           %esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
+  .byte  188,255,255,255,245                 // mov           $0xf5ffffff,%esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  232,255,255,255,218                 // callq         ffffffffdb00cadc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdafe21e0>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,204                             // dec           %esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -21776,12 +21892,12 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           c96b <_sk_load_bgra_avx+0xa7>
+  .byte  15,133,135,0,0,0                    // jne           cb8b <_sk_load_bgra_avx+0xa7>
   .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,110,227,1,0           // vmovapd       0x1e36e(%rip),%ymm10        # 2ac60 <_sk_srcover_rgba_8888_sse2_lowp+0x6c4>
+  .byte  197,125,40,21,174,228,1,0           // vmovapd       0x1e4ae(%rip),%ymm10        # 2afc0 <_sk_srcover_rgba_8888_sse2_lowp+0x6c4>
   .byte  196,193,53,84,202                   // vandpd        %ymm10,%ymm9,%ymm1
   .byte  197,252,91,201                      // vcvtdq2ps     %ymm1,%ymm1
-  .byte  196,98,125,24,5,88,229,1,0          // vbroadcastss  0x1e558(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,152,230,1,0         // vbroadcastss  0x1e698(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,116,89,208                  // vmulps        %ymm8,%ymm1,%ymm2
   .byte  196,193,113,114,209,8               // vpsrld        $0x8,%xmm9,%xmm1
   .byte  196,99,125,25,203,1                 // vextractf128  $0x1,%ymm9,%xmm3
@@ -21808,21 +21924,21 @@
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            c8ea <_sk_load_bgra_avx+0x26>
+  .byte  15,135,102,255,255,255              // ja            cb0a <_sk_load_bgra_avx+0x26>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # ca20 <_sk_load_bgra_avx+0x15c>
+  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # cc40 <_sk_load_bgra_avx+0x15c>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          c8ea <_sk_load_bgra_avx+0x26>
+  .byte  233,71,255,255,255                  // jmpq          cb0a <_sk_load_bgra_avx+0x26>
   .byte  196,129,121,110,68,152,8            // vmovd         0x8(%r8,%r11,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,99,117,12,200,4                 // vblendps      $0x4,%ymm0,%ymm1,%ymm9
   .byte  196,129,123,16,4,152                // vmovsd        (%r8,%r11,4),%xmm0
   .byte  196,99,53,13,200,1                  // vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          c8ea <_sk_load_bgra_avx+0x26>
+  .byte  233,32,255,255,255                  // jmpq          cb0a <_sk_load_bgra_avx+0x26>
   .byte  196,129,121,110,68,152,24           // vmovd         0x18(%r8,%r11,4),%xmm0
   .byte  197,249,112,192,68                  // vpshufd       $0x44,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -21836,9 +21952,9 @@
   .byte  196,99,53,24,200,1                  // vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   .byte  196,129,121,16,4,152                // vmovupd       (%r8,%r11,4),%xmm0
   .byte  196,67,125,13,201,12                // vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          c8ea <_sk_load_bgra_avx+0x26>
+  .byte  233,203,254,255,255                 // jmpq          cb0a <_sk_load_bgra_avx+0x26>
   .byte  144                                 // nop
-  .byte  120,255                             // js            ca21 <_sk_load_bgra_avx+0x15d>
+  .byte  120,255                             // js            cc41 <_sk_load_bgra_avx+0x15d>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
   .byte  255                                 // (bad)
@@ -21871,12 +21987,12 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,135,0,0,0                    // jne           cae3 <_sk_load_bgra_dst_avx+0xa7>
+  .byte  15,133,135,0,0,0                    // jne           cd03 <_sk_load_bgra_dst_avx+0xa7>
   .byte  196,1,125,16,12,152                 // vmovupd       (%r8,%r11,4),%ymm9
-  .byte  197,125,40,21,22,226,1,0            // vmovapd       0x1e216(%rip),%ymm10        # 2ac80 <_sk_srcover_rgba_8888_sse2_lowp+0x6e4>
+  .byte  197,125,40,21,86,227,1,0            // vmovapd       0x1e356(%rip),%ymm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0x6e4>
   .byte  196,193,53,84,234                   // vandpd        %ymm10,%ymm9,%ymm5
   .byte  197,252,91,237                      // vcvtdq2ps     %ymm5,%ymm5
-  .byte  196,98,125,24,5,224,227,1,0         // vbroadcastss  0x1e3e0(%rip),%ymm8        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,5,32,229,1,0          // vbroadcastss  0x1e520(%rip),%ymm8        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,84,89,240                   // vmulps        %ymm8,%ymm5,%ymm6
   .byte  196,193,81,114,209,8                // vpsrld        $0x8,%xmm9,%xmm5
   .byte  196,99,125,25,207,1                 // vextractf128  $0x1,%ymm9,%xmm7
@@ -21903,21 +22019,21 @@
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  15,135,102,255,255,255              // ja            ca62 <_sk_load_bgra_dst_avx+0x26>
+  .byte  15,135,102,255,255,255              // ja            cc82 <_sk_load_bgra_dst_avx+0x26>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # cb98 <_sk_load_bgra_dst_avx+0x15c>
+  .byte  76,141,21,145,0,0,0                 // lea           0x91(%rip),%r10        # cdb8 <_sk_load_bgra_dst_avx+0x15c>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,122,16,12,152                 // vmovss        (%r8,%r11,4),%xmm9
-  .byte  233,71,255,255,255                  // jmpq          ca62 <_sk_load_bgra_dst_avx+0x26>
+  .byte  233,71,255,255,255                  // jmpq          cc82 <_sk_load_bgra_dst_avx+0x26>
   .byte  196,129,121,110,100,152,8           // vmovd         0x8(%r8,%r11,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  197,212,87,237                      // vxorps        %ymm5,%ymm5,%ymm5
   .byte  196,99,85,12,204,4                  // vblendps      $0x4,%ymm4,%ymm5,%ymm9
   .byte  196,129,123,16,36,152               // vmovsd        (%r8,%r11,4),%xmm4
   .byte  196,99,53,13,204,1                  // vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  .byte  233,32,255,255,255                  // jmpq          ca62 <_sk_load_bgra_dst_avx+0x26>
+  .byte  233,32,255,255,255                  // jmpq          cc82 <_sk_load_bgra_dst_avx+0x26>
   .byte  196,129,121,110,100,152,24          // vmovd         0x18(%r8,%r11,4),%xmm4
   .byte  197,249,112,228,68                  // vpshufd       $0x44,%xmm4,%xmm4
   .byte  196,227,125,24,228,1                // vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
@@ -21931,9 +22047,9 @@
   .byte  196,99,53,24,204,1                  // vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   .byte  196,129,121,16,36,152               // vmovupd       (%r8,%r11,4),%xmm4
   .byte  196,67,93,13,201,12                 // vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  .byte  233,203,254,255,255                 // jmpq          ca62 <_sk_load_bgra_dst_avx+0x26>
+  .byte  233,203,254,255,255                 // jmpq          cc82 <_sk_load_bgra_dst_avx+0x26>
   .byte  144                                 // nop
-  .byte  120,255                             // js            cb99 <_sk_load_bgra_dst_avx+0x15d>
+  .byte  120,255                             // js            cdb9 <_sk_load_bgra_dst_avx+0x15d>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,131             // lcall         *-0x7c000001(%rcx)
   .byte  255                                 // (bad)
@@ -21963,6 +22079,22 @@
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,57,118,192                   // vpcmpeqd      %xmm8,%xmm8,%xmm8
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
+  .byte  197,180,95,192                      // vmaxps        %ymm0,%ymm9,%ymm0
+  .byte  197,252,93,194                      // vminps        %ymm2,%ymm0,%ymm0
+  .byte  196,226,125,24,80,16                // vbroadcastss  0x10(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,193,97,254,216                  // vpaddd        %xmm8,%xmm3,%xmm3
+  .byte  196,193,105,254,208                 // vpaddd        %xmm8,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  197,180,95,201                      // vmaxps        %ymm1,%ymm9,%ymm1
+  .byte  197,244,93,202                      // vminps        %ymm2,%ymm1,%ymm1
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,254,91,201                      // vcvttps2dq    %ymm1,%ymm1
   .byte  197,249,110,80,8                    // vmovd         0x8(%rax),%xmm2
@@ -21995,10 +22127,10 @@
   .byte  196,131,121,34,4,176,2              // vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   .byte  196,195,121,34,28,152,3             // vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   .byte  196,227,61,24,195,1                 // vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  .byte  197,124,40,13,58,224,1,0            // vmovaps       0x1e03a(%rip),%ymm9        # 2aca0 <_sk_srcover_rgba_8888_sse2_lowp+0x704>
+  .byte  197,124,40,13,40,225,1,0            // vmovaps       0x1e128(%rip),%ymm9        # 2b000 <_sk_srcover_rgba_8888_sse2_lowp+0x704>
   .byte  196,193,124,84,193                  // vandps        %ymm9,%ymm0,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,21,228,225,1,0        // vbroadcastss  0x1e1e4(%rip),%ymm10        # 2ae5c <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  .byte  196,98,125,24,21,210,226,1,0        // vbroadcastss  0x1e2d2(%rip),%ymm10        # 2b1bc <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   .byte  196,193,124,89,210                  // vmulps        %ymm10,%ymm0,%ymm2
   .byte  196,193,121,114,208,8               // vpsrld        $0x8,%xmm8,%xmm0
   .byte  197,241,114,211,8                   // vpsrld        $0x8,%xmm3,%xmm1
@@ -22035,7 +22167,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,218                           // movslq        %edx,%r11
-  .byte  196,98,125,24,5,20,225,1,0          // vbroadcastss  0x1e114(%rip),%ymm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,125,24,5,2,226,1,0           // vbroadcastss  0x1e202(%rip),%ymm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  196,65,108,89,200                   // vmulps        %ymm8,%ymm2,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,65,116,89,208                   // vmulps        %ymm8,%ymm1,%ymm10
@@ -22060,7 +22192,7 @@
   .byte  196,65,45,86,192                    // vorpd         %ymm8,%ymm10,%ymm8
   .byte  196,65,53,86,192                    // vorpd         %ymm8,%ymm9,%ymm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           cd8e <_sk_store_bgra_avx+0xae>
+  .byte  117,10                              // jne           d000 <_sk_store_bgra_avx+0xae>
   .byte  196,1,124,17,4,152                  // vmovups       %ymm8,(%r8,%r11,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -22068,17 +22200,17 @@
   .byte  65,128,225,7                        // and           $0x7,%r9b
   .byte  65,254,201                          // dec           %r9b
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,236                             // ja            cd8a <_sk_store_bgra_avx+0xaa>
+  .byte  119,236                             // ja            cffc <_sk_store_bgra_avx+0xaa>
   .byte  69,15,182,201                       // movzbl        %r9b,%r9d
-  .byte  76,141,21,83,0,0,0                  // lea           0x53(%rip),%r10        # cdfc <_sk_store_bgra_avx+0x11c>
+  .byte  76,141,21,85,0,0,0                  // lea           0x55(%rip),%r10        # d070 <_sk_store_bgra_avx+0x11e>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,1,121,126,4,152                 // vmovd         %xmm8,(%r8,%r11,4)
-  .byte  235,208                             // jmp           cd8a <_sk_store_bgra_avx+0xaa>
+  .byte  235,208                             // jmp           cffc <_sk_store_bgra_avx+0xaa>
   .byte  196,3,121,22,68,152,8,2             // vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   .byte  196,1,121,214,4,152                 // vmovq         %xmm8,(%r8,%r11,4)
-  .byte  235,192                             // jmp           cd8a <_sk_store_bgra_avx+0xaa>
+  .byte  235,192                             // jmp           cffc <_sk_store_bgra_avx+0xaa>
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,3,121,22,76,152,24,2            // vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
@@ -22086,25 +22218,22 @@
   .byte  196,67,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm9
   .byte  196,1,122,17,76,152,16              // vmovss        %xmm9,0x10(%r8,%r11,4)
   .byte  196,1,121,17,4,152                  // vmovupd       %xmm8,(%r8,%r11,4)
-  .byte  235,143                             // jmp           cd8a <_sk_store_bgra_avx+0xaa>
-  .byte  144                                 // nop
-  .byte  182,255                             // mov           $0xff,%dh
+  .byte  235,143                             // jmp           cffc <_sk_store_bgra_avx+0xaa>
+  .byte  15,31,0                             // nopl          (%rax)
+  .byte  180,255                             // mov           $0xff,%ah
   .byte  255                                 // (bad)
-  .byte  255,198                             // inc           %esi
+  .byte  255,196                             // inc           %esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  190,255,255,255,247                 // mov           $0xf7ffffff,%esi
+  .byte  188,255,255,255,245                 // mov           $0xf5ffffff,%esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  234                                 // (bad)
+  .byte  232,255,255,255,218                 // callq         ffffffffdb00d084 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdafe2788>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  220,255                             // fdivr         %st,%st(7)
-  .byte  255                                 // (bad)
-  .byte  255,206                             // dec           %esi
+  .byte  255,204                             // dec           %esp
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -22126,7 +22255,7 @@
   .byte  197,252,17,116,36,192               // vmovups       %ymm6,-0x40(%rsp)
   .byte  197,252,17,108,36,160               // vmovups       %ymm5,-0x60(%rsp)
   .byte  197,252,17,100,36,128               // vmovups       %ymm4,-0x80(%rsp)
-  .byte  15,133,31,2,0,0                     // jne           d073 <_sk_load_f16_avx+0x25b>
+  .byte  15,133,31,2,0,0                     // jne           d2e7 <_sk_load_f16_avx+0x25b>
   .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
   .byte  196,193,121,16,84,192,16            // vmovupd       0x10(%r8,%rax,8),%xmm2
   .byte  196,193,121,16,92,192,32            // vmovupd       0x20(%r8,%rax,8),%xmm3
@@ -22143,14 +22272,14 @@
   .byte  196,226,121,51,200                  // vpmovzxwd     %xmm0,%xmm1
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
-  .byte  197,123,18,21,43,233,1,0            // vmovddup      0x1e92b(%rip),%xmm10        # 2b7d8 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
+  .byte  197,123,18,21,23,234,1,0            // vmovddup      0x1ea17(%rip),%xmm10        # 2bb38 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
   .byte  196,193,121,219,218                 // vpand         %xmm10,%xmm0,%xmm3
-  .byte  196,98,121,24,29,169,224,1,0        // vbroadcastss  0x1e0a9(%rip),%xmm11        # 2af64 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
+  .byte  196,98,121,24,29,149,225,1,0        // vbroadcastss  0x1e195(%rip),%xmm11        # 2b2c4 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
   .byte  197,33,102,227                      // vpcmpgtd      %xmm3,%xmm11,%xmm12
   .byte  196,193,113,219,210                 // vpand         %xmm10,%xmm1,%xmm2
   .byte  197,33,102,234                      // vpcmpgtd      %xmm2,%xmm11,%xmm13
   .byte  196,195,21,24,252,1                 // vinsertf128   $0x1,%xmm12,%ymm13,%ymm7
-  .byte  197,123,18,37,10,233,1,0            // vmovddup      0x1e90a(%rip),%xmm12        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1244>
+  .byte  197,123,18,37,246,233,1,0           // vmovddup      0x1e9f6(%rip),%xmm12        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0x1244>
   .byte  196,193,113,219,204                 // vpand         %xmm12,%xmm1,%xmm1
   .byte  197,241,114,241,16                  // vpslld        $0x10,%xmm1,%xmm1
   .byte  196,193,121,219,196                 // vpand         %xmm12,%xmm0,%xmm0
@@ -22159,7 +22288,7 @@
   .byte  197,241,235,202                     // vpor          %xmm2,%xmm1,%xmm1
   .byte  197,233,114,243,13                  // vpslld        $0xd,%xmm3,%xmm2
   .byte  197,249,235,194                     // vpor          %xmm2,%xmm0,%xmm0
-  .byte  196,226,121,24,29,99,224,1,0        // vbroadcastss  0x1e063(%rip),%xmm3        # 2af68 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
+  .byte  196,226,121,24,29,79,225,1,0        // vbroadcastss  0x1e14f(%rip),%xmm3        # 2b2c8 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
   .byte  197,249,254,195                     // vpaddd        %xmm3,%xmm0,%xmm0
   .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
@@ -22238,29 +22367,29 @@
   .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            d0d9 <_sk_load_f16_avx+0x2c1>
+  .byte  116,85                              // je            d34d <_sk_load_f16_avx+0x2c1>
   .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            d0d9 <_sk_load_f16_avx+0x2c1>
+  .byte  114,72                              // jb            d34d <_sk_load_f16_avx+0x2c1>
   .byte  196,193,123,16,84,192,16            // vmovsd        0x10(%r8,%rax,8),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            d0e6 <_sk_load_f16_avx+0x2ce>
+  .byte  116,72                              // je            d35a <_sk_load_f16_avx+0x2ce>
   .byte  196,193,105,22,84,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            d0e6 <_sk_load_f16_avx+0x2ce>
+  .byte  114,59                              // jb            d35a <_sk_load_f16_avx+0x2ce>
   .byte  196,193,123,16,92,192,32            // vmovsd        0x20(%r8,%rax,8),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,179,253,255,255              // je            ce6f <_sk_load_f16_avx+0x57>
+  .byte  15,132,179,253,255,255              // je            d0e3 <_sk_load_f16_avx+0x57>
   .byte  196,193,97,22,92,192,40             // vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,162,253,255,255              // jb            ce6f <_sk_load_f16_avx+0x57>
+  .byte  15,130,162,253,255,255              // jb            d0e3 <_sk_load_f16_avx+0x57>
   .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,150,253,255,255                 // jmpq          ce6f <_sk_load_f16_avx+0x57>
+  .byte  233,150,253,255,255                 // jmpq          d0e3 <_sk_load_f16_avx+0x57>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,137,253,255,255                 // jmpq          ce6f <_sk_load_f16_avx+0x57>
+  .byte  233,137,253,255,255                 // jmpq          d0e3 <_sk_load_f16_avx+0x57>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,128,253,255,255                 // jmpq          ce6f <_sk_load_f16_avx+0x57>
+  .byte  233,128,253,255,255                 // jmpq          d0e3 <_sk_load_f16_avx+0x57>
 
 HIDDEN _sk_load_f16_dst_avx
 .globl _sk_load_f16_dst_avx
@@ -22279,7 +22408,7 @@
   .byte  197,252,17,84,36,192                // vmovups       %ymm2,-0x40(%rsp)
   .byte  197,252,17,76,36,160                // vmovups       %ymm1,-0x60(%rsp)
   .byte  197,252,17,68,36,128                // vmovups       %ymm0,-0x80(%rsp)
-  .byte  15,133,31,2,0,0                     // jne           d34a <_sk_load_f16_dst_avx+0x25b>
+  .byte  15,133,31,2,0,0                     // jne           d5be <_sk_load_f16_dst_avx+0x25b>
   .byte  196,65,121,16,4,192                 // vmovupd       (%r8,%rax,8),%xmm8
   .byte  196,193,121,16,116,192,16           // vmovupd       0x10(%r8,%rax,8),%xmm6
   .byte  196,193,121,16,124,192,32           // vmovupd       0x20(%r8,%rax,8),%xmm7
@@ -22296,14 +22425,14 @@
   .byte  196,226,121,51,236                  // vpmovzxwd     %xmm4,%xmm5
   .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
   .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
-  .byte  197,123,18,21,84,230,1,0            // vmovddup      0x1e654(%rip),%xmm10        # 2b7d8 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
+  .byte  197,123,18,21,64,231,1,0            // vmovddup      0x1e740(%rip),%xmm10        # 2bb38 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
   .byte  196,193,89,219,250                  // vpand         %xmm10,%xmm4,%xmm7
-  .byte  196,98,121,24,29,210,221,1,0        // vbroadcastss  0x1ddd2(%rip),%xmm11        # 2af64 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
+  .byte  196,98,121,24,29,190,222,1,0        // vbroadcastss  0x1debe(%rip),%xmm11        # 2b2c4 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
   .byte  197,33,102,231                      // vpcmpgtd      %xmm7,%xmm11,%xmm12
   .byte  196,193,81,219,242                  // vpand         %xmm10,%xmm5,%xmm6
   .byte  197,33,102,238                      // vpcmpgtd      %xmm6,%xmm11,%xmm13
   .byte  196,195,21,24,220,1                 // vinsertf128   $0x1,%xmm12,%ymm13,%ymm3
-  .byte  197,123,18,37,51,230,1,0            // vmovddup      0x1e633(%rip),%xmm12        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1244>
+  .byte  197,123,18,37,31,231,1,0            // vmovddup      0x1e71f(%rip),%xmm12        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0x1244>
   .byte  196,193,81,219,236                  // vpand         %xmm12,%xmm5,%xmm5
   .byte  197,209,114,245,16                  // vpslld        $0x10,%xmm5,%xmm5
   .byte  196,193,89,219,228                  // vpand         %xmm12,%xmm4,%xmm4
@@ -22312,7 +22441,7 @@
   .byte  197,209,235,238                     // vpor          %xmm6,%xmm5,%xmm5
   .byte  197,201,114,247,13                  // vpslld        $0xd,%xmm7,%xmm6
   .byte  197,217,235,230                     // vpor          %xmm6,%xmm4,%xmm4
-  .byte  196,226,121,24,61,140,221,1,0       // vbroadcastss  0x1dd8c(%rip),%xmm7        # 2af68 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
+  .byte  196,226,121,24,61,120,222,1,0       // vbroadcastss  0x1de78(%rip),%xmm7        # 2b2c8 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
   .byte  197,217,254,231                     // vpaddd        %xmm7,%xmm4,%xmm4
   .byte  197,209,254,239                     // vpaddd        %xmm7,%xmm5,%xmm5
   .byte  196,227,85,24,228,1                 // vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
@@ -22391,29 +22520,29 @@
   .byte  196,65,123,16,4,192                 // vmovsd        (%r8,%rax,8),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            d3b0 <_sk_load_f16_dst_avx+0x2c1>
+  .byte  116,85                              // je            d624 <_sk_load_f16_dst_avx+0x2c1>
   .byte  196,65,57,22,68,192,8               // vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            d3b0 <_sk_load_f16_dst_avx+0x2c1>
+  .byte  114,72                              // jb            d624 <_sk_load_f16_dst_avx+0x2c1>
   .byte  196,193,123,16,116,192,16           // vmovsd        0x10(%r8,%rax,8),%xmm6
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            d3bd <_sk_load_f16_dst_avx+0x2ce>
+  .byte  116,72                              // je            d631 <_sk_load_f16_dst_avx+0x2ce>
   .byte  196,193,73,22,116,192,24            // vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            d3bd <_sk_load_f16_dst_avx+0x2ce>
+  .byte  114,59                              // jb            d631 <_sk_load_f16_dst_avx+0x2ce>
   .byte  196,193,123,16,124,192,32           // vmovsd        0x20(%r8,%rax,8),%xmm7
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,179,253,255,255              // je            d146 <_sk_load_f16_dst_avx+0x57>
+  .byte  15,132,179,253,255,255              // je            d3ba <_sk_load_f16_dst_avx+0x57>
   .byte  196,193,65,22,124,192,40            // vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,162,253,255,255              // jb            d146 <_sk_load_f16_dst_avx+0x57>
+  .byte  15,130,162,253,255,255              // jb            d3ba <_sk_load_f16_dst_avx+0x57>
   .byte  196,65,122,126,76,192,48            // vmovq         0x30(%r8,%rax,8),%xmm9
-  .byte  233,150,253,255,255                 // jmpq          d146 <_sk_load_f16_dst_avx+0x57>
+  .byte  233,150,253,255,255                 // jmpq          d3ba <_sk_load_f16_dst_avx+0x57>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
   .byte  197,201,87,246                      // vxorpd        %xmm6,%xmm6,%xmm6
-  .byte  233,137,253,255,255                 // jmpq          d146 <_sk_load_f16_dst_avx+0x57>
+  .byte  233,137,253,255,255                 // jmpq          d3ba <_sk_load_f16_dst_avx+0x57>
   .byte  197,193,87,255                      // vxorpd        %xmm7,%xmm7,%xmm7
-  .byte  233,128,253,255,255                 // jmpq          d146 <_sk_load_f16_dst_avx+0x57>
+  .byte  233,128,253,255,255                 // jmpq          d3ba <_sk_load_f16_dst_avx+0x57>
 
 HIDDEN _sk_gather_f16_avx
 .globl _sk_gather_f16_avx
@@ -22423,28 +22552,45 @@
   .byte  65,86                               // push          %r14
   .byte  65,84                               // push          %r12
   .byte  83                                  // push          %rbx
-  .byte  197,252,17,124,36,200               // vmovups       %ymm7,-0x38(%rsp)
-  .byte  197,252,17,116,36,168               // vmovups       %ymm6,-0x58(%rsp)
-  .byte  197,252,17,108,36,136               // vmovups       %ymm5,-0x78(%rsp)
-  .byte  197,252,40,236                      // vmovaps       %ymm4,%ymm5
+  .byte  72,131,236,24                       // sub           $0x18,%rsp
+  .byte  197,252,17,124,36,224               // vmovups       %ymm7,-0x20(%rsp)
+  .byte  197,252,17,116,36,192               // vmovups       %ymm6,-0x40(%rsp)
+  .byte  197,252,17,108,36,160               // vmovups       %ymm5,-0x60(%rsp)
+  .byte  197,252,17,100,36,128               // vmovups       %ymm4,-0x80(%rsp)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  197,254,91,209                      // vcvttps2dq    %ymm1,%ymm2
-  .byte  197,249,110,72,8                    // vmovd         0x8(%rax),%xmm1
-  .byte  197,249,112,217,0                   // vpshufd       $0x0,%xmm1,%xmm3
-  .byte  196,226,97,64,202                   // vpmulld       %xmm2,%xmm3,%xmm1
-  .byte  196,227,125,25,210,1                // vextractf128  $0x1,%ymm2,%xmm2
-  .byte  196,226,97,64,210                   // vpmulld       %xmm2,%xmm3,%xmm2
-  .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
+  .byte  196,226,125,24,80,12                // vbroadcastss  0xc(%rax),%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  196,65,49,118,201                   // vpcmpeqd      %xmm9,%xmm9,%xmm9
+  .byte  196,193,97,254,217                  // vpaddd        %xmm9,%xmm3,%xmm3
+  .byte  196,193,105,254,209                 // vpaddd        %xmm9,%xmm2,%xmm2
+  .byte  196,227,109,24,211,1                // vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  .byte  197,220,87,228                      // vxorps        %ymm4,%ymm4,%ymm4
+  .byte  197,220,95,192                      // vmaxps        %ymm0,%ymm4,%ymm0
+  .byte  197,252,93,210                      // vminps        %ymm2,%ymm0,%ymm2
+  .byte  196,226,125,24,64,16                // vbroadcastss  0x10(%rax),%ymm0
   .byte  196,227,125,25,195,1                // vextractf128  $0x1,%ymm0,%xmm3
-  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
-  .byte  196,227,249,22,208,1                // vpextrq       $0x1,%xmm2,%rax
+  .byte  196,193,97,254,217                  // vpaddd        %xmm9,%xmm3,%xmm3
+  .byte  196,193,121,254,193                 // vpaddd        %xmm9,%xmm0,%xmm0
+  .byte  196,227,125,24,195,1                // vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  .byte  197,220,95,201                      // vmaxps        %ymm1,%ymm4,%ymm1
+  .byte  197,244,93,192                      // vminps        %ymm0,%ymm1,%ymm0
+  .byte  76,139,0                            // mov           (%rax),%r8
+  .byte  197,254,91,200                      // vcvttps2dq    %ymm0,%ymm1
+  .byte  197,249,110,64,8                    // vmovd         0x8(%rax),%xmm0
+  .byte  197,249,112,216,0                   // vpshufd       $0x0,%xmm0,%xmm3
+  .byte  196,226,97,64,193                   // vpmulld       %xmm1,%xmm3,%xmm0
+  .byte  196,227,125,25,201,1                // vextractf128  $0x1,%ymm1,%xmm1
+  .byte  196,226,97,64,201                   // vpmulld       %xmm1,%xmm3,%xmm1
+  .byte  197,254,91,210                      // vcvttps2dq    %ymm2,%ymm2
+  .byte  196,227,125,25,211,1                // vextractf128  $0x1,%ymm2,%xmm3
+  .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
+  .byte  196,227,249,22,200,1                // vpextrq       $0x1,%xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  196,193,249,126,210                 // vmovq         %xmm2,%r10
+  .byte  196,193,249,126,202                 // vmovq         %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
-  .byte  197,241,254,192                     // vpaddd        %xmm0,%xmm1,%xmm0
+  .byte  197,249,254,194                     // vpaddd        %xmm2,%xmm0,%xmm0
   .byte  196,227,249,22,195,1                // vpextrq       $0x1,%xmm0,%rbx
   .byte  65,137,222                          // mov           %ebx,%r14d
   .byte  72,193,235,32                       // shr           $0x20,%rbx
@@ -22453,118 +22599,118 @@
   .byte  73,193,239,32                       // shr           $0x20,%r15
   .byte  196,129,122,126,4,248               // vmovq         (%r8,%r15,8),%xmm0
   .byte  196,129,122,126,12,224              // vmovq         (%r8,%r12,8),%xmm1
-  .byte  197,113,108,200                     // vpunpcklqdq   %xmm0,%xmm1,%xmm9
+  .byte  197,113,108,208                     // vpunpcklqdq   %xmm0,%xmm1,%xmm10
   .byte  196,193,122,126,12,216              // vmovq         (%r8,%rbx,8),%xmm1
   .byte  196,129,122,126,20,240              // vmovq         (%r8,%r14,8),%xmm2
   .byte  197,233,108,201                     // vpunpcklqdq   %xmm1,%xmm2,%xmm1
   .byte  196,129,122,126,20,208              // vmovq         (%r8,%r10,8),%xmm2
   .byte  196,129,122,126,28,216              // vmovq         (%r8,%r11,8),%xmm3
   .byte  197,225,108,210                     // vpunpcklqdq   %xmm2,%xmm3,%xmm2
-  .byte  196,65,122,126,4,192                // vmovq         (%r8,%rax,8),%xmm8
+  .byte  196,65,122,126,12,192               // vmovq         (%r8,%rax,8),%xmm9
   .byte  196,129,122,126,28,200              // vmovq         (%r8,%r9,8),%xmm3
-  .byte  196,193,97,108,216                  // vpunpcklqdq   %xmm8,%xmm3,%xmm3
-  .byte  197,177,97,193                      // vpunpcklwd    %xmm1,%xmm9,%xmm0
-  .byte  197,177,105,201                     // vpunpckhwd    %xmm1,%xmm9,%xmm1
-  .byte  197,105,97,203                      // vpunpcklwd    %xmm3,%xmm2,%xmm9
+  .byte  196,193,97,108,217                  // vpunpcklqdq   %xmm9,%xmm3,%xmm3
+  .byte  197,169,97,193                      // vpunpcklwd    %xmm1,%xmm10,%xmm0
+  .byte  197,169,105,201                     // vpunpckhwd    %xmm1,%xmm10,%xmm1
+  .byte  197,105,97,211                      // vpunpcklwd    %xmm3,%xmm2,%xmm10
   .byte  197,233,105,211                     // vpunpckhwd    %xmm3,%xmm2,%xmm2
   .byte  197,121,97,241                      // vpunpcklwd    %xmm1,%xmm0,%xmm14
-  .byte  197,121,105,193                     // vpunpckhwd    %xmm1,%xmm0,%xmm8
-  .byte  197,49,97,250                       // vpunpcklwd    %xmm2,%xmm9,%xmm15
-  .byte  197,49,105,202                      // vpunpckhwd    %xmm2,%xmm9,%xmm9
+  .byte  197,121,105,201                     // vpunpckhwd    %xmm1,%xmm0,%xmm9
+  .byte  197,41,97,250                       // vpunpcklwd    %xmm2,%xmm10,%xmm15
+  .byte  197,41,105,210                      // vpunpckhwd    %xmm2,%xmm10,%xmm10
   .byte  196,193,9,108,199                   // vpunpcklqdq   %xmm15,%xmm14,%xmm0
   .byte  196,226,121,51,208                  // vpmovzxwd     %xmm0,%xmm2
   .byte  197,249,112,192,78                  // vpshufd       $0x4e,%xmm0,%xmm0
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
-  .byte  197,123,18,21,17,227,1,0            // vmovddup      0x1e311(%rip),%xmm10        # 2b7d8 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
-  .byte  196,193,121,219,218                 // vpand         %xmm10,%xmm0,%xmm3
-  .byte  196,98,121,24,29,143,218,1,0        // vbroadcastss  0x1da8f(%rip),%xmm11        # 2af64 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
-  .byte  197,33,102,227                      // vpcmpgtd      %xmm3,%xmm11,%xmm12
-  .byte  196,193,105,219,202                 // vpand         %xmm10,%xmm2,%xmm1
-  .byte  197,33,102,233                      // vpcmpgtd      %xmm1,%xmm11,%xmm13
-  .byte  196,195,21,24,228,1                 // vinsertf128   $0x1,%xmm12,%ymm13,%ymm4
-  .byte  197,123,18,37,240,226,1,0           // vmovddup      0x1e2f0(%rip),%xmm12        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1244>
-  .byte  196,193,105,219,212                 // vpand         %xmm12,%xmm2,%xmm2
+  .byte  197,123,18,29,166,227,1,0           // vmovddup      0x1e3a6(%rip),%xmm11        # 2bb38 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
+  .byte  196,193,121,219,219                 // vpand         %xmm11,%xmm0,%xmm3
+  .byte  196,98,121,24,37,36,219,1,0         // vbroadcastss  0x1db24(%rip),%xmm12        # 2b2c4 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
+  .byte  197,25,102,235                      // vpcmpgtd      %xmm3,%xmm12,%xmm13
+  .byte  196,193,105,219,203                 // vpand         %xmm11,%xmm2,%xmm1
+  .byte  197,25,102,193                      // vpcmpgtd      %xmm1,%xmm12,%xmm8
+  .byte  196,67,61,24,197,1                  // vinsertf128   $0x1,%xmm13,%ymm8,%ymm8
+  .byte  197,123,18,45,133,227,1,0           // vmovddup      0x1e385(%rip),%xmm13        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0x1244>
+  .byte  196,193,105,219,213                 // vpand         %xmm13,%xmm2,%xmm2
   .byte  197,233,114,242,16                  // vpslld        $0x10,%xmm2,%xmm2
-  .byte  196,193,121,219,196                 // vpand         %xmm12,%xmm0,%xmm0
-  .byte  197,249,114,240,16                  // vpslld        $0x10,%xmm0,%xmm0
   .byte  197,241,114,241,13                  // vpslld        $0xd,%xmm1,%xmm1
   .byte  197,233,235,201                     // vpor          %xmm1,%xmm2,%xmm1
+  .byte  196,193,121,219,197                 // vpand         %xmm13,%xmm0,%xmm0
+  .byte  197,249,114,240,16                  // vpslld        $0x10,%xmm0,%xmm0
   .byte  197,233,114,243,13                  // vpslld        $0xd,%xmm3,%xmm2
   .byte  197,249,235,194                     // vpor          %xmm2,%xmm0,%xmm0
-  .byte  196,226,121,24,29,73,218,1,0        // vbroadcastss  0x1da49(%rip),%xmm3        # 2af68 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
+  .byte  196,226,121,24,29,222,218,1,0       // vbroadcastss  0x1dade(%rip),%xmm3        # 2b2c8 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
   .byte  197,249,254,195                     // vpaddd        %xmm3,%xmm0,%xmm0
   .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
-  .byte  196,65,20,87,237                    // vxorps        %ymm13,%ymm13,%ymm13
-  .byte  196,195,125,74,197,64               // vblendvps     %ymm4,%ymm13,%ymm0,%ymm0
+  .byte  196,227,125,74,196,128              // vblendvps     %ymm8,%ymm4,%ymm0,%ymm0
   .byte  196,193,9,109,207                   // vpunpckhqdq   %xmm15,%xmm14,%xmm1
   .byte  196,226,121,51,209                  // vpmovzxwd     %xmm1,%xmm2
   .byte  197,249,112,201,78                  // vpshufd       $0x4e,%xmm1,%xmm1
-  .byte  196,98,121,51,249                   // vpmovzxwd     %xmm1,%xmm15
-  .byte  196,193,1,219,226                   // vpand         %xmm10,%xmm15,%xmm4
-  .byte  197,33,102,244                      // vpcmpgtd      %xmm4,%xmm11,%xmm14
-  .byte  196,193,105,219,202                 // vpand         %xmm10,%xmm2,%xmm1
-  .byte  197,161,102,249                     // vpcmpgtd      %xmm1,%xmm11,%xmm7
+  .byte  196,98,121,51,193                   // vpmovzxwd     %xmm1,%xmm8
+  .byte  196,65,57,219,251                   // vpand         %xmm11,%xmm8,%xmm15
+  .byte  196,65,25,102,247                   // vpcmpgtd      %xmm15,%xmm12,%xmm14
+  .byte  196,193,105,219,203                 // vpand         %xmm11,%xmm2,%xmm1
+  .byte  197,153,102,249                     // vpcmpgtd      %xmm1,%xmm12,%xmm7
   .byte  196,195,69,24,254,1                 // vinsertf128   $0x1,%xmm14,%ymm7,%ymm7
-  .byte  196,193,105,219,212                 // vpand         %xmm12,%xmm2,%xmm2
+  .byte  196,193,105,219,213                 // vpand         %xmm13,%xmm2,%xmm2
   .byte  197,233,114,242,16                  // vpslld        $0x10,%xmm2,%xmm2
   .byte  197,241,114,241,13                  // vpslld        $0xd,%xmm1,%xmm1
   .byte  197,233,235,201                     // vpor          %xmm1,%xmm2,%xmm1
-  .byte  196,193,1,219,212                   // vpand         %xmm12,%xmm15,%xmm2
+  .byte  196,193,57,219,213                  // vpand         %xmm13,%xmm8,%xmm2
   .byte  197,233,114,242,16                  // vpslld        $0x10,%xmm2,%xmm2
-  .byte  197,217,114,244,13                  // vpslld        $0xd,%xmm4,%xmm4
-  .byte  197,233,235,212                     // vpor          %xmm4,%xmm2,%xmm2
+  .byte  196,193,73,114,247,13               // vpslld        $0xd,%xmm15,%xmm6
+  .byte  197,233,235,214                     // vpor          %xmm6,%xmm2,%xmm2
   .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
   .byte  197,241,254,203                     // vpaddd        %xmm3,%xmm1,%xmm1
   .byte  196,227,117,24,202,1                // vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
-  .byte  196,195,117,74,205,112              // vblendvps     %ymm7,%ymm13,%ymm1,%ymm1
-  .byte  196,193,57,108,209                  // vpunpcklqdq   %xmm9,%xmm8,%xmm2
-  .byte  196,226,121,51,226                  // vpmovzxwd     %xmm2,%xmm4
+  .byte  196,227,117,74,204,112              // vblendvps     %ymm7,%ymm4,%ymm1,%ymm1
+  .byte  196,193,49,108,210                  // vpunpcklqdq   %xmm10,%xmm9,%xmm2
+  .byte  196,226,121,51,242                  // vpmovzxwd     %xmm2,%xmm6
   .byte  197,249,112,210,78                  // vpshufd       $0x4e,%xmm2,%xmm2
-  .byte  196,98,121,51,250                   // vpmovzxwd     %xmm2,%xmm15
-  .byte  196,193,1,219,250                   // vpand         %xmm10,%xmm15,%xmm7
-  .byte  197,33,102,247                      // vpcmpgtd      %xmm7,%xmm11,%xmm14
-  .byte  196,193,89,219,210                  // vpand         %xmm10,%xmm4,%xmm2
-  .byte  197,161,102,242                     // vpcmpgtd      %xmm2,%xmm11,%xmm6
-  .byte  196,195,77,24,246,1                 // vinsertf128   $0x1,%xmm14,%ymm6,%ymm6
-  .byte  196,193,89,219,228                  // vpand         %xmm12,%xmm4,%xmm4
-  .byte  197,217,114,244,16                  // vpslld        $0x10,%xmm4,%xmm4
+  .byte  196,98,121,51,242                   // vpmovzxwd     %xmm2,%xmm14
+  .byte  196,193,9,219,251                   // vpand         %xmm11,%xmm14,%xmm7
+  .byte  197,25,102,199                      // vpcmpgtd      %xmm7,%xmm12,%xmm8
+  .byte  196,193,73,219,211                  // vpand         %xmm11,%xmm6,%xmm2
+  .byte  197,25,102,250                      // vpcmpgtd      %xmm2,%xmm12,%xmm15
+  .byte  196,67,5,24,192,1                   // vinsertf128   $0x1,%xmm8,%ymm15,%ymm8
+  .byte  196,193,73,219,245                  // vpand         %xmm13,%xmm6,%xmm6
+  .byte  197,201,114,246,16                  // vpslld        $0x10,%xmm6,%xmm6
   .byte  197,233,114,242,13                  // vpslld        $0xd,%xmm2,%xmm2
-  .byte  197,217,235,210                     // vpor          %xmm2,%xmm4,%xmm2
-  .byte  196,193,1,219,228                   // vpand         %xmm12,%xmm15,%xmm4
-  .byte  197,217,114,244,16                  // vpslld        $0x10,%xmm4,%xmm4
-  .byte  197,193,114,247,13                  // vpslld        $0xd,%xmm7,%xmm7
-  .byte  197,217,235,231                     // vpor          %xmm7,%xmm4,%xmm4
-  .byte  197,217,254,227                     // vpaddd        %xmm3,%xmm4,%xmm4
-  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
-  .byte  196,227,109,24,212,1                // vinsertf128   $0x1,%xmm4,%ymm2,%ymm2
-  .byte  196,195,109,74,213,96               // vblendvps     %ymm6,%ymm13,%ymm2,%ymm2
-  .byte  196,193,57,109,225                  // vpunpckhqdq   %xmm9,%xmm8,%xmm4
-  .byte  196,226,121,51,244                  // vpmovzxwd     %xmm4,%xmm6
-  .byte  197,249,112,228,78                  // vpshufd       $0x4e,%xmm4,%xmm4
-  .byte  196,226,121,51,228                  // vpmovzxwd     %xmm4,%xmm4
-  .byte  196,65,89,219,202                   // vpand         %xmm10,%xmm4,%xmm9
-  .byte  196,65,33,102,193                   // vpcmpgtd      %xmm9,%xmm11,%xmm8
-  .byte  196,193,73,219,250                  // vpand         %xmm10,%xmm6,%xmm7
-  .byte  197,33,102,215                      // vpcmpgtd      %xmm7,%xmm11,%xmm10
-  .byte  196,67,45,24,192,1                  // vinsertf128   $0x1,%xmm8,%ymm10,%ymm8
-  .byte  196,193,73,219,244                  // vpand         %xmm12,%xmm6,%xmm6
-  .byte  196,193,89,219,228                  // vpand         %xmm12,%xmm4,%xmm4
+  .byte  197,201,235,210                     // vpor          %xmm2,%xmm6,%xmm2
+  .byte  196,193,9,219,245                   // vpand         %xmm13,%xmm14,%xmm6
   .byte  197,201,114,246,16                  // vpslld        $0x10,%xmm6,%xmm6
   .byte  197,193,114,247,13                  // vpslld        $0xd,%xmm7,%xmm7
   .byte  197,201,235,247                     // vpor          %xmm7,%xmm6,%xmm6
-  .byte  197,217,114,244,16                  // vpslld        $0x10,%xmm4,%xmm4
-  .byte  196,193,65,114,241,13               // vpslld        $0xd,%xmm9,%xmm7
-  .byte  197,217,235,231                     // vpor          %xmm7,%xmm4,%xmm4
-  .byte  197,217,254,227                     // vpaddd        %xmm3,%xmm4,%xmm4
+  .byte  197,201,254,243                     // vpaddd        %xmm3,%xmm6,%xmm6
+  .byte  197,233,254,211                     // vpaddd        %xmm3,%xmm2,%xmm2
+  .byte  196,227,109,24,214,1                // vinsertf128   $0x1,%xmm6,%ymm2,%ymm2
+  .byte  196,227,109,74,212,128              // vblendvps     %ymm8,%ymm4,%ymm2,%ymm2
+  .byte  196,193,49,109,242                  // vpunpckhqdq   %xmm10,%xmm9,%xmm6
+  .byte  196,226,121,51,254                  // vpmovzxwd     %xmm6,%xmm7
+  .byte  197,249,112,246,78                  // vpshufd       $0x4e,%xmm6,%xmm6
+  .byte  196,98,121,51,214                   // vpmovzxwd     %xmm6,%xmm10
+  .byte  196,65,41,219,195                   // vpand         %xmm11,%xmm10,%xmm8
+  .byte  196,65,25,102,200                   // vpcmpgtd      %xmm8,%xmm12,%xmm9
+  .byte  196,193,65,219,243                  // vpand         %xmm11,%xmm7,%xmm6
+  .byte  197,25,102,222                      // vpcmpgtd      %xmm6,%xmm12,%xmm11
+  .byte  196,67,37,24,201,1                  // vinsertf128   $0x1,%xmm9,%ymm11,%ymm9
+  .byte  196,193,65,219,253                  // vpand         %xmm13,%xmm7,%xmm7
+  .byte  196,65,41,219,213                   // vpand         %xmm13,%xmm10,%xmm10
+  .byte  197,193,114,247,16                  // vpslld        $0x10,%xmm7,%xmm7
+  .byte  197,201,114,246,13                  // vpslld        $0xd,%xmm6,%xmm6
+  .byte  197,193,235,246                     // vpor          %xmm6,%xmm7,%xmm6
+  .byte  196,193,65,114,242,16               // vpslld        $0x10,%xmm10,%xmm7
+  .byte  196,193,81,114,240,13               // vpslld        $0xd,%xmm8,%xmm5
+  .byte  197,193,235,237                     // vpor          %xmm5,%xmm7,%xmm5
+  .byte  197,209,254,235                     // vpaddd        %xmm3,%xmm5,%xmm5
   .byte  197,201,254,219                     // vpaddd        %xmm3,%xmm6,%xmm3
-  .byte  196,227,101,24,220,1                // vinsertf128   $0x1,%xmm4,%ymm3,%ymm3
-  .byte  196,195,101,74,221,128              // vblendvps     %ymm8,%ymm13,%ymm3,%ymm3
+  .byte  196,227,101,24,221,1                // vinsertf128   $0x1,%xmm5,%ymm3,%ymm3
+  .byte  196,227,101,74,220,144              // vblendvps     %ymm9,%ymm4,%ymm3,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  197,252,40,229                      // vmovaps       %ymm5,%ymm4
-  .byte  197,252,16,108,36,136               // vmovups       -0x78(%rsp),%ymm5
-  .byte  197,252,16,116,36,168               // vmovups       -0x58(%rsp),%ymm6
-  .byte  197,252,16,124,36,200               // vmovups       -0x38(%rsp),%ymm7
+  .byte  197,252,16,100,36,128               // vmovups       -0x80(%rsp),%ymm4
+  .byte  197,252,16,108,36,160               // vmovups       -0x60(%rsp),%ymm5
+  .byte  197,252,16,116,36,192               // vmovups       -0x40(%rsp),%ymm6
+  .byte  197,252,16,124,36,224               // vmovups       -0x20(%rsp),%ymm7
+  .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
   .byte  65,94                               // pop           %r14
@@ -22581,12 +22727,12 @@
   .byte  197,252,17,108,36,192               // vmovups       %ymm5,-0x40(%rsp)
   .byte  197,252,17,100,36,160               // vmovups       %ymm4,-0x60(%rsp)
   .byte  197,252,40,225                      // vmovaps       %ymm1,%ymm4
-  .byte  196,98,125,24,5,139,216,1,0         // vbroadcastss  0x1d88b(%rip),%ymm8        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,5,28,217,1,0          // vbroadcastss  0x1d91c(%rip),%ymm8        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,65,124,84,216                   // vandps        %ymm8,%ymm0,%ymm11
-  .byte  196,98,125,24,21,169,216,1,0        // vbroadcastss  0x1d8a9(%rip),%ymm10        # 2af6c <_sk_srcover_rgba_8888_sse2_lowp+0x9d0>
+  .byte  196,98,125,24,21,58,217,1,0         // vbroadcastss  0x1d93a(%rip),%ymm10        # 2b2cc <_sk_srcover_rgba_8888_sse2_lowp+0x9d0>
   .byte  196,65,124,84,226                   // vandps        %ymm10,%ymm0,%ymm12
   .byte  196,67,125,25,229,1                 // vextractf128  $0x1,%ymm12,%xmm13
-  .byte  196,98,121,24,13,153,216,1,0        // vbroadcastss  0x1d899(%rip),%xmm9        # 2af70 <_sk_srcover_rgba_8888_sse2_lowp+0x9d4>
+  .byte  196,98,121,24,13,42,217,1,0         // vbroadcastss  0x1d92a(%rip),%xmm9        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0x9d4>
   .byte  196,65,49,102,245                   // vpcmpgtd      %xmm13,%xmm9,%xmm14
   .byte  196,65,49,102,252                   // vpcmpgtd      %xmm12,%xmm9,%xmm15
   .byte  196,67,5,24,246,1                   // vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
@@ -22597,7 +22743,7 @@
   .byte  196,65,17,254,239                   // vpaddd        %xmm15,%xmm13,%xmm13
   .byte  196,193,25,114,212,13               // vpsrld        $0xd,%xmm12,%xmm12
   .byte  196,65,25,254,227                   // vpaddd        %xmm11,%xmm12,%xmm12
-  .byte  196,98,121,24,29,92,216,1,0         // vbroadcastss  0x1d85c(%rip),%xmm11        # 2af74 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  .byte  196,98,121,24,29,237,216,1,0        // vbroadcastss  0x1d8ed(%rip),%xmm11        # 2b2d4 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
   .byte  196,65,17,254,235                   // vpaddd        %xmm11,%xmm13,%xmm13
   .byte  196,65,25,254,227                   // vpaddd        %xmm11,%xmm12,%xmm12
   .byte  196,67,29,24,237,1                  // vinsertf128   $0x1,%xmm13,%ymm12,%ymm13
@@ -22680,7 +22826,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,68                              // jne           d8ef <_sk_store_f16_avx+0x262>
+  .byte  117,68                              // jne           dbbe <_sk_store_f16_avx+0x262>
   .byte  196,65,122,127,28,192               // vmovdqu       %xmm11,(%r8,%rax,8)
   .byte  196,65,122,127,84,192,16            // vmovdqu       %xmm10,0x10(%r8,%rax,8)
   .byte  196,65,122,127,76,192,32            // vmovdqu       %xmm9,0x20(%r8,%rax,8)
@@ -22696,22 +22842,22 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,214,28,192               // vmovq         %xmm11,(%r8,%rax,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,203                             // je            d8c6 <_sk_store_f16_avx+0x239>
+  .byte  116,203                             // je            db95 <_sk_store_f16_avx+0x239>
   .byte  196,65,121,23,92,192,8              // vmovhpd       %xmm11,0x8(%r8,%rax,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,190                             // jb            d8c6 <_sk_store_f16_avx+0x239>
+  .byte  114,190                             // jb            db95 <_sk_store_f16_avx+0x239>
   .byte  196,65,121,214,84,192,16            // vmovq         %xmm10,0x10(%r8,%rax,8)
-  .byte  116,181                             // je            d8c6 <_sk_store_f16_avx+0x239>
+  .byte  116,181                             // je            db95 <_sk_store_f16_avx+0x239>
   .byte  196,65,121,23,84,192,24             // vmovhpd       %xmm10,0x18(%r8,%rax,8)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,168                             // jb            d8c6 <_sk_store_f16_avx+0x239>
+  .byte  114,168                             // jb            db95 <_sk_store_f16_avx+0x239>
   .byte  196,65,121,214,76,192,32            // vmovq         %xmm9,0x20(%r8,%rax,8)
-  .byte  116,159                             // je            d8c6 <_sk_store_f16_avx+0x239>
+  .byte  116,159                             // je            db95 <_sk_store_f16_avx+0x239>
   .byte  196,65,121,23,76,192,40             // vmovhpd       %xmm9,0x28(%r8,%rax,8)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,146                             // jb            d8c6 <_sk_store_f16_avx+0x239>
+  .byte  114,146                             // jb            db95 <_sk_store_f16_avx+0x239>
   .byte  196,65,121,214,68,192,48            // vmovq         %xmm8,0x30(%r8,%rax,8)
-  .byte  235,137                             // jmp           d8c6 <_sk_store_f16_avx+0x239>
+  .byte  235,137                             // jmp           db95 <_sk_store_f16_avx+0x239>
 
 HIDDEN _sk_load_u16_be_avx
 .globl _sk_load_u16_be_avx
@@ -22726,7 +22872,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,12,1,0,0                     // jne           da70 <_sk_load_u16_be_avx+0x133>
+  .byte  15,133,12,1,0,0                     // jne           dd3f <_sk_load_u16_be_avx+0x133>
   .byte  196,65,121,16,4,64                  // vmovupd       (%r8,%rax,2),%xmm8
   .byte  196,193,121,16,84,64,16             // vmovupd       0x10(%r8,%rax,2),%xmm2
   .byte  196,193,121,16,92,64,32             // vmovupd       0x20(%r8,%rax,2),%xmm3
@@ -22748,7 +22894,7 @@
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,163,212,1,0        // vbroadcastss  0x1d4a3(%rip),%ymm9        # 2ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  .byte  196,98,125,24,13,52,213,1,0         // vbroadcastss  0x1d534(%rip),%ymm9        # 2b1d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,169,109,202                     // vpunpckhqdq   %xmm2,%xmm10,%xmm1
   .byte  197,233,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm2
@@ -22785,29 +22931,29 @@
   .byte  196,65,123,16,4,64                  // vmovsd        (%r8,%rax,2),%xmm8
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,85                              // je            dad6 <_sk_load_u16_be_avx+0x199>
+  .byte  116,85                              // je            dda5 <_sk_load_u16_be_avx+0x199>
   .byte  196,65,57,22,68,64,8                // vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,72                              // jb            dad6 <_sk_load_u16_be_avx+0x199>
+  .byte  114,72                              // jb            dda5 <_sk_load_u16_be_avx+0x199>
   .byte  196,193,123,16,84,64,16             // vmovsd        0x10(%r8,%rax,2),%xmm2
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  116,72                              // je            dae3 <_sk_load_u16_be_avx+0x1a6>
+  .byte  116,72                              // je            ddb2 <_sk_load_u16_be_avx+0x1a6>
   .byte  196,193,105,22,84,64,24             // vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,59                              // jb            dae3 <_sk_load_u16_be_avx+0x1a6>
+  .byte  114,59                              // jb            ddb2 <_sk_load_u16_be_avx+0x1a6>
   .byte  196,193,123,16,92,64,32             // vmovsd        0x20(%r8,%rax,2),%xmm3
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  15,132,198,254,255,255              // je            d97f <_sk_load_u16_be_avx+0x42>
+  .byte  15,132,198,254,255,255              // je            dc4e <_sk_load_u16_be_avx+0x42>
   .byte  196,193,97,22,92,64,40              // vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,130,181,254,255,255              // jb            d97f <_sk_load_u16_be_avx+0x42>
+  .byte  15,130,181,254,255,255              // jb            dc4e <_sk_load_u16_be_avx+0x42>
   .byte  196,65,122,126,76,64,48             // vmovq         0x30(%r8,%rax,2),%xmm9
-  .byte  233,169,254,255,255                 // jmpq          d97f <_sk_load_u16_be_avx+0x42>
+  .byte  233,169,254,255,255                 // jmpq          dc4e <_sk_load_u16_be_avx+0x42>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
   .byte  197,233,87,210                      // vxorpd        %xmm2,%xmm2,%xmm2
-  .byte  233,156,254,255,255                 // jmpq          d97f <_sk_load_u16_be_avx+0x42>
+  .byte  233,156,254,255,255                 // jmpq          dc4e <_sk_load_u16_be_avx+0x42>
   .byte  197,225,87,219                      // vxorpd        %xmm3,%xmm3,%xmm3
-  .byte  233,147,254,255,255                 // jmpq          d97f <_sk_load_u16_be_avx+0x42>
+  .byte  233,147,254,255,255                 // jmpq          dc4e <_sk_load_u16_be_avx+0x42>
 
 HIDDEN _sk_load_rgb_u16_be_avx
 .globl _sk_load_rgb_u16_be_avx
@@ -22824,7 +22970,7 @@
   .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
   .byte  72,193,248,32                       // sar           $0x20,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,253,0,0,0                    // jne           dc14 <_sk_load_rgb_u16_be_avx+0x128>
+  .byte  15,133,253,0,0,0                    // jne           dee3 <_sk_load_rgb_u16_be_avx+0x128>
   .byte  196,65,122,111,28,64                // vmovdqu       (%r8,%rax,2),%xmm11
   .byte  196,193,122,111,92,64,12            // vmovdqu       0xc(%r8,%rax,2),%xmm3
   .byte  196,193,122,111,84,64,24            // vmovdqu       0x18(%r8,%rax,2),%xmm2
@@ -22852,7 +22998,7 @@
   .byte  196,226,121,51,192                  // vpmovzxwd     %xmm0,%xmm0
   .byte  196,227,117,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  197,252,91,192                      // vcvtdq2ps     %ymm0,%ymm0
-  .byte  196,98,125,24,13,210,210,1,0        // vbroadcastss  0x1d2d2(%rip),%ymm9        # 2ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  .byte  196,98,125,24,13,99,211,1,0         // vbroadcastss  0x1d363(%rip),%ymm9        # 2b1d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   .byte  196,193,124,89,193                  // vmulps        %ymm9,%ymm0,%ymm0
   .byte  197,185,109,203                     // vpunpckhqdq   %xmm3,%xmm8,%xmm1
   .byte  197,225,113,241,8                   // vpsllw        $0x8,%xmm1,%xmm3
@@ -22874,69 +23020,69 @@
   .byte  197,252,91,210                      // vcvtdq2ps     %ymm2,%ymm2
   .byte  196,193,108,89,209                  // vmulps        %ymm9,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,214,209,1,0       // vbroadcastss  0x1d1d6(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,103,210,1,0       // vbroadcastss  0x1d267(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,4,64                // vmovd         (%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,65,121,196,92,64,4,2            // vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,31                              // jne           dc4c <_sk_load_rgb_u16_be_avx+0x160>
+  .byte  117,31                              // jne           df1b <_sk_load_rgb_u16_be_avx+0x160>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
-  .byte  233,0,255,255,255                   // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,0,255,255,255                   // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
   .byte  196,193,121,110,68,64,6             // vmovd         0x6(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,65,121,196,68,64,10,2           // vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,48                              // jb            dc96 <_sk_load_rgb_u16_be_avx+0x1aa>
+  .byte  114,48                              // jb            df65 <_sk_load_rgb_u16_be_avx+0x1aa>
   .byte  196,193,121,110,68,64,12            // vmovd         0xc(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,92,64,16,2          // vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  117,48                              // jne           dcb0 <_sk_load_rgb_u16_be_avx+0x1c4>
+  .byte  117,48                              // jne           df7f <_sk_load_rgb_u16_be_avx+0x1c4>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
-  .byte  233,182,254,255,255                 // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,182,254,255,255                 // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
   .byte  196,65,41,239,210                   // vpxor         %xmm10,%xmm10,%xmm10
   .byte  197,225,239,219                     // vpxor         %xmm3,%xmm3,%xmm3
-  .byte  233,156,254,255,255                 // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,156,254,255,255                 // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
   .byte  196,193,121,110,68,64,18            // vmovd         0x12(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,65,121,196,84,64,22,2           // vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,39                              // jb            dcf1 <_sk_load_rgb_u16_be_avx+0x205>
+  .byte  114,39                              // jb            dfc0 <_sk_load_rgb_u16_be_avx+0x205>
   .byte  196,193,121,110,68,64,24            // vmovd         0x18(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,84,64,28,2          // vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  117,30                              // jne           dd02 <_sk_load_rgb_u16_be_avx+0x216>
+  .byte  117,30                              // jne           dfd1 <_sk_load_rgb_u16_be_avx+0x216>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
-  .byte  233,91,254,255,255                  // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,91,254,255,255                  // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  197,241,239,201                     // vpxor         %xmm1,%xmm1,%xmm1
   .byte  197,233,239,210                     // vpxor         %xmm2,%xmm2,%xmm2
-  .byte  233,74,254,255,255                  // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,74,254,255,255                  // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
   .byte  196,193,121,110,68,64,30            // vmovd         0x1e(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,76,64,34,2          // vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,25                              // jb            dd35 <_sk_load_rgb_u16_be_avx+0x249>
+  .byte  114,25                              // jb            e004 <_sk_load_rgb_u16_be_avx+0x249>
   .byte  196,193,121,110,68,64,36            // vmovd         0x24(%r8,%rax,2),%xmm0
   .byte  196,65,49,239,201                   // vpxor         %xmm9,%xmm9,%xmm9
   .byte  196,193,121,196,68,64,40,2          // vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  .byte  233,23,254,255,255                  // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,23,254,255,255                  // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
-  .byte  233,14,254,255,255                  // jmpq          db4c <_sk_load_rgb_u16_be_avx+0x60>
+  .byte  233,14,254,255,255                  // jmpq          de1b <_sk_load_rgb_u16_be_avx+0x60>
 
 HIDDEN _sk_store_u16_be_avx
 .globl _sk_store_u16_be_avx
@@ -22950,7 +23096,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  196,98,125,24,5,155,209,1,0         // vbroadcastss  0x1d19b(%rip),%ymm8        # 2af00 <_sk_srcover_rgba_8888_sse2_lowp+0x964>
+  .byte  196,98,125,24,5,44,210,1,0          // vbroadcastss  0x1d22c(%rip),%ymm8        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0x964>
   .byte  196,65,124,89,200                   // vmulps        %ymm8,%ymm0,%ymm9
   .byte  196,65,125,91,201                   // vcvtps2dq     %ymm9,%ymm9
   .byte  196,67,125,25,202,1                 // vextractf128  $0x1,%ymm9,%xmm10
@@ -22988,7 +23134,7 @@
   .byte  196,65,17,98,200                    // vpunpckldq    %xmm8,%xmm13,%xmm9
   .byte  196,65,17,106,192                   // vpunpckhdq    %xmm8,%xmm13,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,31                              // jne           de49 <_sk_store_u16_be_avx+0x10b>
+  .byte  117,31                              // jne           e118 <_sk_store_u16_be_avx+0x10b>
   .byte  196,65,122,127,28,64                // vmovdqu       %xmm11,(%r8,%rax,2)
   .byte  196,65,122,127,84,64,16             // vmovdqu       %xmm10,0x10(%r8,%rax,2)
   .byte  196,65,122,127,76,64,32             // vmovdqu       %xmm9,0x20(%r8,%rax,2)
@@ -22997,22 +23143,22 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,214,28,64                // vmovq         %xmm11,(%r8,%rax,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            de45 <_sk_store_u16_be_avx+0x107>
+  .byte  116,240                             // je            e114 <_sk_store_u16_be_avx+0x107>
   .byte  196,65,121,23,92,64,8               // vmovhpd       %xmm11,0x8(%r8,%rax,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            de45 <_sk_store_u16_be_avx+0x107>
+  .byte  114,227                             // jb            e114 <_sk_store_u16_be_avx+0x107>
   .byte  196,65,121,214,84,64,16             // vmovq         %xmm10,0x10(%r8,%rax,2)
-  .byte  116,218                             // je            de45 <_sk_store_u16_be_avx+0x107>
+  .byte  116,218                             // je            e114 <_sk_store_u16_be_avx+0x107>
   .byte  196,65,121,23,84,64,24              // vmovhpd       %xmm10,0x18(%r8,%rax,2)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            de45 <_sk_store_u16_be_avx+0x107>
+  .byte  114,205                             // jb            e114 <_sk_store_u16_be_avx+0x107>
   .byte  196,65,121,214,76,64,32             // vmovq         %xmm9,0x20(%r8,%rax,2)
-  .byte  116,196                             // je            de45 <_sk_store_u16_be_avx+0x107>
+  .byte  116,196                             // je            e114 <_sk_store_u16_be_avx+0x107>
   .byte  196,65,121,23,76,64,40              // vmovhpd       %xmm9,0x28(%r8,%rax,2)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,183                             // jb            de45 <_sk_store_u16_be_avx+0x107>
+  .byte  114,183                             // jb            e114 <_sk_store_u16_be_avx+0x107>
   .byte  196,65,121,214,68,64,48             // vmovq         %xmm8,0x30(%r8,%rax,2)
-  .byte  235,174                             // jmp           de45 <_sk_store_u16_be_avx+0x107>
+  .byte  235,174                             // jmp           e114 <_sk_store_u16_be_avx+0x107>
 
 HIDDEN _sk_load_f32_avx
 .globl _sk_load_f32_avx
@@ -23021,7 +23167,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            e008 <_sk_load_f32_avx+0x171>
+  .byte  15,135,97,1,0,0                     // ja            e2d7 <_sk_load_f32_avx+0x171>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,100,36,128               // vmovupd       %ymm4,-0x80(%rsp)
   .byte  197,253,17,108,36,160               // vmovupd       %ymm5,-0x60(%rsp)
@@ -23034,7 +23180,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,49,1,0,0                  // lea           0x131(%rip),%r10        # e018 <_sk_load_f32_avx+0x181>
+  .byte  76,141,21,50,1,0,0                  // lea           0x132(%rip),%r10        # e2e8 <_sk_load_f32_avx+0x182>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
@@ -23097,24 +23243,19 @@
   .byte  197,229,87,219                      // vxorpd        %ymm3,%ymm3,%ymm3
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,245,87,201                      // vxorpd        %ymm1,%ymm1,%ymm1
-  .byte  235,203                             // jmp           dfe2 <_sk_load_f32_avx+0x14b>
-  .byte  144                                 // nop
-  .byte  28,255                              // sbb           $0xff,%al
+  .byte  235,203                             // jmp           e2b1 <_sk_load_f32_avx+0x14b>
+  .byte  102,144                             // xchg          %ax,%ax
+  .byte  27,255                              // sbb           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,162,255,255,255,141             // jmpq          *-0x72000001(%rdx)
+  .byte  255,161,255,255,255,140             // jmpq          *-0x73000001(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
+  .byte  255,119,255                         // pushq         -0x1(%rdi)
   .byte  255                                 // (bad)
-  .byte  120,255                             // js            e025 <_sk_load_f32_avx+0x18e>
+  .byte  255,92,255,255                      // lcall         *-0x1(%rdi,%rdi,8)
+  .byte  255,70,255                          // incl          -0x1(%rsi)
   .byte  255                                 // (bad)
-  .byte  255,93,255                          // lcall         *-0x1(%rbp)
-  .byte  255                                 // (bad)
-  .byte  255,71,255                          // incl          -0x1(%rdi)
-  .byte  255                                 // (bad)
-  .byte  255,54                              // pushq         (%rsi)
-  .byte  255                                 // (bad)
-  .byte  255                                 // (bad)
-  .byte  255,41                              // ljmp          *(%rcx)
+  .byte  255,53,255,255,255,40               // pushq         0x28ffffff(%rip)        # 2900e304 <_sk_srcover_rgba_8888_sse2_lowp+0x28fe3a08>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // .byte         0xff
@@ -23126,7 +23267,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,221,87,228                      // vxorpd        %ymm4,%ymm4,%ymm4
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  15,135,97,1,0,0                     // ja            e1a9 <_sk_load_f32_dst_avx+0x171>
+  .byte  15,135,97,1,0,0                     // ja            e479 <_sk_load_f32_dst_avx+0x171>
   .byte  72,131,236,24                       // sub           $0x18,%rsp
   .byte  197,253,17,68,36,128                // vmovupd       %ymm0,-0x80(%rsp)
   .byte  197,253,17,76,36,160                // vmovupd       %ymm1,-0x60(%rsp)
@@ -23139,7 +23280,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  77,99,201                           // movslq        %r9d,%r9
-  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # e1b8 <_sk_load_f32_dst_avx+0x180>
+  .byte  76,141,21,48,1,0,0                  // lea           0x130(%rip),%r10        # e488 <_sk_load_f32_dst_avx+0x180>
   .byte  73,99,4,186                         // movslq        (%r10,%rdi,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  197,253,87,192                      // vxorpd        %ymm0,%ymm0,%ymm0
@@ -23202,7 +23343,7 @@
   .byte  197,197,87,255                      // vxorpd        %ymm7,%ymm7,%ymm7
   .byte  196,65,45,87,210                    // vxorpd        %ymm10,%ymm10,%ymm10
   .byte  197,213,87,237                      // vxorpd        %ymm5,%ymm5,%ymm5
-  .byte  235,203                             // jmp           e183 <_sk_load_f32_dst_avx+0x14b>
+  .byte  235,203                             // jmp           e453 <_sk_load_f32_dst_avx+0x14b>
   .byte  29,255,255,255,163                  // sbb           $0xa3ffffff,%eax
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
@@ -23242,7 +23383,7 @@
   .byte  196,65,37,20,196                    // vunpcklpd     %ymm12,%ymm11,%ymm8
   .byte  196,65,37,21,220                    // vunpckhpd     %ymm12,%ymm11,%ymm11
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,55                              // jne           e257 <_sk_store_f32_avx+0x7f>
+  .byte  117,55                              // jne           e527 <_sk_store_f32_avx+0x7f>
   .byte  196,67,45,24,225,1                  // vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   .byte  196,67,61,24,235,1                  // vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   .byte  196,67,45,6,201,49                  // vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
@@ -23255,56 +23396,22 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,17,20,128                // vmovupd       %xmm10,(%r8,%rax,4)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            e253 <_sk_store_f32_avx+0x7b>
+  .byte  116,240                             // je            e523 <_sk_store_f32_avx+0x7b>
   .byte  196,65,121,17,76,128,16             // vmovupd       %xmm9,0x10(%r8,%rax,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            e253 <_sk_store_f32_avx+0x7b>
+  .byte  114,227                             // jb            e523 <_sk_store_f32_avx+0x7b>
   .byte  196,65,121,17,68,128,32             // vmovupd       %xmm8,0x20(%r8,%rax,4)
-  .byte  116,218                             // je            e253 <_sk_store_f32_avx+0x7b>
+  .byte  116,218                             // je            e523 <_sk_store_f32_avx+0x7b>
   .byte  196,65,121,17,92,128,48             // vmovupd       %xmm11,0x30(%r8,%rax,4)
   .byte  72,131,255,5                        // cmp           $0x5,%rdi
-  .byte  114,205                             // jb            e253 <_sk_store_f32_avx+0x7b>
+  .byte  114,205                             // jb            e523 <_sk_store_f32_avx+0x7b>
   .byte  196,67,125,25,84,128,64,1           // vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  .byte  116,195                             // je            e253 <_sk_store_f32_avx+0x7b>
+  .byte  116,195                             // je            e523 <_sk_store_f32_avx+0x7b>
   .byte  196,67,125,25,76,128,80,1           // vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
   .byte  72,131,255,7                        // cmp           $0x7,%rdi
-  .byte  114,181                             // jb            e253 <_sk_store_f32_avx+0x7b>
+  .byte  114,181                             // jb            e523 <_sk_store_f32_avx+0x7b>
   .byte  196,67,125,25,68,128,96,1           // vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  .byte  235,171                             // jmp           e253 <_sk_store_f32_avx+0x7b>
-
-HIDDEN _sk_clamp_x_avx
-.globl _sk_clamp_x_avx
-FUNCTION(_sk_clamp_x_avx)
-_sk_clamp_x_avx:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,95,200                       // vmaxps        %ymm0,%ymm8,%ymm9
-  .byte  196,98,125,24,0                     // vbroadcastss  (%rax),%ymm8
-  .byte  196,99,125,25,192,1                 // vextractf128  $0x1,%ymm8,%xmm0
-  .byte  196,65,41,118,210                   // vpcmpeqd      %xmm10,%xmm10,%xmm10
-  .byte  196,193,121,254,194                 // vpaddd        %xmm10,%xmm0,%xmm0
-  .byte  196,65,57,254,194                   // vpaddd        %xmm10,%xmm8,%xmm8
-  .byte  196,227,61,24,192,1                 // vinsertf128   $0x1,%xmm0,%ymm8,%ymm0
-  .byte  197,180,93,192                      // vminps        %ymm0,%ymm9,%ymm0
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  255,224                             // jmpq          *%rax
-
-HIDDEN _sk_clamp_y_avx
-.globl _sk_clamp_y_avx
-FUNCTION(_sk_clamp_y_avx)
-_sk_clamp_y_avx:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,95,201                       // vmaxps        %ymm1,%ymm8,%ymm9
-  .byte  196,98,125,24,0                     // vbroadcastss  (%rax),%ymm8
-  .byte  196,99,125,25,193,1                 // vextractf128  $0x1,%ymm8,%xmm1
-  .byte  196,65,41,118,210                   // vpcmpeqd      %xmm10,%xmm10,%xmm10
-  .byte  196,193,113,254,202                 // vpaddd        %xmm10,%xmm1,%xmm1
-  .byte  196,65,57,254,194                   // vpaddd        %xmm10,%xmm8,%xmm8
-  .byte  196,227,61,24,201,1                 // vinsertf128   $0x1,%xmm1,%ymm8,%ymm1
-  .byte  197,180,93,201                      // vminps        %ymm1,%ymm9,%ymm1
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  255,224                             // jmpq          *%rax
+  .byte  235,171                             // jmp           e523 <_sk_store_f32_avx+0x7b>
 
 HIDDEN _sk_repeat_x_avx
 .globl _sk_repeat_x_avx
@@ -23317,14 +23424,6 @@
   .byte  196,98,125,24,8                     // vbroadcastss  (%rax),%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  196,193,124,92,192                  // vsubps        %ymm8,%ymm0,%ymm0
-  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,95,192                       // vmaxps        %ymm0,%ymm8,%ymm8
-  .byte  196,99,125,25,200,1                 // vextractf128  $0x1,%ymm9,%xmm0
-  .byte  196,65,41,118,210                   // vpcmpeqd      %xmm10,%xmm10,%xmm10
-  .byte  196,193,121,254,194                 // vpaddd        %xmm10,%xmm0,%xmm0
-  .byte  196,65,49,254,202                   // vpaddd        %xmm10,%xmm9,%xmm9
-  .byte  196,227,53,24,192,1                 // vinsertf128   $0x1,%xmm0,%ymm9,%ymm0
-  .byte  197,188,93,192                      // vminps        %ymm0,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -23339,14 +23438,6 @@
   .byte  196,98,125,24,8                     // vbroadcastss  (%rax),%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  196,193,116,92,200                  // vsubps        %ymm8,%ymm1,%ymm1
-  .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,95,193                       // vmaxps        %ymm1,%ymm8,%ymm8
-  .byte  196,99,125,25,201,1                 // vextractf128  $0x1,%ymm9,%xmm1
-  .byte  196,65,41,118,210                   // vpcmpeqd      %xmm10,%xmm10,%xmm10
-  .byte  196,193,113,254,202                 // vpaddd        %xmm10,%xmm1,%xmm1
-  .byte  196,65,49,254,202                   // vpaddd        %xmm10,%xmm9,%xmm9
-  .byte  196,227,53,24,201,1                 // vinsertf128   $0x1,%xmm1,%ymm9,%ymm1
-  .byte  197,188,93,201                      // vminps        %ymm1,%ymm8,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -23363,7 +23454,7 @@
   .byte  196,193,58,88,192                   // vaddss        %xmm8,%xmm8,%xmm0
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,99,125,24,192,1                 // vinsertf128   $0x1,%xmm0,%ymm0,%ymm8
-  .byte  197,178,89,5,7,202,1,0              // vmulss        0x1ca07(%rip),%xmm9,%xmm0        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,178,89,5,77,203,1,0             // vmulss        0x1cb4d(%rip),%xmm9,%xmm0        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,164,89,192                      // vmulps        %ymm0,%ymm11,%ymm0
@@ -23372,15 +23463,8 @@
   .byte  197,164,92,192                      // vsubps        %ymm0,%ymm11,%ymm0
   .byte  196,193,124,92,194                  // vsubps        %ymm10,%ymm0,%ymm0
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,92,200                       // vsubps        %ymm0,%ymm8,%ymm9
-  .byte  197,180,84,192                      // vandps        %ymm0,%ymm9,%ymm0
-  .byte  197,60,95,192                       // vmaxps        %ymm0,%ymm8,%ymm8
-  .byte  196,99,125,25,208,1                 // vextractf128  $0x1,%ymm10,%xmm0
-  .byte  196,65,49,118,201                   // vpcmpeqd      %xmm9,%xmm9,%xmm9
-  .byte  196,193,121,254,193                 // vpaddd        %xmm9,%xmm0,%xmm0
-  .byte  196,65,41,254,201                   // vpaddd        %xmm9,%xmm10,%xmm9
-  .byte  196,227,53,24,192,1                 // vinsertf128   $0x1,%xmm0,%ymm9,%ymm0
-  .byte  197,188,93,192                      // vminps        %ymm0,%ymm8,%ymm0
+  .byte  197,60,92,192                       // vsubps        %ymm0,%ymm8,%ymm8
+  .byte  197,188,84,192                      // vandps        %ymm0,%ymm8,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -23397,7 +23481,7 @@
   .byte  196,193,58,88,200                   // vaddss        %xmm8,%xmm8,%xmm1
   .byte  196,227,121,4,201,0                 // vpermilps     $0x0,%xmm1,%xmm1
   .byte  196,99,117,24,193,1                 // vinsertf128   $0x1,%xmm1,%ymm1,%ymm8
-  .byte  197,178,89,13,122,201,1,0           // vmulss        0x1c97a(%rip),%xmm9,%xmm1        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,178,89,13,227,202,1,0           // vmulss        0x1cae3(%rip),%xmm9,%xmm1        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,227,121,4,201,0                 // vpermilps     $0x0,%xmm1,%xmm1
   .byte  196,227,117,24,201,1                // vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   .byte  197,164,89,201                      // vmulps        %ymm1,%ymm11,%ymm1
@@ -23406,15 +23490,8 @@
   .byte  197,164,92,201                      // vsubps        %ymm1,%ymm11,%ymm1
   .byte  196,193,116,92,202                  // vsubps        %ymm10,%ymm1,%ymm1
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
-  .byte  197,60,92,201                       // vsubps        %ymm1,%ymm8,%ymm9
-  .byte  197,180,84,201                      // vandps        %ymm1,%ymm9,%ymm1
-  .byte  197,60,95,193                       // vmaxps        %ymm1,%ymm8,%ymm8
-  .byte  196,99,125,25,209,1                 // vextractf128  $0x1,%ymm10,%xmm1
-  .byte  196,65,49,118,201                   // vpcmpeqd      %xmm9,%xmm9,%xmm9
-  .byte  196,193,113,254,201                 // vpaddd        %xmm9,%xmm1,%xmm1
-  .byte  196,65,41,254,201                   // vpaddd        %xmm9,%xmm10,%xmm9
-  .byte  196,227,53,24,201,1                 // vinsertf128   $0x1,%xmm1,%ymm9,%ymm1
-  .byte  197,188,93,201                      // vminps        %ymm1,%ymm8,%ymm1
+  .byte  197,60,92,193                       // vsubps        %ymm1,%ymm8,%ymm8
+  .byte  197,188,84,201                      // vandps        %ymm1,%ymm8,%ymm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -23424,7 +23501,7 @@
 _sk_clamp_x_1_avx:
   .byte  196,65,60,87,192                    // vxorps        %ymm8,%ymm8,%ymm8
   .byte  197,188,95,192                      // vmaxps        %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,24,5,20,201,1,0          // vbroadcastss  0x1c914(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,160,202,1,0         // vbroadcastss  0x1caa0(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  196,193,124,93,192                  // vminps        %ymm8,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -23442,9 +23519,9 @@
 .globl _sk_mirror_x_1_avx
 FUNCTION(_sk_mirror_x_1_avx)
 _sk_mirror_x_1_avx:
-  .byte  196,98,125,24,5,11,201,1,0          // vbroadcastss  0x1c90b(%rip),%ymm8        # 2ae00 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  .byte  196,98,125,24,5,151,202,1,0         // vbroadcastss  0x1ca97(%rip),%ymm8        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,13,225,200,1,0        // vbroadcastss  0x1c8e1(%rip),%ymm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,13,109,202,1,0        // vbroadcastss  0x1ca6d(%rip),%ymm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,124,89,201                   // vmulps        %ymm9,%ymm0,%ymm9
   .byte  196,67,125,8,201,1                  // vroundps      $0x1,%ymm9,%ymm9
   .byte  196,65,52,88,201                    // vaddps        %ymm9,%ymm9,%ymm9
@@ -23460,12 +23537,12 @@
 .globl _sk_luminance_to_alpha_avx
 FUNCTION(_sk_luminance_to_alpha_avx)
 _sk_luminance_to_alpha_avx:
-  .byte  196,226,125,24,29,205,201,1,0       // vbroadcastss  0x1c9cd(%rip),%ymm3        # 2af04 <_sk_srcover_rgba_8888_sse2_lowp+0x968>
+  .byte  196,226,125,24,29,89,203,1,0        // vbroadcastss  0x1cb59(%rip),%ymm3        # 2b264 <_sk_srcover_rgba_8888_sse2_lowp+0x968>
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,29,196,201,1,0       // vbroadcastss  0x1c9c4(%rip),%ymm3        # 2af08 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
+  .byte  196,226,125,24,29,80,203,1,0        // vbroadcastss  0x1cb50(%rip),%ymm3        # 2b268 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
   .byte  197,244,89,203                      // vmulps        %ymm3,%ymm1,%ymm1
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
-  .byte  196,226,125,24,13,183,201,1,0       // vbroadcastss  0x1c9b7(%rip),%ymm1        # 2af0c <_sk_srcover_rgba_8888_sse2_lowp+0x970>
+  .byte  196,226,125,24,13,67,203,1,0        // vbroadcastss  0x1cb43(%rip),%ymm1        # 2b26c <_sk_srcover_rgba_8888_sse2_lowp+0x970>
   .byte  197,236,89,201                      // vmulps        %ymm1,%ymm2,%ymm1
   .byte  197,252,88,217                      // vaddps        %ymm1,%ymm0,%ymm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -23713,9 +23790,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  72,139,104,8                        // mov           0x8(%rax),%rbp
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            e8f9 <_sk_evenly_spaced_gradient_avx+0x25>
+  .byte  120,7                               // js            eacd <_sk_evenly_spaced_gradient_avx+0x25>
   .byte  196,225,242,42,203                  // vcvtsi2ss     %rbx,%xmm1,%xmm1
-  .byte  235,21                              // jmp           e90e <_sk_evenly_spaced_gradient_avx+0x3a>
+  .byte  235,21                              // jmp           eae2 <_sk_evenly_spaced_gradient_avx+0x3a>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -23873,18 +23950,18 @@
 .globl _sk_gauss_a_to_rgba_avx
 FUNCTION(_sk_gauss_a_to_rgba_avx)
 _sk_gauss_a_to_rgba_avx:
-  .byte  196,226,125,24,5,210,194,1,0        // vbroadcastss  0x1c2d2(%rip),%ymm0        # 2af14 <_sk_srcover_rgba_8888_sse2_lowp+0x978>
+  .byte  196,226,125,24,5,94,196,1,0         // vbroadcastss  0x1c45e(%rip),%ymm0        # 2b274 <_sk_srcover_rgba_8888_sse2_lowp+0x978>
   .byte  197,228,89,192                      // vmulps        %ymm0,%ymm3,%ymm0
-  .byte  196,226,125,24,13,193,194,1,0       // vbroadcastss  0x1c2c1(%rip),%ymm1        # 2af10 <_sk_srcover_rgba_8888_sse2_lowp+0x974>
+  .byte  196,226,125,24,13,77,196,1,0        // vbroadcastss  0x1c44d(%rip),%ymm1        # 2b270 <_sk_srcover_rgba_8888_sse2_lowp+0x974>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,184,194,1,0       // vbroadcastss  0x1c2b8(%rip),%ymm1        # 2af18 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
+  .byte  196,226,125,24,13,68,196,1,0        // vbroadcastss  0x1c444(%rip),%ymm1        # 2b278 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,171,194,1,0       // vbroadcastss  0x1c2ab(%rip),%ymm1        # 2af1c <_sk_srcover_rgba_8888_sse2_lowp+0x980>
+  .byte  196,226,125,24,13,55,196,1,0        // vbroadcastss  0x1c437(%rip),%ymm1        # 2b27c <_sk_srcover_rgba_8888_sse2_lowp+0x980>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  197,252,89,195                      // vmulps        %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,24,13,158,194,1,0       // vbroadcastss  0x1c29e(%rip),%ymm1        # 2af20 <_sk_srcover_rgba_8888_sse2_lowp+0x984>
+  .byte  196,226,125,24,13,42,196,1,0        // vbroadcastss  0x1c42a(%rip),%ymm1        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0x984>
   .byte  197,252,88,193                      // vaddps        %ymm1,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,252,40,200                      // vmovaps       %ymm0,%ymm1
@@ -23906,12 +23983,12 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,81                              // jb            ed05 <_sk_gradient_avx+0x6f>
+  .byte  114,81                              // jb            eed9 <_sk_gradient_avx+0x6f>
   .byte  72,139,88,72                        // mov           0x48(%rax),%rbx
   .byte  73,255,200                          // dec           %r8
   .byte  72,131,195,4                        // add           $0x4,%rbx
   .byte  196,65,52,87,201                    // vxorps        %ymm9,%ymm9,%ymm9
-  .byte  196,98,125,24,21,31,193,1,0         // vbroadcastss  0x1c11f(%rip),%ymm10        # 2adec <_sk_srcover_rgba_8888_sse2_lowp+0x850>
+  .byte  196,98,125,24,21,171,194,1,0        // vbroadcastss  0x1c2ab(%rip),%ymm10        # 2b14c <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  196,98,125,24,3                     // vbroadcastss  (%rbx),%ymm8
   .byte  197,60,194,192,2                    // vcmpleps      %ymm0,%ymm8,%ymm8
@@ -23923,7 +24000,7 @@
   .byte  196,227,117,24,202,1                // vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
   .byte  72,131,195,4                        // add           $0x4,%rbx
   .byte  73,255,200                          // dec           %r8
-  .byte  117,204                             // jne           ecd1 <_sk_gradient_avx+0x3b>
+  .byte  117,204                             // jne           eea5 <_sk_gradient_avx+0x3b>
   .byte  196,195,249,22,200,1                // vpextrq       $0x1,%xmm1,%r8
   .byte  69,137,193                          // mov           %r8d,%r9d
   .byte  73,193,232,32                       // shr           $0x20,%r8
@@ -24105,27 +24182,27 @@
   .byte  196,65,52,95,226                    // vmaxps        %ymm10,%ymm9,%ymm12
   .byte  196,65,36,94,220                    // vdivps        %ymm12,%ymm11,%ymm11
   .byte  196,65,36,89,227                    // vmulps        %ymm11,%ymm11,%ymm12
-  .byte  196,98,125,24,45,73,190,1,0         // vbroadcastss  0x1be49(%rip),%ymm13        # 2af24 <_sk_srcover_rgba_8888_sse2_lowp+0x988>
+  .byte  196,98,125,24,45,213,191,1,0        // vbroadcastss  0x1bfd5(%rip),%ymm13        # 2b284 <_sk_srcover_rgba_8888_sse2_lowp+0x988>
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
-  .byte  196,98,125,24,53,63,190,1,0         // vbroadcastss  0x1be3f(%rip),%ymm14        # 2af28 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
+  .byte  196,98,125,24,53,203,191,1,0        // vbroadcastss  0x1bfcb(%rip),%ymm14        # 2b288 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
   .byte  196,65,28,89,237                    // vmulps        %ymm13,%ymm12,%ymm13
-  .byte  196,98,125,24,53,48,190,1,0         // vbroadcastss  0x1be30(%rip),%ymm14        # 2af2c <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  .byte  196,98,125,24,53,188,191,1,0        // vbroadcastss  0x1bfbc(%rip),%ymm14        # 2b28c <_sk_srcover_rgba_8888_sse2_lowp+0x990>
   .byte  196,65,20,88,238                    // vaddps        %ymm14,%ymm13,%ymm13
   .byte  196,65,28,89,229                    // vmulps        %ymm13,%ymm12,%ymm12
-  .byte  196,98,125,24,45,33,190,1,0         // vbroadcastss  0x1be21(%rip),%ymm13        # 2af30 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
+  .byte  196,98,125,24,45,173,191,1,0        // vbroadcastss  0x1bfad(%rip),%ymm13        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   .byte  196,65,28,88,229                    // vaddps        %ymm13,%ymm12,%ymm12
   .byte  196,65,36,89,220                    // vmulps        %ymm12,%ymm11,%ymm11
   .byte  196,65,52,194,202,1                 // vcmpltps      %ymm10,%ymm9,%ymm9
-  .byte  196,98,125,24,21,12,190,1,0         // vbroadcastss  0x1be0c(%rip),%ymm10        # 2af34 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  .byte  196,98,125,24,21,152,191,1,0        // vbroadcastss  0x1bf98(%rip),%ymm10        # 2b294 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
   .byte  196,65,44,92,211                    // vsubps        %ymm11,%ymm10,%ymm10
   .byte  196,67,37,74,202,144                // vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   .byte  196,193,124,194,192,1               // vcmpltps      %ymm8,%ymm0,%ymm0
-  .byte  196,98,125,24,21,162,188,1,0        // vbroadcastss  0x1bca2(%rip),%ymm10        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,21,46,190,1,0         // vbroadcastss  0x1be2e(%rip),%ymm10        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,44,92,209                    // vsubps        %ymm9,%ymm10,%ymm10
   .byte  196,195,53,74,194,0                 // vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   .byte  196,65,116,194,200,1                // vcmpltps      %ymm8,%ymm1,%ymm9
-  .byte  196,98,125,24,21,140,188,1,0        // vbroadcastss  0x1bc8c(%rip),%ymm10        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,21,24,190,1,0         // vbroadcastss  0x1be18(%rip),%ymm10        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,44,92,208                       // vsubps        %ymm0,%ymm10,%ymm10
   .byte  196,195,125,74,194,144              // vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   .byte  196,65,124,194,200,3                // vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -24155,7 +24232,7 @@
   .byte  196,67,121,4,210,0                  // vpermilps     $0x0,%xmm10,%xmm10
   .byte  196,67,45,24,210,1                  // vinsertf128   $0x1,%xmm10,%ymm10,%ymm10
   .byte  197,44,88,208                       // vaddps        %ymm0,%ymm10,%ymm10
-  .byte  196,98,125,24,29,130,189,1,0        // vbroadcastss  0x1bd82(%rip),%ymm11        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  .byte  196,98,125,24,29,14,191,1,0         // vbroadcastss  0x1bf0e(%rip),%ymm11        # 2b298 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
   .byte  197,252,89,192                      // vmulps        %ymm0,%ymm0,%ymm0
   .byte  197,116,89,217                      // vmulps        %ymm1,%ymm1,%ymm11
@@ -24164,17 +24241,17 @@
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,164,92,192                      // vsubps        %ymm0,%ymm11,%ymm0
-  .byte  196,98,125,24,13,86,189,1,0         // vbroadcastss  0x1bd56(%rip),%ymm9        # 2af3c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  .byte  196,98,125,24,13,226,190,1,0        // vbroadcastss  0x1bee2(%rip),%ymm9        # 2b29c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,65,44,89,194                    // vmulps        %ymm10,%ymm10,%ymm8
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
   .byte  197,252,81,192                      // vsqrtps       %ymm0,%ymm0
   .byte  196,98,125,24,64,36                 // vbroadcastss  0x24(%rax),%ymm8
-  .byte  196,98,125,24,13,52,189,1,0         // vbroadcastss  0x1bd34(%rip),%ymm9        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,13,192,190,1,0        // vbroadcastss  0x1bec0(%rip),%ymm9        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,65,44,87,201                    // vxorps        %ymm9,%ymm10,%ymm9
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  196,98,125,24,29,197,187,1,0        // vbroadcastss  0x1bbc5(%rip),%ymm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,29,81,189,1,0         // vbroadcastss  0x1bd51(%rip),%ymm11        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  196,65,60,89,210                    // vmulps        %ymm10,%ymm8,%ymm10
   .byte  197,180,92,192                      // vsubps        %ymm0,%ymm9,%ymm0
@@ -24194,7 +24271,7 @@
   .byte  196,67,121,4,210,0                  // vpermilps     $0x0,%xmm10,%xmm10
   .byte  196,67,45,24,210,1                  // vinsertf128   $0x1,%xmm10,%ymm10,%ymm10
   .byte  197,44,88,208                       // vaddps        %ymm0,%ymm10,%ymm10
-  .byte  196,98,125,24,29,212,188,1,0        // vbroadcastss  0x1bcd4(%rip),%ymm11        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  .byte  196,98,125,24,29,96,190,1,0         // vbroadcastss  0x1be60(%rip),%ymm11        # 2b298 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   .byte  196,65,44,89,211                    // vmulps        %ymm11,%ymm10,%ymm10
   .byte  197,252,89,192                      // vmulps        %ymm0,%ymm0,%ymm0
   .byte  197,116,89,217                      // vmulps        %ymm1,%ymm1,%ymm11
@@ -24203,17 +24280,17 @@
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,164,92,192                      // vsubps        %ymm0,%ymm11,%ymm0
-  .byte  196,98,125,24,13,168,188,1,0        // vbroadcastss  0x1bca8(%rip),%ymm9        # 2af3c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  .byte  196,98,125,24,13,52,190,1,0         // vbroadcastss  0x1be34(%rip),%ymm9        # 2b29c <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
   .byte  197,188,89,192                      // vmulps        %ymm0,%ymm8,%ymm0
   .byte  196,65,44,89,194                    // vmulps        %ymm10,%ymm10,%ymm8
   .byte  196,193,124,88,192                  // vaddps        %ymm8,%ymm0,%ymm0
   .byte  197,252,81,192                      // vsqrtps       %ymm0,%ymm0
   .byte  196,98,125,24,64,36                 // vbroadcastss  0x24(%rax),%ymm8
-  .byte  196,98,125,24,13,134,188,1,0        // vbroadcastss  0x1bc86(%rip),%ymm9        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,13,18,190,1,0         // vbroadcastss  0x1be12(%rip),%ymm9        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,65,44,87,201                    // vxorps        %ymm9,%ymm10,%ymm9
   .byte  196,65,124,92,210                   // vsubps        %ymm10,%ymm0,%ymm10
-  .byte  196,98,125,24,29,23,187,1,0         // vbroadcastss  0x1bb17(%rip),%ymm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,29,163,188,1,0        // vbroadcastss  0x1bca3(%rip),%ymm11        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,60,89,195                    // vmulps        %ymm11,%ymm8,%ymm8
   .byte  196,65,60,89,210                    // vmulps        %ymm10,%ymm8,%ymm10
   .byte  197,180,92,192                      // vsubps        %ymm0,%ymm9,%ymm0
@@ -24232,7 +24309,7 @@
   .byte  196,67,121,4,201,0                  // vpermilps     $0x0,%xmm9,%xmm9
   .byte  196,67,53,24,201,1                  // vinsertf128   $0x1,%xmm9,%ymm9,%ymm9
   .byte  197,52,88,200                       // vaddps        %ymm0,%ymm9,%ymm9
-  .byte  196,98,125,24,21,44,188,1,0         // vbroadcastss  0x1bc2c(%rip),%ymm10        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  .byte  196,98,125,24,21,184,189,1,0        // vbroadcastss  0x1bdb8(%rip),%ymm10        # 2b298 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   .byte  196,65,52,89,202                    // vmulps        %ymm10,%ymm9,%ymm9
   .byte  197,252,89,192                      // vmulps        %ymm0,%ymm0,%ymm0
   .byte  197,116,89,209                      // vmulps        %ymm1,%ymm1,%ymm10
@@ -24241,7 +24318,7 @@
   .byte  196,227,121,4,192,0                 // vpermilps     $0x0,%xmm0,%xmm0
   .byte  196,227,125,24,192,1                // vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   .byte  197,172,92,192                      // vsubps        %ymm0,%ymm10,%ymm0
-  .byte  196,98,125,24,5,4,188,1,0           // vbroadcastss  0x1bc04(%rip),%ymm8        # 2af40 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  .byte  196,98,125,24,5,144,189,1,0         // vbroadcastss  0x1bd90(%rip),%ymm8        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   .byte  196,193,124,87,192                  // vxorps        %ymm8,%ymm0,%ymm0
   .byte  196,193,124,94,193                  // vdivps        %ymm9,%ymm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24282,7 +24359,7 @@
 FUNCTION(_sk_save_xy_avx)
 _sk_save_xy_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,64,186,1,0          // vbroadcastss  0x1ba40(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,204,187,1,0         // vbroadcastss  0x1bbcc(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,124,88,200                   // vaddps        %ymm8,%ymm0,%ymm9
   .byte  196,67,125,8,209,1                  // vroundps      $0x1,%ymm9,%ymm10
   .byte  196,65,52,92,202                    // vsubps        %ymm10,%ymm9,%ymm9
@@ -24319,9 +24396,9 @@
 FUNCTION(_sk_bilinear_nx_avx)
 _sk_bilinear_nx_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,40,187,1,0         // vbroadcastss  0x1bb28(%rip),%ymm0        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,5,180,188,1,0        // vbroadcastss  0x1bcb4(%rip),%ymm0        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,191,185,1,0         // vbroadcastss  0x1b9bf(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,75,187,1,0          // vbroadcastss  0x1bb4b(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,64                     // vsubps        0x40(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24332,7 +24409,7 @@
 FUNCTION(_sk_bilinear_px_avx)
 _sk_bilinear_px_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,159,185,1,0        // vbroadcastss  0x1b99f(%rip),%ymm0        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,5,43,187,1,0         // vbroadcastss  0x1bb2b(%rip),%ymm0        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,64,64                    // vmovups       0x40(%rax),%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
@@ -24344,9 +24421,9 @@
 FUNCTION(_sk_bilinear_ny_avx)
 _sk_bilinear_ny_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,223,186,1,0       // vbroadcastss  0x1badf(%rip),%ymm1        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,13,107,188,1,0       // vbroadcastss  0x1bc6b(%rip),%ymm1        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,117,185,1,0         // vbroadcastss  0x1b975(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,1,187,1,0           // vbroadcastss  0x1bb01(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,96                     // vsubps        0x60(%rax),%ymm8,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24357,7 +24434,7 @@
 FUNCTION(_sk_bilinear_py_avx)
 _sk_bilinear_py_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,85,185,1,0        // vbroadcastss  0x1b955(%rip),%ymm1        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,226,125,24,13,225,186,1,0       // vbroadcastss  0x1bae1(%rip),%ymm1        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
   .byte  197,124,16,64,96                    // vmovups       0x60(%rax),%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
@@ -24369,14 +24446,14 @@
 FUNCTION(_sk_bicubic_n3x_avx)
 _sk_bicubic_n3x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,152,186,1,0        // vbroadcastss  0x1ba98(%rip),%ymm0        # 2af48 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  .byte  196,226,125,24,5,36,188,1,0         // vbroadcastss  0x1bc24(%rip),%ymm0        # 2b2a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,43,185,1,0          // vbroadcastss  0x1b92b(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,183,186,1,0         // vbroadcastss  0x1bab7(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,64                     // vsubps        0x40(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,124,186,1,0        // vbroadcastss  0x1ba7c(%rip),%ymm10        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,8,188,1,0          // vbroadcastss  0x1bc08(%rip),%ymm10        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,122,185,1,0        // vbroadcastss  0x1b97a(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,21,6,187,1,0          // vbroadcastss  0x1bb06(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
@@ -24388,19 +24465,19 @@
 FUNCTION(_sk_bicubic_n1x_avx)
 _sk_bicubic_n1x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,69,186,1,0         // vbroadcastss  0x1ba45(%rip),%ymm0        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,5,209,187,1,0        // vbroadcastss  0x1bbd1(%rip),%ymm0        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
-  .byte  196,98,125,24,5,220,184,1,0         // vbroadcastss  0x1b8dc(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,104,186,1,0         // vbroadcastss  0x1ba68(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,64                     // vsubps        0x40(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,58,186,1,0         // vbroadcastss  0x1ba3a(%rip),%ymm9        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,13,198,187,1,0        // vbroadcastss  0x1bbc6(%rip),%ymm9        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,40,186,1,0         // vbroadcastss  0x1ba28(%rip),%ymm10        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,21,180,187,1,0        // vbroadcastss  0x1bbb4(%rip),%ymm10        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,169,184,1,0        // vbroadcastss  0x1b8a9(%rip),%ymm10        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,21,53,186,1,0         // vbroadcastss  0x1ba35(%rip),%ymm10        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,10,186,1,0         // vbroadcastss  0x1ba0a(%rip),%ymm9        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,13,150,187,1,0        // vbroadcastss  0x1bb96(%rip),%ymm9        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24411,17 +24488,17 @@
 FUNCTION(_sk_bicubic_p1x_avx)
 _sk_bicubic_p1x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,122,184,1,0         // vbroadcastss  0x1b87a(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,6,186,1,0           // vbroadcastss  0x1ba06(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,188,88,0                        // vaddps        (%rax),%ymm8,%ymm0
   .byte  197,124,16,72,64                    // vmovups       0x40(%rax),%ymm9
-  .byte  196,98,125,24,21,216,185,1,0        // vbroadcastss  0x1b9d8(%rip),%ymm10        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,21,100,187,1,0        // vbroadcastss  0x1bb64(%rip),%ymm10        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
-  .byte  196,98,125,24,29,198,185,1,0        // vbroadcastss  0x1b9c6(%rip),%ymm11        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,29,82,187,1,0         // vbroadcastss  0x1bb52(%rip),%ymm11        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
   .byte  196,65,44,88,192                    // vaddps        %ymm8,%ymm10,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,177,185,1,0        // vbroadcastss  0x1b9b1(%rip),%ymm9        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,13,61,187,1,0         // vbroadcastss  0x1bb3d(%rip),%ymm9        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24432,13 +24509,13 @@
 FUNCTION(_sk_bicubic_p3x_avx)
 _sk_bicubic_p3x_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,5,141,185,1,0        // vbroadcastss  0x1b98d(%rip),%ymm0        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,226,125,24,5,25,187,1,0         // vbroadcastss  0x1bb19(%rip),%ymm0        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  197,252,88,0                        // vaddps        (%rax),%ymm0,%ymm0
   .byte  197,124,16,64,64                    // vmovups       0x40(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,114,185,1,0        // vbroadcastss  0x1b972(%rip),%ymm10        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,254,186,1,0        // vbroadcastss  0x1bafe(%rip),%ymm10        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,112,184,1,0        // vbroadcastss  0x1b870(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,21,252,185,1,0        // vbroadcastss  0x1b9fc(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,128,0,0,0            // vmovups       %ymm8,0x80(%rax)
@@ -24450,14 +24527,14 @@
 FUNCTION(_sk_bicubic_n3y_avx)
 _sk_bicubic_n3y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,63,185,1,0        // vbroadcastss  0x1b93f(%rip),%ymm1        # 2af48 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  .byte  196,226,125,24,13,203,186,1,0       // vbroadcastss  0x1bacb(%rip),%ymm1        # 2b2a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,209,183,1,0         // vbroadcastss  0x1b7d1(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,93,185,1,0          // vbroadcastss  0x1b95d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,96                     // vsubps        0x60(%rax),%ymm8,%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,34,185,1,0         // vbroadcastss  0x1b922(%rip),%ymm10        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,174,186,1,0        // vbroadcastss  0x1baae(%rip),%ymm10        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,32,184,1,0         // vbroadcastss  0x1b820(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,21,172,185,1,0        // vbroadcastss  0x1b9ac(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
@@ -24469,19 +24546,19 @@
 FUNCTION(_sk_bicubic_n1y_avx)
 _sk_bicubic_n1y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,235,184,1,0       // vbroadcastss  0x1b8eb(%rip),%ymm1        # 2af44 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  .byte  196,226,125,24,13,119,186,1,0       // vbroadcastss  0x1ba77(%rip),%ymm1        # 2b2a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
-  .byte  196,98,125,24,5,129,183,1,0         // vbroadcastss  0x1b781(%rip),%ymm8        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,98,125,24,5,13,185,1,0          // vbroadcastss  0x1b90d(%rip),%ymm8        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,60,92,64,96                     // vsubps        0x60(%rax),%ymm8,%ymm8
-  .byte  196,98,125,24,13,223,184,1,0        // vbroadcastss  0x1b8df(%rip),%ymm9        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,13,107,186,1,0        // vbroadcastss  0x1ba6b(%rip),%ymm9        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,205,184,1,0        // vbroadcastss  0x1b8cd(%rip),%ymm10        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,21,89,186,1,0         // vbroadcastss  0x1ba59(%rip),%ymm10        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,201                    // vmulps        %ymm9,%ymm8,%ymm9
-  .byte  196,98,125,24,21,78,183,1,0         // vbroadcastss  0x1b74e(%rip),%ymm10        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,21,218,184,1,0        // vbroadcastss  0x1b8da(%rip),%ymm10        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,65,52,88,202                    // vaddps        %ymm10,%ymm9,%ymm9
   .byte  196,65,60,89,193                    // vmulps        %ymm9,%ymm8,%ymm8
-  .byte  196,98,125,24,13,175,184,1,0        // vbroadcastss  0x1b8af(%rip),%ymm9        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,13,59,186,1,0         // vbroadcastss  0x1ba3b(%rip),%ymm9        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24492,17 +24569,17 @@
 FUNCTION(_sk_bicubic_p1y_avx)
 _sk_bicubic_p1y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,98,125,24,5,31,183,1,0          // vbroadcastss  0x1b71f(%rip),%ymm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  196,98,125,24,5,171,184,1,0         // vbroadcastss  0x1b8ab(%rip),%ymm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  197,188,88,72,32                    // vaddps        0x20(%rax),%ymm8,%ymm1
   .byte  197,124,16,72,96                    // vmovups       0x60(%rax),%ymm9
-  .byte  196,98,125,24,21,124,184,1,0        // vbroadcastss  0x1b87c(%rip),%ymm10        # 2af54 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  .byte  196,98,125,24,21,8,186,1,0          // vbroadcastss  0x1ba08(%rip),%ymm10        # 2b2b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
-  .byte  196,98,125,24,29,106,184,1,0        // vbroadcastss  0x1b86a(%rip),%ymm11        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,98,125,24,29,246,185,1,0        // vbroadcastss  0x1b9f6(%rip),%ymm11        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  196,65,44,88,211                    // vaddps        %ymm11,%ymm10,%ymm10
   .byte  196,65,52,89,210                    // vmulps        %ymm10,%ymm9,%ymm10
   .byte  196,65,44,88,192                    // vaddps        %ymm8,%ymm10,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,24,13,85,184,1,0         // vbroadcastss  0x1b855(%rip),%ymm9        # 2af58 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  .byte  196,98,125,24,13,225,185,1,0        // vbroadcastss  0x1b9e1(%rip),%ymm9        # 2b2b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   .byte  196,65,60,88,193                    // vaddps        %ymm9,%ymm8,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -24513,13 +24590,13 @@
 FUNCTION(_sk_bicubic_p3y_avx)
 _sk_bicubic_p3y_avx:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,13,49,184,1,0        // vbroadcastss  0x1b831(%rip),%ymm1        # 2af50 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  .byte  196,226,125,24,13,189,185,1,0       // vbroadcastss  0x1b9bd(%rip),%ymm1        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   .byte  197,244,88,72,32                    // vaddps        0x20(%rax),%ymm1,%ymm1
   .byte  197,124,16,64,96                    // vmovups       0x60(%rax),%ymm8
   .byte  196,65,60,89,200                    // vmulps        %ymm8,%ymm8,%ymm9
-  .byte  196,98,125,24,21,21,184,1,0         // vbroadcastss  0x1b815(%rip),%ymm10        # 2af4c <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  .byte  196,98,125,24,21,161,185,1,0        // vbroadcastss  0x1b9a1(%rip),%ymm10        # 2b2ac <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   .byte  196,65,60,89,194                    // vmulps        %ymm10,%ymm8,%ymm8
-  .byte  196,98,125,24,21,19,183,1,0         // vbroadcastss  0x1b713(%rip),%ymm10        # 2ae58 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  .byte  196,98,125,24,21,159,184,1,0        // vbroadcastss  0x1b89f(%rip),%ymm10        # 2b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   .byte  196,65,60,88,194                    // vaddps        %ymm10,%ymm8,%ymm8
   .byte  196,65,52,89,192                    // vmulps        %ymm8,%ymm9,%ymm8
   .byte  197,124,17,128,160,0,0,0            // vmovups       %ymm8,0xa0(%rax)
@@ -24667,7 +24744,7 @@
   .byte  72,139,0                            // mov           (%rax),%rax
   .byte  197,217,254,207                     // vpaddd        %xmm7,%xmm4,%xmm1
   .byte  197,249,254,193                     // vpaddd        %xmm1,%xmm0,%xmm0
-  .byte  196,226,121,24,37,173,181,1,0       // vbroadcastss  0x1b5ad(%rip),%xmm4        # 2af60 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
+  .byte  196,226,121,24,37,57,183,1,0        // vbroadcastss  0x1b739(%rip),%xmm4        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   .byte  196,98,121,64,228                   // vpmulld       %xmm4,%xmm0,%xmm12
   .byte  196,226,49,64,198                   // vpmulld       %xmm6,%xmm9,%xmm0
   .byte  197,249,127,132,36,128,0,0,0        // vmovdqa       %xmm0,0x80(%rsp)
@@ -24721,7 +24798,7 @@
   .byte  196,161,122,16,60,128               // vmovss        (%rax,%r8,4),%xmm7
   .byte  196,227,73,33,247,48                // vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   .byte  196,227,77,24,237,1                 // vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  .byte  196,98,121,24,21,22,179,1,0         // vbroadcastss  0x1b316(%rip),%xmm10        # 2adf4 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  .byte  196,98,121,24,21,162,180,1,0        // vbroadcastss  0x1b4a2(%rip),%xmm10        # 2b154 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   .byte  196,193,105,254,210                 // vpaddd        %xmm10,%xmm2,%xmm2
   .byte  196,195,249,22,208,1                // vpextrq       $0x1,%xmm2,%r8
   .byte  196,193,249,126,209                 // vmovq         %xmm2,%r9
@@ -24749,7 +24826,7 @@
   .byte  196,161,122,16,60,128               // vmovss        (%rax,%r8,4),%xmm7
   .byte  196,227,73,33,247,48                // vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   .byte  196,227,77,24,210,1                 // vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
-  .byte  196,226,125,24,61,234,179,1,0       // vbroadcastss  0x1b3ea(%rip),%ymm7        # 2af5c <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  .byte  196,226,125,24,61,118,181,1,0       // vbroadcastss  0x1b576(%rip),%ymm7        # 2b2bc <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
   .byte  197,148,88,247                      // vaddps        %ymm7,%ymm13,%ymm6
   .byte  197,124,40,231                      // vmovaps       %ymm7,%ymm12
   .byte  197,124,17,36,36                    // vmovups       %ymm12,(%rsp)
@@ -25492,7 +25569,7 @@
   .byte  197,249,127,68,36,32                // vmovdqa       %xmm0,0x20(%rsp)
   .byte  197,225,254,216                     // vpaddd        %xmm0,%xmm3,%xmm3
   .byte  197,233,254,195                     // vpaddd        %xmm3,%xmm2,%xmm0
-  .byte  196,98,121,24,13,174,164,1,0        // vbroadcastss  0x1a4ae(%rip),%xmm9        # 2af60 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
+  .byte  196,98,121,24,13,58,166,1,0         // vbroadcastss  0x1a63a(%rip),%xmm9        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   .byte  196,194,121,64,209                  // vpmulld       %xmm9,%xmm0,%xmm2
   .byte  196,226,81,64,199                   // vpmulld       %xmm7,%xmm5,%xmm0
   .byte  197,249,127,132,36,96,1,0,0         // vmovdqa       %xmm0,0x160(%rsp)
@@ -25549,7 +25626,7 @@
   .byte  196,161,122,16,60,128               // vmovss        (%rax,%r8,4),%xmm7
   .byte  196,227,73,33,247,48                // vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   .byte  196,227,77,24,237,1                 // vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  .byte  196,98,121,24,21,7,162,1,0          // vbroadcastss  0x1a207(%rip),%xmm10        # 2adf4 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  .byte  196,98,121,24,21,147,163,1,0        // vbroadcastss  0x1a393(%rip),%xmm10        # 2b154 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   .byte  196,193,121,254,194                 // vpaddd        %xmm10,%xmm0,%xmm0
   .byte  196,195,249,22,192,1                // vpextrq       $0x1,%xmm0,%r8
   .byte  196,193,249,126,193                 // vmovq         %xmm0,%r9
@@ -25577,7 +25654,7 @@
   .byte  196,161,122,16,52,128               // vmovss        (%rax,%r8,4),%xmm6
   .byte  196,227,105,33,214,48               // vinsertps     $0x30,%xmm6,%xmm2,%xmm2
   .byte  196,227,109,24,208,1                // vinsertf128   $0x1,%xmm0,%ymm2,%ymm2
-  .byte  196,98,125,24,37,219,162,1,0        // vbroadcastss  0x1a2db(%rip),%ymm12        # 2af5c <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  .byte  196,98,125,24,37,103,164,1,0        // vbroadcastss  0x1a467(%rip),%ymm12        # 2b2bc <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
   .byte  196,193,4,88,196                    // vaddps        %ymm12,%ymm15,%ymm0
   .byte  197,124,17,36,36                    // vmovups       %ymm12,(%rsp)
   .byte  197,254,91,192                      // vcvttps2dq    %ymm0,%ymm0
@@ -26975,7 +27052,7 @@
   .byte  197,228,89,210                      // vmulps        %ymm2,%ymm3,%ymm2
   .byte  197,220,88,210                      // vaddps        %ymm2,%ymm4,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,24,29,40,132,1,0        // vbroadcastss  0x18428(%rip),%ymm3        # 2ade8 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  .byte  196,226,125,24,29,180,133,1,0       // vbroadcastss  0x185b4(%rip),%ymm3        # 2b148 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   .byte  197,252,16,164,36,64,2,0,0          // vmovups       0x240(%rsp),%ymm4
   .byte  197,252,16,172,36,96,2,0,0          // vmovups       0x260(%rsp),%ymm5
   .byte  197,252,16,180,36,128,2,0,0         // vmovups       0x280(%rsp),%ymm6
@@ -27008,13 +27085,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  115,83                              // jae           12a76 <_sk_start_pipeline_sse41+0x82>
+  .byte  115,83                              // jae           12c4a <_sk_start_pipeline_sse41+0x82>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,4                         // lea           0x4(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,35                              // ja            12a5c <_sk_start_pipeline_sse41+0x68>
+  .byte  119,35                              // ja            12c30 <_sk_start_pipeline_sse41+0x68>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  76,137,246                          // mov           %r14,%rsi
@@ -27025,16 +27102,16 @@
   .byte  73,131,196,8                        // add           $0x8,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,225                             // jbe           12a3d <_sk_start_pipeline_sse41+0x49>
+  .byte  118,225                             // jbe           12c11 <_sk_start_pipeline_sse41+0x49>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,9                               // je            12a6d <_sk_start_pipeline_sse41+0x79>
+  .byte  116,9                               // je            12c41 <_sk_start_pipeline_sse41+0x79>
   .byte  76,137,246                          // mov           %r14,%rsi
   .byte  72,137,217                          // mov           %rbx,%rcx
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,185                             // jne           12a2f <_sk_start_pipeline_sse41+0x3b>
+  .byte  117,185                             // jne           12c03 <_sk_start_pipeline_sse41+0x3b>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -27057,13 +27134,13 @@
   .byte  102,15,110,194                      // movd          %edx,%xmm0
   .byte  102,15,112,192,0                    // pshufd        $0x0,%xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,88,5,55,133,1,0                  // addps         0x18537(%rip),%xmm0        # 2afd0 <_sk_srcover_rgba_8888_sse2_lowp+0xa34>
+  .byte  15,88,5,195,134,1,0                 // addps         0x186c3(%rip),%xmm0        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xa34>
   .byte  102,15,110,201                      // movd          %ecx,%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,88,13,52,133,1,0                 // addps         0x18534(%rip),%xmm1        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,88,13,192,134,1,0                // addps         0x186c0(%rip),%xmm1        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,21,59,133,1,0                 // movaps        0x1853b(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,199,134,1,0                // movaps        0x186c7(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
@@ -27078,18 +27155,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,68,15,110,194                   // movd          %edx,%xmm8
   .byte  102,69,15,112,192,0                 // pshufd        $0x0,%xmm8,%xmm8
-  .byte  102,68,15,254,5,212,132,1,0         // paddd         0x184d4(%rip),%xmm8        # 2afb0 <_sk_srcover_rgba_8888_sse2_lowp+0xa14>
+  .byte  102,68,15,254,5,96,134,1,0          // paddd         0x18660(%rip),%xmm8        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xa14>
   .byte  102,68,15,110,201                   // movd          %ecx,%xmm9
   .byte  102,69,15,112,201,0                 // pshufd        $0x0,%xmm9,%xmm9
   .byte  102,69,15,239,200                   // pxor          %xmm8,%xmm9
-  .byte  102,68,15,111,21,11,133,1,0         // movdqa        0x1850b(%rip),%xmm10        # 2b000 <_sk_srcover_rgba_8888_sse2_lowp+0xa64>
+  .byte  102,68,15,111,21,151,134,1,0        // movdqa        0x18697(%rip),%xmm10        # 2b360 <_sk_srcover_rgba_8888_sse2_lowp+0xa64>
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
   .byte  102,69,15,219,218                   // pand          %xmm10,%xmm11
   .byte  102,65,15,114,243,5                 // pslld         $0x5,%xmm11
   .byte  102,69,15,219,208                   // pand          %xmm8,%xmm10
   .byte  102,65,15,114,242,4                 // pslld         $0x4,%xmm10
-  .byte  102,68,15,111,37,247,132,1,0        // movdqa        0x184f7(%rip),%xmm12        # 2b010 <_sk_srcover_rgba_8888_sse2_lowp+0xa74>
-  .byte  102,68,15,111,45,254,132,1,0        // movdqa        0x184fe(%rip),%xmm13        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,37,131,134,1,0        // movdqa        0x18683(%rip),%xmm12        # 2b370 <_sk_srcover_rgba_8888_sse2_lowp+0xa74>
+  .byte  102,68,15,111,45,138,134,1,0        // movdqa        0x1868a(%rip),%xmm13        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,69,15,111,241                   // movdqa        %xmm9,%xmm14
   .byte  102,69,15,219,245                   // pand          %xmm13,%xmm14
   .byte  102,65,15,114,246,2                 // pslld         $0x2,%xmm14
@@ -27105,8 +27182,8 @@
   .byte  102,69,15,235,198                   // por           %xmm14,%xmm8
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,185,132,1,0              // mulps         0x184b9(%rip),%xmm8        # 2b030 <_sk_srcover_rgba_8888_sse2_lowp+0xa94>
-  .byte  68,15,88,5,193,132,1,0              // addps         0x184c1(%rip),%xmm8        # 2b040 <_sk_srcover_rgba_8888_sse2_lowp+0xaa4>
+  .byte  68,15,89,5,69,134,1,0               // mulps         0x18645(%rip),%xmm8        # 2b390 <_sk_srcover_rgba_8888_sse2_lowp+0xa94>
+  .byte  68,15,88,5,77,134,1,0               // addps         0x1864d(%rip),%xmm8        # 2b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaa4>
   .byte  243,68,15,16,16                     // movss         (%rax),%xmm10
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,89,208                        // mulps         %xmm8,%xmm10
@@ -27148,7 +27225,7 @@
 FUNCTION(_sk_black_color_sse41)
 _sk_black_color_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,247,131,1,0                // movaps        0x183f7(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,131,133,1,0                // movaps        0x18583(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -27159,7 +27236,7 @@
 FUNCTION(_sk_white_color_sse41)
 _sk_white_color_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,227,131,1,0                 // movaps        0x183e3(%rip),%xmm0        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,5,111,133,1,0                 // movaps        0x1856f(%rip),%xmm0        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -27205,7 +27282,7 @@
 FUNCTION(_sk_srcatop_sse41)
 _sk_srcatop_sse41:
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  68,15,40,5,147,131,1,0              // movaps        0x18393(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,31,133,1,0               // movaps        0x1851f(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -27230,7 +27307,7 @@
 _sk_dstatop_sse41:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
   .byte  68,15,89,196                        // mulps         %xmm4,%xmm8
-  .byte  68,15,40,13,70,131,1,0              // movaps        0x18346(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,210,132,1,0             // movaps        0x184d2(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
@@ -27277,7 +27354,7 @@
 .globl _sk_srcout_sse41
 FUNCTION(_sk_srcout_sse41)
 _sk_srcout_sse41:
-  .byte  68,15,40,5,218,130,1,0              // movaps        0x182da(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,102,132,1,0              // movaps        0x18466(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
@@ -27290,7 +27367,7 @@
 .globl _sk_dstout_sse41
 FUNCTION(_sk_dstout_sse41)
 _sk_dstout_sse41:
-  .byte  68,15,40,5,186,130,1,0              // movaps        0x182ba(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,70,132,1,0               // movaps        0x18446(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -27307,7 +27384,7 @@
 .globl _sk_srcover_sse41
 FUNCTION(_sk_srcover_sse41)
 _sk_srcover_sse41:
-  .byte  68,15,40,5,141,130,1,0              // movaps        0x1828d(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,25,132,1,0               // movaps        0x18419(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -27327,7 +27404,7 @@
 .globl _sk_dstover_sse41
 FUNCTION(_sk_dstover_sse41)
 _sk_dstover_sse41:
-  .byte  68,15,40,5,81,130,1,0               // movaps        0x18251(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,221,131,1,0              // movaps        0x183dd(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -27355,7 +27432,7 @@
 .globl _sk_multiply_sse41
 FUNCTION(_sk_multiply_sse41)
 _sk_multiply_sse41:
-  .byte  68,15,40,5,21,130,1,0               // movaps        0x18215(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,161,131,1,0              // movaps        0x183a1(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
@@ -27393,7 +27470,7 @@
 FUNCTION(_sk_plus__sse41)
 _sk_plus__sse41:
   .byte  15,88,196                           // addps         %xmm4,%xmm0
-  .byte  68,15,40,5,150,129,1,0              // movaps        0x18196(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,34,131,1,0               // movaps        0x18322(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  15,88,205                           // addps         %xmm5,%xmm1
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
@@ -27435,7 +27512,7 @@
 FUNCTION(_sk_xor__sse41)
 _sk_xor__sse41:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
-  .byte  15,40,29,34,129,1,0                 // movaps        0x18122(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,174,130,1,0                // movaps        0x182ae(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
@@ -27483,7 +27560,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,95,209                        // maxps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,125,128,1,0                // movaps        0x1807d(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,9,130,1,0                  // movaps        0x18209(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27517,7 +27594,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,18,128,1,0                 // movaps        0x18012(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,158,129,1,0                // movaps        0x1819e(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27554,7 +27631,7 @@
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,156,127,1,0                // movaps        0x17f9c(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,40,129,1,0                 // movaps        0x18128(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27582,7 +27659,7 @@
   .byte  15,89,214                           // mulps         %xmm6,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,76,127,1,0                 // movaps        0x17f4c(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,216,128,1,0                // movaps        0x180d8(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -27594,7 +27671,7 @@
 .globl _sk_colorburn_sse41
 FUNCTION(_sk_colorburn_sse41)
 _sk_colorburn_sse41:
-  .byte  68,15,40,29,51,127,1,0              // movaps        0x17f33(%rip),%xmm11        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,29,191,128,1,0             // movaps        0x180bf(%rip),%xmm11        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
   .byte  68,15,92,231                        // subps         %xmm7,%xmm12
   .byte  69,15,40,204                        // movaps        %xmm12,%xmm9
@@ -27678,7 +27755,7 @@
 FUNCTION(_sk_colordodge_sse41)
 _sk_colordodge_sse41:
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,40,21,253,125,1,0             // movaps        0x17dfd(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,137,127,1,0             // movaps        0x17f89(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
   .byte  68,15,92,223                        // subps         %xmm7,%xmm11
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
@@ -27760,7 +27837,7 @@
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
-  .byte  68,15,40,21,200,124,1,0             // movaps        0x17cc8(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,84,126,1,0              // movaps        0x17e54(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,40,234                        // movaps        %xmm10,%xmm5
   .byte  15,92,239                           // subps         %xmm7,%xmm5
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
@@ -27843,7 +27920,7 @@
 _sk_overlay_sse41:
   .byte  68,15,40,201                        // movaps        %xmm1,%xmm9
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
-  .byte  68,15,40,21,157,123,1,0             // movaps        0x17b9d(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,41,125,1,0              // movaps        0x17d29(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
   .byte  68,15,92,223                        // subps         %xmm7,%xmm11
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
@@ -27928,7 +28005,7 @@
   .byte  15,40,198                           // movaps        %xmm6,%xmm0
   .byte  15,94,199                           // divps         %xmm7,%xmm0
   .byte  65,15,84,193                        // andps         %xmm9,%xmm0
-  .byte  15,40,13,100,122,1,0                // movaps        0x17a64(%rip),%xmm1        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,13,240,123,1,0                // movaps        0x17bf0(%rip),%xmm1        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  68,15,92,208                        // subps         %xmm0,%xmm10
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
@@ -27941,10 +28018,10 @@
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,89,210                           // mulps         %xmm2,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
-  .byte  68,15,40,45,146,122,1,0             // movaps        0x17a92(%rip),%xmm13        # 2b050 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
+  .byte  68,15,40,45,30,124,1,0              // movaps        0x17c1e(%rip),%xmm13        # 2b3b0 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
   .byte  69,15,88,245                        // addps         %xmm13,%xmm14
   .byte  68,15,89,242                        // mulps         %xmm2,%xmm14
-  .byte  68,15,40,37,146,122,1,0             // movaps        0x17a92(%rip),%xmm12        # 2b060 <_sk_srcover_rgba_8888_sse2_lowp+0xac4>
+  .byte  68,15,40,37,30,124,1,0              // movaps        0x17c1e(%rip),%xmm12        # 2b3c0 <_sk_srcover_rgba_8888_sse2_lowp+0xac4>
   .byte  69,15,89,252                        // mulps         %xmm12,%xmm15
   .byte  69,15,88,254                        // addps         %xmm14,%xmm15
   .byte  15,40,198                           // movaps        %xmm6,%xmm0
@@ -28130,12 +28207,12 @@
   .byte  68,15,84,208                        // andps         %xmm0,%xmm10
   .byte  15,84,200                           // andps         %xmm0,%xmm1
   .byte  68,15,84,232                        // andps         %xmm0,%xmm13
-  .byte  15,40,5,253,119,1,0                 // movaps        0x177fd(%rip),%xmm0        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  15,40,5,137,121,1,0                 // movaps        0x17989(%rip),%xmm0        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  68,15,89,224                        // mulps         %xmm0,%xmm12
-  .byte  15,40,21,2,120,1,0                  // movaps        0x17802(%rip),%xmm2        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  15,40,21,142,121,1,0                // movaps        0x1798e(%rip),%xmm2        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  15,89,250                           // mulps         %xmm2,%xmm7
   .byte  65,15,88,252                        // addps         %xmm12,%xmm7
-  .byte  68,15,40,53,3,120,1,0               // movaps        0x17803(%rip),%xmm14        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,53,143,121,1,0             // movaps        0x1798f(%rip),%xmm14        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  68,15,40,252                        // movaps        %xmm4,%xmm15
   .byte  69,15,89,254                        // mulps         %xmm14,%xmm15
   .byte  68,15,88,255                        // addps         %xmm7,%xmm15
@@ -28218,7 +28295,7 @@
   .byte  65,15,88,214                        // addps         %xmm14,%xmm2
   .byte  15,40,196                           // movaps        %xmm4,%xmm0
   .byte  102,15,56,20,202                    // blendvps      %xmm0,%xmm2,%xmm1
-  .byte  68,15,40,13,23,118,1,0              // movaps        0x17617(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,163,119,1,0             // movaps        0x177a3(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,40,225                        // movaps        %xmm9,%xmm4
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  15,40,68,36,200                     // movaps        -0x38(%rsp),%xmm0
@@ -28312,14 +28389,14 @@
   .byte  68,15,84,215                        // andps         %xmm7,%xmm10
   .byte  68,15,84,223                        // andps         %xmm7,%xmm11
   .byte  68,15,84,199                        // andps         %xmm7,%xmm8
-  .byte  15,40,21,65,117,1,0                 // movaps        0x17541(%rip),%xmm2        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  15,40,21,205,118,1,0                // movaps        0x176cd(%rip),%xmm2        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  15,40,221                           // movaps        %xmm5,%xmm3
   .byte  15,89,218                           // mulps         %xmm2,%xmm3
-  .byte  15,40,13,68,117,1,0                 // movaps        0x17544(%rip),%xmm1        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  15,40,13,208,118,1,0                // movaps        0x176d0(%rip),%xmm1        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  15,40,254                           // movaps        %xmm6,%xmm7
   .byte  15,89,249                           // mulps         %xmm1,%xmm7
   .byte  15,88,251                           // addps         %xmm3,%xmm7
-  .byte  68,15,40,45,67,117,1,0              // movaps        0x17543(%rip),%xmm13        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,45,207,118,1,0             // movaps        0x176cf(%rip),%xmm13        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  68,15,88,247                        // addps         %xmm7,%xmm14
   .byte  65,15,40,218                        // movaps        %xmm10,%xmm3
@@ -28400,7 +28477,7 @@
   .byte  65,15,88,253                        // addps         %xmm13,%xmm7
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  102,68,15,56,20,223                 // blendvps      %xmm0,%xmm7,%xmm11
-  .byte  68,15,40,13,89,115,1,0              // movaps        0x17359(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,229,116,1,0             // movaps        0x174e5(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  68,15,92,204                        // subps         %xmm4,%xmm9
   .byte  15,40,124,36,168                    // movaps        -0x58(%rsp),%xmm7
@@ -28455,14 +28532,14 @@
   .byte  15,40,231                           // movaps        %xmm7,%xmm4
   .byte  68,15,89,244                        // mulps         %xmm4,%xmm14
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
-  .byte  68,15,40,13,20,115,1,0              // movaps        0x17314(%rip),%xmm9        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,13,160,116,1,0             // movaps        0x174a0(%rip),%xmm9        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  65,15,40,250                        // movaps        %xmm10,%xmm7
   .byte  65,15,89,249                        // mulps         %xmm9,%xmm7
-  .byte  68,15,40,21,20,115,1,0              // movaps        0x17314(%rip),%xmm10        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  68,15,40,21,160,116,1,0             // movaps        0x174a0(%rip),%xmm10        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  65,15,40,219                        // movaps        %xmm11,%xmm3
   .byte  65,15,89,218                        // mulps         %xmm10,%xmm3
   .byte  15,88,223                           // addps         %xmm7,%xmm3
-  .byte  68,15,40,29,17,115,1,0              // movaps        0x17311(%rip),%xmm11        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,29,157,116,1,0             // movaps        0x1749d(%rip),%xmm11        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  69,15,40,236                        // movaps        %xmm12,%xmm13
   .byte  69,15,89,235                        // mulps         %xmm11,%xmm13
   .byte  68,15,88,235                        // addps         %xmm3,%xmm13
@@ -28547,7 +28624,7 @@
   .byte  65,15,88,251                        // addps         %xmm11,%xmm7
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  102,15,56,20,207                    // blendvps      %xmm0,%xmm7,%xmm1
-  .byte  68,15,40,13,29,113,1,0              // movaps        0x1711d(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,169,114,1,0             // movaps        0x172a9(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  68,15,89,192                        // mulps         %xmm0,%xmm8
@@ -28599,13 +28676,13 @@
   .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,89,205                        // mulps         %xmm5,%xmm9
-  .byte  68,15,40,5,229,112,1,0              // movaps        0x170e5(%rip),%xmm8        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,5,113,114,1,0              // movaps        0x17271(%rip),%xmm8        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
-  .byte  68,15,40,21,233,112,1,0             // movaps        0x170e9(%rip),%xmm10        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  68,15,40,21,117,114,1,0             // movaps        0x17275(%rip),%xmm10        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  15,40,233                           // movaps        %xmm1,%xmm5
   .byte  65,15,89,234                        // mulps         %xmm10,%xmm5
   .byte  15,88,232                           // addps         %xmm0,%xmm5
-  .byte  68,15,40,37,231,112,1,0             // movaps        0x170e7(%rip),%xmm12        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,37,115,114,1,0             // movaps        0x17273(%rip),%xmm12        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  68,15,40,242                        // movaps        %xmm2,%xmm14
   .byte  69,15,89,244                        // mulps         %xmm12,%xmm14
   .byte  68,15,88,245                        // addps         %xmm5,%xmm14
@@ -28690,7 +28767,7 @@
   .byte  65,15,88,244                        // addps         %xmm12,%xmm6
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  102,68,15,56,20,206                 // blendvps      %xmm0,%xmm6,%xmm9
-  .byte  15,40,5,237,110,1,0                 // movaps        0x16eed(%rip),%xmm0        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,5,121,112,1,0                 // movaps        0x17079(%rip),%xmm0        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,92,215                           // subps         %xmm7,%xmm2
   .byte  15,89,226                           // mulps         %xmm2,%xmm4
@@ -28735,23 +28812,23 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,219,0,0,0                    // jne           1426b <_sk_srcover_rgba_8888_sse41+0xfb>
+  .byte  15,133,219,0,0,0                    // jne           1443f <_sk_srcover_rgba_8888_sse41+0xfb>
   .byte  243,65,15,111,60,128                // movdqu        (%r8,%rax,4),%xmm7
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  102,15,111,37,255,110,1,0           // movdqa        0x16eff(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,37,139,112,1,0           // movdqa        0x1708b(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
   .byte  102,15,111,239                      // movdqa        %xmm7,%xmm5
-  .byte  102,15,56,0,45,251,110,1,0          // pshufb        0x16efb(%rip),%xmm5        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,45,135,112,1,0          // pshufb        0x17087(%rip),%xmm5        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
   .byte  102,15,111,247                      // movdqa        %xmm7,%xmm6
-  .byte  102,15,56,0,53,251,110,1,0          // pshufb        0x16efb(%rip),%xmm6        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,53,135,112,1,0          // pshufb        0x17087(%rip),%xmm6        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  102,15,114,215,24                   // psrld         $0x18,%xmm7
   .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  68,15,40,5,24,110,1,0               // movaps        0x16e18(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,164,111,1,0              // movaps        0x16fa4(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
-  .byte  68,15,40,37,236,110,1,0             // movaps        0x16eec(%rip),%xmm12        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,37,120,112,1,0             // movaps        0x17078(%rip),%xmm12        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  65,15,89,196                        // mulps         %xmm12,%xmm0
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -28777,7 +28854,7 @@
   .byte  102,15,114,240,24                   // pslld         $0x18,%xmm0
   .byte  102,15,235,194                      // por           %xmm2,%xmm0
   .byte  102,15,235,193                      // por           %xmm1,%xmm0
-  .byte  117,88                              // jne           142a9 <_sk_srcover_rgba_8888_sse41+0x139>
+  .byte  117,88                              // jne           1447d <_sk_srcover_rgba_8888_sse41+0x139>
   .byte  243,65,15,127,4,128                 // movdqu        %xmm0,(%r8,%rax,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
@@ -28788,32 +28865,32 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,91                              // je            142d3 <_sk_srcover_rgba_8888_sse41+0x163>
+  .byte  116,91                              // je            144a7 <_sk_srcover_rgba_8888_sse41+0x163>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,22                              // je            14298 <_sk_srcover_rgba_8888_sse41+0x128>
+  .byte  116,22                              // je            1446c <_sk_srcover_rgba_8888_sse41+0x128>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,10,255,255,255               // jne           14196 <_sk_srcover_rgba_8888_sse41+0x26>
+  .byte  15,133,10,255,255,255               // jne           1436a <_sk_srcover_rgba_8888_sse41+0x26>
   .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
   .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,237,254,255,255                 // jmpq          14196 <_sk_srcover_rgba_8888_sse41+0x26>
+  .byte  233,237,254,255,255                 // jmpq          1436a <_sk_srcover_rgba_8888_sse41+0x26>
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,40                              // je            142de <_sk_srcover_rgba_8888_sse41+0x16e>
+  .byte  116,40                              // je            144b2 <_sk_srcover_rgba_8888_sse41+0x16e>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            142cb <_sk_srcover_rgba_8888_sse41+0x15b>
+  .byte  116,15                              // je            1449f <_sk_srcover_rgba_8888_sse41+0x15b>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,149                             // jne           14257 <_sk_srcover_rgba_8888_sse41+0xe7>
+  .byte  117,149                             // jne           1442b <_sk_srcover_rgba_8888_sse41+0xe7>
   .byte  102,65,15,58,22,68,128,8,2          // pextrd        $0x2,%xmm0,0x8(%r8,%rax,4)
   .byte  102,65,15,214,4,128                 // movq          %xmm0,(%r8,%rax,4)
-  .byte  235,132                             // jmp           14257 <_sk_srcover_rgba_8888_sse41+0xe7>
+  .byte  235,132                             // jmp           1442b <_sk_srcover_rgba_8888_sse41+0xe7>
   .byte  102,65,15,110,60,128                // movd          (%r8,%rax,4),%xmm7
-  .byte  233,184,254,255,255                 // jmpq          14196 <_sk_srcover_rgba_8888_sse41+0x26>
+  .byte  233,184,254,255,255                 // jmpq          1436a <_sk_srcover_rgba_8888_sse41+0x26>
   .byte  102,65,15,126,4,128                 // movd          %xmm0,(%r8,%rax,4)
-  .byte  233,110,255,255,255                 // jmpq          14257 <_sk_srcover_rgba_8888_sse41+0xe7>
+  .byte  233,110,255,255,255                 // jmpq          1442b <_sk_srcover_rgba_8888_sse41+0xe7>
 
 HIDDEN _sk_clamp_0_sse41
 .globl _sk_clamp_0_sse41
@@ -28831,7 +28908,7 @@
 .globl _sk_clamp_1_sse41
 FUNCTION(_sk_clamp_1_sse41)
 _sk_clamp_1_sse41:
-  .byte  68,15,40,5,231,108,1,0              // movaps        0x16ce7(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,115,110,1,0              // movaps        0x16e73(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  65,15,93,208                        // minps         %xmm8,%xmm2
@@ -28843,7 +28920,7 @@
 .globl _sk_clamp_a_sse41
 FUNCTION(_sk_clamp_a_sse41)
 _sk_clamp_a_sse41:
-  .byte  15,93,29,204,108,1,0                // minps         0x16ccc(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,29,88,110,1,0                 // minps         0x16e58(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,93,195                           // minps         %xmm3,%xmm0
   .byte  15,93,203                           // minps         %xmm3,%xmm1
   .byte  15,93,211                           // minps         %xmm3,%xmm2
@@ -28854,7 +28931,7 @@
 .globl _sk_clamp_a_dst_sse41
 FUNCTION(_sk_clamp_a_dst_sse41)
 _sk_clamp_a_dst_sse41:
-  .byte  15,93,61,184,108,1,0                // minps         0x16cb8(%rip),%xmm7        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,61,68,110,1,0                 // minps         0x16e44(%rip),%xmm7        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,93,231                           // minps         %xmm7,%xmm4
   .byte  15,93,239                           // minps         %xmm7,%xmm5
   .byte  15,93,247                           // minps         %xmm7,%xmm6
@@ -28889,7 +28966,7 @@
 .globl _sk_invert_sse41
 FUNCTION(_sk_invert_sse41)
 _sk_invert_sse41:
-  .byte  68,15,40,5,116,108,1,0              // movaps        0x16c74(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,0,110,1,0                // movaps        0x16e00(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,200                        // subps         %xmm0,%xmm9
   .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
@@ -28951,7 +29028,7 @@
 FUNCTION(_sk_unpremul_sse41)
 _sk_unpremul_sse41:
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,40,13,254,107,1,0             // movaps        0x16bfe(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,138,109,1,0             // movaps        0x16d8a(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,94,203                        // divps         %xmm3,%xmm9
   .byte  68,15,194,195,4                     // cmpneqps      %xmm3,%xmm8
   .byte  69,15,84,193                        // andps         %xmm9,%xmm8
@@ -28965,20 +29042,20 @@
 .globl _sk_from_srgb_sse41
 FUNCTION(_sk_from_srgb_sse41)
 _sk_from_srgb_sse41:
-  .byte  68,15,40,29,201,108,1,0             // movaps        0x16cc9(%rip),%xmm11        # 2b0e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
+  .byte  68,15,40,29,85,110,1,0              // movaps        0x16e55(%rip),%xmm11        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
   .byte  68,15,40,208                        // movaps        %xmm0,%xmm10
   .byte  69,15,89,210                        // mulps         %xmm10,%xmm10
-  .byte  68,15,40,37,65,108,1,0              // movaps        0x16c41(%rip),%xmm12        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,37,205,109,1,0             // movaps        0x16dcd(%rip),%xmm12        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
   .byte  69,15,89,196                        // mulps         %xmm12,%xmm8
-  .byte  68,15,40,45,177,108,1,0             // movaps        0x16cb1(%rip),%xmm13        # 2b0f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
+  .byte  68,15,40,45,61,110,1,0              // movaps        0x16e3d(%rip),%xmm13        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
   .byte  69,15,88,197                        // addps         %xmm13,%xmm8
   .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
-  .byte  68,15,40,53,177,108,1,0             // movaps        0x16cb1(%rip),%xmm14        # 2b100 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
+  .byte  68,15,40,53,61,110,1,0              // movaps        0x16e3d(%rip),%xmm14        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
   .byte  69,15,88,198                        // addps         %xmm14,%xmm8
-  .byte  68,15,40,61,181,108,1,0             // movaps        0x16cb5(%rip),%xmm15        # 2b110 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
+  .byte  68,15,40,61,65,110,1,0              // movaps        0x16e41(%rip),%xmm15        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
   .byte  65,15,194,199,1                     // cmpltps       %xmm15,%xmm0
   .byte  102,69,15,56,20,193                 // blendvps      %xmm0,%xmm9,%xmm8
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
@@ -29015,19 +29092,19 @@
 _sk_from_srgb_dst_sse41:
   .byte  68,15,40,204                        // movaps        %xmm4,%xmm9
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,40,29,0,108,1,0               // movaps        0x16c00(%rip),%xmm11        # 2b0e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
+  .byte  68,15,40,29,140,109,1,0             // movaps        0x16d8c(%rip),%xmm11        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  69,15,89,211                        // mulps         %xmm11,%xmm10
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
-  .byte  68,15,40,37,121,107,1,0             // movaps        0x16b79(%rip),%xmm12        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,37,5,109,1,0               // movaps        0x16d05(%rip),%xmm12        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  65,15,89,228                        // mulps         %xmm12,%xmm4
-  .byte  68,15,40,45,237,107,1,0             // movaps        0x16bed(%rip),%xmm13        # 2b0f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
+  .byte  68,15,40,45,121,109,1,0             // movaps        0x16d79(%rip),%xmm13        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
   .byte  65,15,88,229                        // addps         %xmm13,%xmm4
   .byte  15,89,224                           // mulps         %xmm0,%xmm4
-  .byte  68,15,40,53,238,107,1,0             // movaps        0x16bee(%rip),%xmm14        # 2b100 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
+  .byte  68,15,40,53,122,109,1,0             // movaps        0x16d7a(%rip),%xmm14        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
   .byte  65,15,88,230                        // addps         %xmm14,%xmm4
-  .byte  68,15,40,61,242,107,1,0             // movaps        0x16bf2(%rip),%xmm15        # 2b110 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
+  .byte  68,15,40,61,126,109,1,0             // movaps        0x16d7e(%rip),%xmm15        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
   .byte  69,15,194,207,1                     // cmpltps       %xmm15,%xmm9
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  102,65,15,56,20,226                 // blendvps      %xmm0,%xmm10,%xmm4
@@ -29071,22 +29148,22 @@
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  68,15,82,192                        // rsqrtps       %xmm0,%xmm8
-  .byte  68,15,40,29,102,107,1,0             // movaps        0x16b66(%rip),%xmm11        # 2b120 <_sk_srcover_rgba_8888_sse2_lowp+0xb84>
+  .byte  68,15,40,29,242,108,1,0             // movaps        0x16cf2(%rip),%xmm11        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xb84>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
-  .byte  68,15,40,37,102,107,1,0             // movaps        0x16b66(%rip),%xmm12        # 2b130 <_sk_srcover_rgba_8888_sse2_lowp+0xb94>
+  .byte  68,15,40,37,242,108,1,0             // movaps        0x16cf2(%rip),%xmm12        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xb94>
   .byte  69,15,40,248                        // movaps        %xmm8,%xmm15
   .byte  69,15,89,252                        // mulps         %xmm12,%xmm15
-  .byte  68,15,40,21,102,107,1,0             // movaps        0x16b66(%rip),%xmm10        # 2b140 <_sk_srcover_rgba_8888_sse2_lowp+0xba4>
+  .byte  68,15,40,21,242,108,1,0             // movaps        0x16cf2(%rip),%xmm10        # 2b4a0 <_sk_srcover_rgba_8888_sse2_lowp+0xba4>
   .byte  69,15,88,250                        // addps         %xmm10,%xmm15
   .byte  69,15,89,248                        // mulps         %xmm8,%xmm15
-  .byte  68,15,40,45,102,107,1,0             // movaps        0x16b66(%rip),%xmm13        # 2b150 <_sk_srcover_rgba_8888_sse2_lowp+0xbb4>
+  .byte  68,15,40,45,242,108,1,0             // movaps        0x16cf2(%rip),%xmm13        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xbb4>
   .byte  69,15,88,253                        // addps         %xmm13,%xmm15
-  .byte  68,15,40,53,106,107,1,0             // movaps        0x16b6a(%rip),%xmm14        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0xbc4>
+  .byte  68,15,40,53,246,108,1,0             // movaps        0x16cf6(%rip),%xmm14        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xbc4>
   .byte  69,15,88,198                        // addps         %xmm14,%xmm8
   .byte  69,15,83,192                        // rcpps         %xmm8,%xmm8
   .byte  69,15,89,199                        // mulps         %xmm15,%xmm8
-  .byte  68,15,40,61,102,107,1,0             // movaps        0x16b66(%rip),%xmm15        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0xbd4>
+  .byte  68,15,40,61,242,108,1,0             // movaps        0x16cf2(%rip),%xmm15        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xbd4>
   .byte  65,15,194,199,1                     // cmpltps       %xmm15,%xmm0
   .byte  102,69,15,56,20,193                 // blendvps      %xmm0,%xmm9,%xmm8
   .byte  68,15,82,202                        // rsqrtps       %xmm2,%xmm9
@@ -29141,7 +29218,7 @@
   .byte  68,15,93,224                        // minps         %xmm0,%xmm12
   .byte  65,15,40,203                        // movaps        %xmm11,%xmm1
   .byte  65,15,92,204                        // subps         %xmm12,%xmm1
-  .byte  68,15,40,53,29,105,1,0              // movaps        0x1691d(%rip),%xmm14        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,53,169,106,1,0             // movaps        0x16aa9(%rip),%xmm14        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,94,241                        // divps         %xmm1,%xmm14
   .byte  69,15,40,211                        // movaps        %xmm11,%xmm10
   .byte  69,15,194,208,0                     // cmpeqps       %xmm8,%xmm10
@@ -29150,27 +29227,27 @@
   .byte  65,15,89,198                        // mulps         %xmm14,%xmm0
   .byte  69,15,40,249                        // movaps        %xmm9,%xmm15
   .byte  68,15,194,250,1                     // cmpltps       %xmm2,%xmm15
-  .byte  68,15,84,61,132,106,1,0             // andps         0x16a84(%rip),%xmm15        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
+  .byte  68,15,84,61,16,108,1,0              // andps         0x16c10(%rip),%xmm15        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
   .byte  68,15,88,248                        // addps         %xmm0,%xmm15
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  65,15,194,193,0                     // cmpeqps       %xmm9,%xmm0
   .byte  65,15,92,208                        // subps         %xmm8,%xmm2
   .byte  65,15,89,214                        // mulps         %xmm14,%xmm2
-  .byte  68,15,40,45,119,106,1,0             // movaps        0x16a77(%rip),%xmm13        # 2b190 <_sk_srcover_rgba_8888_sse2_lowp+0xbf4>
+  .byte  68,15,40,45,3,108,1,0               // movaps        0x16c03(%rip),%xmm13        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf4>
   .byte  65,15,88,213                        // addps         %xmm13,%xmm2
   .byte  69,15,92,193                        // subps         %xmm9,%xmm8
   .byte  69,15,89,198                        // mulps         %xmm14,%xmm8
-  .byte  68,15,88,5,115,106,1,0              // addps         0x16a73(%rip),%xmm8        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
+  .byte  68,15,88,5,255,107,1,0              // addps         0x16bff(%rip),%xmm8        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
   .byte  102,68,15,56,20,194                 // blendvps      %xmm0,%xmm2,%xmm8
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  102,69,15,56,20,199                 // blendvps      %xmm0,%xmm15,%xmm8
-  .byte  68,15,89,5,107,106,1,0              // mulps         0x16a6b(%rip),%xmm8        # 2b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
+  .byte  68,15,89,5,247,107,1,0              // mulps         0x16bf7(%rip),%xmm8        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
   .byte  69,15,40,203                        // movaps        %xmm11,%xmm9
   .byte  69,15,194,204,4                     // cmpneqps      %xmm12,%xmm9
   .byte  69,15,84,193                        // andps         %xmm9,%xmm8
   .byte  69,15,92,235                        // subps         %xmm11,%xmm13
   .byte  69,15,88,220                        // addps         %xmm12,%xmm11
-  .byte  15,40,5,127,104,1,0                 // movaps        0x1687f(%rip),%xmm0        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,40,5,11,106,1,0                  // movaps        0x16a0b(%rip),%xmm0        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,40,211                        // movaps        %xmm11,%xmm2
   .byte  15,89,208                           // mulps         %xmm0,%xmm2
   .byte  15,194,194,1                        // cmpltps       %xmm2,%xmm0
@@ -29192,7 +29269,7 @@
   .byte  15,41,100,36,184                    // movaps        %xmm4,-0x48(%rsp)
   .byte  15,41,92,36,168                     // movaps        %xmm3,-0x58(%rsp)
   .byte  68,15,40,208                        // movaps        %xmm0,%xmm10
-  .byte  68,15,40,13,53,104,1,0              // movaps        0x16835(%rip),%xmm9        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,13,193,105,1,0             // movaps        0x169c1(%rip),%xmm9        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,194,194,2                        // cmpleps       %xmm2,%xmm0
   .byte  15,40,217                           // movaps        %xmm1,%xmm3
@@ -29205,19 +29282,19 @@
   .byte  15,41,84,36,152                     // movaps        %xmm2,-0x68(%rsp)
   .byte  69,15,88,192                        // addps         %xmm8,%xmm8
   .byte  68,15,92,197                        // subps         %xmm5,%xmm8
-  .byte  68,15,40,53,224,105,1,0             // movaps        0x169e0(%rip),%xmm14        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0xc24>
+  .byte  68,15,40,53,108,107,1,0             // movaps        0x16b6c(%rip),%xmm14        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0xc24>
   .byte  69,15,88,242                        // addps         %xmm10,%xmm14
   .byte  102,65,15,58,8,198,1                // roundps       $0x1,%xmm14,%xmm0
   .byte  68,15,92,240                        // subps         %xmm0,%xmm14
-  .byte  68,15,40,29,217,105,1,0             // movaps        0x169d9(%rip),%xmm11        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0xc34>
+  .byte  68,15,40,29,101,107,1,0             // movaps        0x16b65(%rip),%xmm11        # 2b530 <_sk_srcover_rgba_8888_sse2_lowp+0xc34>
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  65,15,194,198,2                     // cmpleps       %xmm14,%xmm0
   .byte  15,40,245                           // movaps        %xmm5,%xmm6
   .byte  65,15,92,240                        // subps         %xmm8,%xmm6
-  .byte  15,40,61,114,105,1,0                // movaps        0x16972(%rip),%xmm7        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
+  .byte  15,40,61,254,106,1,0                // movaps        0x16afe(%rip),%xmm7        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
   .byte  69,15,40,238                        // movaps        %xmm14,%xmm13
   .byte  68,15,89,239                        // mulps         %xmm7,%xmm13
-  .byte  15,40,29,131,105,1,0                // movaps        0x16983(%rip),%xmm3        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
+  .byte  15,40,29,15,107,1,0                 // movaps        0x16b0f(%rip),%xmm3        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
   .byte  68,15,40,227                        // movaps        %xmm3,%xmm12
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
   .byte  68,15,89,230                        // mulps         %xmm6,%xmm12
@@ -29227,7 +29304,7 @@
   .byte  65,15,194,198,2                     // cmpleps       %xmm14,%xmm0
   .byte  68,15,40,253                        // movaps        %xmm5,%xmm15
   .byte  102,69,15,56,20,252                 // blendvps      %xmm0,%xmm12,%xmm15
-  .byte  68,15,40,37,98,105,1,0              // movaps        0x16962(%rip),%xmm12        # 2b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
+  .byte  68,15,40,37,238,106,1,0             // movaps        0x16aee(%rip),%xmm12        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
   .byte  65,15,40,196                        // movaps        %xmm12,%xmm0
   .byte  65,15,194,198,2                     // cmpleps       %xmm14,%xmm0
   .byte  68,15,89,238                        // mulps         %xmm6,%xmm13
@@ -29261,7 +29338,7 @@
   .byte  65,15,40,198                        // movaps        %xmm14,%xmm0
   .byte  15,40,84,36,152                     // movaps        -0x68(%rsp),%xmm2
   .byte  102,15,56,20,202                    // blendvps      %xmm0,%xmm2,%xmm1
-  .byte  68,15,88,21,250,104,1,0             // addps         0x168fa(%rip),%xmm10        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,88,21,134,106,1,0             // addps         0x16a86(%rip),%xmm10        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  102,65,15,58,8,194,1                // roundps       $0x1,%xmm10,%xmm0
   .byte  68,15,92,208                        // subps         %xmm0,%xmm10
   .byte  69,15,194,218,2                     // cmpleps       %xmm10,%xmm11
@@ -29316,11 +29393,11 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,52                              // jne           149cd <_sk_scale_u8_sse41+0x4c>
+  .byte  117,52                              // jne           14ba1 <_sk_scale_u8_sse41+0x4c>
   .byte  102,71,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm8
-  .byte  102,68,15,219,5,247,102,1,0         // pand          0x166f7(%rip),%xmm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,68,15,219,5,131,104,1,0         // pand          0x16883(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,59,104,1,0               // mulps         0x1683b(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,89,5,199,105,1,0              // mulps         0x169c7(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
@@ -29331,12 +29408,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,59                              // je            14a15 <_sk_scale_u8_sse41+0x94>
+  .byte  116,59                              // je            14be9 <_sk_scale_u8_sse41+0x94>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            149fc <_sk_scale_u8_sse41+0x7b>
+  .byte  116,23                              // je            14bd0 <_sk_scale_u8_sse41+0x7b>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,181                             // jne           149a0 <_sk_scale_u8_sse41+0x1f>
+  .byte  117,181                             // jne           14b74 <_sk_scale_u8_sse41+0x1f>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
@@ -29344,10 +29421,10 @@
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,69,15,56,49,201                 // pmovzxbd      %xmm9,%xmm9
   .byte  102,69,15,58,14,193,15              // pblendw       $0xf,%xmm9,%xmm8
-  .byte  235,139                             // jmp           149a0 <_sk_scale_u8_sse41+0x1f>
+  .byte  235,139                             // jmp           14b74 <_sk_scale_u8_sse41+0x1f>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,124,255,255,255                 // jmpq          149a0 <_sk_scale_u8_sse41+0x1f>
+  .byte  233,124,255,255,255                 // jmpq          14b74 <_sk_scale_u8_sse41+0x1f>
 
 HIDDEN _sk_scale_565_sse41
 .globl _sk_scale_565_sse41
@@ -29362,19 +29439,19 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,159,0,0,0                    // jne           14ae7 <_sk_scale_565_sse41+0xc3>
+  .byte  15,133,159,0,0,0                    // jne           14cbb <_sk_scale_565_sse41+0xc3>
   .byte  102,71,15,56,51,28,80               // pmovzxwd      (%r8,%r10,2),%xmm11
-  .byte  102,15,111,5,169,103,1,0            // movdqa        0x167a9(%rip),%xmm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,5,53,105,1,0             // movdqa        0x16935(%rip),%xmm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,65,15,219,195                   // pand          %xmm11,%xmm0
   .byte  68,15,91,200                        // cvtdq2ps      %xmm0,%xmm9
-  .byte  68,15,89,13,168,103,1,0             // mulps         0x167a8(%rip),%xmm9        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,5,176,103,1,0            // movdqa        0x167b0(%rip),%xmm0        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  68,15,89,13,52,105,1,0              // mulps         0x16934(%rip),%xmm9        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,5,60,105,1,0             // movdqa        0x1693c(%rip),%xmm0        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,65,15,219,195                   // pand          %xmm11,%xmm0
   .byte  68,15,91,208                        // cvtdq2ps      %xmm0,%xmm10
-  .byte  68,15,89,21,175,103,1,0             // mulps         0x167af(%rip),%xmm10        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,68,15,219,29,182,103,1,0        // pand          0x167b6(%rip),%xmm11        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  68,15,89,21,59,105,1,0              // mulps         0x1693b(%rip),%xmm10        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,68,15,219,29,66,105,1,0         // pand          0x16942(%rip),%xmm11        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  69,15,91,219                        // cvtdq2ps      %xmm11,%xmm11
-  .byte  68,15,89,29,186,103,1,0             // mulps         0x167ba(%rip),%xmm11        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  68,15,89,29,70,105,1,0              // mulps         0x16946(%rip),%xmm11        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  15,40,195                           // movaps        %xmm3,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
   .byte  69,15,40,226                        // movaps        %xmm10,%xmm12
@@ -29399,22 +29476,22 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            14b30 <_sk_scale_565_sse41+0x10c>
+  .byte  116,60                              // je            14d04 <_sk_scale_565_sse41+0x10c>
   .byte  102,69,15,239,219                   // pxor          %xmm11,%xmm11
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,26                              // je            14b19 <_sk_scale_565_sse41+0xf5>
+  .byte  116,26                              // je            14ced <_sk_scale_565_sse41+0xf5>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,70,255,255,255               // jne           14a4f <_sk_scale_565_sse41+0x2b>
+  .byte  15,133,70,255,255,255               // jne           14c23 <_sk_scale_565_sse41+0x2b>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,68,15,112,216,69                // pshufd        $0x45,%xmm0,%xmm11
   .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,68,15,58,14,216,15              // pblendw       $0xf,%xmm0,%xmm11
-  .byte  233,31,255,255,255                  // jmpq          14a4f <_sk_scale_565_sse41+0x2b>
+  .byte  233,31,255,255,255                  // jmpq          14c23 <_sk_scale_565_sse41+0x2b>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,68,15,110,216                   // movd          %eax,%xmm11
-  .byte  233,16,255,255,255                  // jmpq          14a4f <_sk_scale_565_sse41+0x2b>
+  .byte  233,16,255,255,255                  // jmpq          14c23 <_sk_scale_565_sse41+0x2b>
 
 HIDDEN _sk_lerp_1_float_sse41
 .globl _sk_lerp_1_float_sse41
@@ -29449,11 +29526,11 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,72                              // jne           14bd7 <_sk_lerp_u8_sse41+0x60>
+  .byte  117,72                              // jne           14dab <_sk_lerp_u8_sse41+0x60>
   .byte  102,71,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm8
-  .byte  102,68,15,219,5,1,101,1,0           // pand          0x16501(%rip),%xmm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,68,15,219,5,141,102,1,0         // pand          0x1668d(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,69,102,1,0               // mulps         0x16645(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,89,5,209,103,1,0              // mulps         0x167d1(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -29471,12 +29548,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,62                              // je            14c22 <_sk_lerp_u8_sse41+0xab>
+  .byte  116,62                              // je            14df6 <_sk_lerp_u8_sse41+0xab>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            14c06 <_sk_lerp_u8_sse41+0x8f>
+  .byte  116,23                              // je            14dda <_sk_lerp_u8_sse41+0x8f>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,161                             // jne           14b96 <_sk_lerp_u8_sse41+0x1f>
+  .byte  117,161                             // jne           14d6a <_sk_lerp_u8_sse41+0x1f>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
@@ -29484,10 +29561,10 @@
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,69,15,56,49,201                 // pmovzxbd      %xmm9,%xmm9
   .byte  102,69,15,58,14,193,15              // pblendw       $0xf,%xmm9,%xmm8
-  .byte  233,116,255,255,255                 // jmpq          14b96 <_sk_lerp_u8_sse41+0x1f>
+  .byte  233,116,255,255,255                 // jmpq          14d6a <_sk_lerp_u8_sse41+0x1f>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,101,255,255,255                 // jmpq          14b96 <_sk_lerp_u8_sse41+0x1f>
+  .byte  233,101,255,255,255                 // jmpq          14d6a <_sk_lerp_u8_sse41+0x1f>
 
 HIDDEN _sk_lerp_565_sse41
 .globl _sk_lerp_565_sse41
@@ -29502,19 +29579,19 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,165,0,0,0                    // jne           14cfa <_sk_lerp_565_sse41+0xc9>
+  .byte  15,133,165,0,0,0                    // jne           14ece <_sk_lerp_565_sse41+0xc9>
   .byte  102,71,15,56,51,20,80               // pmovzxwd      (%r8,%r10,2),%xmm10
-  .byte  102,15,111,5,156,101,1,0            // movdqa        0x1659c(%rip),%xmm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,5,40,103,1,0             // movdqa        0x16728(%rip),%xmm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,65,15,219,194                   // pand          %xmm10,%xmm0
   .byte  68,15,91,200                        // cvtdq2ps      %xmm0,%xmm9
-  .byte  68,15,89,13,155,101,1,0             // mulps         0x1659b(%rip),%xmm9        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,5,163,101,1,0            // movdqa        0x165a3(%rip),%xmm0        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  68,15,89,13,39,103,1,0              // mulps         0x16727(%rip),%xmm9        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,5,47,103,1,0             // movdqa        0x1672f(%rip),%xmm0        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,65,15,219,194                   // pand          %xmm10,%xmm0
   .byte  68,15,91,216                        // cvtdq2ps      %xmm0,%xmm11
-  .byte  68,15,89,29,162,101,1,0             // mulps         0x165a2(%rip),%xmm11        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,68,15,219,21,169,101,1,0        // pand          0x165a9(%rip),%xmm10        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  68,15,89,29,46,103,1,0              // mulps         0x1672e(%rip),%xmm11        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,68,15,219,21,53,103,1,0         // pand          0x16735(%rip),%xmm10        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
-  .byte  68,15,89,21,173,101,1,0             // mulps         0x165ad(%rip),%xmm10        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  68,15,89,21,57,103,1,0              // mulps         0x16739(%rip),%xmm10        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  15,40,195                           // movaps        %xmm3,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
@@ -29542,22 +29619,22 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            14d43 <_sk_lerp_565_sse41+0x112>
+  .byte  116,60                              // je            14f17 <_sk_lerp_565_sse41+0x112>
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,26                              // je            14d2c <_sk_lerp_565_sse41+0xfb>
+  .byte  116,26                              // je            14f00 <_sk_lerp_565_sse41+0xfb>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,64,255,255,255               // jne           14c5c <_sk_lerp_565_sse41+0x2b>
+  .byte  15,133,64,255,255,255               // jne           14e30 <_sk_lerp_565_sse41+0x2b>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,68,15,112,208,69                // pshufd        $0x45,%xmm0,%xmm10
   .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,68,15,58,14,208,15              // pblendw       $0xf,%xmm0,%xmm10
-  .byte  233,25,255,255,255                  // jmpq          14c5c <_sk_lerp_565_sse41+0x2b>
+  .byte  233,25,255,255,255                  // jmpq          14e30 <_sk_lerp_565_sse41+0x2b>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,68,15,110,208                   // movd          %eax,%xmm10
-  .byte  233,10,255,255,255                  // jmpq          14c5c <_sk_lerp_565_sse41+0x2b>
+  .byte  233,10,255,255,255                  // jmpq          14e30 <_sk_lerp_565_sse41+0x2b>
 
 HIDDEN _sk_load_tables_sse41
 .globl _sk_load_tables_sse41
@@ -29566,11 +29643,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,20,1,0,0                     // jne           14e74 <_sk_load_tables_sse41+0x122>
+  .byte  15,133,20,1,0,0                     // jne           15048 <_sk_load_tables_sse41+0x122>
   .byte  243,69,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm8
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
-  .byte  102,15,111,5,47,99,1,0              // movdqa        0x1632f(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,187,100,1,0            // movdqa        0x164bb(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,73,15,58,22,192,1               // pextrq        $0x1,%xmm0,%r8
   .byte  102,73,15,126,193                   // movq          %xmm0,%r9
@@ -29585,7 +29662,7 @@
   .byte  102,66,15,58,33,4,155,32            // insertps      $0x20,(%rbx,%r11,4),%xmm0
   .byte  102,66,15,58,33,4,3,48              // insertps      $0x30,(%rbx,%r8,1),%xmm0
   .byte  102,65,15,111,200                   // movdqa        %xmm8,%xmm1
-  .byte  102,15,56,0,13,234,98,1,0           // pshufb        0x162ea(%rip),%xmm1        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,13,118,100,1,0          // pshufb        0x16476(%rip),%xmm1        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
   .byte  68,15,182,203                       // movzbl        %bl,%r9d
@@ -29600,7 +29677,7 @@
   .byte  102,15,58,33,202,48                 // insertps      $0x30,%xmm2,%xmm1
   .byte  76,139,64,24                        // mov           0x18(%rax),%r8
   .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
-  .byte  102,15,56,0,21,166,98,1,0           // pshufb        0x162a6(%rip),%xmm2        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,21,50,100,1,0           // pshufb        0x16432(%rip),%xmm2        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  102,72,15,58,22,211,1               // pextrq        $0x1,%xmm2,%rbx
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
   .byte  68,15,182,200                       // movzbl        %al,%r9d
@@ -29615,7 +29692,7 @@
   .byte  102,15,58,33,211,48                 // insertps      $0x30,%xmm3,%xmm2
   .byte  102,65,15,114,208,24                // psrld         $0x18,%xmm8
   .byte  65,15,91,216                        // cvtdq2ps      %xmm8,%xmm3
-  .byte  15,89,29,131,99,1,0                 // mulps         0x16383(%rip),%xmm3        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,29,15,101,1,0                 // mulps         0x1650f(%rip),%xmm3        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
@@ -29623,19 +29700,19 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,52                              // je            14eb5 <_sk_load_tables_sse41+0x163>
+  .byte  116,52                              // je            15089 <_sk_load_tables_sse41+0x163>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            14ea3 <_sk_load_tables_sse41+0x151>
+  .byte  116,23                              // je            15077 <_sk_load_tables_sse41+0x151>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,208,254,255,255              // jne           14d66 <_sk_load_tables_sse41+0x14>
+  .byte  15,133,208,254,255,255              // jne           14f3a <_sk_load_tables_sse41+0x14>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  243,65,15,126,4,144                 // movq          (%r8,%rdx,4),%xmm0
   .byte  102,68,15,58,14,192,15              // pblendw       $0xf,%xmm0,%xmm8
-  .byte  233,177,254,255,255                 // jmpq          14d66 <_sk_load_tables_sse41+0x14>
+  .byte  233,177,254,255,255                 // jmpq          14f3a <_sk_load_tables_sse41+0x14>
   .byte  102,69,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm8
-  .byte  233,166,254,255,255                 // jmpq          14d66 <_sk_load_tables_sse41+0x14>
+  .byte  233,166,254,255,255                 // jmpq          14f3a <_sk_load_tables_sse41+0x14>
 
 HIDDEN _sk_load_tables_u16_be_sse41
 .globl _sk_load_tables_u16_be_sse41
@@ -29645,7 +29722,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,95,1,0,0                     // jne           15035 <_sk_load_tables_u16_be_sse41+0x175>
+  .byte  15,133,95,1,0,0                     // jne           15209 <_sk_load_tables_u16_be_sse41+0x175>
   .byte  102,67,15,16,4,72                   // movupd        (%r8,%r9,2),%xmm0
   .byte  243,67,15,111,76,72,16              // movdqu        0x10(%r8,%r9,2),%xmm1
   .byte  65,86                               // push          %r14
@@ -29656,7 +29733,7 @@
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  102,68,15,105,200                   // punpckhwd     %xmm0,%xmm9
-  .byte  102,68,15,111,5,85,99,1,0           // movdqa        0x16355(%rip),%xmm8        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
+  .byte  102,68,15,111,5,225,100,1,0         // movdqa        0x164e1(%rip),%xmm8        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
@@ -29674,7 +29751,7 @@
   .byte  102,15,58,33,194,32                 // insertps      $0x20,%xmm2,%xmm0
   .byte  243,66,15,16,20,3                   // movss         (%rbx,%r8,1),%xmm2
   .byte  102,15,58,33,194,48                 // insertps      $0x30,%xmm2,%xmm0
-  .byte  102,15,56,0,13,4,99,1,0             // pshufb        0x16304(%rip),%xmm1        # 2b270 <_sk_srcover_rgba_8888_sse2_lowp+0xcd4>
+  .byte  102,15,56,0,13,144,100,1,0          // pshufb        0x16490(%rip),%xmm1        # 2b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0xcd4>
   .byte  102,15,56,51,201                    // pmovzxwd      %xmm1,%xmm1
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -29710,23 +29787,23 @@
   .byte  102,65,15,235,216                   // por           %xmm8,%xmm3
   .byte  102,15,56,51,219                    // pmovzxwd      %xmm3,%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,82,98,1,0                  // mulps         0x16252(%rip),%xmm3        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
+  .byte  15,89,29,222,99,1,0                 // mulps         0x163de(%rip),%xmm3        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
   .byte  242,67,15,16,4,72                   // movsd         (%r8,%r9,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1504e <_sk_load_tables_u16_be_sse41+0x18e>
+  .byte  117,13                              // jne           15222 <_sk_load_tables_u16_be_sse41+0x18e>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,149,254,255,255                 // jmpq          14ee3 <_sk_load_tables_u16_be_sse41+0x23>
+  .byte  233,149,254,255,255                 // jmpq          150b7 <_sk_load_tables_u16_be_sse41+0x23>
   .byte  102,67,15,22,68,72,8                // movhpd        0x8(%r8,%r9,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,128,254,255,255              // jb            14ee3 <_sk_load_tables_u16_be_sse41+0x23>
+  .byte  15,130,128,254,255,255              // jb            150b7 <_sk_load_tables_u16_be_sse41+0x23>
   .byte  243,67,15,126,76,72,16              // movq          0x10(%r8,%r9,2),%xmm1
-  .byte  233,116,254,255,255                 // jmpq          14ee3 <_sk_load_tables_u16_be_sse41+0x23>
+  .byte  233,116,254,255,255                 // jmpq          150b7 <_sk_load_tables_u16_be_sse41+0x23>
 
 HIDDEN _sk_load_tables_rgb_u16_be_sse41
 .globl _sk_load_tables_rgb_u16_be_sse41
@@ -29736,7 +29813,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,79,1,0,0                     // jne           151d0 <_sk_load_tables_rgb_u16_be_sse41+0x161>
+  .byte  15,133,79,1,0,0                     // jne           153a4 <_sk_load_tables_rgb_u16_be_sse41+0x161>
   .byte  243,67,15,111,20,72                 // movdqu        (%r8,%r9,2),%xmm2
   .byte  243,67,15,111,76,72,8               // movdqu        0x8(%r8,%r9,2),%xmm1
   .byte  102,15,115,217,4                    // psrldq        $0x4,%xmm1
@@ -29750,7 +29827,7 @@
   .byte  102,15,97,209                       // punpcklwd     %xmm1,%xmm2
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,97,201                    // punpcklwd     %xmm9,%xmm1
-  .byte  102,68,15,111,5,155,97,1,0          // movdqa        0x1619b(%rip),%xmm8        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
+  .byte  102,68,15,111,5,39,99,1,0           // movdqa        0x16327(%rip),%xmm8        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
@@ -29768,7 +29845,7 @@
   .byte  102,15,58,33,195,32                 // insertps      $0x20,%xmm3,%xmm0
   .byte  243,66,15,16,28,3                   // movss         (%rbx,%r8,1),%xmm3
   .byte  102,15,58,33,195,48                 // insertps      $0x30,%xmm3,%xmm0
-  .byte  102,15,56,0,13,74,97,1,0            // pshufb        0x1614a(%rip),%xmm1        # 2b270 <_sk_srcover_rgba_8888_sse2_lowp+0xcd4>
+  .byte  102,15,56,0,13,214,98,1,0           // pshufb        0x162d6(%rip),%xmm1        # 2b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0xcd4>
   .byte  102,15,56,51,201                    // pmovzxwd      %xmm1,%xmm1
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -29799,7 +29876,7 @@
   .byte  243,65,15,16,28,24                  // movss         (%r8,%rbx,1),%xmm3
   .byte  102,15,58,33,211,48                 // insertps      $0x30,%xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,37,94,1,0                  // movaps        0x15e25(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,177,95,1,0                 // movaps        0x15fb1(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
@@ -29807,21 +29884,21 @@
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,84,72,4,2             // pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,14                              // jne           151f6 <_sk_load_tables_rgb_u16_be_sse41+0x187>
+  .byte  117,14                              // jne           153ca <_sk_load_tables_rgb_u16_be_sse41+0x187>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
-  .byte  233,177,254,255,255                 // jmpq          150a7 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+  .byte  233,177,254,255,255                 // jmpq          1527b <_sk_load_tables_rgb_u16_be_sse41+0x38>
   .byte  102,71,15,110,76,72,6               // movd          0x6(%r8,%r9,2),%xmm9
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,71,15,196,76,72,10,2            // pinsrw        $0x2,0xa(%r8,%r9,2),%xmm9
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            15227 <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
+  .byte  114,24                              // jb            153fb <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
   .byte  102,67,15,110,76,72,12              // movd          0xc(%r8,%r9,2),%xmm1
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,76,72,16,2            // pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  .byte  233,128,254,255,255                 // jmpq          150a7 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+  .byte  233,128,254,255,255                 // jmpq          1527b <_sk_load_tables_rgb_u16_be_sse41+0x38>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,119,254,255,255                 // jmpq          150a7 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+  .byte  233,119,254,255,255                 // jmpq          1527b <_sk_load_tables_rgb_u16_be_sse41+0x38>
 
 HIDDEN _sk_byte_tables_sse41
 .globl _sk_byte_tables_sse41
@@ -29831,7 +29908,7 @@
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,146,94,1,0               // movaps        0x15e92(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,30,96,1,0                // movaps        0x1601e(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  102,73,15,58,22,192,1               // pextrq        $0x1,%xmm0,%r8
@@ -29854,7 +29931,7 @@
   .byte  102,15,58,32,197,3                  // pinsrb        $0x3,%ebp,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,13,72,95,1,0               // movaps        0x15f48(%rip),%xmm9        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,13,212,96,1,0              // movaps        0x160d4(%rip),%xmm9        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
@@ -29956,7 +30033,7 @@
   .byte  102,15,58,32,197,3                  // pinsrb        $0x3,%ebp,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,13,164,93,1,0              // movaps        0x15da4(%rip),%xmm9        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,13,48,95,1,0               // movaps        0x15f30(%rip),%xmm9        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
@@ -30138,31 +30215,31 @@
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,91,194                        // cvtdq2ps      %xmm10,%xmm8
-  .byte  68,15,89,5,127,91,1,0               // mulps         0x15b7f(%rip),%xmm8        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,21,135,91,1,0              // andps         0x15b87(%rip),%xmm10        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,21,191,88,1,0              // orps          0x158bf(%rip),%xmm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,5,135,91,1,0               // addps         0x15b87(%rip),%xmm8        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  68,15,40,37,143,91,1,0              // movaps        0x15b8f(%rip),%xmm12        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,5,11,93,1,0                // mulps         0x15d0b(%rip),%xmm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,21,19,93,1,0               // andps         0x15d13(%rip),%xmm10        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,21,75,90,1,0               // orps          0x15a4b(%rip),%xmm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,5,19,93,1,0                // addps         0x15d13(%rip),%xmm8        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,27,93,1,0               // movaps        0x15d1b(%rip),%xmm12        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  69,15,92,196                        // subps         %xmm12,%xmm8
-  .byte  68,15,88,21,143,91,1,0              // addps         0x15b8f(%rip),%xmm10        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  68,15,40,37,151,91,1,0              // movaps        0x15b97(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,21,27,93,1,0               // addps         0x15d1b(%rip),%xmm10        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,37,35,93,1,0               // movaps        0x15d23(%rip),%xmm12        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,92,196                        // subps         %xmm12,%xmm8
   .byte  69,15,89,195                        // mulps         %xmm11,%xmm8
   .byte  102,69,15,58,8,208,1                // roundps       $0x1,%xmm8,%xmm10
   .byte  69,15,40,216                        // movaps        %xmm8,%xmm11
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
-  .byte  68,15,88,5,132,91,1,0               // addps         0x15b84(%rip),%xmm8        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  68,15,40,21,140,91,1,0              // movaps        0x15b8c(%rip),%xmm10        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,5,16,93,1,0                // addps         0x15d10(%rip),%xmm8        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  68,15,40,21,24,93,1,0               // movaps        0x15d18(%rip),%xmm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  69,15,89,211                        // mulps         %xmm11,%xmm10
   .byte  69,15,92,194                        // subps         %xmm10,%xmm8
-  .byte  68,15,40,21,140,91,1,0              // movaps        0x15b8c(%rip),%xmm10        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,21,24,93,1,0               // movaps        0x15d18(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,211                        // subps         %xmm11,%xmm10
-  .byte  68,15,40,29,144,91,1,0              // movaps        0x15b90(%rip),%xmm11        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,29,28,93,1,0               // movaps        0x15d1c(%rip),%xmm11        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  69,15,94,218                        // divps         %xmm10,%xmm11
   .byte  69,15,88,216                        // addps         %xmm8,%xmm11
-  .byte  68,15,89,29,144,91,1,0              // mulps         0x15b90(%rip),%xmm11        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  68,15,89,29,28,93,1,0               // mulps         0x15d1c(%rip),%xmm11        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,211                    // cvtps2dq      %xmm11,%xmm10
   .byte  243,68,15,16,64,20                  // movss         0x14(%rax),%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
@@ -30170,7 +30247,7 @@
   .byte  102,69,15,56,20,193                 // blendvps      %xmm0,%xmm9,%xmm8
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,93,5,39,88,1,0                // minps         0x15827(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,93,5,179,89,1,0               // minps         0x159b3(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -30200,31 +30277,31 @@
   .byte  68,15,88,217                        // addps         %xmm1,%xmm11
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,91,227                        // cvtdq2ps      %xmm11,%xmm12
-  .byte  68,15,89,37,88,90,1,0               // mulps         0x15a58(%rip),%xmm12        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,29,96,90,1,0               // andps         0x15a60(%rip),%xmm11        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,29,152,87,1,0              // orps          0x15798(%rip),%xmm11        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,37,96,90,1,0               // addps         0x15a60(%rip),%xmm12        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  15,40,13,105,90,1,0                 // movaps        0x15a69(%rip),%xmm1        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,37,228,91,1,0              // mulps         0x15be4(%rip),%xmm12        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,29,236,91,1,0              // andps         0x15bec(%rip),%xmm11        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,29,36,89,1,0               // orps          0x15924(%rip),%xmm11        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,37,236,91,1,0              // addps         0x15bec(%rip),%xmm12        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  15,40,13,245,91,1,0                 // movaps        0x15bf5(%rip),%xmm1        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  68,15,92,225                        // subps         %xmm1,%xmm12
-  .byte  68,15,88,29,105,90,1,0              // addps         0x15a69(%rip),%xmm11        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  15,40,13,114,90,1,0                 // movaps        0x15a72(%rip),%xmm1        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,29,245,91,1,0              // addps         0x15bf5(%rip),%xmm11        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  15,40,13,254,91,1,0                 // movaps        0x15bfe(%rip),%xmm1        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  65,15,94,203                        // divps         %xmm11,%xmm1
   .byte  68,15,92,225                        // subps         %xmm1,%xmm12
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  102,69,15,58,8,212,1                // roundps       $0x1,%xmm12,%xmm10
   .byte  69,15,40,220                        // movaps        %xmm12,%xmm11
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
-  .byte  68,15,88,37,95,90,1,0               // addps         0x15a5f(%rip),%xmm12        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  15,40,13,104,90,1,0                 // movaps        0x15a68(%rip),%xmm1        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,37,235,91,1,0              // addps         0x15beb(%rip),%xmm12        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  15,40,13,244,91,1,0                 // movaps        0x15bf4(%rip),%xmm1        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  68,15,92,225                        // subps         %xmm1,%xmm12
-  .byte  68,15,40,21,104,90,1,0              // movaps        0x15a68(%rip),%xmm10        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,21,244,91,1,0              // movaps        0x15bf4(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,211                        // subps         %xmm11,%xmm10
-  .byte  15,40,13,109,90,1,0                 // movaps        0x15a6d(%rip),%xmm1        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  15,40,13,249,91,1,0                 // movaps        0x15bf9(%rip),%xmm1        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  65,15,94,202                        // divps         %xmm10,%xmm1
   .byte  65,15,88,204                        // addps         %xmm12,%xmm1
-  .byte  15,89,13,110,90,1,0                 // mulps         0x15a6e(%rip),%xmm1        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  15,89,13,250,91,1,0                 // mulps         0x15bfa(%rip),%xmm1        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,68,15,91,209                    // cvtps2dq      %xmm1,%xmm10
   .byte  243,15,16,72,20                     // movss         0x14(%rax),%xmm1
   .byte  15,198,201,0                        // shufps        $0x0,%xmm1,%xmm1
@@ -30232,7 +30309,7 @@
   .byte  102,65,15,56,20,201                 // blendvps      %xmm0,%xmm9,%xmm1
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,95,200                           // maxps         %xmm0,%xmm1
-  .byte  15,93,13,9,87,1,0                   // minps         0x15709(%rip),%xmm1        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,13,149,88,1,0                 // minps         0x15895(%rip),%xmm1        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -30262,31 +30339,31 @@
   .byte  68,15,88,218                        // addps         %xmm2,%xmm11
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,91,227                        // cvtdq2ps      %xmm11,%xmm12
-  .byte  68,15,89,37,58,89,1,0               // mulps         0x1593a(%rip),%xmm12        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,29,66,89,1,0               // andps         0x15942(%rip),%xmm11        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,29,122,86,1,0              // orps          0x1567a(%rip),%xmm11        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,37,66,89,1,0               // addps         0x15942(%rip),%xmm12        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  15,40,21,75,89,1,0                  // movaps        0x1594b(%rip),%xmm2        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,37,198,90,1,0              // mulps         0x15ac6(%rip),%xmm12        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,29,206,90,1,0              // andps         0x15ace(%rip),%xmm11        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,29,6,88,1,0                // orps          0x15806(%rip),%xmm11        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,37,206,90,1,0              // addps         0x15ace(%rip),%xmm12        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  15,40,21,215,90,1,0                 // movaps        0x15ad7(%rip),%xmm2        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  65,15,89,211                        // mulps         %xmm11,%xmm2
   .byte  68,15,92,226                        // subps         %xmm2,%xmm12
-  .byte  68,15,88,29,75,89,1,0               // addps         0x1594b(%rip),%xmm11        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  15,40,21,84,89,1,0                  // movaps        0x15954(%rip),%xmm2        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,29,215,90,1,0              // addps         0x15ad7(%rip),%xmm11        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  15,40,21,224,90,1,0                 // movaps        0x15ae0(%rip),%xmm2        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  65,15,94,211                        // divps         %xmm11,%xmm2
   .byte  68,15,92,226                        // subps         %xmm2,%xmm12
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  102,69,15,58,8,212,1                // roundps       $0x1,%xmm12,%xmm10
   .byte  69,15,40,220                        // movaps        %xmm12,%xmm11
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
-  .byte  68,15,88,37,65,89,1,0               // addps         0x15941(%rip),%xmm12        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  15,40,21,74,89,1,0                  // movaps        0x1594a(%rip),%xmm2        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,37,205,90,1,0              // addps         0x15acd(%rip),%xmm12        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  15,40,21,214,90,1,0                 // movaps        0x15ad6(%rip),%xmm2        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  65,15,89,211                        // mulps         %xmm11,%xmm2
   .byte  68,15,92,226                        // subps         %xmm2,%xmm12
-  .byte  68,15,40,21,74,89,1,0               // movaps        0x1594a(%rip),%xmm10        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,21,214,90,1,0              // movaps        0x15ad6(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,211                        // subps         %xmm11,%xmm10
-  .byte  15,40,21,79,89,1,0                  // movaps        0x1594f(%rip),%xmm2        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  15,40,21,219,90,1,0                 // movaps        0x15adb(%rip),%xmm2        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  65,15,94,210                        // divps         %xmm10,%xmm2
   .byte  65,15,88,212                        // addps         %xmm12,%xmm2
-  .byte  15,89,21,80,89,1,0                  // mulps         0x15950(%rip),%xmm2        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  15,89,21,220,90,1,0                 // mulps         0x15adc(%rip),%xmm2        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,68,15,91,210                    // cvtps2dq      %xmm2,%xmm10
   .byte  243,15,16,80,20                     // movss         0x14(%rax),%xmm2
   .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
@@ -30294,7 +30371,7 @@
   .byte  102,65,15,56,20,209                 // blendvps      %xmm0,%xmm9,%xmm2
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,95,208                           // maxps         %xmm0,%xmm2
-  .byte  15,93,21,235,85,1,0                 // minps         0x155eb(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,21,119,87,1,0                 // minps         0x15777(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -30324,31 +30401,31 @@
   .byte  68,15,88,219                        // addps         %xmm3,%xmm11
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,91,227                        // cvtdq2ps      %xmm11,%xmm12
-  .byte  68,15,89,37,28,88,1,0               // mulps         0x1581c(%rip),%xmm12        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,29,36,88,1,0               // andps         0x15824(%rip),%xmm11        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,29,92,85,1,0               // orps          0x1555c(%rip),%xmm11        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,37,36,88,1,0               // addps         0x15824(%rip),%xmm12        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  15,40,29,45,88,1,0                  // movaps        0x1582d(%rip),%xmm3        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,37,168,89,1,0              // mulps         0x159a8(%rip),%xmm12        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,29,176,89,1,0              // andps         0x159b0(%rip),%xmm11        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,29,232,86,1,0              // orps          0x156e8(%rip),%xmm11        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,37,176,89,1,0              // addps         0x159b0(%rip),%xmm12        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  15,40,29,185,89,1,0                 // movaps        0x159b9(%rip),%xmm3        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  65,15,89,219                        // mulps         %xmm11,%xmm3
   .byte  68,15,92,227                        // subps         %xmm3,%xmm12
-  .byte  68,15,88,29,45,88,1,0               // addps         0x1582d(%rip),%xmm11        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  15,40,29,54,88,1,0                  // movaps        0x15836(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,29,185,89,1,0              // addps         0x159b9(%rip),%xmm11        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  15,40,29,194,89,1,0                 // movaps        0x159c2(%rip),%xmm3        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  65,15,94,219                        // divps         %xmm11,%xmm3
   .byte  68,15,92,227                        // subps         %xmm3,%xmm12
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  102,69,15,58,8,212,1                // roundps       $0x1,%xmm12,%xmm10
   .byte  69,15,40,220                        // movaps        %xmm12,%xmm11
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
-  .byte  68,15,88,37,35,88,1,0               // addps         0x15823(%rip),%xmm12        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  15,40,29,44,88,1,0                  // movaps        0x1582c(%rip),%xmm3        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,37,175,89,1,0              // addps         0x159af(%rip),%xmm12        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  15,40,29,184,89,1,0                 // movaps        0x159b8(%rip),%xmm3        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  65,15,89,219                        // mulps         %xmm11,%xmm3
   .byte  68,15,92,227                        // subps         %xmm3,%xmm12
-  .byte  68,15,40,21,44,88,1,0               // movaps        0x1582c(%rip),%xmm10        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,21,184,89,1,0              // movaps        0x159b8(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,211                        // subps         %xmm11,%xmm10
-  .byte  15,40,29,49,88,1,0                  // movaps        0x15831(%rip),%xmm3        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  15,40,29,189,89,1,0                 // movaps        0x159bd(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  65,15,94,218                        // divps         %xmm10,%xmm3
   .byte  65,15,88,220                        // addps         %xmm12,%xmm3
-  .byte  15,89,29,50,88,1,0                  // mulps         0x15832(%rip),%xmm3        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  15,89,29,190,89,1,0                 // mulps         0x159be(%rip),%xmm3        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,68,15,91,211                    // cvtps2dq      %xmm3,%xmm10
   .byte  243,15,16,88,20                     // movss         0x14(%rax),%xmm3
   .byte  15,198,219,0                        // shufps        $0x0,%xmm3,%xmm3
@@ -30356,7 +30433,7 @@
   .byte  102,65,15,56,20,217                 // blendvps      %xmm0,%xmm9,%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,95,216                           // maxps         %xmm0,%xmm3
-  .byte  15,93,29,205,84,1,0                 // minps         0x154cd(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,29,89,86,1,0                  // minps         0x15659(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -30373,20 +30450,20 @@
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,91,194                           // cvtdq2ps      %xmm2,%xmm0
-  .byte  15,89,5,60,87,1,0                   // mulps         0x1573c(%rip),%xmm0        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,40,53,68,87,1,0               // movaps        0x15744(%rip),%xmm14        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  15,89,5,200,88,1,0                  // mulps         0x158c8(%rip),%xmm0        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,40,53,208,88,1,0              // movaps        0x158d0(%rip),%xmm14        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
   .byte  65,15,84,214                        // andps         %xmm14,%xmm2
-  .byte  68,15,40,37,120,84,1,0              // movaps        0x15478(%rip),%xmm12        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,37,4,86,1,0                // movaps        0x15604(%rip),%xmm12        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,86,212                        // orps          %xmm12,%xmm2
-  .byte  68,15,40,21,60,87,1,0               // movaps        0x1573c(%rip),%xmm10        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,21,200,88,1,0              // movaps        0x158c8(%rip),%xmm10        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
   .byte  65,15,88,194                        // addps         %xmm10,%xmm0
-  .byte  68,15,40,29,64,87,1,0               // movaps        0x15740(%rip),%xmm11        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,29,204,88,1,0              // movaps        0x158cc(%rip),%xmm11        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  15,40,226                           // movaps        %xmm2,%xmm4
   .byte  65,15,89,227                        // mulps         %xmm11,%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  68,15,40,13,62,87,1,0               // movaps        0x1573e(%rip),%xmm9        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,13,202,88,1,0              // movaps        0x158ca(%rip),%xmm9        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
   .byte  65,15,88,209                        // addps         %xmm9,%xmm2
-  .byte  68,15,40,45,66,87,1,0               // movaps        0x15742(%rip),%xmm13        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,45,206,88,1,0              // movaps        0x158ce(%rip),%xmm13        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  65,15,40,229                        // movaps        %xmm13,%xmm4
   .byte  15,94,226                           // divps         %xmm2,%xmm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -30397,21 +30474,21 @@
   .byte  102,15,58,8,208,1                   // roundps       $0x1,%xmm0,%xmm2
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,92,226                           // subps         %xmm2,%xmm4
-  .byte  15,40,53,37,87,1,0                  // movaps        0x15725(%rip),%xmm6        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  15,40,53,177,88,1,0                 // movaps        0x158b1(%rip),%xmm6        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
   .byte  15,88,198                           // addps         %xmm6,%xmm0
-  .byte  15,40,61,59,87,1,0                  // movaps        0x1573b(%rip),%xmm7        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  15,40,61,199,88,1,0                 // movaps        0x158c7(%rip),%xmm7        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
   .byte  15,40,212                           // movaps        %xmm4,%xmm2
-  .byte  15,40,37,27,87,1,0                  // movaps        0x1571b(%rip),%xmm4        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  15,40,37,167,88,1,0                 // movaps        0x158a7(%rip),%xmm4        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  15,92,194                           // subps         %xmm2,%xmm0
-  .byte  68,15,40,61,45,87,1,0               // movaps        0x1572d(%rip),%xmm15        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,61,185,88,1,0              // movaps        0x158b9(%rip),%xmm15        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  65,15,40,215                        // movaps        %xmm15,%xmm2
   .byte  15,94,213                           // divps         %xmm5,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  15,89,5,137,86,1,0                  // mulps         0x15689(%rip),%xmm0        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  15,89,5,21,88,1,0                   // mulps         0x15815(%rip),%xmm0        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
   .byte  65,15,84,206                        // andps         %xmm14,%xmm1
   .byte  65,15,86,204                        // orps          %xmm12,%xmm1
   .byte  65,15,88,194                        // addps         %xmm10,%xmm0
@@ -30437,8 +30514,8 @@
   .byte  15,94,206                           // divps         %xmm6,%xmm1
   .byte  15,88,200                           // addps         %xmm0,%xmm1
   .byte  15,91,195                           // cvtdq2ps      %xmm3,%xmm0
-  .byte  15,89,5,42,86,1,0                   // mulps         0x1562a(%rip),%xmm0        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  15,84,29,51,86,1,0                  // andps         0x15633(%rip),%xmm3        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  15,89,5,182,87,1,0                  // mulps         0x157b6(%rip),%xmm0        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  15,84,29,191,87,1,0                 // andps         0x157bf(%rip),%xmm3        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
   .byte  65,15,86,220                        // orps          %xmm12,%xmm3
   .byte  65,15,88,194                        // addps         %xmm10,%xmm0
   .byte  68,15,89,219                        // mulps         %xmm3,%xmm11
@@ -30456,7 +30533,7 @@
   .byte  15,92,253                           // subps         %xmm5,%xmm7
   .byte  68,15,94,255                        // divps         %xmm7,%xmm15
   .byte  68,15,88,248                        // addps         %xmm0,%xmm15
-  .byte  15,40,5,123,86,1,0                  // movaps        0x1567b(%rip),%xmm0        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  15,40,5,7,88,1,0                    // movaps        0x15807(%rip),%xmm0        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  15,89,208                           // mulps         %xmm0,%xmm2
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
   .byte  68,15,89,248                        // mulps         %xmm0,%xmm15
@@ -30476,29 +30553,29 @@
 FUNCTION(_sk_lab_to_xyz_sse41)
 _sk_lab_to_xyz_sse41:
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,89,5,75,86,1,0                // mulps         0x1564b(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xda4>
-  .byte  68,15,40,13,211,83,1,0              // movaps        0x153d3(%rip),%xmm9        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,89,5,215,87,1,0               // mulps         0x157d7(%rip),%xmm8        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0xda4>
+  .byte  68,15,40,13,95,85,1,0               // movaps        0x1555f(%rip),%xmm9        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  65,15,89,201                        // mulps         %xmm9,%xmm1
-  .byte  15,40,5,72,86,1,0                   // movaps        0x15648(%rip),%xmm0        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xdb4>
+  .byte  15,40,5,212,87,1,0                  // movaps        0x157d4(%rip),%xmm0        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0xdb4>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
   .byte  65,15,89,209                        // mulps         %xmm9,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
-  .byte  68,15,88,5,70,86,1,0                // addps         0x15646(%rip),%xmm8        # 2b360 <_sk_srcover_rgba_8888_sse2_lowp+0xdc4>
-  .byte  68,15,89,5,78,86,1,0                // mulps         0x1564e(%rip),%xmm8        # 2b370 <_sk_srcover_rgba_8888_sse2_lowp+0xdd4>
-  .byte  15,89,13,87,86,1,0                  // mulps         0x15657(%rip),%xmm1        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xde4>
+  .byte  68,15,88,5,210,87,1,0               // addps         0x157d2(%rip),%xmm8        # 2b6c0 <_sk_srcover_rgba_8888_sse2_lowp+0xdc4>
+  .byte  68,15,89,5,218,87,1,0               // mulps         0x157da(%rip),%xmm8        # 2b6d0 <_sk_srcover_rgba_8888_sse2_lowp+0xdd4>
+  .byte  15,89,13,227,87,1,0                 // mulps         0x157e3(%rip),%xmm1        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xde4>
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  15,89,21,92,86,1,0                  // mulps         0x1565c(%rip),%xmm2        # 2b390 <_sk_srcover_rgba_8888_sse2_lowp+0xdf4>
+  .byte  15,89,21,232,87,1,0                 // mulps         0x157e8(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xdf4>
   .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
   .byte  68,15,92,210                        // subps         %xmm2,%xmm10
   .byte  68,15,40,217                        // movaps        %xmm1,%xmm11
   .byte  69,15,89,219                        // mulps         %xmm11,%xmm11
   .byte  68,15,89,217                        // mulps         %xmm1,%xmm11
-  .byte  68,15,40,13,80,86,1,0               // movaps        0x15650(%rip),%xmm9        # 2b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0xe04>
+  .byte  68,15,40,13,220,87,1,0              // movaps        0x157dc(%rip),%xmm9        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0xe04>
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  65,15,194,195,1                     // cmpltps       %xmm11,%xmm0
-  .byte  15,40,21,80,86,1,0                  // movaps        0x15650(%rip),%xmm2        # 2b3b0 <_sk_srcover_rgba_8888_sse2_lowp+0xe14>
+  .byte  15,40,21,220,87,1,0                 // movaps        0x157dc(%rip),%xmm2        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0xe14>
   .byte  15,88,202                           // addps         %xmm2,%xmm1
-  .byte  68,15,40,37,85,86,1,0               // movaps        0x15655(%rip),%xmm12        # 2b3c0 <_sk_srcover_rgba_8888_sse2_lowp+0xe24>
+  .byte  68,15,40,37,225,87,1,0              // movaps        0x157e1(%rip),%xmm12        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xe24>
   .byte  65,15,89,204                        // mulps         %xmm12,%xmm1
   .byte  102,65,15,56,20,203                 // blendvps      %xmm0,%xmm11,%xmm1
   .byte  69,15,40,216                        // movaps        %xmm8,%xmm11
@@ -30517,8 +30594,8 @@
   .byte  65,15,89,212                        // mulps         %xmm12,%xmm2
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  102,65,15,56,20,211                 // blendvps      %xmm0,%xmm11,%xmm2
-  .byte  15,89,13,14,86,1,0                  // mulps         0x1560e(%rip),%xmm1        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xe34>
-  .byte  15,89,21,23,86,1,0                  // mulps         0x15617(%rip),%xmm2        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xe44>
+  .byte  15,89,13,154,87,1,0                 // mulps         0x1579a(%rip),%xmm1        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0xe34>
+  .byte  15,89,21,163,87,1,0                 // mulps         0x157a3(%rip),%xmm2        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0xe44>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
@@ -30535,11 +30612,11 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,39                              // jne           15e13 <_sk_load_a8_sse41+0x3f>
+  .byte  117,39                              // jne           15fe7 <_sk_load_a8_sse41+0x3f>
   .byte  102,67,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm0
-  .byte  102,15,219,5,165,82,1,0             // pand          0x152a5(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,5,49,84,1,0              // pand          0x15431(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,235,83,1,0                 // mulps         0x153eb(%rip),%xmm3        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,29,119,85,1,0                 // mulps         0x15577(%rip),%xmm3        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
@@ -30548,12 +30625,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            15e55 <_sk_load_a8_sse41+0x81>
+  .byte  116,53                              // je            16029 <_sk_load_a8_sse41+0x81>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            15e3f <_sk_load_a8_sse41+0x6b>
+  .byte  116,21                              // je            16013 <_sk_load_a8_sse41+0x6b>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           15df3 <_sk_load_a8_sse41+0x1f>
+  .byte  117,195                             // jne           15fc7 <_sk_load_a8_sse41+0x1f>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
@@ -30561,10 +30638,10 @@
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,56,49,201                    // pmovzxbd      %xmm1,%xmm1
   .byte  102,15,58,14,193,15                 // pblendw       $0xf,%xmm1,%xmm0
-  .byte  235,158                             // jmp           15df3 <_sk_load_a8_sse41+0x1f>
+  .byte  235,158                             // jmp           15fc7 <_sk_load_a8_sse41+0x1f>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,147                             // jmp           15df3 <_sk_load_a8_sse41+0x1f>
+  .byte  235,147                             // jmp           15fc7 <_sk_load_a8_sse41+0x1f>
 
 HIDDEN _sk_load_a8_dst_sse41
 .globl _sk_load_a8_dst_sse41
@@ -30577,11 +30654,11 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,39                              // jne           15e9f <_sk_load_a8_dst_sse41+0x3f>
+  .byte  117,39                              // jne           16073 <_sk_load_a8_dst_sse41+0x3f>
   .byte  102,67,15,56,49,36,16               // pmovzxbd      (%r8,%r10,1),%xmm4
-  .byte  102,15,219,37,25,82,1,0             // pand          0x15219(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,37,165,83,1,0            // pand          0x153a5(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,252                           // cvtdq2ps      %xmm4,%xmm7
-  .byte  15,89,61,95,83,1,0                  // mulps         0x1535f(%rip),%xmm7        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,61,235,84,1,0                 // mulps         0x154eb(%rip),%xmm7        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
@@ -30590,12 +30667,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            15ee1 <_sk_load_a8_dst_sse41+0x81>
+  .byte  116,53                              // je            160b5 <_sk_load_a8_dst_sse41+0x81>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            15ecb <_sk_load_a8_dst_sse41+0x6b>
+  .byte  116,21                              // je            1609f <_sk_load_a8_dst_sse41+0x6b>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           15e7f <_sk_load_a8_dst_sse41+0x1f>
+  .byte  117,195                             // jne           16053 <_sk_load_a8_dst_sse41+0x1f>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
@@ -30603,23 +30680,36 @@
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,56,49,237                    // pmovzxbd      %xmm5,%xmm5
   .byte  102,15,58,14,229,15                 // pblendw       $0xf,%xmm5,%xmm4
-  .byte  235,158                             // jmp           15e7f <_sk_load_a8_dst_sse41+0x1f>
+  .byte  235,158                             // jmp           16053 <_sk_load_a8_dst_sse41+0x1f>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,147                             // jmp           15e7f <_sk_load_a8_dst_sse41+0x1f>
+  .byte  235,147                             // jmp           16053 <_sk_load_a8_dst_sse41+0x1f>
 
 HIDDEN _sk_gather_a8_sse41
 .globl _sk_gather_a8_sse41
 FUNCTION(_sk_gather_a8_sse41)
 _sk_gather_a8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,58,22,192,1               // pextrq        $0x1,%xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -30636,11 +30726,11 @@
   .byte  102,15,58,32,192,3                  // pinsrb        $0x3,%eax,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,142,82,1,0                 // mulps         0x1528e(%rip),%xmm3        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,29,227,83,1,0                 // mulps         0x153e3(%rip),%xmm3        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_store_a8_sse41
@@ -30653,13 +30743,13 @@
   .byte  77,15,175,193                       // imul          %r9,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
-  .byte  68,15,40,5,68,81,1,0                // movaps        0x15144(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,154,82,1,0               // movaps        0x1529a(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  68,15,89,195                        // mulps         %xmm3,%xmm8
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
   .byte  102,68,15,103,192                   // packuswb      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,13                              // jne           15fb2 <_sk_store_a8_sse41+0x41>
+  .byte  117,13                              // jne           161bc <_sk_store_a8_sse41+0x41>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  67,137,4,16                         // mov           %eax,(%r8,%r10,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -30668,17 +30758,17 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            15fee <_sk_store_a8_sse41+0x7d>
+  .byte  116,41                              // je            161f8 <_sk_store_a8_sse41+0x7d>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            15fda <_sk_store_a8_sse41+0x69>
+  .byte  116,15                              // je            161e4 <_sk_store_a8_sse41+0x69>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,221                             // jne           15fae <_sk_store_a8_sse41+0x3d>
+  .byte  117,221                             // jne           161b8 <_sk_store_a8_sse41+0x3d>
   .byte  102,71,15,58,20,68,16,2,8           // pextrb        $0x8,%xmm8,0x2(%r8,%r10,1)
-  .byte  102,68,15,56,0,5,12,84,1,0          // pshufb        0x1540c(%rip),%xmm8        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xe54>
+  .byte  102,68,15,56,0,5,98,85,1,0          // pshufb        0x15562(%rip),%xmm8        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0xe54>
   .byte  102,71,15,58,21,4,16,0              // pextrw        $0x0,%xmm8,(%r8,%r10,1)
-  .byte  235,192                             // jmp           15fae <_sk_store_a8_sse41+0x3d>
+  .byte  235,192                             // jmp           161b8 <_sk_store_a8_sse41+0x3d>
   .byte  102,71,15,58,20,4,16,0              // pextrb        $0x0,%xmm8,(%r8,%r10,1)
-  .byte  235,182                             // jmp           15fae <_sk_store_a8_sse41+0x3d>
+  .byte  235,182                             // jmp           161b8 <_sk_store_a8_sse41+0x3d>
 
 HIDDEN _sk_load_g8_sse41
 .globl _sk_load_g8_sse41
@@ -30691,25 +30781,25 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,42                              // jne           1603a <_sk_load_g8_sse41+0x42>
+  .byte  117,42                              // jne           16244 <_sk_load_g8_sse41+0x42>
   .byte  102,67,15,56,49,4,16                // pmovzxbd      (%r8,%r10,1),%xmm0
-  .byte  102,15,219,5,129,80,1,0             // pand          0x15081(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,5,215,81,1,0             // pand          0x151d7(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,199,81,1,0                  // mulps         0x151c7(%rip),%xmm0        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,5,29,83,1,0                   // mulps         0x1531d(%rip),%xmm0        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,190,79,1,0                 // movaps        0x14fbe(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,20,81,1,0                  // movaps        0x15114(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1607c <_sk_load_g8_sse41+0x84>
+  .byte  116,53                              // je            16286 <_sk_load_g8_sse41+0x84>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            16066 <_sk_load_g8_sse41+0x6e>
+  .byte  116,21                              // je            16270 <_sk_load_g8_sse41+0x6e>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           16017 <_sk_load_g8_sse41+0x1f>
+  .byte  117,192                             // jne           16221 <_sk_load_g8_sse41+0x1f>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
@@ -30717,10 +30807,10 @@
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,56,49,201                    // pmovzxbd      %xmm1,%xmm1
   .byte  102,15,58,14,193,15                 // pblendw       $0xf,%xmm1,%xmm0
-  .byte  235,155                             // jmp           16017 <_sk_load_g8_sse41+0x1f>
+  .byte  235,155                             // jmp           16221 <_sk_load_g8_sse41+0x1f>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,144                             // jmp           16017 <_sk_load_g8_sse41+0x1f>
+  .byte  235,144                             // jmp           16221 <_sk_load_g8_sse41+0x1f>
 
 HIDDEN _sk_load_g8_dst_sse41
 .globl _sk_load_g8_dst_sse41
@@ -30733,25 +30823,25 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,42                              // jne           160c9 <_sk_load_g8_dst_sse41+0x42>
+  .byte  117,42                              // jne           162d3 <_sk_load_g8_dst_sse41+0x42>
   .byte  102,67,15,56,49,36,16               // pmovzxbd      (%r8,%r10,1),%xmm4
-  .byte  102,15,219,37,242,79,1,0            // pand          0x14ff2(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,37,72,81,1,0             // pand          0x15148(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,56,81,1,0                  // mulps         0x15138(%rip),%xmm4        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,37,142,82,1,0                 // mulps         0x1528e(%rip),%xmm4        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,47,79,1,0                  // movaps        0x14f2f(%rip),%xmm7        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,61,133,80,1,0                 // movaps        0x15085(%rip),%xmm7        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1610b <_sk_load_g8_dst_sse41+0x84>
+  .byte  116,53                              // je            16315 <_sk_load_g8_dst_sse41+0x84>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            160f5 <_sk_load_g8_dst_sse41+0x6e>
+  .byte  116,21                              // je            162ff <_sk_load_g8_dst_sse41+0x6e>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           160a6 <_sk_load_g8_dst_sse41+0x1f>
+  .byte  117,192                             // jne           162b0 <_sk_load_g8_dst_sse41+0x1f>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
@@ -30759,23 +30849,36 @@
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,56,49,237                    // pmovzxbd      %xmm5,%xmm5
   .byte  102,15,58,14,229,15                 // pblendw       $0xf,%xmm5,%xmm4
-  .byte  235,155                             // jmp           160a6 <_sk_load_g8_dst_sse41+0x1f>
+  .byte  235,155                             // jmp           162b0 <_sk_load_g8_dst_sse41+0x1f>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,144                             // jmp           160a6 <_sk_load_g8_dst_sse41+0x1f>
+  .byte  235,144                             // jmp           162b0 <_sk_load_g8_dst_sse41+0x1f>
 
 HIDDEN _sk_gather_g8_sse41
 .globl _sk_gather_g8_sse41
 FUNCTION(_sk_gather_g8_sse41)
 _sk_gather_g8_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,58,22,192,1               // pextrq        $0x1,%xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -30792,9 +30895,9 @@
   .byte  102,15,58,32,192,3                  // pinsrb        $0x3,%eax,%xmm0
   .byte  102,15,56,49,192                    // pmovzxbd      %xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,100,80,1,0                  // mulps         0x15064(%rip),%xmm0        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,5,131,81,1,0                  // mulps         0x15183(%rip),%xmm0        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,91,78,1,0                  // movaps        0x14e5b(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,122,79,1,0                 // movaps        0x14f7a(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
@@ -30811,41 +30914,41 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,80                              // jne           16208 <_sk_load_565_sse41+0x6b>
+  .byte  117,80                              // jne           16449 <_sk_load_565_sse41+0x6b>
   .byte  102,67,15,56,51,20,80               // pmovzxwd      (%r8,%r10,2),%xmm2
-  .byte  102,15,111,5,57,80,1,0              // movdqa        0x15039(%rip),%xmm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,5,88,81,1,0              // movdqa        0x15158(%rip),%xmm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,59,80,1,0                   // mulps         0x1503b(%rip),%xmm0        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,13,67,80,1,0             // movdqa        0x15043(%rip),%xmm1        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  15,89,5,90,81,1,0                   // mulps         0x1515a(%rip),%xmm0        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,13,98,81,1,0             // movdqa        0x15162(%rip),%xmm1        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,69,80,1,0                  // mulps         0x15045(%rip),%xmm1        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,15,219,21,77,80,1,0             // pand          0x1504d(%rip),%xmm2        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  15,89,13,100,81,1,0                 // mulps         0x15164(%rip),%xmm1        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,15,219,21,108,81,1,0            // pand          0x1516c(%rip),%xmm2        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,83,80,1,0                  // mulps         0x15053(%rip),%xmm2        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  15,89,21,114,81,1,0                 // mulps         0x15172(%rip),%xmm2        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,234,77,1,0                 // movaps        0x14dea(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,9,79,1,0                   // movaps        0x14f09(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            1624a <_sk_load_565_sse41+0xad>
+  .byte  116,53                              // je            1648b <_sk_load_565_sse41+0xad>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            16234 <_sk_load_565_sse41+0x97>
+  .byte  116,21                              // je            16475 <_sk_load_565_sse41+0x97>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           161bf <_sk_load_565_sse41+0x22>
+  .byte  117,154                             // jne           16400 <_sk_load_565_sse41+0x22>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,208,69                   // pshufd        $0x45,%xmm0,%xmm2
   .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,15,58,14,208,15                 // pblendw       $0xf,%xmm0,%xmm2
-  .byte  233,117,255,255,255                 // jmpq          161bf <_sk_load_565_sse41+0x22>
+  .byte  233,117,255,255,255                 // jmpq          16400 <_sk_load_565_sse41+0x22>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,208                      // movd          %eax,%xmm2
-  .byte  233,103,255,255,255                 // jmpq          161bf <_sk_load_565_sse41+0x22>
+  .byte  233,103,255,255,255                 // jmpq          16400 <_sk_load_565_sse41+0x22>
 
 HIDDEN _sk_load_565_dst_sse41
 .globl _sk_load_565_dst_sse41
@@ -30859,54 +30962,67 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,80                              // jne           162c3 <_sk_load_565_dst_sse41+0x6b>
+  .byte  117,80                              // jne           16504 <_sk_load_565_dst_sse41+0x6b>
   .byte  102,67,15,56,51,52,80               // pmovzxwd      (%r8,%r10,2),%xmm6
-  .byte  102,15,111,37,126,79,1,0            // movdqa        0x14f7e(%rip),%xmm4        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,37,157,80,1,0            // movdqa        0x1509d(%rip),%xmm4        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,128,79,1,0                 // mulps         0x14f80(%rip),%xmm4        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,45,136,79,1,0            // movdqa        0x14f88(%rip),%xmm5        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  15,89,37,159,80,1,0                 // mulps         0x1509f(%rip),%xmm4        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,45,167,80,1,0            // movdqa        0x150a7(%rip),%xmm5        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,15,219,238                      // pand          %xmm6,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,138,79,1,0                 // mulps         0x14f8a(%rip),%xmm5        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,15,219,53,146,79,1,0            // pand          0x14f92(%rip),%xmm6        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  15,89,45,169,80,1,0                 // mulps         0x150a9(%rip),%xmm5        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,15,219,53,177,80,1,0            // pand          0x150b1(%rip),%xmm6        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,152,79,1,0                 // mulps         0x14f98(%rip),%xmm6        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  15,89,53,183,80,1,0                 // mulps         0x150b7(%rip),%xmm6        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,47,77,1,0                  // movaps        0x14d2f(%rip),%xmm7        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,61,78,78,1,0                  // movaps        0x14e4e(%rip),%xmm7        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            16305 <_sk_load_565_dst_sse41+0xad>
+  .byte  116,53                              // je            16546 <_sk_load_565_dst_sse41+0xad>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            162ef <_sk_load_565_dst_sse41+0x97>
+  .byte  116,21                              // je            16530 <_sk_load_565_dst_sse41+0x97>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           1627a <_sk_load_565_dst_sse41+0x22>
+  .byte  117,154                             // jne           164bb <_sk_load_565_dst_sse41+0x22>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,244,69                   // pshufd        $0x45,%xmm4,%xmm6
   .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
   .byte  102,15,56,51,228                    // pmovzxwd      %xmm4,%xmm4
   .byte  102,15,58,14,244,15                 // pblendw       $0xf,%xmm4,%xmm6
-  .byte  233,117,255,255,255                 // jmpq          1627a <_sk_load_565_dst_sse41+0x22>
+  .byte  233,117,255,255,255                 // jmpq          164bb <_sk_load_565_dst_sse41+0x22>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,240                      // movd          %eax,%xmm6
-  .byte  233,103,255,255,255                 // jmpq          1627a <_sk_load_565_dst_sse41+0x22>
+  .byte  233,103,255,255,255                 // jmpq          164bb <_sk_load_565_dst_sse41+0x22>
 
 HIDDEN _sk_gather_565_sse41
 .globl _sk_gather_565_sse41
 FUNCTION(_sk_gather_565_sse41)
 _sk_gather_565_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,58,22,192,1               // pextrq        $0x1,%xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -30922,19 +31038,19 @@
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,192,3                    // pinsrw        $0x3,%eax,%xmm0
   .byte  102,15,56,51,208                    // pmovzxwd      %xmm0,%xmm2
-  .byte  102,15,111,5,124,78,1,0             // movdqa        0x14e7c(%rip),%xmm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,5,100,79,1,0             // movdqa        0x14f64(%rip),%xmm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,126,78,1,0                  // mulps         0x14e7e(%rip),%xmm0        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,13,134,78,1,0            // movdqa        0x14e86(%rip),%xmm1        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  15,89,5,102,79,1,0                  // mulps         0x14f66(%rip),%xmm0        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,13,110,79,1,0            // movdqa        0x14f6e(%rip),%xmm1        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,136,78,1,0                 // mulps         0x14e88(%rip),%xmm1        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,15,219,21,144,78,1,0            // pand          0x14e90(%rip),%xmm2        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  15,89,13,112,79,1,0                 // mulps         0x14f70(%rip),%xmm1        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,15,219,21,120,79,1,0            // pand          0x14f78(%rip),%xmm2        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,150,78,1,0                 // mulps         0x14e96(%rip),%xmm2        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  15,89,21,126,79,1,0                 // mulps         0x14f7e(%rip),%xmm2        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,45,76,1,0                  // movaps        0x14c2d(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,21,77,1,0                  // movaps        0x14d15(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_store_565_sse41
@@ -30948,12 +31064,12 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  68,15,40,5,29,80,1,0                // movaps        0x1501d(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xe64>
+  .byte  68,15,40,5,5,81,1,0                 // movaps        0x15105(%rip),%xmm8        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0xe64>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  102,65,15,114,241,11                // pslld         $0xb,%xmm9
-  .byte  68,15,40,21,18,80,1,0               // movaps        0x15012(%rip),%xmm10        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xe74>
+  .byte  68,15,40,21,250,80,1,0              // movaps        0x150fa(%rip),%xmm10        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xe74>
   .byte  68,15,89,209                        // mulps         %xmm1,%xmm10
   .byte  102,69,15,91,210                    // cvtps2dq      %xmm10,%xmm10
   .byte  102,65,15,114,242,5                 // pslld         $0x5,%xmm10
@@ -30963,7 +31079,7 @@
   .byte  102,69,15,86,194                    // orpd          %xmm10,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           16435 <_sk_store_565_sse41+0x70>
+  .byte  117,10                              // jne           166ad <_sk_store_565_sse41+0x70>
   .byte  102,69,15,214,4,64                  // movq          %xmm8,(%r8,%rax,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -30971,17 +31087,17 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,35                              // je            1646b <_sk_store_565_sse41+0xa6>
+  .byte  116,35                              // je            166e3 <_sk_store_565_sse41+0xa6>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            1645d <_sk_store_565_sse41+0x98>
+  .byte  116,15                              // je            166d5 <_sk_store_565_sse41+0x98>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,221                             // jne           16431 <_sk_store_565_sse41+0x6c>
+  .byte  117,221                             // jne           166a9 <_sk_store_565_sse41+0x6c>
   .byte  102,69,15,58,21,68,64,4,4           // pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
   .byte  102,69,15,126,4,64                  // movd          %xmm8,(%r8,%rax,2)
-  .byte  235,198                             // jmp           16431 <_sk_store_565_sse41+0x6c>
+  .byte  235,198                             // jmp           166a9 <_sk_store_565_sse41+0x6c>
   .byte  102,69,15,58,21,4,64,0              // pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  .byte  235,188                             // jmp           16431 <_sk_store_565_sse41+0x6c>
+  .byte  235,188                             // jmp           166a9 <_sk_store_565_sse41+0x6c>
 
 HIDDEN _sk_load_4444_sse41
 .globl _sk_load_4444_sse41
@@ -30995,44 +31111,44 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,95                              // jne           164ef <_sk_load_4444_sse41+0x7a>
+  .byte  117,95                              // jne           16767 <_sk_load_4444_sse41+0x7a>
   .byte  102,67,15,56,51,28,80               // pmovzxwd      (%r8,%r10,2),%xmm3
-  .byte  102,15,111,5,129,79,1,0             // movdqa        0x14f81(%rip),%xmm0        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
+  .byte  102,15,111,5,105,80,1,0             // movdqa        0x15069(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,131,79,1,0                  // mulps         0x14f83(%rip),%xmm0        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
-  .byte  102,15,111,13,139,79,1,0            // movdqa        0x14f8b(%rip),%xmm1        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
+  .byte  15,89,5,107,80,1,0                  // mulps         0x1506b(%rip),%xmm0        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
+  .byte  102,15,111,13,115,80,1,0            // movdqa        0x15073(%rip),%xmm1        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,141,79,1,0                 // mulps         0x14f8d(%rip),%xmm1        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
-  .byte  102,15,111,21,149,79,1,0            // movdqa        0x14f95(%rip),%xmm2        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
+  .byte  15,89,13,117,80,1,0                 // mulps         0x15075(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
+  .byte  102,15,111,21,125,80,1,0            // movdqa        0x1507d(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,151,79,1,0                 // mulps         0x14f97(%rip),%xmm2        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
-  .byte  102,15,219,29,159,79,1,0            // pand          0x14f9f(%rip),%xmm3        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
+  .byte  15,89,21,127,80,1,0                 // mulps         0x1507f(%rip),%xmm2        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
+  .byte  102,15,219,29,135,80,1,0            // pand          0x15087(%rip),%xmm3        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,165,79,1,0                 // mulps         0x14fa5(%rip),%xmm3        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
+  .byte  15,89,29,141,80,1,0                 // mulps         0x1508d(%rip),%xmm3        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            16531 <_sk_load_4444_sse41+0xbc>
+  .byte  116,53                              // je            167a9 <_sk_load_4444_sse41+0xbc>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1651b <_sk_load_4444_sse41+0xa6>
+  .byte  116,21                              // je            16793 <_sk_load_4444_sse41+0xa6>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           16497 <_sk_load_4444_sse41+0x22>
+  .byte  117,139                             // jne           1670f <_sk_load_4444_sse41+0x22>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
   .byte  102,15,56,51,192                    // pmovzxwd      %xmm0,%xmm0
   .byte  102,15,58,14,216,15                 // pblendw       $0xf,%xmm0,%xmm3
-  .byte  233,102,255,255,255                 // jmpq          16497 <_sk_load_4444_sse41+0x22>
+  .byte  233,102,255,255,255                 // jmpq          1670f <_sk_load_4444_sse41+0x22>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  233,88,255,255,255                  // jmpq          16497 <_sk_load_4444_sse41+0x22>
+  .byte  233,88,255,255,255                  // jmpq          1670f <_sk_load_4444_sse41+0x22>
 
 HIDDEN _sk_load_4444_dst_sse41
 .globl _sk_load_4444_dst_sse41
@@ -31046,57 +31162,70 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,95                              // jne           165b9 <_sk_load_4444_dst_sse41+0x7a>
+  .byte  117,95                              // jne           16831 <_sk_load_4444_dst_sse41+0x7a>
   .byte  102,67,15,56,51,60,80               // pmovzxwd      (%r8,%r10,2),%xmm7
-  .byte  102,15,111,37,183,78,1,0            // movdqa        0x14eb7(%rip),%xmm4        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
+  .byte  102,15,111,37,159,79,1,0            // movdqa        0x14f9f(%rip),%xmm4        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,185,78,1,0                 // mulps         0x14eb9(%rip),%xmm4        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
-  .byte  102,15,111,45,193,78,1,0            // movdqa        0x14ec1(%rip),%xmm5        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
+  .byte  15,89,37,161,79,1,0                 // mulps         0x14fa1(%rip),%xmm4        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
+  .byte  102,15,111,45,169,79,1,0            // movdqa        0x14fa9(%rip),%xmm5        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
   .byte  102,15,219,239                      // pand          %xmm7,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,195,78,1,0                 // mulps         0x14ec3(%rip),%xmm5        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
-  .byte  102,15,111,53,203,78,1,0            // movdqa        0x14ecb(%rip),%xmm6        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
+  .byte  15,89,45,171,79,1,0                 // mulps         0x14fab(%rip),%xmm5        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
+  .byte  102,15,111,53,179,79,1,0            // movdqa        0x14fb3(%rip),%xmm6        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
   .byte  102,15,219,247                      // pand          %xmm7,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,205,78,1,0                 // mulps         0x14ecd(%rip),%xmm6        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
-  .byte  102,15,219,61,213,78,1,0            // pand          0x14ed5(%rip),%xmm7        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
+  .byte  15,89,53,181,79,1,0                 // mulps         0x14fb5(%rip),%xmm6        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
+  .byte  102,15,219,61,189,79,1,0            // pand          0x14fbd(%rip),%xmm7        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
   .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  15,89,61,219,78,1,0                 // mulps         0x14edb(%rip),%xmm7        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
+  .byte  15,89,61,195,79,1,0                 // mulps         0x14fc3(%rip),%xmm7        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,53                              // je            165fb <_sk_load_4444_dst_sse41+0xbc>
+  .byte  116,53                              // je            16873 <_sk_load_4444_dst_sse41+0xbc>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            165e5 <_sk_load_4444_dst_sse41+0xa6>
+  .byte  116,21                              // je            1685d <_sk_load_4444_dst_sse41+0xa6>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           16561 <_sk_load_4444_dst_sse41+0x22>
+  .byte  117,139                             // jne           167d9 <_sk_load_4444_dst_sse41+0x22>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
   .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
   .byte  102,15,56,51,228                    // pmovzxwd      %xmm4,%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,102,255,255,255                 // jmpq          16561 <_sk_load_4444_dst_sse41+0x22>
+  .byte  233,102,255,255,255                 // jmpq          167d9 <_sk_load_4444_dst_sse41+0x22>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  233,88,255,255,255                  // jmpq          16561 <_sk_load_4444_dst_sse41+0x22>
+  .byte  233,88,255,255,255                  // jmpq          167d9 <_sk_load_4444_dst_sse41+0x22>
 
 HIDDEN _sk_gather_4444_sse41
 .globl _sk_gather_4444_sse41
 FUNCTION(_sk_gather_4444_sse41)
 _sk_gather_4444_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,58,22,192,1               // pextrq        $0x1,%xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -31112,21 +31241,21 @@
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,192,3                    // pinsrw        $0x3,%eax,%xmm0
   .byte  102,15,56,51,216                    // pmovzxwd      %xmm0,%xmm3
-  .byte  102,15,111,5,166,77,1,0             // movdqa        0x14da6(%rip),%xmm0        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
+  .byte  102,15,111,5,87,78,1,0              // movdqa        0x14e57(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,168,77,1,0                  // mulps         0x14da8(%rip),%xmm0        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
-  .byte  102,15,111,13,176,77,1,0            // movdqa        0x14db0(%rip),%xmm1        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
+  .byte  15,89,5,89,78,1,0                   // mulps         0x14e59(%rip),%xmm0        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
+  .byte  102,15,111,13,97,78,1,0             // movdqa        0x14e61(%rip),%xmm1        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,178,77,1,0                 // mulps         0x14db2(%rip),%xmm1        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
-  .byte  102,15,111,21,186,77,1,0            // movdqa        0x14dba(%rip),%xmm2        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
+  .byte  15,89,13,99,78,1,0                  // mulps         0x14e63(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
+  .byte  102,15,111,21,107,78,1,0            // movdqa        0x14e6b(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,188,77,1,0                 // mulps         0x14dbc(%rip),%xmm2        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
-  .byte  102,15,219,29,196,77,1,0            // pand          0x14dc4(%rip),%xmm3        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
+  .byte  15,89,21,109,78,1,0                 // mulps         0x14e6d(%rip),%xmm2        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
+  .byte  102,15,219,29,117,78,1,0            // pand          0x14e75(%rip),%xmm3        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,202,77,1,0                 // mulps         0x14dca(%rip),%xmm3        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
+  .byte  15,89,29,123,78,1,0                 // mulps         0x14e7b(%rip),%xmm3        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -31141,7 +31270,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  68,15,40,5,184,77,1,0               // movaps        0x14db8(%rip),%xmm8        # 2b4a0 <_sk_srcover_rgba_8888_sse2_lowp+0xf04>
+  .byte  68,15,40,5,105,78,1,0               // movaps        0x14e69(%rip),%xmm8        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0xf04>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
@@ -31161,7 +31290,7 @@
   .byte  102,69,15,86,194                    // orpd          %xmm10,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1674e <_sk_store_4444_sse41+0x84>
+  .byte  117,10                              // jne           169fd <_sk_store_4444_sse41+0x84>
   .byte  102,69,15,214,4,64                  // movq          %xmm8,(%r8,%rax,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -31169,17 +31298,17 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,35                              // je            16784 <_sk_store_4444_sse41+0xba>
+  .byte  116,35                              // je            16a33 <_sk_store_4444_sse41+0xba>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            16776 <_sk_store_4444_sse41+0xac>
+  .byte  116,15                              // je            16a25 <_sk_store_4444_sse41+0xac>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,221                             // jne           1674a <_sk_store_4444_sse41+0x80>
+  .byte  117,221                             // jne           169f9 <_sk_store_4444_sse41+0x80>
   .byte  102,69,15,58,21,68,64,4,4           // pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
   .byte  102,69,15,126,4,64                  // movd          %xmm8,(%r8,%rax,2)
-  .byte  235,198                             // jmp           1674a <_sk_store_4444_sse41+0x80>
+  .byte  235,198                             // jmp           169f9 <_sk_store_4444_sse41+0x80>
   .byte  102,69,15,58,21,4,64,0              // pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  .byte  235,188                             // jmp           1674a <_sk_store_4444_sse41+0x80>
+  .byte  235,188                             // jmp           169f9 <_sk_store_4444_sse41+0x80>
 
 HIDDEN _sk_load_8888_sse41
 .globl _sk_load_8888_sse41
@@ -31193,19 +31322,19 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           16803 <_sk_load_8888_sse41+0x75>
+  .byte  117,89                              // jne           16ab2 <_sk_load_8888_sse41+0x75>
   .byte  243,65,15,111,28,128                // movdqu        (%r8,%rax,4),%xmm3
-  .byte  102,15,111,5,232,72,1,0             // movdqa        0x148e8(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,153,73,1,0             // movdqa        0x14999(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,41,74,1,0                // movaps        0x14a29(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,218,74,1,0               // movaps        0x14ada(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
-  .byte  102,15,56,0,13,216,72,1,0           // pshufb        0x148d8(%rip),%xmm1        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,13,137,73,1,0           // pshufb        0x14989(%rip),%xmm1        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
-  .byte  102,15,56,0,21,212,72,1,0           // pshufb        0x148d4(%rip),%xmm2        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,21,133,73,1,0           // pshufb        0x14985(%rip),%xmm2        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31216,19 +31345,19 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            1683d <_sk_load_8888_sse41+0xaf>
+  .byte  116,45                              // je            16aec <_sk_load_8888_sse41+0xaf>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            1682c <_sk_load_8888_sse41+0x9e>
+  .byte  116,18                              // je            16adb <_sk_load_8888_sse41+0x9e>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           167b0 <_sk_load_8888_sse41+0x22>
+  .byte  117,144                             // jne           16a5f <_sk_load_8888_sse41+0x22>
   .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  243,65,15,126,4,128                 // movq          (%r8,%rax,4),%xmm0
   .byte  102,15,58,14,216,15                 // pblendw       $0xf,%xmm0,%xmm3
-  .byte  233,115,255,255,255                 // jmpq          167b0 <_sk_load_8888_sse41+0x22>
+  .byte  233,115,255,255,255                 // jmpq          16a5f <_sk_load_8888_sse41+0x22>
   .byte  102,65,15,110,28,128                // movd          (%r8,%rax,4),%xmm3
-  .byte  233,104,255,255,255                 // jmpq          167b0 <_sk_load_8888_sse41+0x22>
+  .byte  233,104,255,255,255                 // jmpq          16a5f <_sk_load_8888_sse41+0x22>
 
 HIDDEN _sk_load_8888_dst_sse41
 .globl _sk_load_8888_dst_sse41
@@ -31242,19 +31371,19 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           168bd <_sk_load_8888_dst_sse41+0x75>
+  .byte  117,89                              // jne           16b6c <_sk_load_8888_dst_sse41+0x75>
   .byte  243,65,15,111,60,128                // movdqu        (%r8,%rax,4),%xmm7
-  .byte  102,15,111,37,46,72,1,0             // movdqa        0x1482e(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,37,223,72,1,0            // movdqa        0x148df(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  68,15,40,5,111,73,1,0               // movaps        0x1496f(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,32,74,1,0                // movaps        0x14a20(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,224                        // mulps         %xmm8,%xmm4
   .byte  102,15,111,239                      // movdqa        %xmm7,%xmm5
-  .byte  102,15,56,0,45,30,72,1,0            // pshufb        0x1481e(%rip),%xmm5        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,45,207,72,1,0           // pshufb        0x148cf(%rip),%xmm5        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
   .byte  65,15,89,232                        // mulps         %xmm8,%xmm5
   .byte  102,15,111,247                      // movdqa        %xmm7,%xmm6
-  .byte  102,15,56,0,53,26,72,1,0            // pshufb        0x1481a(%rip),%xmm6        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,53,203,72,1,0           // pshufb        0x148cb(%rip),%xmm6        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  65,15,89,240                        // mulps         %xmm8,%xmm6
   .byte  102,15,114,215,24                   // psrld         $0x18,%xmm7
@@ -31265,32 +31394,45 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            168f7 <_sk_load_8888_dst_sse41+0xaf>
+  .byte  116,45                              // je            16ba6 <_sk_load_8888_dst_sse41+0xaf>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            168e6 <_sk_load_8888_dst_sse41+0x9e>
+  .byte  116,18                              // je            16b95 <_sk_load_8888_dst_sse41+0x9e>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           1686a <_sk_load_8888_dst_sse41+0x22>
+  .byte  117,144                             // jne           16b19 <_sk_load_8888_dst_sse41+0x22>
   .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
   .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,115,255,255,255                 // jmpq          1686a <_sk_load_8888_dst_sse41+0x22>
+  .byte  233,115,255,255,255                 // jmpq          16b19 <_sk_load_8888_dst_sse41+0x22>
   .byte  102,65,15,110,60,128                // movd          (%r8,%rax,4),%xmm7
-  .byte  233,104,255,255,255                 // jmpq          1686a <_sk_load_8888_dst_sse41+0x22>
+  .byte  233,104,255,255,255                 // jmpq          16b19 <_sk_load_8888_dst_sse41+0x22>
 
 HIDDEN _sk_gather_8888_sse41
 .globl _sk_gather_8888_sse41
 FUNCTION(_sk_gather_8888_sse41)
 _sk_gather_8888_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -31301,17 +31443,17 @@
   .byte  102,65,15,58,34,28,128,1            // pinsrd        $0x1,(%r8,%rax,4),%xmm3
   .byte  102,67,15,58,34,28,152,2            // pinsrd        $0x2,(%r8,%r11,4),%xmm3
   .byte  102,67,15,58,34,28,144,3            // pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  .byte  102,15,111,5,62,71,1,0              // movdqa        0x1473e(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,184,71,1,0             // movdqa        0x147b8(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,127,72,1,0               // movaps        0x1487f(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,249,72,1,0               // movaps        0x148f9(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
-  .byte  102,15,56,0,13,46,71,1,0            // pshufb        0x1472e(%rip),%xmm1        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,13,168,71,1,0           // pshufb        0x147a8(%rip),%xmm1        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
-  .byte  102,15,56,0,21,42,71,1,0            // pshufb        0x1472a(%rip),%xmm2        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,21,164,71,1,0           // pshufb        0x147a4(%rip),%xmm2        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31331,7 +31473,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  68,15,40,5,4,71,1,0                 // movaps        0x14704(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,126,71,1,0               // movaps        0x1477e(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
@@ -31350,23 +31492,23 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,194                   // por           %xmm10,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           16a2c <_sk_store_8888_sse41+0x7f>
+  .byte  117,10                              // jne           16d12 <_sk_store_8888_sse41+0x7f>
   .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,29                              // je            16a56 <_sk_store_8888_sse41+0xa9>
+  .byte  116,29                              // je            16d3c <_sk_store_8888_sse41+0xa9>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            16a4e <_sk_store_8888_sse41+0xa1>
+  .byte  116,15                              // je            16d34 <_sk_store_8888_sse41+0xa1>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           16a28 <_sk_store_8888_sse41+0x7b>
+  .byte  117,227                             // jne           16d0e <_sk_store_8888_sse41+0x7b>
   .byte  102,69,15,58,22,68,128,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
   .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,210                             // jmp           16a28 <_sk_store_8888_sse41+0x7b>
+  .byte  235,210                             // jmp           16d0e <_sk_store_8888_sse41+0x7b>
   .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,202                             // jmp           16a28 <_sk_store_8888_sse41+0x7b>
+  .byte  235,202                             // jmp           16d0e <_sk_store_8888_sse41+0x7b>
 
 HIDDEN _sk_load_bgra_sse41
 .globl _sk_load_bgra_sse41
@@ -31380,19 +31522,19 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           16ad3 <_sk_load_bgra_sse41+0x75>
+  .byte  117,89                              // jne           16db9 <_sk_load_bgra_sse41+0x75>
   .byte  243,65,15,111,28,128                // movdqu        (%r8,%rax,4),%xmm3
-  .byte  102,15,111,5,24,70,1,0              // movdqa        0x14618(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,146,70,1,0             // movdqa        0x14692(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,208                           // cvtdq2ps      %xmm0,%xmm2
-  .byte  68,15,40,5,89,71,1,0                // movaps        0x14759(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,211,71,1,0               // movaps        0x147d3(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,8,70,1,0              // pshufb        0x14608(%rip),%xmm0        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,5,130,70,1,0            // pshufb        0x14682(%rip),%xmm0        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,200                           // cvtdq2ps      %xmm0,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,4,70,1,0              // pshufb        0x14604(%rip),%xmm0        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,5,126,70,1,0            // pshufb        0x1467e(%rip),%xmm0        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31403,19 +31545,19 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            16b0d <_sk_load_bgra_sse41+0xaf>
+  .byte  116,45                              // je            16df3 <_sk_load_bgra_sse41+0xaf>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            16afc <_sk_load_bgra_sse41+0x9e>
+  .byte  116,18                              // je            16de2 <_sk_load_bgra_sse41+0x9e>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           16a80 <_sk_load_bgra_sse41+0x22>
+  .byte  117,144                             // jne           16d66 <_sk_load_bgra_sse41+0x22>
   .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  243,65,15,126,4,128                 // movq          (%r8,%rax,4),%xmm0
   .byte  102,15,58,14,216,15                 // pblendw       $0xf,%xmm0,%xmm3
-  .byte  233,115,255,255,255                 // jmpq          16a80 <_sk_load_bgra_sse41+0x22>
+  .byte  233,115,255,255,255                 // jmpq          16d66 <_sk_load_bgra_sse41+0x22>
   .byte  102,65,15,110,28,128                // movd          (%r8,%rax,4),%xmm3
-  .byte  233,104,255,255,255                 // jmpq          16a80 <_sk_load_bgra_sse41+0x22>
+  .byte  233,104,255,255,255                 // jmpq          16d66 <_sk_load_bgra_sse41+0x22>
 
 HIDDEN _sk_load_bgra_dst_sse41
 .globl _sk_load_bgra_dst_sse41
@@ -31429,19 +31571,19 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,89                              // jne           16b8d <_sk_load_bgra_dst_sse41+0x75>
+  .byte  117,89                              // jne           16e73 <_sk_load_bgra_dst_sse41+0x75>
   .byte  243,65,15,111,60,128                // movdqu        (%r8,%rax,4),%xmm7
-  .byte  102,15,111,37,94,69,1,0             // movdqa        0x1455e(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,37,216,69,1,0            // movdqa        0x145d8(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,244                           // cvtdq2ps      %xmm4,%xmm6
-  .byte  68,15,40,5,159,70,1,0               // movaps        0x1469f(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,25,71,1,0                // movaps        0x14719(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,240                        // mulps         %xmm8,%xmm6
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
-  .byte  102,15,56,0,37,78,69,1,0            // pshufb        0x1454e(%rip),%xmm4        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,37,200,69,1,0           // pshufb        0x145c8(%rip),%xmm4        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,236                           // cvtdq2ps      %xmm4,%xmm5
   .byte  65,15,89,232                        // mulps         %xmm8,%xmm5
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
-  .byte  102,15,56,0,37,74,69,1,0            // pshufb        0x1454a(%rip),%xmm4        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,37,196,69,1,0           // pshufb        0x145c4(%rip),%xmm4        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
   .byte  65,15,89,224                        // mulps         %xmm8,%xmm4
   .byte  102,15,114,215,24                   // psrld         $0x18,%xmm7
@@ -31452,32 +31594,45 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            16bc7 <_sk_load_bgra_dst_sse41+0xaf>
+  .byte  116,45                              // je            16ead <_sk_load_bgra_dst_sse41+0xaf>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            16bb6 <_sk_load_bgra_dst_sse41+0x9e>
+  .byte  116,18                              // je            16e9c <_sk_load_bgra_dst_sse41+0x9e>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,144                             // jne           16b3a <_sk_load_bgra_dst_sse41+0x22>
+  .byte  117,144                             // jne           16e20 <_sk_load_bgra_dst_sse41+0x22>
   .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
   .byte  243,65,15,126,36,128                // movq          (%r8,%rax,4),%xmm4
   .byte  102,15,58,14,252,15                 // pblendw       $0xf,%xmm4,%xmm7
-  .byte  233,115,255,255,255                 // jmpq          16b3a <_sk_load_bgra_dst_sse41+0x22>
+  .byte  233,115,255,255,255                 // jmpq          16e20 <_sk_load_bgra_dst_sse41+0x22>
   .byte  102,65,15,110,60,128                // movd          (%r8,%rax,4),%xmm7
-  .byte  233,104,255,255,255                 // jmpq          16b3a <_sk_load_bgra_dst_sse41+0x22>
+  .byte  233,104,255,255,255                 // jmpq          16e20 <_sk_load_bgra_dst_sse41+0x22>
 
 HIDDEN _sk_gather_bgra_sse41
 .globl _sk_gather_bgra_sse41
 FUNCTION(_sk_gather_bgra_sse41)
 _sk_gather_bgra_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -31488,17 +31643,17 @@
   .byte  102,65,15,58,34,28,128,1            // pinsrd        $0x1,(%r8,%rax,4),%xmm3
   .byte  102,67,15,58,34,28,152,2            // pinsrd        $0x2,(%r8,%r11,4),%xmm3
   .byte  102,67,15,58,34,28,144,3            // pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  .byte  102,15,111,5,110,68,1,0             // movdqa        0x1446e(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,177,68,1,0             // movdqa        0x144b1(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,208                           // cvtdq2ps      %xmm0,%xmm2
-  .byte  68,15,40,5,175,69,1,0               // movaps        0x145af(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,242,69,1,0               // movaps        0x145f2(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,94,68,1,0             // pshufb        0x1445e(%rip),%xmm0        # 2b0b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
+  .byte  102,15,56,0,5,161,68,1,0            // pshufb        0x144a1(%rip),%xmm0        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xb14>
   .byte  15,91,200                           // cvtdq2ps      %xmm0,%xmm1
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,56,0,5,90,68,1,0             // pshufb        0x1445a(%rip),%xmm0        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
+  .byte  102,15,56,0,5,157,68,1,0            // pshufb        0x1449d(%rip),%xmm0        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xb24>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
@@ -31518,7 +31673,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  68,15,40,5,52,68,1,0                // movaps        0x14434(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,119,68,1,0               // movaps        0x14477(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  68,15,40,202                        // movaps        %xmm2,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
@@ -31537,23 +31692,23 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,194                   // por           %xmm10,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           16cfc <_sk_store_bgra_sse41+0x7f>
+  .byte  117,10                              // jne           17019 <_sk_store_bgra_sse41+0x7f>
   .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,29                              // je            16d26 <_sk_store_bgra_sse41+0xa9>
+  .byte  116,29                              // je            17043 <_sk_store_bgra_sse41+0xa9>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,15                              // je            16d1e <_sk_store_bgra_sse41+0xa1>
+  .byte  116,15                              // je            1703b <_sk_store_bgra_sse41+0xa1>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           16cf8 <_sk_store_bgra_sse41+0x7b>
+  .byte  117,227                             // jne           17015 <_sk_store_bgra_sse41+0x7b>
   .byte  102,69,15,58,22,68,128,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
   .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,210                             // jmp           16cf8 <_sk_store_bgra_sse41+0x7b>
+  .byte  235,210                             // jmp           17015 <_sk_store_bgra_sse41+0x7b>
   .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,202                             // jmp           16cf8 <_sk_store_bgra_sse41+0x7b>
+  .byte  235,202                             // jmp           17015 <_sk_store_bgra_sse41+0x7b>
 
 HIDDEN _sk_load_f16_sse41
 .globl _sk_load_f16_sse41
@@ -31567,7 +31722,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,68,1,0,0                     // jne           16e92 <_sk_load_f16_sse41+0x164>
+  .byte  15,133,68,1,0,0                     // jne           171af <_sk_load_f16_sse41+0x164>
   .byte  102,65,15,16,4,192                  // movupd        (%r8,%rax,8),%xmm0
   .byte  243,65,15,111,76,192,16             // movdqu        0x10(%r8,%rax,8),%xmm1
   .byte  102,68,15,40,200                    // movapd        %xmm0,%xmm9
@@ -31577,19 +31732,19 @@
   .byte  102,68,15,97,224                    // punpcklwd     %xmm0,%xmm12
   .byte  102,68,15,105,200                   // punpckhwd     %xmm0,%xmm9
   .byte  102,65,15,56,51,212                 // pmovzxwd      %xmm12,%xmm2
-  .byte  102,68,15,111,5,41,71,1,0           // movdqa        0x14729(%rip),%xmm8        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
+  .byte  102,68,15,111,5,108,71,1,0          // movdqa        0x1476c(%rip),%xmm8        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,219,200                   // pand          %xmm8,%xmm1
-  .byte  102,68,15,111,21,39,71,1,0          // movdqa        0x14727(%rip),%xmm10        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,21,106,71,1,0         // movdqa        0x1476a(%rip),%xmm10        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
   .byte  102,65,15,219,210                   // pand          %xmm10,%xmm2
-  .byte  102,15,111,29,42,71,1,0             // movdqa        0x1472a(%rip),%xmm3        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
+  .byte  102,15,111,29,109,71,1,0            // movdqa        0x1476d(%rip),%xmm3        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
   .byte  102,15,114,241,16                   // pslld         $0x10,%xmm1
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,56,63,195                    // pmaxud        %xmm3,%xmm0
   .byte  102,15,118,194                      // pcmpeqd       %xmm2,%xmm0
   .byte  102,15,114,242,13                   // pslld         $0xd,%xmm2
   .byte  102,15,235,209                      // por           %xmm1,%xmm2
-  .byte  102,68,15,111,29,22,71,1,0          // movdqa        0x14716(%rip),%xmm11        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
+  .byte  102,68,15,111,29,89,71,1,0          // movdqa        0x14759(%rip),%xmm11        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
   .byte  102,65,15,254,211                   // paddd         %xmm11,%xmm2
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,65,15,112,204,238               // pshufd        $0xee,%xmm12,%xmm1
@@ -31632,16 +31787,16 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  242,65,15,16,4,192                  // movsd         (%r8,%rax,8),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           16eab <_sk_load_f16_sse41+0x17d>
+  .byte  117,13                              // jne           171c8 <_sk_load_f16_sse41+0x17d>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,176,254,255,255                 // jmpq          16d5b <_sk_load_f16_sse41+0x2d>
+  .byte  233,176,254,255,255                 // jmpq          17078 <_sk_load_f16_sse41+0x2d>
   .byte  102,65,15,22,68,192,8               // movhpd        0x8(%r8,%rax,8),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,155,254,255,255              // jb            16d5b <_sk_load_f16_sse41+0x2d>
+  .byte  15,130,155,254,255,255              // jb            17078 <_sk_load_f16_sse41+0x2d>
   .byte  243,65,15,126,76,192,16             // movq          0x10(%r8,%rax,8),%xmm1
-  .byte  233,143,254,255,255                 // jmpq          16d5b <_sk_load_f16_sse41+0x2d>
+  .byte  233,143,254,255,255                 // jmpq          17078 <_sk_load_f16_sse41+0x2d>
 
 HIDDEN _sk_load_f16_dst_sse41
 .globl _sk_load_f16_dst_sse41
@@ -31655,7 +31810,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,68,1,0,0                     // jne           17030 <_sk_load_f16_dst_sse41+0x164>
+  .byte  15,133,68,1,0,0                     // jne           1734d <_sk_load_f16_dst_sse41+0x164>
   .byte  102,65,15,16,36,192                 // movupd        (%r8,%rax,8),%xmm4
   .byte  243,65,15,111,108,192,16            // movdqu        0x10(%r8,%rax,8),%xmm5
   .byte  102,68,15,40,204                    // movapd        %xmm4,%xmm9
@@ -31665,19 +31820,19 @@
   .byte  102,68,15,97,228                    // punpcklwd     %xmm4,%xmm12
   .byte  102,68,15,105,204                   // punpckhwd     %xmm4,%xmm9
   .byte  102,65,15,56,51,244                 // pmovzxwd      %xmm12,%xmm6
-  .byte  102,68,15,111,5,139,69,1,0          // movdqa        0x1458b(%rip),%xmm8        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
+  .byte  102,68,15,111,5,206,69,1,0          // movdqa        0x145ce(%rip),%xmm8        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,65,15,219,232                   // pand          %xmm8,%xmm5
-  .byte  102,68,15,111,21,137,69,1,0         // movdqa        0x14589(%rip),%xmm10        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,21,204,69,1,0         // movdqa        0x145cc(%rip),%xmm10        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
   .byte  102,65,15,219,242                   // pand          %xmm10,%xmm6
-  .byte  102,15,111,61,140,69,1,0            // movdqa        0x1458c(%rip),%xmm7        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
+  .byte  102,15,111,61,207,69,1,0            // movdqa        0x145cf(%rip),%xmm7        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
   .byte  102,15,114,245,16                   // pslld         $0x10,%xmm5
   .byte  102,15,111,230                      // movdqa        %xmm6,%xmm4
   .byte  102,15,56,63,231                    // pmaxud        %xmm7,%xmm4
   .byte  102,15,118,230                      // pcmpeqd       %xmm6,%xmm4
   .byte  102,15,114,246,13                   // pslld         $0xd,%xmm6
   .byte  102,15,235,245                      // por           %xmm5,%xmm6
-  .byte  102,68,15,111,29,120,69,1,0         // movdqa        0x14578(%rip),%xmm11        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
+  .byte  102,68,15,111,29,187,69,1,0         // movdqa        0x145bb(%rip),%xmm11        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
   .byte  102,65,15,254,243                   // paddd         %xmm11,%xmm6
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  102,65,15,112,236,238               // pshufd        $0xee,%xmm12,%xmm5
@@ -31720,29 +31875,42 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  242,65,15,16,36,192                 // movsd         (%r8,%rax,8),%xmm4
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           17049 <_sk_load_f16_dst_sse41+0x17d>
+  .byte  117,13                              // jne           17366 <_sk_load_f16_dst_sse41+0x17d>
   .byte  243,15,126,228                      // movq          %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
-  .byte  233,176,254,255,255                 // jmpq          16ef9 <_sk_load_f16_dst_sse41+0x2d>
+  .byte  233,176,254,255,255                 // jmpq          17216 <_sk_load_f16_dst_sse41+0x2d>
   .byte  102,65,15,22,100,192,8              // movhpd        0x8(%r8,%rax,8),%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,155,254,255,255              // jb            16ef9 <_sk_load_f16_dst_sse41+0x2d>
+  .byte  15,130,155,254,255,255              // jb            17216 <_sk_load_f16_dst_sse41+0x2d>
   .byte  243,65,15,126,108,192,16            // movq          0x10(%r8,%rax,8),%xmm5
-  .byte  233,143,254,255,255                 // jmpq          16ef9 <_sk_load_f16_dst_sse41+0x2d>
+  .byte  233,143,254,255,255                 // jmpq          17216 <_sk_load_f16_dst_sse41+0x2d>
 
 HIDDEN _sk_gather_f16_sse41
 .globl _sk_gather_f16_sse41
 FUNCTION(_sk_gather_f16_sse41)
 _sk_gather_f16_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,56,64,209                    // pmulld        %xmm1,%xmm2
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,194                      // paddd         %xmm2,%xmm0
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,56,64,200                    // pmulld        %xmm0,%xmm1
+  .byte  243,65,15,91,193                    // cvttps2dq     %xmm9,%xmm0
+  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
@@ -31762,19 +31930,19 @@
   .byte  102,68,15,97,226                    // punpcklwd     %xmm2,%xmm12
   .byte  102,68,15,105,202                   // punpckhwd     %xmm2,%xmm9
   .byte  102,65,15,56,51,212                 // pmovzxwd      %xmm12,%xmm2
-  .byte  102,68,15,111,5,192,67,1,0          // movdqa        0x143c0(%rip),%xmm8        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
+  .byte  102,68,15,111,5,204,67,1,0          // movdqa        0x143cc(%rip),%xmm8        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,219,200                   // pand          %xmm8,%xmm1
-  .byte  102,68,15,111,21,190,67,1,0         // movdqa        0x143be(%rip),%xmm10        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,21,202,67,1,0         // movdqa        0x143ca(%rip),%xmm10        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
   .byte  102,65,15,219,210                   // pand          %xmm10,%xmm2
-  .byte  102,15,111,29,193,67,1,0            // movdqa        0x143c1(%rip),%xmm3        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
+  .byte  102,15,111,29,205,67,1,0            // movdqa        0x143cd(%rip),%xmm3        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
   .byte  102,15,114,241,16                   // pslld         $0x10,%xmm1
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,56,63,195                    // pmaxud        %xmm3,%xmm0
   .byte  102,15,118,194                      // pcmpeqd       %xmm2,%xmm0
   .byte  102,15,114,242,13                   // pslld         $0xd,%xmm2
   .byte  102,15,235,209                      // por           %xmm1,%xmm2
-  .byte  102,68,15,111,29,173,67,1,0         // movdqa        0x143ad(%rip),%xmm11        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
+  .byte  102,68,15,111,29,185,67,1,0         // movdqa        0x143b9(%rip),%xmm11        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
   .byte  102,65,15,254,211                   // paddd         %xmm11,%xmm2
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,65,15,112,204,238               // pshufd        $0xee,%xmm12,%xmm1
@@ -31827,20 +31995,20 @@
   .byte  73,193,224,3                        // shl           $0x3,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  102,68,15,111,13,213,66,1,0         // movdqa        0x142d5(%rip),%xmm9        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  102,68,15,111,13,225,66,1,0         // movdqa        0x142e1(%rip),%xmm9        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
   .byte  102,68,15,111,224                   // movdqa        %xmm0,%xmm12
   .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,210,66,1,0         // movdqa        0x142d2(%rip),%xmm11        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0xf64>
+  .byte  102,68,15,111,29,222,66,1,0         // movdqa        0x142de(%rip),%xmm11        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0xf64>
   .byte  102,68,15,111,232                   // movdqa        %xmm0,%xmm13
   .byte  102,69,15,219,235                   // pand          %xmm11,%xmm13
-  .byte  102,68,15,111,21,207,66,1,0         // movdqa        0x142cf(%rip),%xmm10        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0xf74>
+  .byte  102,68,15,111,21,219,66,1,0         // movdqa        0x142db(%rip),%xmm10        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0xf74>
   .byte  102,65,15,114,212,16                // psrld         $0x10,%xmm12
   .byte  102,69,15,111,197                   // movdqa        %xmm13,%xmm8
   .byte  102,69,15,56,63,194                 // pmaxud        %xmm10,%xmm8
   .byte  102,69,15,118,197                   // pcmpeqd       %xmm13,%xmm8
   .byte  102,65,15,114,213,13                // psrld         $0xd,%xmm13
   .byte  102,69,15,254,236                   // paddd         %xmm12,%xmm13
-  .byte  102,68,15,111,37,181,66,1,0         // movdqa        0x142b5(%rip),%xmm12        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0xf84>
+  .byte  102,68,15,111,37,193,66,1,0         // movdqa        0x142c1(%rip),%xmm12        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0xf84>
   .byte  102,69,15,254,236                   // paddd         %xmm12,%xmm13
   .byte  102,69,15,219,197                   // pand          %xmm13,%xmm8
   .byte  102,68,15,56,43,192                 // packusdw      %xmm0,%xmm8
@@ -31885,7 +32053,7 @@
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,98,205                    // punpckldq     %xmm13,%xmm9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,21                              // jne           17369 <_sk_store_f16_sse41+0x16e>
+  .byte  117,21                              // jne           176bd <_sk_store_f16_sse41+0x16e>
   .byte  69,15,17,12,192                     // movups        %xmm9,(%r8,%rax,8)
   .byte  102,69,15,106,197                   // punpckhdq     %xmm13,%xmm8
   .byte  243,69,15,127,68,192,16             // movdqu        %xmm8,0x10(%r8,%rax,8)
@@ -31893,13 +32061,13 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,214,12,192                // movq          %xmm9,(%r8,%rax,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            17365 <_sk_store_f16_sse41+0x16a>
+  .byte  116,240                             // je            176b9 <_sk_store_f16_sse41+0x16a>
   .byte  102,69,15,23,76,192,8               // movhpd        %xmm9,0x8(%r8,%rax,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            17365 <_sk_store_f16_sse41+0x16a>
+  .byte  114,227                             // jb            176b9 <_sk_store_f16_sse41+0x16a>
   .byte  102,69,15,106,197                   // punpckhdq     %xmm13,%xmm8
   .byte  102,69,15,214,68,192,16             // movq          %xmm8,0x10(%r8,%rax,8)
-  .byte  235,213                             // jmp           17365 <_sk_store_f16_sse41+0x16a>
+  .byte  235,213                             // jmp           176b9 <_sk_store_f16_sse41+0x16a>
 
 HIDDEN _sk_load_u16_be_sse41
 .globl _sk_load_u16_be_sse41
@@ -31914,7 +32082,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,185,0,0,0                    // jne           17470 <_sk_load_u16_be_sse41+0xe0>
+  .byte  15,133,185,0,0,0                    // jne           177c4 <_sk_load_u16_be_sse41+0xe0>
   .byte  102,65,15,16,4,64                   // movupd        (%r8,%rax,2),%xmm0
   .byte  243,65,15,111,76,64,16              // movdqu        0x10(%r8,%rax,2),%xmm1
   .byte  102,15,40,208                       // movapd        %xmm0,%xmm2
@@ -31930,7 +32098,7 @@
   .byte  102,15,235,200                      // por           %xmm0,%xmm1
   .byte  102,15,56,51,193                    // pmovzxwd      %xmm1,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,125,62,1,0               // movaps        0x13e7d(%rip),%xmm8        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
+  .byte  68,15,40,5,137,62,1,0               // movaps        0x13e89(%rip),%xmm8        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -31958,16 +32126,16 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  242,65,15,16,4,64                   // movsd         (%r8,%rax,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           17489 <_sk_load_u16_be_sse41+0xf9>
+  .byte  117,13                              // jne           177dd <_sk_load_u16_be_sse41+0xf9>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,59,255,255,255                  // jmpq          173c4 <_sk_load_u16_be_sse41+0x34>
+  .byte  233,59,255,255,255                  // jmpq          17718 <_sk_load_u16_be_sse41+0x34>
   .byte  102,65,15,22,68,64,8                // movhpd        0x8(%r8,%rax,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,38,255,255,255               // jb            173c4 <_sk_load_u16_be_sse41+0x34>
+  .byte  15,130,38,255,255,255               // jb            17718 <_sk_load_u16_be_sse41+0x34>
   .byte  243,65,15,126,76,64,16              // movq          0x10(%r8,%rax,2),%xmm1
-  .byte  233,26,255,255,255                  // jmpq          173c4 <_sk_load_u16_be_sse41+0x34>
+  .byte  233,26,255,255,255                  // jmpq          17718 <_sk_load_u16_be_sse41+0x34>
 
 HIDDEN _sk_load_rgb_u16_be_sse41
 .globl _sk_load_rgb_u16_be_sse41
@@ -31984,7 +32152,7 @@
   .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
   .byte  72,193,248,32                       // sar           $0x20,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,170,0,0,0                    // jne           1757f <_sk_load_rgb_u16_be_sse41+0xd5>
+  .byte  15,133,170,0,0,0                    // jne           178d3 <_sk_load_rgb_u16_be_sse41+0xd5>
   .byte  243,65,15,111,20,64                 // movdqu        (%r8,%rax,2),%xmm2
   .byte  243,65,15,111,92,64,8               // movdqu        0x8(%r8,%rax,2),%xmm3
   .byte  102,15,115,219,4                    // psrldq        $0x4,%xmm3
@@ -32004,7 +32172,7 @@
   .byte  102,15,235,200                      // por           %xmm0,%xmm1
   .byte  102,15,56,51,193                    // pmovzxwd      %xmm1,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,76,61,1,0                // movaps        0x13d4c(%rip),%xmm8        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
+  .byte  68,15,40,5,88,61,1,0                // movaps        0x13d58(%rip),%xmm8        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -32021,27 +32189,27 @@
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,115,58,1,0                 // movaps        0x13a73(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,127,58,1,0                 // movaps        0x13a7f(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,20,64                 // movd          (%r8,%rax,2),%xmm2
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,84,64,4,2             // pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           175a4 <_sk_load_rgb_u16_be_sse41+0xfa>
+  .byte  117,13                              // jne           178f8 <_sk_load_rgb_u16_be_sse41+0xfa>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  233,85,255,255,255                  // jmpq          174f9 <_sk_load_rgb_u16_be_sse41+0x4f>
+  .byte  233,85,255,255,255                  // jmpq          1784d <_sk_load_rgb_u16_be_sse41+0x4f>
   .byte  102,65,15,110,68,64,6               // movd          0x6(%r8,%rax,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,68,64,10,2            // pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            175d5 <_sk_load_rgb_u16_be_sse41+0x12b>
+  .byte  114,24                              // jb            17929 <_sk_load_rgb_u16_be_sse41+0x12b>
   .byte  102,65,15,110,92,64,12              // movd          0xc(%r8,%rax,2),%xmm3
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,92,64,16,2            // pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  .byte  233,36,255,255,255                  // jmpq          174f9 <_sk_load_rgb_u16_be_sse41+0x4f>
+  .byte  233,36,255,255,255                  // jmpq          1784d <_sk_load_rgb_u16_be_sse41+0x4f>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  233,27,255,255,255                  // jmpq          174f9 <_sk_load_rgb_u16_be_sse41+0x4f>
+  .byte  233,27,255,255,255                  // jmpq          1784d <_sk_load_rgb_u16_be_sse41+0x4f>
 
 HIDDEN _sk_store_u16_be_sse41
 .globl _sk_store_u16_be_sse41
@@ -32055,7 +32223,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  68,15,40,21,44,63,1,0               // movaps        0x13f2c(%rip),%xmm10        # 2b530 <_sk_srcover_rgba_8888_sse2_lowp+0xf94>
+  .byte  68,15,40,21,56,63,1,0               // movaps        0x13f38(%rip),%xmm10        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0xf94>
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
   .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
@@ -32092,7 +32260,7 @@
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
   .byte  102,69,15,98,209                    // punpckldq     %xmm9,%xmm10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,21                              // jne           176d2 <_sk_store_u16_be_sse41+0xf4>
+  .byte  117,21                              // jne           17a26 <_sk_store_u16_be_sse41+0xf4>
   .byte  69,15,17,20,64                      // movups        %xmm10,(%r8,%rax,2)
   .byte  102,69,15,106,193                   // punpckhdq     %xmm9,%xmm8
   .byte  243,69,15,127,68,64,16              // movdqu        %xmm8,0x10(%r8,%rax,2)
@@ -32100,13 +32268,13 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,214,20,64                 // movq          %xmm10,(%r8,%rax,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            176ce <_sk_store_u16_be_sse41+0xf0>
+  .byte  116,240                             // je            17a22 <_sk_store_u16_be_sse41+0xf0>
   .byte  102,69,15,23,84,64,8                // movhpd        %xmm10,0x8(%r8,%rax,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            176ce <_sk_store_u16_be_sse41+0xf0>
+  .byte  114,227                             // jb            17a22 <_sk_store_u16_be_sse41+0xf0>
   .byte  102,69,15,106,193                   // punpckhdq     %xmm9,%xmm8
   .byte  102,69,15,214,68,64,16              // movq          %xmm8,0x10(%r8,%rax,2)
-  .byte  235,213                             // jmp           176ce <_sk_store_u16_be_sse41+0xf0>
+  .byte  235,213                             // jmp           17a22 <_sk_store_u16_be_sse41+0xf0>
 
 HIDDEN _sk_load_f32_sse41
 .globl _sk_load_f32_sse41
@@ -32122,7 +32290,7 @@
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           17764 <_sk_load_f32_sse41+0x6b>
+  .byte  117,66                              // jne           17ab8 <_sk_load_f32_sse41+0x6b>
   .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
   .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
   .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
@@ -32142,17 +32310,17 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           17776 <_sk_load_f32_sse41+0x7d>
+  .byte  117,8                               // jne           17aca <_sk_load_f32_sse41+0x7d>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
-  .byte  235,190                             // jmp           17734 <_sk_load_f32_sse41+0x3b>
+  .byte  235,190                             // jmp           17a88 <_sk_load_f32_sse41+0x3b>
   .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            1778a <_sk_load_f32_sse41+0x91>
+  .byte  114,8                               // jb            17ade <_sk_load_f32_sse41+0x91>
   .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
-  .byte  235,170                             // jmp           17734 <_sk_load_f32_sse41+0x3b>
+  .byte  235,170                             // jmp           17a88 <_sk_load_f32_sse41+0x3b>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,165                             // jmp           17734 <_sk_load_f32_sse41+0x3b>
+  .byte  235,165                             // jmp           17a88 <_sk_load_f32_sse41+0x3b>
 
 HIDDEN _sk_load_f32_dst_sse41
 .globl _sk_load_f32_dst_sse41
@@ -32168,7 +32336,7 @@
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           177fa <_sk_load_f32_dst_sse41+0x6b>
+  .byte  117,66                              // jne           17b4e <_sk_load_f32_dst_sse41+0x6b>
   .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
   .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
   .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
@@ -32188,17 +32356,17 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           1780c <_sk_load_f32_dst_sse41+0x7d>
+  .byte  117,8                               // jne           17b60 <_sk_load_f32_dst_sse41+0x7d>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  235,190                             // jmp           177ca <_sk_load_f32_dst_sse41+0x3b>
+  .byte  235,190                             // jmp           17b1e <_sk_load_f32_dst_sse41+0x3b>
   .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            17820 <_sk_load_f32_dst_sse41+0x91>
+  .byte  114,8                               // jb            17b74 <_sk_load_f32_dst_sse41+0x91>
   .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
-  .byte  235,170                             // jmp           177ca <_sk_load_f32_dst_sse41+0x3b>
+  .byte  235,170                             // jmp           17b1e <_sk_load_f32_dst_sse41+0x3b>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
-  .byte  235,165                             // jmp           177ca <_sk_load_f32_dst_sse41+0x3b>
+  .byte  235,165                             // jmp           17b1e <_sk_load_f32_dst_sse41+0x3b>
 
 HIDDEN _sk_store_f32_sse41
 .globl _sk_store_f32_sse41
@@ -32227,7 +32395,7 @@
   .byte  102,69,15,20,203                    // unpcklpd      %xmm11,%xmm9
   .byte  102,69,15,17,36,128                 // movupd        %xmm12,(%r8,%rax,4)
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,29                              // jne           178a2 <_sk_store_f32_sse41+0x7d>
+  .byte  117,29                              // jne           17bf6 <_sk_store_f32_sse41+0x7d>
   .byte  102,69,15,21,211                    // unpckhpd      %xmm11,%xmm10
   .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
   .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
@@ -32235,65 +32403,27 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,246                             // je            1789e <_sk_store_f32_sse41+0x79>
+  .byte  116,246                             // je            17bf2 <_sk_store_f32_sse41+0x79>
   .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,234                             // jb            1789e <_sk_store_f32_sse41+0x79>
+  .byte  114,234                             // jb            17bf2 <_sk_store_f32_sse41+0x79>
   .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
-  .byte  235,225                             // jmp           1789e <_sk_store_f32_sse41+0x79>
-
-HIDDEN _sk_clamp_x_sse41
-.globl _sk_clamp_x_sse41
-FUNCTION(_sk_clamp_x_sse41)
-_sk_clamp_x_sse41:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  68,15,93,192                        // minps         %xmm0,%xmm8
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
-  .byte  255,224                             // jmpq          *%rax
-
-HIDDEN _sk_clamp_y_sse41
-.globl _sk_clamp_y_sse41
-FUNCTION(_sk_clamp_y_sse41)
-_sk_clamp_y_sse41:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,95,193                        // maxps         %xmm1,%xmm8
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
-  .byte  68,15,93,193                        // minps         %xmm1,%xmm8
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
-  .byte  255,224                             // jmpq          *%rax
+  .byte  235,225                             // jmp           17bf2 <_sk_store_f32_sse41+0x79>
 
 HIDDEN _sk_repeat_x_sse41
 .globl _sk_repeat_x_sse41
 FUNCTION(_sk_repeat_x_sse41)
 _sk_repeat_x_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  243,68,15,16,64,4                   // movss         0x4(%rax),%xmm8
-  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  68,15,89,192                        // mulps         %xmm0,%xmm8
-  .byte  102,69,15,58,8,192,1                // roundps       $0x1,%xmm8,%xmm8
+  .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
+  .byte  243,68,15,16,72,4                   // movss         0x4(%rax),%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
+  .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
+  .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
+  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  68,15,93,192                        // minps         %xmm0,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_repeat_y_sse41
@@ -32301,21 +32431,15 @@
 FUNCTION(_sk_repeat_y_sse41)
 _sk_repeat_y_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  243,68,15,16,64,4                   // movss         0x4(%rax),%xmm8
-  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  68,15,89,193                        // mulps         %xmm1,%xmm8
-  .byte  102,69,15,58,8,192,1                // roundps       $0x1,%xmm8,%xmm8
+  .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
+  .byte  243,68,15,16,72,4                   // movss         0x4(%rax),%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
+  .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
+  .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
+  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  65,15,92,200                        // subps         %xmm8,%xmm1
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,95,193                        // maxps         %xmm1,%xmm8
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
-  .byte  68,15,93,193                        // minps         %xmm1,%xmm8
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_mirror_x_sse41
@@ -32330,7 +32454,7 @@
   .byte  65,15,92,194                        // subps         %xmm10,%xmm0
   .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  243,68,15,89,13,26,52,1,0           // mulss         0x1341a(%rip),%xmm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,89,13,170,52,1,0          // mulss         0x134aa(%rip),%xmm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
@@ -32338,15 +32462,9 @@
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
   .byte  65,15,92,194                        // subps         %xmm10,%xmm0
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
-  .byte  68,15,92,200                        // subps         %xmm0,%xmm9
-  .byte  68,15,84,200                        // andps         %xmm0,%xmm9
-  .byte  69,15,95,193                        // maxps         %xmm9,%xmm8
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,65,15,254,194                   // paddd         %xmm10,%xmm0
-  .byte  68,15,93,192                        // minps         %xmm0,%xmm8
+  .byte  68,15,92,192                        // subps         %xmm0,%xmm8
+  .byte  65,15,84,192                        // andps         %xmm8,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_mirror_y_sse41
@@ -32361,7 +32479,7 @@
   .byte  65,15,92,202                        // subps         %xmm10,%xmm1
   .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
-  .byte  243,68,15,89,13,168,51,1,0          // mulss         0x133a8(%rip),%xmm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,89,13,81,52,1,0           // mulss         0x13451(%rip),%xmm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
   .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
@@ -32369,15 +32487,9 @@
   .byte  65,15,92,201                        // subps         %xmm9,%xmm1
   .byte  65,15,92,202                        // subps         %xmm10,%xmm1
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
-  .byte  68,15,92,201                        // subps         %xmm1,%xmm9
-  .byte  68,15,84,201                        // andps         %xmm1,%xmm9
-  .byte  69,15,95,193                        // maxps         %xmm9,%xmm8
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,65,15,254,202                   // paddd         %xmm10,%xmm1
-  .byte  68,15,93,193                        // minps         %xmm1,%xmm8
+  .byte  68,15,92,193                        // subps         %xmm1,%xmm8
+  .byte  65,15,84,200                        // andps         %xmm8,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_clamp_x_1_sse41
@@ -32386,7 +32498,7 @@
 _sk_clamp_x_1_sse41:
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,93,5,95,53,1,0                // minps         0x1355f(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,93,5,33,54,1,0                // minps         0x13621(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -32404,9 +32516,9 @@
 .globl _sk_mirror_x_1_sse41
 FUNCTION(_sk_mirror_x_1_sse41)
 _sk_mirror_x_1_sse41:
-  .byte  68,15,40,5,160,53,1,0               // movaps        0x135a0(%rip),%xmm8        # 2b050 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
+  .byte  68,15,40,5,98,54,1,0                // movaps        0x13662(%rip),%xmm8        # 2b3b0 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,13,36,53,1,0               // movaps        0x13524(%rip),%xmm9        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,13,230,53,1,0              // movaps        0x135e6(%rip),%xmm9        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  102,69,15,58,8,201,1                // roundps       $0x1,%xmm9,%xmm9
   .byte  69,15,88,201                        // addps         %xmm9,%xmm9
@@ -32423,10 +32535,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse41)
 _sk_luminance_to_alpha_sse41:
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
-  .byte  15,89,5,83,58,1,0                   // mulps         0x13a53(%rip),%xmm0        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xfa4>
-  .byte  15,89,13,92,58,1,0                  // mulps         0x13a5c(%rip),%xmm1        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xfb4>
+  .byte  15,89,5,21,59,1,0                   // mulps         0x13b15(%rip),%xmm0        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0xfa4>
+  .byte  15,89,13,30,59,1,0                  // mulps         0x13b1e(%rip),%xmm1        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0xfb4>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,29,98,58,1,0                  // mulps         0x13a62(%rip),%xmm3        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xfc4>
+  .byte  15,89,29,36,59,1,0                  // mulps         0x13b24(%rip),%xmm3        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0xfc4>
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -32738,9 +32850,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  76,139,112,8                        // mov           0x8(%rax),%r14
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            17f9e <_sk_evenly_spaced_gradient_sse41+0x18>
+  .byte  120,7                               // js            1823c <_sk_evenly_spaced_gradient_sse41+0x18>
   .byte  243,72,15,42,203                    // cvtsi2ss      %rbx,%xmm1
-  .byte  235,21                              // jmp           17fb3 <_sk_evenly_spaced_gradient_sse41+0x2d>
+  .byte  235,21                              // jmp           18251 <_sk_evenly_spaced_gradient_sse41+0x2d>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -32829,15 +32941,15 @@
 .globl _sk_gauss_a_to_rgba_sse41
 FUNCTION(_sk_gauss_a_to_rgba_sse41)
 _sk_gauss_a_to_rgba_sse41:
-  .byte  15,40,5,17,52,1,0                   // movaps        0x13411(%rip),%xmm0        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xfd4>
+  .byte  15,40,5,211,52,1,0                  // movaps        0x134d3(%rip),%xmm0        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0xfd4>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,23,52,1,0                   // addps         0x13417(%rip),%xmm0        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xfe4>
+  .byte  15,88,5,217,52,1,0                  // addps         0x134d9(%rip),%xmm0        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xfe4>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,29,52,1,0                   // addps         0x1341d(%rip),%xmm0        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xff4>
+  .byte  15,88,5,223,52,1,0                  // addps         0x134df(%rip),%xmm0        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xff4>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,35,52,1,0                   // addps         0x13423(%rip),%xmm0        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1004>
+  .byte  15,88,5,229,52,1,0                  // addps         0x134e5(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x1004>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,41,52,1,0                   // addps         0x13429(%rip),%xmm0        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1014>
+  .byte  15,88,5,235,52,1,0                  // addps         0x134eb(%rip),%xmm0        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0x1014>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
@@ -32852,7 +32964,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,41                              // jb            181cc <_sk_gradient_sse41+0x38>
+  .byte  114,41                              // jb            1846a <_sk_gradient_sse41+0x38>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  73,255,200                          // dec           %r8
   .byte  73,131,193,4                        // add           $0x4,%r9
@@ -32863,7 +32975,7 @@
   .byte  102,15,250,202                      // psubd         %xmm2,%xmm1
   .byte  73,131,193,4                        // add           $0x4,%r9
   .byte  73,255,200                          // dec           %r8
-  .byte  117,230                             // jne           181b2 <_sk_gradient_sse41+0x1e>
+  .byte  117,230                             // jne           18450 <_sk_gradient_sse41+0x1e>
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
   .byte  102,73,15,58,22,200,1               // pextrq        $0x1,%xmm1,%r8
@@ -32994,26 +33106,26 @@
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,40,236                        // movaps        %xmm12,%xmm13
   .byte  69,15,89,237                        // mulps         %xmm13,%xmm13
-  .byte  68,15,40,21,160,49,1,0              // movaps        0x131a0(%rip),%xmm10        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0x1024>
+  .byte  68,15,40,21,98,50,1,0               // movaps        0x13262(%rip),%xmm10        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0x1024>
   .byte  69,15,89,213                        // mulps         %xmm13,%xmm10
-  .byte  68,15,88,21,164,49,1,0              // addps         0x131a4(%rip),%xmm10        # 2b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0x1034>
+  .byte  68,15,88,21,102,50,1,0              // addps         0x13266(%rip),%xmm10        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0x1034>
   .byte  69,15,89,213                        // mulps         %xmm13,%xmm10
-  .byte  68,15,88,21,168,49,1,0              // addps         0x131a8(%rip),%xmm10        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1044>
+  .byte  68,15,88,21,106,50,1,0              // addps         0x1326a(%rip),%xmm10        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x1044>
   .byte  69,15,89,213                        // mulps         %xmm13,%xmm10
-  .byte  68,15,88,21,172,49,1,0              // addps         0x131ac(%rip),%xmm10        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1054>
+  .byte  68,15,88,21,110,50,1,0              // addps         0x1326e(%rip),%xmm10        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x1054>
   .byte  69,15,89,212                        // mulps         %xmm12,%xmm10
   .byte  65,15,194,195,1                     // cmpltps       %xmm11,%xmm0
-  .byte  68,15,40,29,171,49,1,0              // movaps        0x131ab(%rip),%xmm11        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0x1064>
+  .byte  68,15,40,29,109,50,1,0              // movaps        0x1326d(%rip),%xmm11        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0x1064>
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
   .byte  102,69,15,56,20,211                 // blendvps      %xmm0,%xmm11,%xmm10
   .byte  69,15,194,200,1                     // cmpltps       %xmm8,%xmm9
-  .byte  68,15,40,29,116,43,1,0              // movaps        0x12b74(%rip),%xmm11        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,29,54,44,1,0               // movaps        0x12c36(%rip),%xmm11        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  102,69,15,56,20,211                 // blendvps      %xmm0,%xmm11,%xmm10
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  65,15,194,192,1                     // cmpltps       %xmm8,%xmm0
-  .byte  68,15,40,13,102,43,1,0              // movaps        0x12b66(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,40,44,1,0               // movaps        0x12c28(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
   .byte  102,69,15,56,20,209                 // blendvps      %xmm0,%xmm9,%xmm10
   .byte  69,15,194,194,7                     // cmpordps      %xmm10,%xmm8
@@ -33047,7 +33159,7 @@
   .byte  243,69,15,89,203                    // mulss         %xmm11,%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,88,200                        // addps         %xmm0,%xmm9
-  .byte  68,15,89,13,31,49,1,0               // mulps         0x1311f(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
+  .byte  68,15,89,13,225,49,1,0              // mulps         0x131e1(%rip),%xmm9        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
@@ -33055,7 +33167,7 @@
   .byte  243,69,15,89,219                    // mulss         %xmm11,%xmm11
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,92,227                        // subps         %xmm11,%xmm12
-  .byte  68,15,89,21,10,49,1,0               // mulps         0x1310a(%rip),%xmm10        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
+  .byte  68,15,89,21,204,49,1,0              // mulps         0x131cc(%rip),%xmm10        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
   .byte  69,15,89,212                        // mulps         %xmm12,%xmm10
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
@@ -33064,8 +33176,8 @@
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
-  .byte  68,15,87,13,178,47,1,0              // xorps         0x12fb2(%rip),%xmm9        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
-  .byte  68,15,89,5,154,42,1,0               // mulps         0x12a9a(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,87,13,116,48,1,0              // xorps         0x13074(%rip),%xmm9        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  68,15,89,5,92,43,1,0                // mulps         0x12b5c(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
@@ -33086,7 +33198,7 @@
   .byte  243,69,15,89,203                    // mulss         %xmm11,%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,88,200                        // addps         %xmm0,%xmm9
-  .byte  68,15,89,13,129,48,1,0              // mulps         0x13081(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
+  .byte  68,15,89,13,67,49,1,0               // mulps         0x13143(%rip),%xmm9        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
@@ -33094,7 +33206,7 @@
   .byte  243,69,15,89,219                    // mulss         %xmm11,%xmm11
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,92,227                        // subps         %xmm11,%xmm12
-  .byte  68,15,89,21,108,48,1,0              // mulps         0x1306c(%rip),%xmm10        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
+  .byte  68,15,89,21,46,49,1,0               // mulps         0x1312e(%rip),%xmm10        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
   .byte  69,15,89,212                        // mulps         %xmm12,%xmm10
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
@@ -33103,8 +33215,8 @@
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
-  .byte  68,15,87,13,20,47,1,0               // xorps         0x12f14(%rip),%xmm9        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
-  .byte  68,15,89,5,252,41,1,0               // mulps         0x129fc(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,87,13,214,47,1,0              // xorps         0x12fd6(%rip),%xmm9        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  68,15,89,5,190,42,1,0               // mulps         0x12abe(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
@@ -33122,7 +33234,7 @@
   .byte  243,69,15,89,200                    // mulss         %xmm8,%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,88,200                        // addps         %xmm0,%xmm9
-  .byte  68,15,89,13,244,47,1,0              // mulps         0x12ff4(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
+  .byte  68,15,89,13,182,48,1,0              // mulps         0x130b6(%rip),%xmm9        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  69,15,89,210                        // mulps         %xmm10,%xmm10
@@ -33130,7 +33242,7 @@
   .byte  243,69,15,89,192                    // mulss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
-  .byte  15,87,5,176,46,1,0                  // xorps         0x12eb0(%rip),%xmm0        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  15,87,5,114,47,1,0                  // xorps         0x12f72(%rip),%xmm0        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
   .byte  65,15,94,193                        // divps         %xmm9,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33173,7 +33285,7 @@
 FUNCTION(_sk_save_xy_sse41)
 _sk_save_xy_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,54,41,1,0                // movaps        0x12936(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,5,248,41,1,0               // movaps        0x129f8(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  15,17,0                             // movups        %xmm0,(%rax)
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,88,200                        // addps         %xmm8,%xmm9
@@ -33217,8 +33329,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,248,46,1,0                  // addps         0x12ef8(%rip),%xmm0        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,176,40,1,0              // movaps        0x128b0(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,5,186,47,1,0                  // addps         0x12fba(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,114,41,1,0              // movaps        0x12972(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,128,0,0,0              // movups        %xmm9,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33231,7 +33343,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,127,40,1,0                  // addps         0x1287f(%rip),%xmm0        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,88,5,65,41,1,0                   // addps         0x12941(%rip),%xmm0        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  68,15,17,128,128,0,0,0              // movups        %xmm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33243,8 +33355,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,177,46,1,0                 // addps         0x12eb1(%rip),%xmm1        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,105,40,1,0              // movaps        0x12869(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,13,115,47,1,0                 // addps         0x12f73(%rip),%xmm1        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,43,41,1,0               // movaps        0x1292b(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,160,0,0,0              // movups        %xmm9,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33257,7 +33369,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,55,40,1,0                  // addps         0x12837(%rip),%xmm1        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,88,13,249,40,1,0                 // addps         0x128f9(%rip),%xmm1        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  68,15,17,128,160,0,0,0              // movups        %xmm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33269,13 +33381,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,122,46,1,0                  // addps         0x12e7a(%rip),%xmm0        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
-  .byte  68,15,40,13,34,40,1,0               // movaps        0x12822(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,5,60,47,1,0                   // addps         0x12f3c(%rip),%xmm0        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
+  .byte  68,15,40,13,228,40,1,0              // movaps        0x128e4(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,110,46,1,0              // mulps         0x12e6e(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,13,246,41,1,0              // addps         0x129f6(%rip),%xmm9        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,13,48,47,1,0               // mulps         0x12f30(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,13,184,42,1,0              // addps         0x12ab8(%rip),%xmm9        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,128,0,0,0              // movups        %xmm9,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33288,16 +33400,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,37,46,1,0                   // addps         0x12e25(%rip),%xmm0        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,221,39,1,0              // movaps        0x127dd(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,5,231,46,1,0                  // addps         0x12ee7(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,159,40,1,0              // movaps        0x1289f(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,65,46,1,0                // movaps        0x12e41(%rip),%xmm8        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,5,3,47,1,0                 // movaps        0x12f03(%rip),%xmm8        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,69,46,1,0                // addps         0x12e45(%rip),%xmm8        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,5,7,47,1,0                 // addps         0x12f07(%rip),%xmm8        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,169,39,1,0               // addps         0x127a9(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,5,107,40,1,0               // addps         0x1286b(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,61,46,1,0                // addps         0x12e3d(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,5,255,46,1,0               // addps         0x12eff(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,128,128,0,0,0              // movups        %xmm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33307,17 +33419,17 @@
 FUNCTION(_sk_bicubic_p1x_sse41)
 _sk_bicubic_p1x_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,135,39,1,0               // movaps        0x12787(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,5,73,40,1,0                // movaps        0x12849(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,72,64                      // movups        0x40(%rax),%xmm9
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,21,243,45,1,0              // movaps        0x12df3(%rip),%xmm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,21,181,46,1,0              // movaps        0x12eb5(%rip),%xmm10        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,247,45,1,0              // addps         0x12df7(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,21,185,46,1,0              // addps         0x12eb9(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,243,45,1,0              // addps         0x12df3(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,21,181,46,1,0              // addps         0x12eb5(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,144,128,0,0,0              // movups        %xmm10,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33329,11 +33441,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,198,45,1,0                  // addps         0x12dc6(%rip),%xmm0        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  15,88,5,136,46,1,0                  // addps         0x12e88(%rip),%xmm0        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,150,45,1,0               // mulps         0x12d96(%rip),%xmm8        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,5,30,41,1,0                // addps         0x1291e(%rip),%xmm8        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,5,88,46,1,0                // mulps         0x12e58(%rip),%xmm8        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,5,224,41,1,0               // addps         0x129e0(%rip),%xmm8        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,128,0,0,0              // movups        %xmm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33346,13 +33458,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,92,45,1,0                  // addps         0x12d5c(%rip),%xmm1        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
-  .byte  68,15,40,13,4,39,1,0                // movaps        0x12704(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,13,30,46,1,0                  // addps         0x12e1e(%rip),%xmm1        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
+  .byte  68,15,40,13,198,39,1,0              // movaps        0x127c6(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,80,45,1,0               // mulps         0x12d50(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,13,216,40,1,0              // addps         0x128d8(%rip),%xmm9        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,13,18,46,1,0               // mulps         0x12e12(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,13,154,41,1,0              // addps         0x1299a(%rip),%xmm9        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,160,0,0,0              // movups        %xmm9,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33365,16 +33477,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,6,45,1,0                   // addps         0x12d06(%rip),%xmm1        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,190,38,1,0              // movaps        0x126be(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,13,200,45,1,0                 // addps         0x12dc8(%rip),%xmm1        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,128,39,1,0              // movaps        0x12780(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,34,45,1,0                // movaps        0x12d22(%rip),%xmm8        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,5,228,45,1,0               // movaps        0x12de4(%rip),%xmm8        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,38,45,1,0                // addps         0x12d26(%rip),%xmm8        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,5,232,45,1,0               // addps         0x12de8(%rip),%xmm8        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,138,38,1,0               // addps         0x1268a(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,5,76,39,1,0                // addps         0x1274c(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,30,45,1,0                // addps         0x12d1e(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,5,224,45,1,0               // addps         0x12de0(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,128,160,0,0,0              // movups        %xmm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33384,17 +33496,17 @@
 FUNCTION(_sk_bicubic_p1y_sse41)
 _sk_bicubic_p1y_sse41:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,104,38,1,0               // movaps        0x12668(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,5,42,39,1,0                // movaps        0x1272a(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,72,96                      // movups        0x60(%rax),%xmm9
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  68,15,40,21,211,44,1,0              // movaps        0x12cd3(%rip),%xmm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,21,149,45,1,0              // movaps        0x12d95(%rip),%xmm10        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,215,44,1,0              // addps         0x12cd7(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,21,153,45,1,0              // addps         0x12d99(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,211,44,1,0              // addps         0x12cd3(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,21,149,45,1,0              // addps         0x12d95(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,144,160,0,0,0              // movups        %xmm10,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -33406,11 +33518,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,165,44,1,0                 // addps         0x12ca5(%rip),%xmm1        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  15,88,13,103,45,1,0                 // addps         0x12d67(%rip),%xmm1        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,117,44,1,0               // mulps         0x12c75(%rip),%xmm8        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,5,253,39,1,0               // addps         0x127fd(%rip),%xmm8        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,5,55,45,1,0                // mulps         0x12d37(%rip),%xmm8        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,5,191,40,1,0               // addps         0x128bf(%rip),%xmm8        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,160,0,0,0              // movups        %xmm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -33521,7 +33633,7 @@
   .byte  15,89,194                           // mulps         %xmm2,%xmm0
   .byte  15,41,68,36,208                     // movaps        %xmm0,-0x30(%rsp)
   .byte  243,15,91,240                       // cvttps2dq     %xmm0,%xmm6
-  .byte  15,40,37,96,43,1,0                  // movaps        0x12b60(%rip),%xmm4        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
+  .byte  15,40,37,34,44,1,0                  // movaps        0x12c22(%rip),%xmm4        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
   .byte  15,88,196                           // addps         %xmm4,%xmm0
   .byte  15,41,68,36,176                     // movaps        %xmm0,-0x50(%rsp)
   .byte  102,65,15,110,208                   // movd          %r8d,%xmm2
@@ -33560,7 +33672,7 @@
   .byte  102,68,15,56,64,192                 // pmulld        %xmm0,%xmm8
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,254,218                      // paddd         %xmm2,%xmm3
-  .byte  102,68,15,111,37,183,42,1,0         // movdqa        0x12ab7(%rip),%xmm12        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,68,15,111,37,121,43,1,0         // movdqa        0x12b79(%rip),%xmm12        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,65,15,56,64,220                 // pmulld        %xmm12,%xmm3
   .byte  102,15,118,228                      // pcmpeqd       %xmm4,%xmm4
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
@@ -33583,7 +33695,7 @@
   .byte  102,65,15,58,22,217,1               // pextrd        $0x1,%xmm3,%r9d
   .byte  102,65,15,58,22,218,2               // pextrd        $0x2,%xmm3,%r10d
   .byte  102,65,15,58,22,219,3               // pextrd        $0x3,%xmm3,%r11d
-  .byte  102,15,111,37,187,35,1,0            // movdqa        0x123bb(%rip),%xmm4        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,37,125,36,1,0            // movdqa        0x1247d(%rip),%xmm4        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,254,220                      // paddd         %xmm4,%xmm3
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,73,15,58,22,222,1               // pextrq        $0x1,%xmm3,%r14
@@ -33756,7 +33868,7 @@
   .byte  102,68,15,254,202                   // paddd         %xmm2,%xmm9
   .byte  102,65,15,111,192                   // movdqa        %xmm8,%xmm0
   .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  102,15,111,45,198,38,1,0            // movdqa        0x126c6(%rip),%xmm5        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,45,136,39,1,0            // movdqa        0x12788(%rip),%xmm5        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,56,64,197                    // pmulld        %xmm5,%xmm0
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,118,246                      // pcmpeqd       %xmm6,%xmm6
@@ -33777,7 +33889,7 @@
   .byte  102,65,15,58,22,193,1               // pextrd        $0x1,%xmm0,%r9d
   .byte  102,65,15,58,22,194,2               // pextrd        $0x2,%xmm0,%r10d
   .byte  102,65,15,58,22,195,3               // pextrd        $0x3,%xmm0,%r11d
-  .byte  102,15,111,61,215,31,1,0            // movdqa        0x11fd7(%rip),%xmm7        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,61,153,32,1,0            // movdqa        0x12099(%rip),%xmm7        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,254,199                      // paddd         %xmm7,%xmm0
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
@@ -33843,7 +33955,7 @@
   .byte  15,88,248                           // addps         %xmm0,%xmm7
   .byte  102,68,15,254,210                   // paddd         %xmm2,%xmm10
   .byte  102,69,15,254,194                   // paddd         %xmm10,%xmm8
-  .byte  102,15,111,13,2,37,1,0              // movdqa        0x12502(%rip),%xmm1        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,196,37,1,0            // movdqa        0x125c4(%rip),%xmm1        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,68,15,56,64,193                 // pmulld        %xmm1,%xmm8
   .byte  102,65,15,111,192                   // movdqa        %xmm8,%xmm0
   .byte  102,15,118,237                      // pcmpeqd       %xmm5,%xmm5
@@ -33864,7 +33976,7 @@
   .byte  102,69,15,58,22,193,1               // pextrd        $0x1,%xmm8,%r9d
   .byte  102,69,15,58,22,194,2               // pextrd        $0x2,%xmm8,%r10d
   .byte  102,69,15,58,22,195,3               // pextrd        $0x3,%xmm8,%r11d
-  .byte  102,15,111,21,13,30,1,0             // movdqa        0x11e0d(%rip),%xmm2        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,21,207,30,1,0            // movdqa        0x11ecf(%rip),%xmm2        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,68,15,254,194                   // paddd         %xmm2,%xmm8
   .byte  102,76,15,58,22,193,1               // pextrq        $0x1,%xmm8,%rcx
   .byte  102,76,15,126,195                   // movq          %xmm8,%rbx
@@ -33991,7 +34103,7 @@
   .byte  15,89,203                           // mulps         %xmm3,%xmm1
   .byte  15,41,76,36,48                      // movaps        %xmm1,0x30(%rsp)
   .byte  243,15,91,249                       // cvttps2dq     %xmm1,%xmm7
-  .byte  15,40,29,96,34,1,0                  // movaps        0x12260(%rip),%xmm3        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
+  .byte  15,40,29,34,35,1,0                  // movaps        0x12322(%rip),%xmm3        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
   .byte  15,88,203                           // addps         %xmm3,%xmm1
   .byte  15,41,76,36,160                     // movaps        %xmm1,-0x60(%rsp)
   .byte  102,65,15,110,232                   // movd          %r8d,%xmm5
@@ -34048,7 +34160,7 @@
   .byte  102,68,15,56,64,253                 // pmulld        %xmm5,%xmm15
   .byte  102,65,15,111,223                   // movdqa        %xmm15,%xmm3
   .byte  102,15,254,217                      // paddd         %xmm1,%xmm3
-  .byte  102,68,15,111,29,95,33,1,0          // movdqa        0x1215f(%rip),%xmm11        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,68,15,111,29,33,34,1,0          // movdqa        0x12221(%rip),%xmm11        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,65,15,56,64,219                 // pmulld        %xmm11,%xmm3
   .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
   .byte  102,15,111,243                      // movdqa        %xmm3,%xmm6
@@ -34070,7 +34182,7 @@
   .byte  102,65,15,58,22,217,1               // pextrd        $0x1,%xmm3,%r9d
   .byte  102,65,15,58,22,218,2               // pextrd        $0x2,%xmm3,%r10d
   .byte  102,65,15,58,22,219,3               // pextrd        $0x3,%xmm3,%r11d
-  .byte  102,68,15,111,21,103,26,1,0         // movdqa        0x11a67(%rip),%xmm10        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,21,41,27,1,0          // movdqa        0x11b29(%rip),%xmm10        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,218                   // paddd         %xmm10,%xmm3
   .byte  102,73,15,58,22,222,1               // pextrq        $0x1,%xmm3,%r14
   .byte  102,72,15,126,219                   // movq          %xmm3,%rbx
@@ -34088,7 +34200,7 @@
   .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
   .byte  102,65,15,56,64,203                 // pmulld        %xmm11,%xmm1
   .byte  102,15,111,217                      // movdqa        %xmm1,%xmm3
-  .byte  102,15,250,29,149,32,1,0            // psubd         0x12095(%rip),%xmm3        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,29,87,33,1,0             // psubd         0x12157(%rip),%xmm3        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,73,15,58,22,222,1               // pextrq        $0x1,%xmm3,%r14
   .byte  102,72,15,126,219                   // movq          %xmm3,%rbx
   .byte  65,137,223                          // mov           %ebx,%r15d
@@ -34143,7 +34255,7 @@
   .byte  102,65,15,254,199                   // paddd         %xmm15,%xmm0
   .byte  102,65,15,56,64,195                 // pmulld        %xmm11,%xmm0
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
-  .byte  102,15,250,45,117,31,1,0            // psubd         0x11f75(%rip),%xmm5        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,45,55,32,1,0             // psubd         0x12037(%rip),%xmm5        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
   .byte  102,72,15,58,22,233,1               // pextrq        $0x1,%xmm5,%rcx
   .byte  102,72,15,126,237                   // movq          %xmm5,%rbp
@@ -34268,7 +34380,7 @@
   .byte  72,193,233,32                       // shr           $0x20,%rcx
   .byte  243,15,16,36,136                    // movss         (%rax,%rcx,4),%xmm4
   .byte  102,68,15,58,33,220,48              // insertps      $0x30,%xmm4,%xmm11
-  .byte  102,15,111,61,89,22,1,0             // movdqa        0x11659(%rip),%xmm7        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,61,27,23,1,0             // movdqa        0x1171b(%rip),%xmm7        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,254,223                      // paddd         %xmm7,%xmm3
   .byte  102,72,15,58,22,217,1               // pextrq        $0x1,%xmm3,%rcx
   .byte  102,72,15,126,221                   // movq          %xmm3,%rbp
@@ -34354,7 +34466,7 @@
   .byte  102,65,15,58,22,201,1               // pextrd        $0x1,%xmm1,%r9d
   .byte  102,65,15,58,22,202,2               // pextrd        $0x2,%xmm1,%r10d
   .byte  102,65,15,58,22,203,3               // pextrd        $0x3,%xmm1,%r11d
-  .byte  102,68,15,111,21,157,20,1,0         // movdqa        0x1149d(%rip),%xmm10        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,21,95,21,1,0          // movdqa        0x1155f(%rip),%xmm10        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,202                   // paddd         %xmm10,%xmm1
   .byte  102,72,15,58,22,201,1               // pextrq        $0x1,%xmm1,%rcx
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -34450,7 +34562,7 @@
   .byte  102,15,111,124,36,192               // movdqa        -0x40(%rsp),%xmm7
   .byte  102,15,111,199                      // movdqa        %xmm7,%xmm0
   .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
-  .byte  102,15,111,21,55,25,1,0             // movdqa        0x11937(%rip),%xmm2        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,21,249,25,1,0            // movdqa        0x119f9(%rip),%xmm2        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,56,64,194                    // pmulld        %xmm2,%xmm0
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
@@ -34471,7 +34583,7 @@
   .byte  102,65,15,58,22,193,1               // pextrd        $0x1,%xmm0,%r9d
   .byte  102,65,15,58,22,194,2               // pextrd        $0x2,%xmm0,%r10d
   .byte  102,65,15,58,22,195,3               // pextrd        $0x3,%xmm0,%r11d
-  .byte  102,15,111,37,70,18,1,0             // movdqa        0x11246(%rip),%xmm4        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,37,8,19,1,0              // movdqa        0x11308(%rip),%xmm4        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,254,196                      // paddd         %xmm4,%xmm0
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
@@ -34543,7 +34655,7 @@
   .byte  102,68,15,111,226                   // movdqa        %xmm2,%xmm12
   .byte  102,65,15,56,64,204                 // pmulld        %xmm12,%xmm1
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
-  .byte  102,15,250,21,98,23,1,0             // psubd         0x11762(%rip),%xmm2        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,21,36,24,1,0             // psubd         0x11824(%rip),%xmm2        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,72,15,58,22,209,1               // pextrq        $0x1,%xmm2,%rcx
   .byte  102,72,15,126,213                   // movq          %xmm2,%rbp
   .byte  137,235                             // mov           %ebp,%ebx
@@ -34577,7 +34689,7 @@
   .byte  102,65,15,111,249                   // movdqa        %xmm9,%xmm7
   .byte  102,69,15,56,64,236                 // pmulld        %xmm12,%xmm13
   .byte  102,65,15,111,205                   // movdqa        %xmm13,%xmm1
-  .byte  102,15,250,13,174,22,1,0            // psubd         0x116ae(%rip),%xmm1        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,13,112,23,1,0            // psubd         0x11770(%rip),%xmm1        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,72,15,58,22,201,1               // pextrq        $0x1,%xmm1,%rcx
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
   .byte  137,221                             // mov           %ebx,%ebp
@@ -34642,7 +34754,7 @@
   .byte  102,65,15,111,206                   // movdqa        %xmm14,%xmm1
   .byte  102,15,111,108,36,192               // movdqa        -0x40(%rsp),%xmm5
   .byte  102,15,254,205                      // paddd         %xmm5,%xmm1
-  .byte  102,15,111,37,69,21,1,0             // movdqa        0x11545(%rip),%xmm4        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,37,7,22,1,0              // movdqa        0x11607(%rip),%xmm4        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,56,64,204                    // pmulld        %xmm4,%xmm1
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,118,246                      // pcmpeqd       %xmm6,%xmm6
@@ -34663,7 +34775,7 @@
   .byte  102,65,15,58,22,201,1               // pextrd        $0x1,%xmm1,%r9d
   .byte  102,65,15,58,22,202,2               // pextrd        $0x2,%xmm1,%r10d
   .byte  102,65,15,58,22,203,3               // pextrd        $0x3,%xmm1,%r11d
-  .byte  102,15,111,29,86,14,1,0             // movdqa        0x10e56(%rip),%xmm3        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,29,24,15,1,0             // movdqa        0x10f18(%rip),%xmm3        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,254,203                      // paddd         %xmm3,%xmm1
   .byte  102,72,15,58,22,201,1               // pextrq        $0x1,%xmm1,%rcx
   .byte  102,72,15,126,203                   // movq          %xmm1,%rbx
@@ -34735,7 +34847,7 @@
   .byte  102,15,56,64,239                    // pmulld        %xmm7,%xmm5
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
-  .byte  102,15,250,5,118,19,1,0             // psubd         0x11376(%rip),%xmm0        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,5,56,20,1,0              // psubd         0x11438(%rip),%xmm0        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,197                   // movq          %xmm0,%rbp
   .byte  137,235                             // mov           %ebp,%ebx
@@ -34753,7 +34865,7 @@
   .byte  102,65,15,58,22,193,1               // pextrd        $0x1,%xmm0,%r9d
   .byte  102,65,15,58,22,194,2               // pextrd        $0x2,%xmm0,%r10d
   .byte  102,65,15,58,22,195,3               // pextrd        $0x3,%xmm0,%r11d
-  .byte  102,15,254,5,132,12,1,0             // paddd         0x10c84(%rip),%xmm0        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,5,70,13,1,0              // paddd         0x10d46(%rip),%xmm0        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
   .byte  137,221                             // mov           %ebx,%ebp
@@ -34769,7 +34881,7 @@
   .byte  102,15,254,84,36,176                // paddd         -0x50(%rsp),%xmm2
   .byte  102,15,56,64,215                    // pmulld        %xmm7,%xmm2
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
-  .byte  102,15,250,5,189,18,1,0             // psubd         0x112bd(%rip),%xmm0        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,5,127,19,1,0             // psubd         0x1137f(%rip),%xmm0        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,72,15,58,22,193,1               // pextrq        $0x1,%xmm0,%rcx
   .byte  102,72,15,126,195                   // movq          %xmm0,%rbx
   .byte  137,221                             // mov           %ebx,%ebp
@@ -34787,7 +34899,7 @@
   .byte  102,65,15,58,22,199,1               // pextrd        $0x1,%xmm0,%r15d
   .byte  102,65,15,58,22,196,2               // pextrd        $0x2,%xmm0,%r12d
   .byte  102,65,15,58,22,198,3               // pextrd        $0x3,%xmm0,%r14d
-  .byte  102,15,254,5,203,11,1,0             // paddd         0x10bcb(%rip),%xmm0        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,5,141,12,1,0             // paddd         0x10c8d(%rip),%xmm0        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,72,15,58,22,195,1               // pextrq        $0x1,%xmm0,%rbx
   .byte  102,72,15,126,197                   // movq          %xmm0,%rbp
   .byte  137,233                             // mov           %ebp,%ecx
@@ -34850,7 +34962,7 @@
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  65,15,88,211                        // addps         %xmm11,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,136,10,1,0                 // movaps        0x10a88(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,74,11,1,0                  // movaps        0x10b4a(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,139,76,36,248                    // mov           -0x8(%rsp),%rcx
   .byte  15,40,100,36,64                     // movaps        0x40(%rsp),%xmm4
   .byte  15,40,108,36,80                     // movaps        0x50(%rsp),%xmm5
@@ -34886,13 +34998,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  115,83                              // jae           1a616 <_sk_start_pipeline_sse2+0x82>
+  .byte  115,83                              // jae           1a8b4 <_sk_start_pipeline_sse2+0x82>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,4                         // lea           0x4(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,35                              // ja            1a5fc <_sk_start_pipeline_sse2+0x68>
+  .byte  119,35                              // ja            1a89a <_sk_start_pipeline_sse2+0x68>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  76,137,246                          // mov           %r14,%rsi
@@ -34903,16 +35015,16 @@
   .byte  73,131,196,8                        // add           $0x8,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,225                             // jbe           1a5dd <_sk_start_pipeline_sse2+0x49>
+  .byte  118,225                             // jbe           1a87b <_sk_start_pipeline_sse2+0x49>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,9                               // je            1a60d <_sk_start_pipeline_sse2+0x79>
+  .byte  116,9                               // je            1a8ab <_sk_start_pipeline_sse2+0x79>
   .byte  76,137,246                          // mov           %r14,%rsi
   .byte  72,137,217                          // mov           %rbx,%rcx
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,185                             // jne           1a5cf <_sk_start_pipeline_sse2+0x3b>
+  .byte  117,185                             // jne           1a86d <_sk_start_pipeline_sse2+0x3b>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -34935,13 +35047,13 @@
   .byte  102,15,110,194                      // movd          %edx,%xmm0
   .byte  102,15,112,192,0                    // pshufd        $0x0,%xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,88,5,151,9,1,0                   // addps         0x10997(%rip),%xmm0        # 2afd0 <_sk_srcover_rgba_8888_sse2_lowp+0xa34>
+  .byte  15,88,5,89,10,1,0                   // addps         0x10a59(%rip),%xmm0        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xa34>
   .byte  102,15,110,201                      // movd          %ecx,%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,88,13,148,9,1,0                  // addps         0x10994(%rip),%xmm1        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,88,13,86,10,1,0                  // addps         0x10a56(%rip),%xmm1        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,21,155,9,1,0                  // movaps        0x1099b(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,93,10,1,0                  // movaps        0x10a5d(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
@@ -34956,18 +35068,18 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,68,15,110,194                   // movd          %edx,%xmm8
   .byte  102,69,15,112,192,0                 // pshufd        $0x0,%xmm8,%xmm8
-  .byte  102,68,15,254,5,52,9,1,0            // paddd         0x10934(%rip),%xmm8        # 2afb0 <_sk_srcover_rgba_8888_sse2_lowp+0xa14>
+  .byte  102,68,15,254,5,246,9,1,0           // paddd         0x109f6(%rip),%xmm8        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xa14>
   .byte  102,68,15,110,201                   // movd          %ecx,%xmm9
   .byte  102,69,15,112,201,0                 // pshufd        $0x0,%xmm9,%xmm9
   .byte  102,69,15,239,200                   // pxor          %xmm8,%xmm9
-  .byte  102,68,15,111,21,107,9,1,0          // movdqa        0x1096b(%rip),%xmm10        # 2b000 <_sk_srcover_rgba_8888_sse2_lowp+0xa64>
+  .byte  102,68,15,111,21,45,10,1,0          // movdqa        0x10a2d(%rip),%xmm10        # 2b360 <_sk_srcover_rgba_8888_sse2_lowp+0xa64>
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
   .byte  102,69,15,219,218                   // pand          %xmm10,%xmm11
   .byte  102,65,15,114,243,5                 // pslld         $0x5,%xmm11
   .byte  102,69,15,219,208                   // pand          %xmm8,%xmm10
   .byte  102,65,15,114,242,4                 // pslld         $0x4,%xmm10
-  .byte  102,68,15,111,37,87,9,1,0           // movdqa        0x10957(%rip),%xmm12        # 2b010 <_sk_srcover_rgba_8888_sse2_lowp+0xa74>
-  .byte  102,68,15,111,45,94,9,1,0           // movdqa        0x1095e(%rip),%xmm13        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,37,25,10,1,0          // movdqa        0x10a19(%rip),%xmm12        # 2b370 <_sk_srcover_rgba_8888_sse2_lowp+0xa74>
+  .byte  102,68,15,111,45,32,10,1,0          // movdqa        0x10a20(%rip),%xmm13        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,69,15,111,241                   // movdqa        %xmm9,%xmm14
   .byte  102,69,15,219,245                   // pand          %xmm13,%xmm14
   .byte  102,65,15,114,246,2                 // pslld         $0x2,%xmm14
@@ -34983,8 +35095,8 @@
   .byte  102,69,15,235,198                   // por           %xmm14,%xmm8
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,25,9,1,0                 // mulps         0x10919(%rip),%xmm8        # 2b030 <_sk_srcover_rgba_8888_sse2_lowp+0xa94>
-  .byte  68,15,88,5,33,9,1,0                 // addps         0x10921(%rip),%xmm8        # 2b040 <_sk_srcover_rgba_8888_sse2_lowp+0xaa4>
+  .byte  68,15,89,5,219,9,1,0                // mulps         0x109db(%rip),%xmm8        # 2b390 <_sk_srcover_rgba_8888_sse2_lowp+0xa94>
+  .byte  68,15,88,5,227,9,1,0                // addps         0x109e3(%rip),%xmm8        # 2b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaa4>
   .byte  243,68,15,16,16                     // movss         (%rax),%xmm10
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
   .byte  69,15,89,208                        // mulps         %xmm8,%xmm10
@@ -35026,7 +35138,7 @@
 FUNCTION(_sk_black_color_sse2)
 _sk_black_color_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,87,8,1,0                   // movaps        0x10857(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,25,9,1,0                   // movaps        0x10919(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -35037,7 +35149,7 @@
 FUNCTION(_sk_white_color_sse2)
 _sk_white_color_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,67,8,1,0                    // movaps        0x10843(%rip),%xmm0        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,5,5,9,1,0                     // movaps        0x10905(%rip),%xmm0        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -35083,7 +35195,7 @@
 FUNCTION(_sk_srcatop_sse2)
 _sk_srcatop_sse2:
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  68,15,40,5,243,7,1,0                // movaps        0x107f3(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,181,8,1,0                // movaps        0x108b5(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -35108,7 +35220,7 @@
 _sk_dstatop_sse2:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
   .byte  68,15,89,196                        // mulps         %xmm4,%xmm8
-  .byte  68,15,40,13,166,7,1,0               // movaps        0x107a6(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,104,8,1,0               // movaps        0x10868(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
@@ -35155,7 +35267,7 @@
 .globl _sk_srcout_sse2
 FUNCTION(_sk_srcout_sse2)
 _sk_srcout_sse2:
-  .byte  68,15,40,5,58,7,1,0                 // movaps        0x1073a(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,252,7,1,0                // movaps        0x107fc(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
@@ -35168,7 +35280,7 @@
 .globl _sk_dstout_sse2
 FUNCTION(_sk_dstout_sse2)
 _sk_dstout_sse2:
-  .byte  68,15,40,5,26,7,1,0                 // movaps        0x1071a(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,220,7,1,0                // movaps        0x107dc(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -35185,7 +35297,7 @@
 .globl _sk_srcover_sse2
 FUNCTION(_sk_srcover_sse2)
 _sk_srcover_sse2:
-  .byte  68,15,40,5,237,6,1,0                // movaps        0x106ed(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,175,7,1,0                // movaps        0x107af(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -35205,7 +35317,7 @@
 .globl _sk_dstover_sse2
 FUNCTION(_sk_dstover_sse2)
 _sk_dstover_sse2:
-  .byte  68,15,40,5,177,6,1,0                // movaps        0x106b1(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,115,7,1,0                // movaps        0x10773(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -35233,7 +35345,7 @@
 .globl _sk_multiply_sse2
 FUNCTION(_sk_multiply_sse2)
 _sk_multiply_sse2:
-  .byte  68,15,40,5,117,6,1,0                // movaps        0x10675(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,55,7,1,0                 // movaps        0x10737(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
@@ -35271,7 +35383,7 @@
 FUNCTION(_sk_plus__sse2)
 _sk_plus__sse2:
   .byte  15,88,196                           // addps         %xmm4,%xmm0
-  .byte  68,15,40,5,246,5,1,0                // movaps        0x105f6(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,184,6,1,0                // movaps        0x106b8(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  15,88,205                           // addps         %xmm5,%xmm1
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
@@ -35313,7 +35425,7 @@
 FUNCTION(_sk_xor__sse2)
 _sk_xor__sse2:
   .byte  68,15,40,195                        // movaps        %xmm3,%xmm8
-  .byte  15,40,29,130,5,1,0                  // movaps        0x10582(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,68,6,1,0                   // movaps        0x10644(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,40,203                        // movaps        %xmm3,%xmm9
   .byte  68,15,92,207                        // subps         %xmm7,%xmm9
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
@@ -35361,7 +35473,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,95,209                        // maxps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,221,4,1,0                  // movaps        0x104dd(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,159,5,1,0                  // movaps        0x1059f(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35395,7 +35507,7 @@
   .byte  68,15,89,206                        // mulps         %xmm6,%xmm9
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,114,4,1,0                  // movaps        0x10472(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,52,5,1,0                   // movaps        0x10534(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35432,7 +35544,7 @@
   .byte  65,15,93,209                        // minps         %xmm9,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,252,3,1,0                  // movaps        0x103fc(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,190,4,1,0                  // movaps        0x104be(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35460,7 +35572,7 @@
   .byte  15,89,214                           // mulps         %xmm6,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  68,15,92,194                        // subps         %xmm2,%xmm8
-  .byte  15,40,21,172,3,1,0                  // movaps        0x103ac(%rip),%xmm2        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,21,110,4,1,0                  // movaps        0x1046e(%rip),%xmm2        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,215                           // mulps         %xmm7,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -35473,7 +35585,7 @@
 FUNCTION(_sk_colorburn_sse2)
 _sk_colorburn_sse2:
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
-  .byte  68,15,40,13,143,3,1,0               // movaps        0x1038f(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,81,4,1,0                // movaps        0x10451(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  68,15,92,215                        // subps         %xmm7,%xmm10
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
@@ -35568,7 +35680,7 @@
 FUNCTION(_sk_colordodge_sse2)
 _sk_colordodge_sse2:
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
-  .byte  68,15,40,21,55,2,1,0                // movaps        0x10237(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,249,2,1,0               // movaps        0x102f9(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
   .byte  68,15,92,223                        // subps         %xmm7,%xmm11
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
@@ -35660,7 +35772,7 @@
   .byte  15,41,116,36,232                    // movaps        %xmm6,-0x18(%rsp)
   .byte  15,40,245                           // movaps        %xmm5,%xmm6
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
-  .byte  68,15,40,29,224,0,1,0               // movaps        0x100e0(%rip),%xmm11        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,29,162,1,1,0               // movaps        0x101a2(%rip),%xmm11        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,211                        // movaps        %xmm11,%xmm10
   .byte  68,15,92,215                        // subps         %xmm7,%xmm10
   .byte  69,15,40,194                        // movaps        %xmm10,%xmm8
@@ -35748,7 +35860,7 @@
 _sk_overlay_sse2:
   .byte  68,15,40,193                        // movaps        %xmm1,%xmm8
   .byte  68,15,40,232                        // movaps        %xmm0,%xmm13
-  .byte  68,15,40,13,158,255,0,0             // movaps        0xff9e(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,96,0,1,0                // movaps        0x10060(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  68,15,92,215                        // subps         %xmm7,%xmm10
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
@@ -35839,7 +35951,7 @@
   .byte  68,15,40,213                        // movaps        %xmm5,%xmm10
   .byte  68,15,94,215                        // divps         %xmm7,%xmm10
   .byte  69,15,84,212                        // andps         %xmm12,%xmm10
-  .byte  68,15,40,13,75,254,0,0              // movaps        0xfe4b(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,13,255,0,0              // movaps        0xff0d(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,249                        // movaps        %xmm9,%xmm15
   .byte  69,15,92,250                        // subps         %xmm10,%xmm15
   .byte  69,15,40,218                        // movaps        %xmm10,%xmm11
@@ -35852,10 +35964,10 @@
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  65,15,88,194                        // addps         %xmm10,%xmm0
-  .byte  68,15,40,53,117,254,0,0             // movaps        0xfe75(%rip),%xmm14        # 2b050 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
+  .byte  68,15,40,53,55,255,0,0              // movaps        0xff37(%rip),%xmm14        # 2b3b0 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
   .byte  69,15,88,222                        // addps         %xmm14,%xmm11
   .byte  68,15,89,216                        // mulps         %xmm0,%xmm11
-  .byte  68,15,40,21,117,254,0,0             // movaps        0xfe75(%rip),%xmm10        # 2b060 <_sk_srcover_rgba_8888_sse2_lowp+0xac4>
+  .byte  68,15,40,21,55,255,0,0              // movaps        0xff37(%rip),%xmm10        # 2b3c0 <_sk_srcover_rgba_8888_sse2_lowp+0xac4>
   .byte  69,15,89,234                        // mulps         %xmm10,%xmm13
   .byte  69,15,88,235                        // addps         %xmm11,%xmm13
   .byte  15,88,228                           // addps         %xmm4,%xmm4
@@ -36000,7 +36112,7 @@
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  68,15,89,211                        // mulps         %xmm3,%xmm10
-  .byte  68,15,40,5,8,252,0,0                // movaps        0xfc08(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,202,252,0,0              // movaps        0xfcca(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,216                        // movaps        %xmm8,%xmm11
   .byte  15,40,207                           // movaps        %xmm7,%xmm1
   .byte  68,15,92,217                        // subps         %xmm1,%xmm11
@@ -36048,12 +36160,12 @@
   .byte  69,15,84,206                        // andps         %xmm14,%xmm9
   .byte  69,15,84,214                        // andps         %xmm14,%xmm10
   .byte  65,15,84,214                        // andps         %xmm14,%xmm2
-  .byte  68,15,40,61,197,251,0,0             // movaps        0xfbc5(%rip),%xmm15        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,61,135,252,0,0             // movaps        0xfc87(%rip),%xmm15        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  65,15,89,231                        // mulps         %xmm15,%xmm4
-  .byte  15,40,5,202,251,0,0                 // movaps        0xfbca(%rip),%xmm0        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  15,40,5,140,252,0,0                 // movaps        0xfc8c(%rip),%xmm0        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  15,89,240                           // mulps         %xmm0,%xmm6
   .byte  15,88,244                           // addps         %xmm4,%xmm6
-  .byte  68,15,40,53,204,251,0,0             // movaps        0xfbcc(%rip),%xmm14        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,53,142,252,0,0             // movaps        0xfc8e(%rip),%xmm14        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  68,15,40,239                        // movaps        %xmm7,%xmm13
   .byte  69,15,89,238                        // mulps         %xmm14,%xmm13
   .byte  68,15,88,238                        // addps         %xmm6,%xmm13
@@ -36231,14 +36343,14 @@
   .byte  68,15,84,211                        // andps         %xmm3,%xmm10
   .byte  68,15,84,203                        // andps         %xmm3,%xmm9
   .byte  15,84,195                           // andps         %xmm3,%xmm0
-  .byte  68,15,40,5,30,249,0,0               // movaps        0xf91e(%rip),%xmm8        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,5,224,249,0,0              // movaps        0xf9e0(%rip),%xmm8        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  15,40,214                           // movaps        %xmm6,%xmm2
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
-  .byte  15,40,13,32,249,0,0                 // movaps        0xf920(%rip),%xmm1        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  15,40,13,226,249,0,0                // movaps        0xf9e2(%rip),%xmm1        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  15,40,221                           // movaps        %xmm5,%xmm3
   .byte  15,89,217                           // mulps         %xmm1,%xmm3
   .byte  15,88,218                           // addps         %xmm2,%xmm3
-  .byte  68,15,40,37,31,249,0,0              // movaps        0xf91f(%rip),%xmm12        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,37,225,249,0,0             // movaps        0xf9e1(%rip),%xmm12        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
   .byte  68,15,88,235                        // addps         %xmm3,%xmm13
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
@@ -36283,7 +36395,7 @@
   .byte  15,40,223                           // movaps        %xmm7,%xmm3
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,89,221                           // mulps         %xmm5,%xmm3
-  .byte  68,15,40,5,212,247,0,0              // movaps        0xf7d4(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,150,248,0,0              // movaps        0xf896(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,40,224                        // movaps        %xmm8,%xmm4
   .byte  68,15,92,199                        // subps         %xmm7,%xmm8
   .byte  15,88,253                           // addps         %xmm5,%xmm7
@@ -36384,14 +36496,14 @@
   .byte  68,15,40,213                        // movaps        %xmm5,%xmm10
   .byte  69,15,89,208                        // mulps         %xmm8,%xmm10
   .byte  65,15,40,208                        // movaps        %xmm8,%xmm2
-  .byte  68,15,40,45,226,246,0,0             // movaps        0xf6e2(%rip),%xmm13        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,45,164,247,0,0             // movaps        0xf7a4(%rip),%xmm13        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  68,15,40,198                        // movaps        %xmm6,%xmm8
   .byte  69,15,89,197                        // mulps         %xmm13,%xmm8
-  .byte  68,15,40,53,226,246,0,0             // movaps        0xf6e2(%rip),%xmm14        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  68,15,40,53,164,247,0,0             // movaps        0xf7a4(%rip),%xmm14        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  65,15,40,195                        // movaps        %xmm11,%xmm0
   .byte  65,15,89,198                        // mulps         %xmm14,%xmm0
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,29,222,246,0,0             // movaps        0xf6de(%rip),%xmm11        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,29,160,247,0,0             // movaps        0xf7a0(%rip),%xmm11        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
   .byte  69,15,89,227                        // mulps         %xmm11,%xmm12
   .byte  68,15,88,224                        // addps         %xmm0,%xmm12
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
@@ -36399,7 +36511,7 @@
   .byte  69,15,40,250                        // movaps        %xmm10,%xmm15
   .byte  69,15,89,254                        // mulps         %xmm14,%xmm15
   .byte  68,15,88,248                        // addps         %xmm0,%xmm15
-  .byte  68,15,40,5,26,246,0,0               // movaps        0xf61a(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,220,246,0,0              // movaps        0xf6dc(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,40,224                        // movaps        %xmm8,%xmm4
   .byte  15,92,226                           // subps         %xmm2,%xmm4
   .byte  15,89,252                           // mulps         %xmm4,%xmm7
@@ -36535,15 +36647,15 @@
   .byte  68,15,40,205                        // movaps        %xmm5,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
   .byte  15,89,222                           // mulps         %xmm6,%xmm3
-  .byte  68,15,40,37,161,244,0,0             // movaps        0xf4a1(%rip),%xmm12        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,37,99,245,0,0              // movaps        0xf563(%rip),%xmm12        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  68,15,40,199                        // movaps        %xmm7,%xmm8
   .byte  69,15,89,196                        // mulps         %xmm12,%xmm8
-  .byte  68,15,40,45,161,244,0,0             // movaps        0xf4a1(%rip),%xmm13        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
+  .byte  68,15,40,45,99,245,0,0              // movaps        0xf563(%rip),%xmm13        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xae4>
   .byte  68,15,40,241                        // movaps        %xmm1,%xmm14
   .byte  69,15,89,245                        // mulps         %xmm13,%xmm14
   .byte  69,15,88,240                        // addps         %xmm8,%xmm14
-  .byte  68,15,40,29,157,244,0,0             // movaps        0xf49d(%rip),%xmm11        # 2b090 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
-  .byte  68,15,40,5,245,243,0,0              // movaps        0xf3f5(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,29,95,245,0,0              // movaps        0xf55f(%rip),%xmm11        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf4>
+  .byte  68,15,40,5,183,244,0,0              // movaps        0xf4b7(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,248                        // movaps        %xmm8,%xmm15
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  68,15,92,248                        // subps         %xmm0,%xmm15
@@ -36684,10 +36796,10 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,228,0,0,0                    // jne           1bee6 <_sk_srcover_rgba_8888_sse2+0x104>
+  .byte  15,133,228,0,0,0                    // jne           1c184 <_sk_srcover_rgba_8888_sse2+0x104>
   .byte  243,69,15,111,4,128                 // movdqu        (%r8,%rax,4),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  102,15,111,53,141,242,0,0           // movdqa        0xf28d(%rip),%xmm6        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,53,79,243,0,0            // movdqa        0xf34f(%rip),%xmm6        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,224                   // movdqa        %xmm8,%xmm4
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
@@ -36701,9 +36813,9 @@
   .byte  15,91,247                           // cvtdq2ps      %xmm7,%xmm6
   .byte  102,65,15,114,208,24                // psrld         $0x18,%xmm8
   .byte  65,15,91,248                        // cvtdq2ps      %xmm8,%xmm7
-  .byte  68,15,40,5,157,241,0,0              // movaps        0xf19d(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,95,242,0,0               // movaps        0xf25f(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,92,195                        // subps         %xmm3,%xmm8
-  .byte  68,15,40,37,113,242,0,0             // movaps        0xf271(%rip),%xmm12        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,37,51,243,0,0              // movaps        0xf333(%rip),%xmm12        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  65,15,89,196                        // mulps         %xmm12,%xmm0
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,89,204                        // mulps         %xmm4,%xmm9
@@ -36729,7 +36841,7 @@
   .byte  102,15,114,240,24                   // pslld         $0x18,%xmm0
   .byte  102,15,235,194                      // por           %xmm2,%xmm0
   .byte  102,15,235,193                      // por           %xmm1,%xmm0
-  .byte  117,84                              // jne           1bf20 <_sk_srcover_rgba_8888_sse2+0x13e>
+  .byte  117,84                              // jne           1c1be <_sk_srcover_rgba_8888_sse2+0x13e>
   .byte  243,65,15,127,4,128                 // movdqu        %xmm0,(%r8,%rax,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
@@ -36740,32 +36852,32 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,90                              // je            1bf4d <_sk_srcover_rgba_8888_sse2+0x16b>
+  .byte  116,90                              // je            1c1eb <_sk_srcover_rgba_8888_sse2+0x16b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1bf15 <_sk_srcover_rgba_8888_sse2+0x133>
+  .byte  116,23                              // je            1c1b3 <_sk_srcover_rgba_8888_sse2+0x133>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,0,255,255,255                // jne           1be08 <_sk_srcover_rgba_8888_sse2+0x26>
+  .byte  15,133,0,255,255,255                // jne           1c0a6 <_sk_srcover_rgba_8888_sse2+0x26>
   .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,18,4,128                  // movlpd        (%r8,%rax,4),%xmm8
-  .byte  233,232,254,255,255                 // jmpq          1be08 <_sk_srcover_rgba_8888_sse2+0x26>
+  .byte  233,232,254,255,255                 // jmpq          1c0a6 <_sk_srcover_rgba_8888_sse2+0x26>
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,43                              // je            1bf58 <_sk_srcover_rgba_8888_sse2+0x176>
+  .byte  116,43                              // je            1c1f6 <_sk_srcover_rgba_8888_sse2+0x176>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            1bf45 <_sk_srcover_rgba_8888_sse2+0x163>
+  .byte  116,18                              // je            1c1e3 <_sk_srcover_rgba_8888_sse2+0x163>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,153                             // jne           1bed2 <_sk_srcover_rgba_8888_sse2+0xf0>
+  .byte  117,153                             // jne           1c170 <_sk_srcover_rgba_8888_sse2+0xf0>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,65,15,126,76,128,8              // movd          %xmm1,0x8(%r8,%rax,4)
   .byte  102,65,15,214,4,128                 // movq          %xmm0,(%r8,%rax,4)
-  .byte  235,133                             // jmp           1bed2 <_sk_srcover_rgba_8888_sse2+0xf0>
+  .byte  235,133                             // jmp           1c170 <_sk_srcover_rgba_8888_sse2+0xf0>
   .byte  102,69,15,110,4,128                 // movd          (%r8,%rax,4),%xmm8
-  .byte  233,176,254,255,255                 // jmpq          1be08 <_sk_srcover_rgba_8888_sse2+0x26>
+  .byte  233,176,254,255,255                 // jmpq          1c0a6 <_sk_srcover_rgba_8888_sse2+0x26>
   .byte  102,65,15,126,4,128                 // movd          %xmm0,(%r8,%rax,4)
-  .byte  233,111,255,255,255                 // jmpq          1bed2 <_sk_srcover_rgba_8888_sse2+0xf0>
+  .byte  233,111,255,255,255                 // jmpq          1c170 <_sk_srcover_rgba_8888_sse2+0xf0>
 
 HIDDEN _sk_clamp_0_sse2
 .globl _sk_clamp_0_sse2
@@ -36783,7 +36895,7 @@
 .globl _sk_clamp_1_sse2
 FUNCTION(_sk_clamp_1_sse2)
 _sk_clamp_1_sse2:
-  .byte  68,15,40,5,109,240,0,0              // movaps        0xf06d(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,47,241,0,0               // movaps        0xf12f(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,93,192                        // minps         %xmm8,%xmm0
   .byte  65,15,93,200                        // minps         %xmm8,%xmm1
   .byte  65,15,93,208                        // minps         %xmm8,%xmm2
@@ -36795,7 +36907,7 @@
 .globl _sk_clamp_a_sse2
 FUNCTION(_sk_clamp_a_sse2)
 _sk_clamp_a_sse2:
-  .byte  15,93,29,82,240,0,0                 // minps         0xf052(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,29,20,241,0,0                 // minps         0xf114(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,93,195                           // minps         %xmm3,%xmm0
   .byte  15,93,203                           // minps         %xmm3,%xmm1
   .byte  15,93,211                           // minps         %xmm3,%xmm2
@@ -36806,7 +36918,7 @@
 .globl _sk_clamp_a_dst_sse2
 FUNCTION(_sk_clamp_a_dst_sse2)
 _sk_clamp_a_dst_sse2:
-  .byte  15,93,61,62,240,0,0                 // minps         0xf03e(%rip),%xmm7        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,93,61,0,241,0,0                  // minps         0xf100(%rip),%xmm7        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,93,231                           // minps         %xmm7,%xmm4
   .byte  15,93,239                           // minps         %xmm7,%xmm5
   .byte  15,93,247                           // minps         %xmm7,%xmm6
@@ -36841,7 +36953,7 @@
 .globl _sk_invert_sse2
 FUNCTION(_sk_invert_sse2)
 _sk_invert_sse2:
-  .byte  68,15,40,5,250,239,0,0              // movaps        0xeffa(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,5,188,240,0,0              // movaps        0xf0bc(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  68,15,92,200                        // subps         %xmm0,%xmm9
   .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
@@ -36903,7 +37015,7 @@
 FUNCTION(_sk_unpremul_sse2)
 _sk_unpremul_sse2:
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,40,13,132,239,0,0             // movaps        0xef84(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,70,240,0,0              // movaps        0xf046(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,94,203                        // divps         %xmm3,%xmm9
   .byte  68,15,194,195,4                     // cmpneqps      %xmm3,%xmm8
   .byte  69,15,84,193                        // andps         %xmm9,%xmm8
@@ -36917,20 +37029,20 @@
 .globl _sk_from_srgb_sse2
 FUNCTION(_sk_from_srgb_sse2)
 _sk_from_srgb_sse2:
-  .byte  68,15,40,5,79,240,0,0               // movaps        0xf04f(%rip),%xmm8        # 2b0e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
+  .byte  68,15,40,5,17,241,0,0               // movaps        0xf111(%rip),%xmm8        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
   .byte  68,15,40,232                        // movaps        %xmm0,%xmm13
   .byte  69,15,89,232                        // mulps         %xmm8,%xmm13
   .byte  68,15,40,216                        // movaps        %xmm0,%xmm11
   .byte  69,15,89,219                        // mulps         %xmm11,%xmm11
-  .byte  68,15,40,13,199,239,0,0             // movaps        0xefc7(%rip),%xmm9        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,13,137,240,0,0             // movaps        0xf089(%rip),%xmm9        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
   .byte  69,15,89,241                        // mulps         %xmm9,%xmm14
-  .byte  68,15,40,21,55,240,0,0              // movaps        0xf037(%rip),%xmm10        # 2b0f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
+  .byte  68,15,40,21,249,240,0,0             // movaps        0xf0f9(%rip),%xmm10        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
   .byte  69,15,88,242                        // addps         %xmm10,%xmm14
   .byte  69,15,89,243                        // mulps         %xmm11,%xmm14
-  .byte  68,15,40,29,55,240,0,0              // movaps        0xf037(%rip),%xmm11        # 2b100 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
+  .byte  68,15,40,29,249,240,0,0             // movaps        0xf0f9(%rip),%xmm11        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,40,37,59,240,0,0              // movaps        0xf03b(%rip),%xmm12        # 2b110 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
+  .byte  68,15,40,37,253,240,0,0             // movaps        0xf0fd(%rip),%xmm12        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
   .byte  65,15,194,196,1                     // cmpltps       %xmm12,%xmm0
   .byte  68,15,84,232                        // andps         %xmm0,%xmm13
   .byte  65,15,85,198                        // andnps        %xmm14,%xmm0
@@ -36966,20 +37078,20 @@
 .globl _sk_from_srgb_dst_sse2
 FUNCTION(_sk_from_srgb_dst_sse2)
 _sk_from_srgb_dst_sse2:
-  .byte  68,15,40,5,140,239,0,0              // movaps        0xef8c(%rip),%xmm8        # 2b0e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
+  .byte  68,15,40,5,78,240,0,0               // movaps        0xf04e(%rip),%xmm8        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xb44>
   .byte  68,15,40,236                        // movaps        %xmm4,%xmm13
   .byte  69,15,89,232                        // mulps         %xmm8,%xmm13
   .byte  68,15,40,220                        // movaps        %xmm4,%xmm11
   .byte  69,15,89,219                        // mulps         %xmm11,%xmm11
-  .byte  68,15,40,13,4,239,0,0               // movaps        0xef04(%rip),%xmm9        # 2b070 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
+  .byte  68,15,40,13,198,239,0,0             // movaps        0xefc6(%rip),%xmm9        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xad4>
   .byte  68,15,40,244                        // movaps        %xmm4,%xmm14
   .byte  69,15,89,241                        // mulps         %xmm9,%xmm14
-  .byte  68,15,40,21,116,239,0,0             // movaps        0xef74(%rip),%xmm10        # 2b0f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
+  .byte  68,15,40,21,54,240,0,0              // movaps        0xf036(%rip),%xmm10        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xb54>
   .byte  69,15,88,242                        // addps         %xmm10,%xmm14
   .byte  69,15,89,243                        // mulps         %xmm11,%xmm14
-  .byte  68,15,40,29,116,239,0,0             // movaps        0xef74(%rip),%xmm11        # 2b100 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
+  .byte  68,15,40,29,54,240,0,0              // movaps        0xf036(%rip),%xmm11        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xb64>
   .byte  69,15,88,243                        // addps         %xmm11,%xmm14
-  .byte  68,15,40,37,120,239,0,0             // movaps        0xef78(%rip),%xmm12        # 2b110 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
+  .byte  68,15,40,37,58,240,0,0              // movaps        0xf03a(%rip),%xmm12        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xb74>
   .byte  65,15,194,228,1                     // cmpltps       %xmm12,%xmm4
   .byte  68,15,84,236                        // andps         %xmm4,%xmm13
   .byte  65,15,85,230                        // andnps        %xmm14,%xmm4
@@ -37016,22 +37128,22 @@
 FUNCTION(_sk_to_srgb_sse2)
 _sk_to_srgb_sse2:
   .byte  68,15,82,232                        // rsqrtps       %xmm0,%xmm13
-  .byte  68,15,40,5,5,239,0,0                // movaps        0xef05(%rip),%xmm8        # 2b120 <_sk_srcover_rgba_8888_sse2_lowp+0xb84>
+  .byte  68,15,40,5,199,239,0,0              // movaps        0xefc7(%rip),%xmm8        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xb84>
   .byte  68,15,40,240                        // movaps        %xmm0,%xmm14
   .byte  69,15,89,240                        // mulps         %xmm8,%xmm14
-  .byte  68,15,40,13,5,239,0,0               // movaps        0xef05(%rip),%xmm9        # 2b130 <_sk_srcover_rgba_8888_sse2_lowp+0xb94>
+  .byte  68,15,40,13,199,239,0,0             // movaps        0xefc7(%rip),%xmm9        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xb94>
   .byte  69,15,40,253                        // movaps        %xmm13,%xmm15
   .byte  69,15,89,249                        // mulps         %xmm9,%xmm15
-  .byte  68,15,40,21,5,239,0,0               // movaps        0xef05(%rip),%xmm10        # 2b140 <_sk_srcover_rgba_8888_sse2_lowp+0xba4>
+  .byte  68,15,40,21,199,239,0,0             // movaps        0xefc7(%rip),%xmm10        # 2b4a0 <_sk_srcover_rgba_8888_sse2_lowp+0xba4>
   .byte  69,15,88,250                        // addps         %xmm10,%xmm15
   .byte  69,15,89,253                        // mulps         %xmm13,%xmm15
-  .byte  68,15,40,29,5,239,0,0               // movaps        0xef05(%rip),%xmm11        # 2b150 <_sk_srcover_rgba_8888_sse2_lowp+0xbb4>
+  .byte  68,15,40,29,199,239,0,0             // movaps        0xefc7(%rip),%xmm11        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xbb4>
   .byte  69,15,88,251                        // addps         %xmm11,%xmm15
-  .byte  68,15,40,37,9,239,0,0               // movaps        0xef09(%rip),%xmm12        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0xbc4>
+  .byte  68,15,40,37,203,239,0,0             // movaps        0xefcb(%rip),%xmm12        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xbc4>
   .byte  69,15,88,236                        // addps         %xmm12,%xmm13
   .byte  69,15,83,237                        // rcpps         %xmm13,%xmm13
   .byte  69,15,89,239                        // mulps         %xmm15,%xmm13
-  .byte  68,15,40,61,5,239,0,0               // movaps        0xef05(%rip),%xmm15        # 2b170 <_sk_srcover_rgba_8888_sse2_lowp+0xbd4>
+  .byte  68,15,40,61,199,239,0,0             // movaps        0xefc7(%rip),%xmm15        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xbd4>
   .byte  65,15,194,199,1                     // cmpltps       %xmm15,%xmm0
   .byte  68,15,84,240                        // andps         %xmm0,%xmm14
   .byte  65,15,85,197                        // andnps        %xmm13,%xmm0
@@ -37083,7 +37195,7 @@
   .byte  68,15,93,216                        // minps         %xmm0,%xmm11
   .byte  65,15,40,202                        // movaps        %xmm10,%xmm1
   .byte  65,15,92,203                        // subps         %xmm11,%xmm1
-  .byte  68,15,40,45,200,236,0,0             // movaps        0xecc8(%rip),%xmm13        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,45,138,237,0,0             // movaps        0xed8a(%rip),%xmm13        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  68,15,94,233                        // divps         %xmm1,%xmm13
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  65,15,194,192,0                     // cmpeqps       %xmm8,%xmm0
@@ -37092,30 +37204,30 @@
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,40,241                        // movaps        %xmm9,%xmm14
   .byte  68,15,194,242,1                     // cmpltps       %xmm2,%xmm14
-  .byte  68,15,84,53,46,238,0,0              // andps         0xee2e(%rip),%xmm14        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
+  .byte  68,15,84,53,240,238,0,0             // andps         0xeef0(%rip),%xmm14        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
   .byte  69,15,88,244                        // addps         %xmm12,%xmm14
   .byte  69,15,40,250                        // movaps        %xmm10,%xmm15
   .byte  69,15,194,249,0                     // cmpeqps       %xmm9,%xmm15
   .byte  65,15,92,208                        // subps         %xmm8,%xmm2
   .byte  65,15,89,213                        // mulps         %xmm13,%xmm2
-  .byte  68,15,40,37,33,238,0,0              // movaps        0xee21(%rip),%xmm12        # 2b190 <_sk_srcover_rgba_8888_sse2_lowp+0xbf4>
+  .byte  68,15,40,37,227,238,0,0             // movaps        0xeee3(%rip),%xmm12        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf4>
   .byte  65,15,88,212                        // addps         %xmm12,%xmm2
   .byte  69,15,92,193                        // subps         %xmm9,%xmm8
   .byte  69,15,89,197                        // mulps         %xmm13,%xmm8
-  .byte  68,15,88,5,29,238,0,0               // addps         0xee1d(%rip),%xmm8        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
+  .byte  68,15,88,5,223,238,0,0              // addps         0xeedf(%rip),%xmm8        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
   .byte  65,15,84,215                        // andps         %xmm15,%xmm2
   .byte  69,15,85,248                        // andnps        %xmm8,%xmm15
   .byte  68,15,86,250                        // orps          %xmm2,%xmm15
   .byte  68,15,84,240                        // andps         %xmm0,%xmm14
   .byte  65,15,85,199                        // andnps        %xmm15,%xmm0
   .byte  65,15,86,198                        // orps          %xmm14,%xmm0
-  .byte  15,89,5,14,238,0,0                  // mulps         0xee0e(%rip),%xmm0        # 2b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
+  .byte  15,89,5,208,238,0,0                 // mulps         0xeed0(%rip),%xmm0        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
   .byte  69,15,40,194                        // movaps        %xmm10,%xmm8
   .byte  69,15,194,195,4                     // cmpneqps      %xmm11,%xmm8
   .byte  65,15,84,192                        // andps         %xmm8,%xmm0
   .byte  69,15,92,226                        // subps         %xmm10,%xmm12
   .byte  69,15,88,211                        // addps         %xmm11,%xmm10
-  .byte  68,15,40,13,33,236,0,0              // movaps        0xec21(%rip),%xmm9        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,13,227,236,0,0             // movaps        0xece3(%rip),%xmm9        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,40,210                        // movaps        %xmm10,%xmm2
   .byte  65,15,89,209                        // mulps         %xmm9,%xmm2
   .byte  68,15,194,202,1                     // cmpltps       %xmm2,%xmm9
@@ -37139,7 +37251,7 @@
   .byte  15,41,92,36,168                     // movaps        %xmm3,-0x58(%rsp)
   .byte  68,15,40,218                        // movaps        %xmm2,%xmm11
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
-  .byte  68,15,40,13,208,235,0,0             // movaps        0xebd0(%rip),%xmm9        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,13,146,236,0,0             // movaps        0xec92(%rip),%xmm9        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,40,209                        // movaps        %xmm9,%xmm10
   .byte  69,15,194,211,2                     // cmpleps       %xmm11,%xmm10
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
@@ -37156,28 +37268,28 @@
   .byte  69,15,88,211                        // addps         %xmm11,%xmm10
   .byte  69,15,88,219                        // addps         %xmm11,%xmm11
   .byte  69,15,92,218                        // subps         %xmm10,%xmm11
-  .byte  15,40,5,105,237,0,0                 // movaps        0xed69(%rip),%xmm0        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0xc24>
+  .byte  15,40,5,43,238,0,0                  // movaps        0xee2b(%rip),%xmm0        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0xc24>
   .byte  15,88,198                           // addps         %xmm6,%xmm0
   .byte  243,15,91,200                       // cvttps2dq     %xmm0,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
   .byte  15,194,217,1                        // cmpltps       %xmm1,%xmm3
-  .byte  15,84,29,129,235,0,0                // andps         0xeb81(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,84,29,67,236,0,0                 // andps         0xec43(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,203                           // subps         %xmm3,%xmm1
   .byte  15,92,193                           // subps         %xmm1,%xmm0
-  .byte  68,15,40,45,83,237,0,0              // movaps        0xed53(%rip),%xmm13        # 2b1d0 <_sk_srcover_rgba_8888_sse2_lowp+0xc34>
+  .byte  68,15,40,45,21,238,0,0              // movaps        0xee15(%rip),%xmm13        # 2b530 <_sk_srcover_rgba_8888_sse2_lowp+0xc34>
   .byte  69,15,40,197                        // movaps        %xmm13,%xmm8
   .byte  68,15,194,192,2                     // cmpleps       %xmm0,%xmm8
   .byte  69,15,40,242                        // movaps        %xmm10,%xmm14
   .byte  69,15,92,243                        // subps         %xmm11,%xmm14
   .byte  65,15,40,217                        // movaps        %xmm9,%xmm3
   .byte  15,194,216,2                        // cmpleps       %xmm0,%xmm3
-  .byte  15,40,21,19,237,0,0                 // movaps        0xed13(%rip),%xmm2        # 2b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
+  .byte  15,40,21,213,237,0,0                // movaps        0xedd5(%rip),%xmm2        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0xc14>
   .byte  68,15,40,250                        // movaps        %xmm2,%xmm15
   .byte  68,15,194,248,2                     // cmpleps       %xmm0,%xmm15
-  .byte  15,40,13,211,236,0,0                // movaps        0xecd3(%rip),%xmm1        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
+  .byte  15,40,13,149,237,0,0                // movaps        0xed95(%rip),%xmm1        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xbe4>
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
-  .byte  15,40,45,233,236,0,0                // movaps        0xece9(%rip),%xmm5        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
+  .byte  15,40,45,171,237,0,0                // movaps        0xedab(%rip),%xmm5        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0xc04>
   .byte  15,40,229                           // movaps        %xmm5,%xmm4
   .byte  15,92,224                           // subps         %xmm0,%xmm4
   .byte  65,15,89,230                        // mulps         %xmm14,%xmm4
@@ -37200,7 +37312,7 @@
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,222                           // movaps        %xmm6,%xmm3
   .byte  15,194,216,1                        // cmpltps       %xmm0,%xmm3
-  .byte  15,84,29,222,234,0,0                // andps         0xeade(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,84,29,160,235,0,0                // andps         0xeba0(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,195                           // subps         %xmm3,%xmm0
   .byte  68,15,40,230                        // movaps        %xmm6,%xmm12
   .byte  68,15,92,224                        // subps         %xmm0,%xmm12
@@ -37230,12 +37342,12 @@
   .byte  15,40,124,36,136                    // movaps        -0x78(%rsp),%xmm7
   .byte  15,40,231                           // movaps        %xmm7,%xmm4
   .byte  15,85,227                           // andnps        %xmm3,%xmm4
-  .byte  15,88,53,86,236,0,0                 // addps         0xec56(%rip),%xmm6        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  15,88,53,24,237,0,0                 // addps         0xed18(%rip),%xmm6        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  243,15,91,198                       // cvttps2dq     %xmm6,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,222                           // movaps        %xmm6,%xmm3
   .byte  15,194,216,1                        // cmpltps       %xmm0,%xmm3
-  .byte  15,84,29,81,234,0,0                 // andps         0xea51(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,84,29,19,235,0,0                 // andps         0xeb13(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,92,195                           // subps         %xmm3,%xmm0
   .byte  15,92,240                           // subps         %xmm0,%xmm6
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
@@ -37299,13 +37411,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,61                              // jne           1c6a0 <_sk_scale_u8_sse2+0x55>
+  .byte  117,61                              // jne           1c93e <_sk_scale_u8_sse2+0x55>
   .byte  102,71,15,110,4,16                  // movd          (%r8,%r10,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  102,68,15,219,5,36,234,0,0          // pand          0xea24(%rip),%xmm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,68,15,219,5,230,234,0,0         // pand          0xeae6(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,104,235,0,0              // mulps         0xeb68(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,89,5,42,236,0,0               // mulps         0xec2a(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
@@ -37316,12 +37428,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,61                              // je            1c6ea <_sk_scale_u8_sse2+0x9f>
+  .byte  116,61                              // je            1c988 <_sk_scale_u8_sse2+0x9f>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1c6cf <_sk_scale_u8_sse2+0x84>
+  .byte  116,23                              // je            1c96d <_sk_scale_u8_sse2+0x84>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,181                             // jne           1c673 <_sk_scale_u8_sse2+0x28>
+  .byte  117,181                             // jne           1c911 <_sk_scale_u8_sse2+0x28>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
@@ -37330,10 +37442,10 @@
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  102,68,15,97,200                    // punpcklwd     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  235,137                             // jmp           1c673 <_sk_scale_u8_sse2+0x28>
+  .byte  235,137                             // jmp           1c911 <_sk_scale_u8_sse2+0x28>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,122,255,255,255                 // jmpq          1c673 <_sk_scale_u8_sse2+0x28>
+  .byte  233,122,255,255,255                 // jmpq          1c911 <_sk_scale_u8_sse2+0x28>
 
 HIDDEN _sk_scale_565_sse2
 .globl _sk_scale_565_sse2
@@ -37347,20 +37459,20 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,173,0,0,0                    // jne           1c7c5 <_sk_scale_565_sse2+0xcc>
+  .byte  15,133,173,0,0,0                    // jne           1ca63 <_sk_scale_565_sse2+0xcc>
   .byte  243,71,15,126,20,80                 // movq          (%r8,%r10,2),%xmm10
   .byte  102,68,15,97,208                    // punpcklwd     %xmm0,%xmm10
-  .byte  102,68,15,111,5,212,234,0,0         // movdqa        0xead4(%rip),%xmm8        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,68,15,111,5,150,235,0,0         // movdqa        0xeb96(%rip),%xmm8        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,69,15,219,194                   // pand          %xmm10,%xmm8
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,211,234,0,0              // mulps         0xead3(%rip),%xmm8        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,68,15,111,13,218,234,0,0        // movdqa        0xeada(%rip),%xmm9        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  68,15,89,5,149,235,0,0              // mulps         0xeb95(%rip),%xmm8        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,68,15,111,13,156,235,0,0        // movdqa        0xeb9c(%rip),%xmm9        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,69,15,219,202                   // pand          %xmm10,%xmm9
   .byte  69,15,91,201                        // cvtdq2ps      %xmm9,%xmm9
-  .byte  68,15,89,13,217,234,0,0             // mulps         0xead9(%rip),%xmm9        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,68,15,219,21,224,234,0,0        // pand          0xeae0(%rip),%xmm10        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  68,15,89,13,155,235,0,0             // mulps         0xeb9b(%rip),%xmm9        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,68,15,219,21,162,235,0,0        // pand          0xeba2(%rip),%xmm10        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
-  .byte  68,15,89,21,228,234,0,0             // mulps         0xeae4(%rip),%xmm10        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  68,15,89,21,166,235,0,0             // mulps         0xeba6(%rip),%xmm10        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  68,15,40,219                        // movaps        %xmm3,%xmm11
   .byte  68,15,194,223,1                     // cmpltps       %xmm7,%xmm11
   .byte  69,15,40,225                        // movaps        %xmm9,%xmm12
@@ -37387,22 +37499,22 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            1c80e <_sk_scale_565_sse2+0x115>
+  .byte  116,60                              // je            1caac <_sk_scale_565_sse2+0x115>
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,27                              // je            1c7f8 <_sk_scale_565_sse2+0xff>
+  .byte  116,27                              // je            1ca96 <_sk_scale_565_sse2+0xff>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,60,255,255,255               // jne           1c723 <_sk_scale_565_sse2+0x2a>
+  .byte  15,133,60,255,255,255               // jne           1c9c1 <_sk_scale_565_sse2+0x2a>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,208,69                // pshufd        $0x45,%xmm8,%xmm10
   .byte  102,71,15,110,4,80                  // movd          (%r8,%r10,2),%xmm8
   .byte  242,69,15,112,192,212               // pshuflw       $0xd4,%xmm8,%xmm8
   .byte  242,69,15,16,208                    // movsd         %xmm8,%xmm10
-  .byte  233,21,255,255,255                  // jmpq          1c723 <_sk_scale_565_sse2+0x2a>
+  .byte  233,21,255,255,255                  // jmpq          1c9c1 <_sk_scale_565_sse2+0x2a>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,68,15,110,208                   // movd          %eax,%xmm10
-  .byte  233,6,255,255,255                   // jmpq          1c723 <_sk_scale_565_sse2+0x2a>
+  .byte  233,6,255,255,255                   // jmpq          1c9c1 <_sk_scale_565_sse2+0x2a>
 
 HIDDEN _sk_lerp_1_float_sse2
 .globl _sk_lerp_1_float_sse2
@@ -37437,13 +37549,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,81                              // jne           1c8be <_sk_lerp_u8_sse2+0x69>
+  .byte  117,81                              // jne           1cb5c <_sk_lerp_u8_sse2+0x69>
   .byte  102,71,15,110,4,16                  // movd          (%r8,%r10,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  102,68,15,219,5,26,232,0,0          // pand          0xe81a(%rip),%xmm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,68,15,219,5,220,232,0,0         // pand          0xe8dc(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,94,233,0,0               // mulps         0xe95e(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,89,5,32,234,0,0               // mulps         0xea20(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  15,88,196                           // addps         %xmm4,%xmm0
@@ -37461,12 +37573,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,64                              // je            1c90b <_sk_lerp_u8_sse2+0xb6>
+  .byte  116,64                              // je            1cba9 <_sk_lerp_u8_sse2+0xb6>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1c8ed <_sk_lerp_u8_sse2+0x98>
+  .byte  116,23                              // je            1cb8b <_sk_lerp_u8_sse2+0x98>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,161                             // jne           1c87d <_sk_lerp_u8_sse2+0x28>
+  .byte  117,161                             // jne           1cb1b <_sk_lerp_u8_sse2+0x28>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
@@ -37475,10 +37587,10 @@
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  102,68,15,97,200                    // punpcklwd     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  233,114,255,255,255                 // jmpq          1c87d <_sk_lerp_u8_sse2+0x28>
+  .byte  233,114,255,255,255                 // jmpq          1cb1b <_sk_lerp_u8_sse2+0x28>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,99,255,255,255                  // jmpq          1c87d <_sk_lerp_u8_sse2+0x28>
+  .byte  233,99,255,255,255                  // jmpq          1cb1b <_sk_lerp_u8_sse2+0x28>
 
 HIDDEN _sk_lerp_565_sse2
 .globl _sk_lerp_565_sse2
@@ -37492,20 +37604,20 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,173,0,0,0                    // jne           1c9e6 <_sk_lerp_565_sse2+0xcc>
+  .byte  15,133,173,0,0,0                    // jne           1cc84 <_sk_lerp_565_sse2+0xcc>
   .byte  243,71,15,126,4,80                  // movq          (%r8,%r10,2),%xmm8
   .byte  102,68,15,97,192                    // punpcklwd     %xmm0,%xmm8
-  .byte  102,68,15,111,13,179,232,0,0        // movdqa        0xe8b3(%rip),%xmm9        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,68,15,111,13,117,233,0,0        // movdqa        0xe975(%rip),%xmm9        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,69,15,219,200                   // pand          %xmm8,%xmm9
   .byte  69,15,91,201                        // cvtdq2ps      %xmm9,%xmm9
-  .byte  68,15,89,13,178,232,0,0             // mulps         0xe8b2(%rip),%xmm9        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,68,15,111,21,185,232,0,0        // movdqa        0xe8b9(%rip),%xmm10        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  68,15,89,13,116,233,0,0             // mulps         0xe974(%rip),%xmm9        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,68,15,111,21,123,233,0,0        // movdqa        0xe97b(%rip),%xmm10        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,69,15,219,208                   // pand          %xmm8,%xmm10
   .byte  69,15,91,218                        // cvtdq2ps      %xmm10,%xmm11
-  .byte  68,15,89,29,184,232,0,0             // mulps         0xe8b8(%rip),%xmm11        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,68,15,219,5,191,232,0,0         // pand          0xe8bf(%rip),%xmm8        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  68,15,89,29,122,233,0,0             // mulps         0xe97a(%rip),%xmm11        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,68,15,219,5,129,233,0,0         // pand          0xe981(%rip),%xmm8        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
-  .byte  68,15,89,5,195,232,0,0              // mulps         0xe8c3(%rip),%xmm8        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  68,15,89,5,133,233,0,0              // mulps         0xe985(%rip),%xmm8        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  68,15,40,211                        // movaps        %xmm3,%xmm10
   .byte  68,15,194,215,1                     // cmpltps       %xmm7,%xmm10
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
@@ -37534,22 +37646,22 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,60                              // je            1ca2f <_sk_lerp_565_sse2+0x115>
+  .byte  116,60                              // je            1cccd <_sk_lerp_565_sse2+0x115>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,27                              // je            1ca19 <_sk_lerp_565_sse2+0xff>
+  .byte  116,27                              // je            1ccb7 <_sk_lerp_565_sse2+0xff>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,60,255,255,255               // jne           1c944 <_sk_lerp_565_sse2+0x2a>
+  .byte  15,133,60,255,255,255               // jne           1cbe2 <_sk_lerp_565_sse2+0x2a>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,112,192,69                // pshufd        $0x45,%xmm8,%xmm8
   .byte  102,71,15,110,12,80                 // movd          (%r8,%r10,2),%xmm9
   .byte  242,69,15,112,201,212               // pshuflw       $0xd4,%xmm9,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  233,21,255,255,255                  // jmpq          1c944 <_sk_lerp_565_sse2+0x2a>
+  .byte  233,21,255,255,255                  // jmpq          1cbe2 <_sk_lerp_565_sse2+0x2a>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  233,6,255,255,255                   // jmpq          1c944 <_sk_lerp_565_sse2+0x2a>
+  .byte  233,6,255,255,255                   // jmpq          1cbe2 <_sk_lerp_565_sse2+0x2a>
 
 HIDDEN _sk_load_tables_sse2
 .globl _sk_load_tables_sse2
@@ -37558,11 +37670,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,34,1,0,0                     // jne           1cb6e <_sk_load_tables_sse2+0x130>
+  .byte  15,133,34,1,0,0                     // jne           1ce0c <_sk_load_tables_sse2+0x130>
   .byte  243,69,15,111,12,144                // movdqu        (%r8,%rdx,4),%xmm9
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
-  .byte  102,68,15,111,5,66,230,0,0          // movdqa        0xe642(%rip),%xmm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,68,15,111,5,4,231,0,0           // movdqa        0xe704(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
@@ -37618,7 +37730,7 @@
   .byte  102,15,20,211                       // unpcklpd      %xmm3,%xmm2
   .byte  102,65,15,114,209,24                // psrld         $0x18,%xmm9
   .byte  65,15,91,217                        // cvtdq2ps      %xmm9,%xmm3
-  .byte  15,89,29,137,230,0,0                // mulps         0xe689(%rip),%xmm3        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,29,75,231,0,0                 // mulps         0xe74b(%rip),%xmm3        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
@@ -37626,18 +37738,18 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,45                              // je            1cba8 <_sk_load_tables_sse2+0x16a>
+  .byte  116,45                              // je            1ce46 <_sk_load_tables_sse2+0x16a>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,23                              // je            1cb9d <_sk_load_tables_sse2+0x15f>
+  .byte  116,23                              // je            1ce3b <_sk_load_tables_sse2+0x15f>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  15,133,194,254,255,255              // jne           1ca52 <_sk_load_tables_sse2+0x14>
+  .byte  15,133,194,254,255,255              // jne           1ccf0 <_sk_load_tables_sse2+0x14>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,200,69                // pshufd        $0x45,%xmm0,%xmm9
   .byte  102,69,15,18,12,144                 // movlpd        (%r8,%rdx,4),%xmm9
-  .byte  233,170,254,255,255                 // jmpq          1ca52 <_sk_load_tables_sse2+0x14>
+  .byte  233,170,254,255,255                 // jmpq          1ccf0 <_sk_load_tables_sse2+0x14>
   .byte  102,69,15,110,12,144                // movd          (%r8,%rdx,4),%xmm9
-  .byte  233,159,254,255,255                 // jmpq          1ca52 <_sk_load_tables_sse2+0x14>
+  .byte  233,159,254,255,255                 // jmpq          1ccf0 <_sk_load_tables_sse2+0x14>
 
 HIDDEN _sk_load_tables_u16_be_sse2
 .globl _sk_load_tables_u16_be_sse2
@@ -37647,7 +37759,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,149,0,0,0,0               // lea           0x0(,%rdx,4),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,93,1,0,0                     // jne           1cd26 <_sk_load_tables_u16_be_sse2+0x173>
+  .byte  15,133,93,1,0,0                     // jne           1cfc4 <_sk_load_tables_u16_be_sse2+0x173>
   .byte  102,67,15,16,4,72                   // movupd        (%r8,%r9,2),%xmm0
   .byte  243,67,15,111,76,72,16              // movdqu        0x10(%r8,%r9,2),%xmm1
   .byte  65,86                               // push          %r14
@@ -37658,7 +37770,7 @@
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  102,68,15,105,200                   // punpckhwd     %xmm0,%xmm9
-  .byte  102,15,111,21,99,230,0,0            // movdqa        0xe663(%rip),%xmm2        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
+  .byte  102,15,111,21,37,231,0,0            // movdqa        0xe725(%rip),%xmm2        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
   .byte  102,15,112,217,238                  // pshufd        $0xee,%xmm1,%xmm3
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
@@ -37719,23 +37831,23 @@
   .byte  102,65,15,235,217                   // por           %xmm9,%xmm3
   .byte  102,65,15,97,216                    // punpcklwd     %xmm8,%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,97,229,0,0                 // mulps         0xe561(%rip),%xmm3        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
+  .byte  15,89,29,35,230,0,0                 // mulps         0xe623(%rip),%xmm3        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
   .byte  242,67,15,16,4,72                   // movsd         (%r8,%r9,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1cd3f <_sk_load_tables_u16_be_sse2+0x18c>
+  .byte  117,13                              // jne           1cfdd <_sk_load_tables_u16_be_sse2+0x18c>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,151,254,255,255                 // jmpq          1cbd6 <_sk_load_tables_u16_be_sse2+0x23>
+  .byte  233,151,254,255,255                 // jmpq          1ce74 <_sk_load_tables_u16_be_sse2+0x23>
   .byte  102,67,15,22,68,72,8                // movhpd        0x8(%r8,%r9,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,130,254,255,255              // jb            1cbd6 <_sk_load_tables_u16_be_sse2+0x23>
+  .byte  15,130,130,254,255,255              // jb            1ce74 <_sk_load_tables_u16_be_sse2+0x23>
   .byte  243,67,15,126,76,72,16              // movq          0x10(%r8,%r9,2),%xmm1
-  .byte  233,118,254,255,255                 // jmpq          1cbd6 <_sk_load_tables_u16_be_sse2+0x23>
+  .byte  233,118,254,255,255                 // jmpq          1ce74 <_sk_load_tables_u16_be_sse2+0x23>
 
 HIDDEN _sk_load_tables_rgb_u16_be_sse2
 .globl _sk_load_tables_rgb_u16_be_sse2
@@ -37745,7 +37857,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  76,141,12,82                        // lea           (%rdx,%rdx,2),%r9
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,81,1,0,0                     // jne           1cec3 <_sk_load_tables_rgb_u16_be_sse2+0x163>
+  .byte  15,133,81,1,0,0                     // jne           1d161 <_sk_load_tables_rgb_u16_be_sse2+0x163>
   .byte  243,67,15,111,20,72                 // movdqu        (%r8,%r9,2),%xmm2
   .byte  243,67,15,111,76,72,8               // movdqu        0x8(%r8,%r9,2),%xmm1
   .byte  102,15,115,217,4                    // psrldq        $0x4,%xmm1
@@ -37760,7 +37872,7 @@
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,65,15,97,194                    // punpcklwd     %xmm10,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,68,15,111,5,165,228,0,0         // movdqa        0xe4a5(%rip),%xmm8        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
+  .byte  102,68,15,111,5,103,229,0,0         // movdqa        0xe567(%rip),%xmm8        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0xcc4>
   .byte  102,65,15,219,192                   // pand          %xmm8,%xmm0
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,65,15,97,193                    // punpcklwd     %xmm9,%xmm0
@@ -37815,7 +37927,7 @@
   .byte  65,15,20,216                        // unpcklps      %xmm8,%xmm3
   .byte  102,15,20,211                       // unpcklpd      %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,50,225,0,0                 // movaps        0xe132(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,244,225,0,0                // movaps        0xe1f4(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  91                                  // pop           %rbx
   .byte  65,94                               // pop           %r14
   .byte  255,224                             // jmpq          *%rax
@@ -37823,21 +37935,21 @@
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,84,72,4,2             // pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,14                              // jne           1cee9 <_sk_load_tables_rgb_u16_be_sse2+0x189>
+  .byte  117,14                              // jne           1d187 <_sk_load_tables_rgb_u16_be_sse2+0x189>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
-  .byte  233,175,254,255,255                 // jmpq          1cd98 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+  .byte  233,175,254,255,255                 // jmpq          1d036 <_sk_load_tables_rgb_u16_be_sse2+0x38>
   .byte  102,71,15,110,84,72,6               // movd          0x6(%r8,%r9,2),%xmm10
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,71,15,196,84,72,10,2            // pinsrw        $0x2,0xa(%r8,%r9,2),%xmm10
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            1cf1a <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
+  .byte  114,24                              // jb            1d1b8 <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
   .byte  102,67,15,110,76,72,12              // movd          0xc(%r8,%r9,2),%xmm1
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,67,15,196,76,72,16,2            // pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  .byte  233,126,254,255,255                 // jmpq          1cd98 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+  .byte  233,126,254,255,255                 // jmpq          1d036 <_sk_load_tables_rgb_u16_be_sse2+0x38>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,117,254,255,255                 // jmpq          1cd98 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+  .byte  233,117,254,255,255                 // jmpq          1d036 <_sk_load_tables_rgb_u16_be_sse2+0x38>
 
 HIDDEN _sk_byte_tables_sse2
 .globl _sk_byte_tables_sse2
@@ -37847,7 +37959,7 @@
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,159,225,0,0              // movaps        0xe19f(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,97,226,0,0               // movaps        0xe261(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  102,73,15,126,192                   // movq          %xmm0,%r8
@@ -37875,7 +37987,7 @@
   .byte  102,65,15,96,193                    // punpcklbw     %xmm9,%xmm0
   .byte  102,65,15,97,193                    // punpcklwd     %xmm9,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,21,74,226,0,0              // movaps        0xe24a(%rip),%xmm10        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,21,12,227,0,0              // movaps        0xe30c(%rip),%xmm10        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,194                        // mulps         %xmm10,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
@@ -37994,7 +38106,7 @@
   .byte  102,65,15,96,193                    // punpcklbw     %xmm9,%xmm0
   .byte  102,65,15,97,193                    // punpcklwd     %xmm9,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,21,138,224,0,0             // movaps        0xe08a(%rip),%xmm10        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,21,76,225,0,0              // movaps        0xe14c(%rip),%xmm10        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,194                        // mulps         %xmm10,%xmm0
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
@@ -38192,15 +38304,15 @@
   .byte  69,15,88,209                        // addps         %xmm9,%xmm10
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,91,202                        // cvtdq2ps      %xmm10,%xmm9
-  .byte  68,15,89,13,86,222,0,0              // mulps         0xde56(%rip),%xmm9        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,21,94,222,0,0              // andps         0xde5e(%rip),%xmm10        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,21,150,219,0,0             // orps          0xdb96(%rip),%xmm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,13,94,222,0,0              // addps         0xde5e(%rip),%xmm9        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  68,15,40,37,102,222,0,0             // movaps        0xde66(%rip),%xmm12        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,13,24,223,0,0              // mulps         0xdf18(%rip),%xmm9        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,21,32,223,0,0              // andps         0xdf20(%rip),%xmm10        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,21,88,220,0,0              // orps          0xdc58(%rip),%xmm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,13,32,223,0,0              // addps         0xdf20(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,40,223,0,0              // movaps        0xdf28(%rip),%xmm12        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,88,21,102,222,0,0             // addps         0xde66(%rip),%xmm10        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  68,15,40,37,110,222,0,0             // movaps        0xde6e(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,21,40,223,0,0              // addps         0xdf28(%rip),%xmm10        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,37,48,223,0,0              // movaps        0xdf30(%rip),%xmm12        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
@@ -38208,22 +38320,22 @@
   .byte  69,15,91,226                        // cvtdq2ps      %xmm10,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,194,236,1                     // cmpltps       %xmm12,%xmm13
-  .byte  68,15,40,21,88,219,0,0              // movaps        0xdb58(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,26,220,0,0              // movaps        0xdc1a(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,13,60,222,0,0              // addps         0xde3c(%rip),%xmm9        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  68,15,40,37,68,222,0,0              // movaps        0xde44(%rip),%xmm12        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,13,254,222,0,0             // addps         0xdefe(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  68,15,40,37,6,223,0,0               // movaps        0xdf06(%rip),%xmm12        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,40,37,68,222,0,0              // movaps        0xde44(%rip),%xmm12        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,37,6,223,0,0               // movaps        0xdf06(%rip),%xmm12        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  68,15,40,45,72,222,0,0              // movaps        0xde48(%rip),%xmm13        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,45,10,223,0,0              // movaps        0xdf0a(%rip),%xmm13        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  69,15,94,236                        // divps         %xmm12,%xmm13
   .byte  69,15,88,233                        // addps         %xmm9,%xmm13
-  .byte  68,15,89,45,72,222,0,0              // mulps         0xde48(%rip),%xmm13        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  68,15,89,45,10,223,0,0              // mulps         0xdf0a(%rip),%xmm13        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,205                    // cvtps2dq      %xmm13,%xmm9
   .byte  243,68,15,16,96,20                  // movss         0x14(%rax),%xmm12
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
@@ -38259,15 +38371,15 @@
   .byte  69,15,88,209                        // addps         %xmm9,%xmm10
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,91,202                        // cvtdq2ps      %xmm10,%xmm9
-  .byte  68,15,89,13,24,221,0,0              // mulps         0xdd18(%rip),%xmm9        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,21,32,221,0,0              // andps         0xdd20(%rip),%xmm10        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,21,88,218,0,0              // orps          0xda58(%rip),%xmm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,13,32,221,0,0              // addps         0xdd20(%rip),%xmm9        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  68,15,40,37,40,221,0,0              // movaps        0xdd28(%rip),%xmm12        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,13,218,221,0,0             // mulps         0xddda(%rip),%xmm9        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,21,226,221,0,0             // andps         0xdde2(%rip),%xmm10        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,21,26,219,0,0              // orps          0xdb1a(%rip),%xmm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,13,226,221,0,0             // addps         0xdde2(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,234,221,0,0             // movaps        0xddea(%rip),%xmm12        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,88,21,40,221,0,0              // addps         0xdd28(%rip),%xmm10        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  68,15,40,37,48,221,0,0              // movaps        0xdd30(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,21,234,221,0,0             // addps         0xddea(%rip),%xmm10        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,37,242,221,0,0             // movaps        0xddf2(%rip),%xmm12        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
@@ -38275,22 +38387,22 @@
   .byte  69,15,91,226                        // cvtdq2ps      %xmm10,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,194,236,1                     // cmpltps       %xmm12,%xmm13
-  .byte  68,15,40,21,26,218,0,0              // movaps        0xda1a(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,220,218,0,0             // movaps        0xdadc(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,13,254,220,0,0             // addps         0xdcfe(%rip),%xmm9        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  68,15,40,37,6,221,0,0               // movaps        0xdd06(%rip),%xmm12        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,13,192,221,0,0             // addps         0xddc0(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  68,15,40,37,200,221,0,0             // movaps        0xddc8(%rip),%xmm12        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,40,37,6,221,0,0               // movaps        0xdd06(%rip),%xmm12        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,37,200,221,0,0             // movaps        0xddc8(%rip),%xmm12        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  68,15,40,45,10,221,0,0              // movaps        0xdd0a(%rip),%xmm13        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,45,204,221,0,0             // movaps        0xddcc(%rip),%xmm13        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  69,15,94,236                        // divps         %xmm12,%xmm13
   .byte  69,15,88,233                        // addps         %xmm9,%xmm13
-  .byte  68,15,89,45,10,221,0,0              // mulps         0xdd0a(%rip),%xmm13        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  68,15,89,45,204,221,0,0             // mulps         0xddcc(%rip),%xmm13        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,205                    // cvtps2dq      %xmm13,%xmm9
   .byte  243,68,15,16,96,20                  // movss         0x14(%rax),%xmm12
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
@@ -38326,15 +38438,15 @@
   .byte  69,15,88,209                        // addps         %xmm9,%xmm10
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,91,202                        // cvtdq2ps      %xmm10,%xmm9
-  .byte  68,15,89,13,218,219,0,0             // mulps         0xdbda(%rip),%xmm9        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,21,226,219,0,0             // andps         0xdbe2(%rip),%xmm10        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,21,26,217,0,0              // orps          0xd91a(%rip),%xmm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,13,226,219,0,0             // addps         0xdbe2(%rip),%xmm9        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  68,15,40,37,234,219,0,0             // movaps        0xdbea(%rip),%xmm12        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,13,156,220,0,0             // mulps         0xdc9c(%rip),%xmm9        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,21,164,220,0,0             // andps         0xdca4(%rip),%xmm10        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,21,220,217,0,0             // orps          0xd9dc(%rip),%xmm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,13,164,220,0,0             // addps         0xdca4(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,172,220,0,0             // movaps        0xdcac(%rip),%xmm12        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,88,21,234,219,0,0             // addps         0xdbea(%rip),%xmm10        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  68,15,40,37,242,219,0,0             // movaps        0xdbf2(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,21,172,220,0,0             // addps         0xdcac(%rip),%xmm10        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,37,180,220,0,0             // movaps        0xdcb4(%rip),%xmm12        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
@@ -38342,22 +38454,22 @@
   .byte  69,15,91,226                        // cvtdq2ps      %xmm10,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,194,236,1                     // cmpltps       %xmm12,%xmm13
-  .byte  68,15,40,21,220,216,0,0             // movaps        0xd8dc(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,158,217,0,0             // movaps        0xd99e(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,13,192,219,0,0             // addps         0xdbc0(%rip),%xmm9        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  68,15,40,37,200,219,0,0             // movaps        0xdbc8(%rip),%xmm12        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,13,130,220,0,0             // addps         0xdc82(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  68,15,40,37,138,220,0,0             // movaps        0xdc8a(%rip),%xmm12        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,40,37,200,219,0,0             // movaps        0xdbc8(%rip),%xmm12        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,37,138,220,0,0             // movaps        0xdc8a(%rip),%xmm12        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  68,15,40,45,204,219,0,0             // movaps        0xdbcc(%rip),%xmm13        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,45,142,220,0,0             // movaps        0xdc8e(%rip),%xmm13        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  69,15,94,236                        // divps         %xmm12,%xmm13
   .byte  69,15,88,233                        // addps         %xmm9,%xmm13
-  .byte  68,15,89,45,204,219,0,0             // mulps         0xdbcc(%rip),%xmm13        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  68,15,89,45,142,220,0,0             // mulps         0xdc8e(%rip),%xmm13        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,205                    // cvtps2dq      %xmm13,%xmm9
   .byte  243,68,15,16,96,20                  // movss         0x14(%rax),%xmm12
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
@@ -38393,15 +38505,15 @@
   .byte  69,15,88,209                        // addps         %xmm9,%xmm10
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,91,202                        // cvtdq2ps      %xmm10,%xmm9
-  .byte  68,15,89,13,156,218,0,0             // mulps         0xda9c(%rip),%xmm9        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  68,15,84,21,164,218,0,0             // andps         0xdaa4(%rip),%xmm10        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,86,21,220,215,0,0             // orps          0xd7dc(%rip),%xmm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
-  .byte  68,15,88,13,164,218,0,0             // addps         0xdaa4(%rip),%xmm9        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
-  .byte  68,15,40,37,172,218,0,0             // movaps        0xdaac(%rip),%xmm12        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,89,13,94,219,0,0              // mulps         0xdb5e(%rip),%xmm9        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  68,15,84,21,102,219,0,0             // andps         0xdb66(%rip),%xmm10        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,86,21,158,216,0,0             // orps          0xd89e(%rip),%xmm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,13,102,219,0,0             // addps         0xdb66(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,110,219,0,0             // movaps        0xdb6e(%rip),%xmm12        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,88,21,172,218,0,0             // addps         0xdaac(%rip),%xmm10        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
-  .byte  68,15,40,37,180,218,0,0             // movaps        0xdab4(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,88,21,110,219,0,0             // addps         0xdb6e(%rip),%xmm10        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,37,118,219,0,0             // movaps        0xdb76(%rip),%xmm12        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  69,15,94,226                        // divps         %xmm10,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
   .byte  69,15,89,203                        // mulps         %xmm11,%xmm9
@@ -38409,22 +38521,22 @@
   .byte  69,15,91,226                        // cvtdq2ps      %xmm10,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,194,236,1                     // cmpltps       %xmm12,%xmm13
-  .byte  68,15,40,21,158,215,0,0             // movaps        0xd79e(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,96,216,0,0              // movaps        0xd860(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,84,234                        // andps         %xmm10,%xmm13
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
   .byte  69,15,40,233                        // movaps        %xmm9,%xmm13
   .byte  69,15,92,236                        // subps         %xmm12,%xmm13
-  .byte  68,15,88,13,130,218,0,0             // addps         0xda82(%rip),%xmm9        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
-  .byte  68,15,40,37,138,218,0,0             // movaps        0xda8a(%rip),%xmm12        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  68,15,88,13,68,219,0,0              // addps         0xdb44(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  68,15,40,37,76,219,0,0              // movaps        0xdb4c(%rip),%xmm12        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  69,15,89,229                        // mulps         %xmm13,%xmm12
   .byte  69,15,92,204                        // subps         %xmm12,%xmm9
-  .byte  68,15,40,37,138,218,0,0             // movaps        0xda8a(%rip),%xmm12        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  68,15,40,37,76,219,0,0              // movaps        0xdb4c(%rip),%xmm12        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  69,15,92,229                        // subps         %xmm13,%xmm12
-  .byte  68,15,40,45,142,218,0,0             // movaps        0xda8e(%rip),%xmm13        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,45,80,219,0,0              // movaps        0xdb50(%rip),%xmm13        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  69,15,94,236                        // divps         %xmm12,%xmm13
   .byte  69,15,88,233                        // addps         %xmm9,%xmm13
-  .byte  68,15,89,45,142,218,0,0             // mulps         0xda8e(%rip),%xmm13        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  68,15,89,45,80,219,0,0              // mulps         0xdb50(%rip),%xmm13        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  102,69,15,91,205                    // cvtps2dq      %xmm13,%xmm9
   .byte  243,68,15,16,96,20                  // movss         0x14(%rax),%xmm12
   .byte  69,15,198,228,0                     // shufps        $0x0,%xmm12,%xmm12
@@ -38449,19 +38561,19 @@
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,91,194                           // cvtdq2ps      %xmm2,%xmm0
-  .byte  15,89,5,153,217,0,0                 // mulps         0xd999(%rip),%xmm0        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  15,84,21,162,217,0,0                // andps         0xd9a2(%rip),%xmm2        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  68,15,40,53,218,214,0,0             // movaps        0xd6da(%rip),%xmm14        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,89,5,91,218,0,0                  // mulps         0xda5b(%rip),%xmm0        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  15,84,21,100,218,0,0                // andps         0xda64(%rip),%xmm2        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  68,15,40,53,156,215,0,0             // movaps        0xd79c(%rip),%xmm14        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,86,214                        // orps          %xmm14,%xmm2
-  .byte  68,15,40,37,158,217,0,0             // movaps        0xd99e(%rip),%xmm12        # 2b2b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
+  .byte  68,15,40,37,96,218,0,0              // movaps        0xda60(%rip),%xmm12        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0xd14>
   .byte  65,15,88,196                        // addps         %xmm12,%xmm0
-  .byte  68,15,40,29,162,217,0,0             // movaps        0xd9a2(%rip),%xmm11        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
+  .byte  68,15,40,29,100,218,0,0             // movaps        0xda64(%rip),%xmm11        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0xd24>
   .byte  15,40,226                           // movaps        %xmm2,%xmm4
   .byte  65,15,89,227                        // mulps         %xmm11,%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  68,15,40,21,160,217,0,0             // movaps        0xd9a0(%rip),%xmm10        # 2b2d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
+  .byte  68,15,40,21,98,218,0,0              // movaps        0xda62(%rip),%xmm10        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0xd34>
   .byte  65,15,88,210                        // addps         %xmm10,%xmm2
-  .byte  68,15,40,45,164,217,0,0             // movaps        0xd9a4(%rip),%xmm13        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
+  .byte  68,15,40,45,102,218,0,0             // movaps        0xda66(%rip),%xmm13        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0xd44>
   .byte  65,15,40,229                        // movaps        %xmm13,%xmm4
   .byte  15,94,226                           // divps         %xmm2,%xmm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -38473,27 +38585,27 @@
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,194,226,1                        // cmpltps       %xmm2,%xmm4
-  .byte  68,15,40,13,132,214,0,0             // movaps        0xd684(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,13,70,215,0,0              // movaps        0xd746(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  65,15,84,225                        // andps         %xmm9,%xmm4
   .byte  15,92,212                           // subps         %xmm4,%xmm2
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,92,226                           // subps         %xmm2,%xmm4
-  .byte  15,40,53,112,217,0,0                // movaps        0xd970(%rip),%xmm6        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
+  .byte  15,40,53,50,218,0,0                 // movaps        0xda32(%rip),%xmm6        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0xd54>
   .byte  15,88,198                           // addps         %xmm6,%xmm0
-  .byte  15,40,61,134,217,0,0                // movaps        0xd986(%rip),%xmm7        # 2b310 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
+  .byte  15,40,61,72,218,0,0                 // movaps        0xda48(%rip),%xmm7        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0xd74>
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
   .byte  15,40,212                           // movaps        %xmm4,%xmm2
-  .byte  15,40,37,102,217,0,0                // movaps        0xd966(%rip),%xmm4        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
+  .byte  15,40,37,40,218,0,0                 // movaps        0xda28(%rip),%xmm4        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0xd64>
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  15,92,194                           // subps         %xmm2,%xmm0
-  .byte  68,15,40,61,120,217,0,0             // movaps        0xd978(%rip),%xmm15        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
+  .byte  68,15,40,61,58,218,0,0              // movaps        0xda3a(%rip),%xmm15        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0xd84>
   .byte  65,15,40,215                        // movaps        %xmm15,%xmm2
   .byte  15,94,213                           // divps         %xmm5,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  15,89,5,212,216,0,0                 // mulps         0xd8d4(%rip),%xmm0        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  15,84,13,221,216,0,0                // andps         0xd8dd(%rip),%xmm1        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  15,89,5,150,217,0,0                 // mulps         0xd996(%rip),%xmm0        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  15,84,13,159,217,0,0                // andps         0xd99f(%rip),%xmm1        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
   .byte  65,15,86,206                        // orps          %xmm14,%xmm1
   .byte  65,15,88,196                        // addps         %xmm12,%xmm0
   .byte  15,40,233                           // movaps        %xmm1,%xmm5
@@ -38523,9 +38635,9 @@
   .byte  15,94,206                           // divps         %xmm6,%xmm1
   .byte  15,88,200                           // addps         %xmm0,%xmm1
   .byte  15,91,195                           // cvtdq2ps      %xmm3,%xmm0
-  .byte  15,89,5,99,216,0,0                  // mulps         0xd863(%rip),%xmm0        # 2b290 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
-  .byte  15,84,29,108,216,0,0                // andps         0xd86c(%rip),%xmm3        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
-  .byte  15,86,29,165,213,0,0                // orps          0xd5a5(%rip),%xmm3        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,89,5,37,217,0,0                  // mulps         0xd925(%rip),%xmm0        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf4>
+  .byte  15,84,29,46,217,0,0                 // andps         0xd92e(%rip),%xmm3        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0xd04>
+  .byte  15,86,29,103,214,0,0                // orps          0xd667(%rip),%xmm3        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,88,196                        // addps         %xmm12,%xmm0
   .byte  68,15,89,219                        // mulps         %xmm3,%xmm11
   .byte  65,15,92,195                        // subps         %xmm11,%xmm0
@@ -38547,7 +38659,7 @@
   .byte  15,92,253                           // subps         %xmm5,%xmm7
   .byte  68,15,94,255                        // divps         %xmm7,%xmm15
   .byte  68,15,88,248                        // addps         %xmm0,%xmm15
-  .byte  15,40,5,162,216,0,0                 // movaps        0xd8a2(%rip),%xmm0        # 2b330 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
+  .byte  15,40,5,100,217,0,0                 // movaps        0xd964(%rip),%xmm0        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0xd94>
   .byte  15,89,208                           // mulps         %xmm0,%xmm2
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
   .byte  68,15,89,248                        // mulps         %xmm0,%xmm15
@@ -38566,29 +38678,29 @@
 .globl _sk_lab_to_xyz_sse2
 FUNCTION(_sk_lab_to_xyz_sse2)
 _sk_lab_to_xyz_sse2:
-  .byte  15,89,5,119,216,0,0                 // mulps         0xd877(%rip),%xmm0        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xda4>
-  .byte  68,15,40,5,255,213,0,0              // movaps        0xd5ff(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  15,89,5,57,217,0,0                  // mulps         0xd939(%rip),%xmm0        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0xda4>
+  .byte  68,15,40,5,193,214,0,0              // movaps        0xd6c1(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  65,15,89,200                        // mulps         %xmm8,%xmm1
-  .byte  68,15,40,13,115,216,0,0             // movaps        0xd873(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xdb4>
+  .byte  68,15,40,13,53,217,0,0              // movaps        0xd935(%rip),%xmm9        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0xdb4>
   .byte  65,15,88,201                        // addps         %xmm9,%xmm1
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  65,15,88,209                        // addps         %xmm9,%xmm2
-  .byte  15,88,5,112,216,0,0                 // addps         0xd870(%rip),%xmm0        # 2b360 <_sk_srcover_rgba_8888_sse2_lowp+0xdc4>
-  .byte  15,89,5,121,216,0,0                 // mulps         0xd879(%rip),%xmm0        # 2b370 <_sk_srcover_rgba_8888_sse2_lowp+0xdd4>
-  .byte  15,89,13,130,216,0,0                // mulps         0xd882(%rip),%xmm1        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xde4>
+  .byte  15,88,5,50,217,0,0                  // addps         0xd932(%rip),%xmm0        # 2b6c0 <_sk_srcover_rgba_8888_sse2_lowp+0xdc4>
+  .byte  15,89,5,59,217,0,0                  // mulps         0xd93b(%rip),%xmm0        # 2b6d0 <_sk_srcover_rgba_8888_sse2_lowp+0xdd4>
+  .byte  15,89,13,68,217,0,0                 // mulps         0xd944(%rip),%xmm1        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xde4>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,21,136,216,0,0                // mulps         0xd888(%rip),%xmm2        # 2b390 <_sk_srcover_rgba_8888_sse2_lowp+0xdf4>
+  .byte  15,89,21,74,217,0,0                 // mulps         0xd94a(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xdf4>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  68,15,92,202                        // subps         %xmm2,%xmm9
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
   .byte  68,15,89,225                        // mulps         %xmm1,%xmm12
-  .byte  15,40,21,125,216,0,0                // movaps        0xd87d(%rip),%xmm2        # 2b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0xe04>
+  .byte  15,40,21,63,217,0,0                 // movaps        0xd93f(%rip),%xmm2        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0xe04>
   .byte  68,15,40,194                        // movaps        %xmm2,%xmm8
   .byte  69,15,194,196,1                     // cmpltps       %xmm12,%xmm8
-  .byte  68,15,40,21,124,216,0,0             // movaps        0xd87c(%rip),%xmm10        # 2b3b0 <_sk_srcover_rgba_8888_sse2_lowp+0xe14>
+  .byte  68,15,40,21,62,217,0,0              // movaps        0xd93e(%rip),%xmm10        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0xe14>
   .byte  65,15,88,202                        // addps         %xmm10,%xmm1
-  .byte  68,15,40,29,128,216,0,0             // movaps        0xd880(%rip),%xmm11        # 2b3c0 <_sk_srcover_rgba_8888_sse2_lowp+0xe24>
+  .byte  68,15,40,29,66,217,0,0              // movaps        0xd942(%rip),%xmm11        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xe24>
   .byte  65,15,89,203                        // mulps         %xmm11,%xmm1
   .byte  69,15,84,224                        // andps         %xmm8,%xmm12
   .byte  68,15,85,193                        // andnps        %xmm1,%xmm8
@@ -38612,8 +38724,8 @@
   .byte  15,84,194                           // andps         %xmm2,%xmm0
   .byte  65,15,85,209                        // andnps        %xmm9,%xmm2
   .byte  15,86,208                           // orps          %xmm0,%xmm2
-  .byte  68,15,89,5,48,216,0,0               // mulps         0xd830(%rip),%xmm8        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0xe34>
-  .byte  15,89,21,57,216,0,0                 // mulps         0xd839(%rip),%xmm2        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0xe44>
+  .byte  68,15,89,5,242,216,0,0              // mulps         0xd8f2(%rip),%xmm8        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0xe34>
+  .byte  15,89,21,251,216,0,0                // mulps         0xd8fb(%rip),%xmm2        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0xe44>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -38629,13 +38741,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,46                              // jne           1dbf5 <_sk_load_a8_sse2+0x46>
+  .byte  117,46                              // jne           1de93 <_sk_load_a8_sse2+0x46>
   .byte  102,67,15,110,4,16                  // movd          (%r8,%r10,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  102,15,97,192                       // punpcklwd     %xmm0,%xmm0
-  .byte  102,15,219,5,195,212,0,0            // pand          0xd4c3(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,5,133,213,0,0            // pand          0xd585(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,9,214,0,0                  // mulps         0xd609(%rip),%xmm3        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,29,203,214,0,0                // mulps         0xd6cb(%rip),%xmm3        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,87,201                       // xorpd         %xmm1,%xmm1
@@ -38644,12 +38756,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            1dc38 <_sk_load_a8_sse2+0x89>
+  .byte  116,54                              // je            1ded6 <_sk_load_a8_sse2+0x89>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1dc21 <_sk_load_a8_sse2+0x72>
+  .byte  116,21                              // je            1debf <_sk_load_a8_sse2+0x72>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           1dbd5 <_sk_load_a8_sse2+0x26>
+  .byte  117,195                             // jne           1de73 <_sk_load_a8_sse2+0x26>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
@@ -38658,10 +38770,10 @@
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  235,157                             // jmp           1dbd5 <_sk_load_a8_sse2+0x26>
+  .byte  235,157                             // jmp           1de73 <_sk_load_a8_sse2+0x26>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,146                             // jmp           1dbd5 <_sk_load_a8_sse2+0x26>
+  .byte  235,146                             // jmp           1de73 <_sk_load_a8_sse2+0x26>
 
 HIDDEN _sk_load_a8_dst_sse2
 .globl _sk_load_a8_dst_sse2
@@ -38674,13 +38786,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,46                              // jne           1dc89 <_sk_load_a8_dst_sse2+0x46>
+  .byte  117,46                              // jne           1df27 <_sk_load_a8_dst_sse2+0x46>
   .byte  102,67,15,110,36,16                 // movd          (%r8,%r10,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,37,47,212,0,0            // pand          0xd42f(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,37,241,212,0,0           // pand          0xd4f1(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,252                           // cvtdq2ps      %xmm4,%xmm7
-  .byte  15,89,61,117,213,0,0                // mulps         0xd575(%rip),%xmm7        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,61,55,214,0,0                 // mulps         0xd637(%rip),%xmm7        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  102,15,87,237                       // xorpd         %xmm5,%xmm5
@@ -38689,12 +38801,12 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            1dccc <_sk_load_a8_dst_sse2+0x89>
+  .byte  116,54                              // je            1df6a <_sk_load_a8_dst_sse2+0x89>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1dcb5 <_sk_load_a8_dst_sse2+0x72>
+  .byte  116,21                              // je            1df53 <_sk_load_a8_dst_sse2+0x72>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,195                             // jne           1dc69 <_sk_load_a8_dst_sse2+0x26>
+  .byte  117,195                             // jne           1df07 <_sk_load_a8_dst_sse2+0x26>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
@@ -38703,32 +38815,46 @@
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  102,15,97,232                       // punpcklwd     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  235,157                             // jmp           1dc69 <_sk_load_a8_dst_sse2+0x26>
+  .byte  235,157                             // jmp           1df07 <_sk_load_a8_dst_sse2+0x26>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,146                             // jmp           1dc69 <_sk_load_a8_dst_sse2+0x26>
+  .byte  235,146                             // jmp           1df07 <_sk_load_a8_dst_sse2+0x26>
 
 HIDDEN _sk_gather_a8_sse2
 .globl _sk_gather_a8_sse2
 FUNCTION(_sk_gather_a8_sse2)
 _sk_gather_a8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,88,12                     // movss         0xc(%rax),%xmm3
+  .byte  15,198,219,0                        // shufps        $0x0,%xmm3,%xmm3
+  .byte  102,69,15,118,201                   // pcmpeqd       %xmm9,%xmm9
+  .byte  102,65,15,254,217                   // paddd         %xmm9,%xmm3
+  .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,208                           // maxps         %xmm0,%xmm2
+  .byte  15,93,211                           // minps         %xmm3,%xmm2
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
-  .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
-  .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,216,245                  // pshufd        $0xf5,%xmm0,%xmm3
+  .byte  102,15,244,217                      // pmuludq       %xmm1,%xmm3
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
+  .byte  102,15,112,203,232                  // pshufd        $0xe8,%xmm3,%xmm1
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,202                       // cvttps2dq     %xmm2,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,15,112,192,78                   // pshufd        $0x4e,%xmm0,%xmm0
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
   .byte  102,73,15,126,194                   // movq          %xmm0,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
@@ -38742,15 +38868,14 @@
   .byte  68,9,200                            // or            %r9d,%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,65,15,196,194,1                 // pinsrw        $0x1,%r10d,%xmm0
-  .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,15,96,193                       // punpcklbw     %xmm1,%xmm0
-  .byte  102,15,97,193                       // punpcklwd     %xmm1,%xmm0
+  .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
+  .byte  102,65,15,97,192                    // punpcklwd     %xmm8,%xmm0
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,29,133,212,0,0                // mulps         0xd485(%rip),%xmm3        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,29,17,213,0,0                 // mulps         0xd511(%rip),%xmm3        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_store_a8_sse2
@@ -38763,7 +38888,7 @@
   .byte  77,15,175,193                       // imul          %r9,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
-  .byte  68,15,40,5,59,211,0,0               // movaps        0xd33b(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,200,211,0,0              // movaps        0xd3c8(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  68,15,89,195                        // mulps         %xmm3,%xmm8
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
   .byte  102,65,15,114,240,16                // pslld         $0x10,%xmm8
@@ -38771,7 +38896,7 @@
   .byte  102,68,15,107,192                   // packssdw      %xmm0,%xmm8
   .byte  102,68,15,103,192                   // packuswb      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,13                              // jne           1ddc6 <_sk_store_a8_sse2+0x4c>
+  .byte  117,13                              // jne           1e099 <_sk_store_a8_sse2+0x4c>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  67,137,4,16                         // mov           %eax,(%r8,%r10,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -38781,22 +38906,22 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            1de13 <_sk_store_a8_sse2+0x99>
+  .byte  116,54                              // je            1e0e6 <_sk_store_a8_sse2+0x99>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,17                              // je            1ddf4 <_sk_store_a8_sse2+0x7a>
+  .byte  116,17                              // je            1e0c7 <_sk_store_a8_sse2+0x7a>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,217                             // jne           1ddc2 <_sk_store_a8_sse2+0x48>
+  .byte  117,217                             // jne           1e095 <_sk_store_a8_sse2+0x48>
   .byte  102,65,15,197,192,4                 // pextrw        $0x4,%xmm8,%eax
   .byte  67,136,68,16,2                      // mov           %al,0x2(%r8,%r10,1)
-  .byte  102,68,15,219,5,163,210,0,0         // pand          0xd2a3(%rip),%xmm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,68,15,219,5,48,211,0,0          // pand          0xd330(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,67,137,4,16                     // mov           %ax,(%r8,%r10,1)
-  .byte  235,175                             // jmp           1ddc2 <_sk_store_a8_sse2+0x48>
+  .byte  235,175                             // jmp           1e095 <_sk_store_a8_sse2+0x48>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  67,136,4,16                         // mov           %al,(%r8,%r10,1)
-  .byte  235,164                             // jmp           1ddc2 <_sk_store_a8_sse2+0x48>
+  .byte  235,164                             // jmp           1e095 <_sk_store_a8_sse2+0x48>
 
 HIDDEN _sk_load_g8_sse2
 .globl _sk_load_g8_sse2
@@ -38809,27 +38934,27 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,49                              // jne           1de67 <_sk_load_g8_sse2+0x49>
+  .byte  117,49                              // jne           1e13a <_sk_load_g8_sse2+0x49>
   .byte  102,67,15,110,4,16                  // movd          (%r8,%r10,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  102,15,97,192                       // punpcklwd     %xmm0,%xmm0
-  .byte  102,15,219,5,84,210,0,0             // pand          0xd254(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,5,225,210,0,0            // pand          0xd2e1(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,154,211,0,0                 // mulps         0xd39a(%rip),%xmm0        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,5,39,212,0,0                  // mulps         0xd427(%rip),%xmm0        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,145,209,0,0                // movaps        0xd191(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,30,210,0,0                 // movaps        0xd21e(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            1deaa <_sk_load_g8_sse2+0x8c>
+  .byte  116,54                              // je            1e17d <_sk_load_g8_sse2+0x8c>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1de93 <_sk_load_g8_sse2+0x75>
+  .byte  116,21                              // je            1e166 <_sk_load_g8_sse2+0x75>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           1de44 <_sk_load_g8_sse2+0x26>
+  .byte  117,192                             // jne           1e117 <_sk_load_g8_sse2+0x26>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
@@ -38838,10 +38963,10 @@
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  235,154                             // jmp           1de44 <_sk_load_g8_sse2+0x26>
+  .byte  235,154                             // jmp           1e117 <_sk_load_g8_sse2+0x26>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,143                             // jmp           1de44 <_sk_load_g8_sse2+0x26>
+  .byte  235,143                             // jmp           1e117 <_sk_load_g8_sse2+0x26>
 
 HIDDEN _sk_load_g8_dst_sse2
 .globl _sk_load_g8_dst_sse2
@@ -38854,27 +38979,27 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,49                              // jne           1defe <_sk_load_g8_dst_sse2+0x49>
+  .byte  117,49                              // jne           1e1d1 <_sk_load_g8_dst_sse2+0x49>
   .byte  102,67,15,110,36,16                 // movd          (%r8,%r10,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,37,189,209,0,0           // pand          0xd1bd(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,219,37,74,210,0,0            // pand          0xd24a(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,3,211,0,0                  // mulps         0xd303(%rip),%xmm4        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,37,144,211,0,0                // mulps         0xd390(%rip),%xmm4        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,250,208,0,0                // movaps        0xd0fa(%rip),%xmm7        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,61,135,209,0,0                // movaps        0xd187(%rip),%xmm7        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,54                              // je            1df41 <_sk_load_g8_dst_sse2+0x8c>
+  .byte  116,54                              // je            1e214 <_sk_load_g8_dst_sse2+0x8c>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1df2a <_sk_load_g8_dst_sse2+0x75>
+  .byte  116,21                              // je            1e1fd <_sk_load_g8_dst_sse2+0x75>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,192                             // jne           1dedb <_sk_load_g8_dst_sse2+0x26>
+  .byte  117,192                             // jne           1e1ae <_sk_load_g8_dst_sse2+0x26>
   .byte  67,15,182,68,16,2                   // movzbl        0x2(%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
@@ -38883,32 +39008,46 @@
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  102,15,97,232                       // punpcklwd     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  235,154                             // jmp           1dedb <_sk_load_g8_dst_sse2+0x26>
+  .byte  235,154                             // jmp           1e1ae <_sk_load_g8_dst_sse2+0x26>
   .byte  67,15,182,4,16                      // movzbl        (%r8,%r10,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,143                             // jmp           1dedb <_sk_load_g8_dst_sse2+0x26>
+  .byte  235,143                             // jmp           1e1ae <_sk_load_g8_dst_sse2+0x26>
 
 HIDDEN _sk_gather_g8_sse2
 .globl _sk_gather_g8_sse2
 FUNCTION(_sk_gather_g8_sse2)
 _sk_gather_g8_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,88,12                     // movss         0xc(%rax),%xmm3
+  .byte  15,198,219,0                        // shufps        $0x0,%xmm3,%xmm3
+  .byte  102,69,15,118,201                   // pcmpeqd       %xmm9,%xmm9
+  .byte  102,65,15,254,217                   // paddd         %xmm9,%xmm3
+  .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,208                           // maxps         %xmm0,%xmm2
+  .byte  15,93,211                           // minps         %xmm3,%xmm2
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
-  .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
-  .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,216,245                  // pshufd        $0xf5,%xmm0,%xmm3
+  .byte  102,15,244,217                      // pmuludq       %xmm1,%xmm3
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
+  .byte  102,15,112,203,232                  // pshufd        $0xe8,%xmm3,%xmm1
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,202                       // cvttps2dq     %xmm2,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,15,112,192,78                   // pshufd        $0x4e,%xmm0,%xmm0
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
   .byte  102,73,15,126,194                   // movq          %xmm0,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
@@ -38922,13 +39061,12 @@
   .byte  68,9,200                            // or            %r9d,%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,65,15,196,194,1                 // pinsrw        $0x1,%r10d,%xmm0
-  .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  102,15,96,193                       // punpcklbw     %xmm1,%xmm0
-  .byte  102,15,97,193                       // punpcklwd     %xmm1,%xmm0
+  .byte  102,65,15,96,192                    // punpcklbw     %xmm8,%xmm0
+  .byte  102,65,15,97,192                    // punpcklwd     %xmm8,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,16,210,0,0                  // mulps         0xd210(%rip),%xmm0        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  15,89,5,103,210,0,0                 // mulps         0xd267(%rip),%xmm0        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,7,208,0,0                  // movaps        0xd007(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,94,208,0,0                 // movaps        0xd05e(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
@@ -38945,42 +39083,42 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,83                              // jne           1e05f <_sk_load_565_sse2+0x6e>
+  .byte  117,83                              // jne           1e368 <_sk_load_565_sse2+0x6e>
   .byte  243,67,15,126,20,80                 // movq          (%r8,%r10,2),%xmm2
   .byte  102,15,97,208                       // punpcklwd     %xmm0,%xmm2
-  .byte  102,15,111,5,226,209,0,0            // movdqa        0xd1e2(%rip),%xmm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,5,57,210,0,0             // movdqa        0xd239(%rip),%xmm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,228,209,0,0                 // mulps         0xd1e4(%rip),%xmm0        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,13,236,209,0,0           // movdqa        0xd1ec(%rip),%xmm1        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  15,89,5,59,210,0,0                  // mulps         0xd23b(%rip),%xmm0        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,13,67,210,0,0            // movdqa        0xd243(%rip),%xmm1        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,238,209,0,0                // mulps         0xd1ee(%rip),%xmm1        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,15,219,21,246,209,0,0           // pand          0xd1f6(%rip),%xmm2        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  15,89,13,69,210,0,0                 // mulps         0xd245(%rip),%xmm1        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,15,219,21,77,210,0,0            // pand          0xd24d(%rip),%xmm2        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,252,209,0,0                // mulps         0xd1fc(%rip),%xmm2        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  15,89,21,83,210,0,0                 // mulps         0xd253(%rip),%xmm2        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,147,207,0,0                // movaps        0xcf93(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,234,207,0,0                // movaps        0xcfea(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            1e09f <_sk_load_565_sse2+0xae>
+  .byte  116,51                              // je            1e3a8 <_sk_load_565_sse2+0xae>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1e08b <_sk_load_565_sse2+0x9a>
+  .byte  116,21                              // je            1e394 <_sk_load_565_sse2+0x9a>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           1e016 <_sk_load_565_sse2+0x25>
+  .byte  117,154                             // jne           1e31f <_sk_load_565_sse2+0x25>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,208,69                   // pshufd        $0x45,%xmm0,%xmm2
   .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
   .byte  242,15,112,192,212                  // pshuflw       $0xd4,%xmm0,%xmm0
   .byte  242,15,16,208                       // movsd         %xmm0,%xmm2
-  .byte  233,119,255,255,255                 // jmpq          1e016 <_sk_load_565_sse2+0x25>
+  .byte  233,119,255,255,255                 // jmpq          1e31f <_sk_load_565_sse2+0x25>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,208                      // movd          %eax,%xmm2
-  .byte  233,105,255,255,255                 // jmpq          1e016 <_sk_load_565_sse2+0x25>
+  .byte  233,105,255,255,255                 // jmpq          1e31f <_sk_load_565_sse2+0x25>
 
 HIDDEN _sk_load_565_dst_sse2
 .globl _sk_load_565_dst_sse2
@@ -38994,65 +39132,79 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,83                              // jne           1e11b <_sk_load_565_dst_sse2+0x6e>
+  .byte  117,83                              // jne           1e424 <_sk_load_565_dst_sse2+0x6e>
   .byte  243,67,15,126,52,80                 // movq          (%r8,%r10,2),%xmm6
   .byte  102,15,97,240                       // punpcklwd     %xmm0,%xmm6
-  .byte  102,15,111,37,38,209,0,0            // movdqa        0xd126(%rip),%xmm4        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,15,111,37,125,209,0,0           // movdqa        0xd17d(%rip),%xmm4        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,40,209,0,0                 // mulps         0xd128(%rip),%xmm4        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,45,48,209,0,0            // movdqa        0xd130(%rip),%xmm5        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  15,89,37,127,209,0,0                // mulps         0xd17f(%rip),%xmm4        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,45,135,209,0,0           // movdqa        0xd187(%rip),%xmm5        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,15,219,238                      // pand          %xmm6,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,50,209,0,0                 // mulps         0xd132(%rip),%xmm5        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,15,219,53,58,209,0,0            // pand          0xd13a(%rip),%xmm6        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  15,89,45,137,209,0,0                // mulps         0xd189(%rip),%xmm5        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,15,219,53,145,209,0,0           // pand          0xd191(%rip),%xmm6        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,64,209,0,0                 // mulps         0xd140(%rip),%xmm6        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  15,89,53,151,209,0,0                // mulps         0xd197(%rip),%xmm6        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,215,206,0,0                // movaps        0xced7(%rip),%xmm7        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,61,46,207,0,0                 // movaps        0xcf2e(%rip),%xmm7        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            1e15b <_sk_load_565_dst_sse2+0xae>
+  .byte  116,51                              // je            1e464 <_sk_load_565_dst_sse2+0xae>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1e147 <_sk_load_565_dst_sse2+0x9a>
+  .byte  116,21                              // je            1e450 <_sk_load_565_dst_sse2+0x9a>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,154                             // jne           1e0d2 <_sk_load_565_dst_sse2+0x25>
+  .byte  117,154                             // jne           1e3db <_sk_load_565_dst_sse2+0x25>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,244,69                   // pshufd        $0x45,%xmm4,%xmm6
   .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
   .byte  242,15,112,228,212                  // pshuflw       $0xd4,%xmm4,%xmm4
   .byte  242,15,16,244                       // movsd         %xmm4,%xmm6
-  .byte  233,119,255,255,255                 // jmpq          1e0d2 <_sk_load_565_dst_sse2+0x25>
+  .byte  233,119,255,255,255                 // jmpq          1e3db <_sk_load_565_dst_sse2+0x25>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,240                      // movd          %eax,%xmm6
-  .byte  233,105,255,255,255                 // jmpq          1e0d2 <_sk_load_565_dst_sse2+0x25>
+  .byte  233,105,255,255,255                 // jmpq          1e3db <_sk_load_565_dst_sse2+0x25>
 
 HIDDEN _sk_gather_565_sse2
 .globl _sk_gather_565_sse2
 FUNCTION(_sk_gather_565_sse2)
 _sk_gather_565_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,88,12                     // movss         0xc(%rax),%xmm3
+  .byte  15,198,219,0                        // shufps        $0x0,%xmm3,%xmm3
+  .byte  102,69,15,118,201                   // pcmpeqd       %xmm9,%xmm9
+  .byte  102,65,15,254,217                   // paddd         %xmm9,%xmm3
+  .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,208                           // maxps         %xmm0,%xmm2
+  .byte  15,93,211                           // minps         %xmm3,%xmm2
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
-  .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
-  .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,216,245                  // pshufd        $0xf5,%xmm0,%xmm3
+  .byte  102,15,244,217                      // pmuludq       %xmm1,%xmm3
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
+  .byte  102,15,112,203,232                  // pshufd        $0xe8,%xmm3,%xmm1
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,202                       // cvttps2dq     %xmm2,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,73,15,126,194                   // movq          %xmm0,%r10
+  .byte  102,73,15,126,202                   // movq          %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
   .byte  71,15,183,20,80                     // movzwl        (%r8,%r10,2),%r10d
@@ -39063,21 +39215,20 @@
   .byte  102,65,15,196,209,2                 // pinsrw        $0x2,%r9d,%xmm2
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,208,3                    // pinsrw        $0x3,%eax,%xmm2
-  .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  102,15,97,208                       // punpcklwd     %xmm0,%xmm2
-  .byte  102,15,111,5,10,208,0,0             // movdqa        0xd00a(%rip),%xmm0        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
+  .byte  102,65,15,97,208                    // punpcklwd     %xmm8,%xmm2
+  .byte  102,15,111,5,44,208,0,0             // movdqa        0xd02c(%rip),%xmm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xc64>
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,12,208,0,0                  // mulps         0xd00c(%rip),%xmm0        # 2b210 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
-  .byte  102,15,111,13,20,208,0,0            // movdqa        0xd014(%rip),%xmm1        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
+  .byte  15,89,5,46,208,0,0                  // mulps         0xd02e(%rip),%xmm0        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xc74>
+  .byte  102,15,111,13,54,208,0,0            // movdqa        0xd036(%rip),%xmm1        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xc84>
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,22,208,0,0                 // mulps         0xd016(%rip),%xmm1        # 2b230 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
-  .byte  102,15,219,21,30,208,0,0            // pand          0xd01e(%rip),%xmm2        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
+  .byte  15,89,13,56,208,0,0                 // mulps         0xd038(%rip),%xmm1        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xc94>
+  .byte  102,15,219,21,64,208,0,0            // pand          0xd040(%rip),%xmm2        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0xca4>
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,36,208,0,0                 // mulps         0xd024(%rip),%xmm2        # 2b250 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
+  .byte  15,89,21,70,208,0,0                 // mulps         0xd046(%rip),%xmm2        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0xcb4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,187,205,0,0                // movaps        0xcdbb(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,221,205,0,0                // movaps        0xcddd(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_store_565_sse2
@@ -39091,12 +39242,12 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
-  .byte  68,15,40,5,171,209,0,0              // movaps        0xd1ab(%rip),%xmm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xe64>
+  .byte  68,15,40,5,205,209,0,0              // movaps        0xd1cd(%rip),%xmm8        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0xe64>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
   .byte  102,65,15,114,241,11                // pslld         $0xb,%xmm9
-  .byte  68,15,40,21,160,209,0,0             // movaps        0xd1a0(%rip),%xmm10        # 2b410 <_sk_srcover_rgba_8888_sse2_lowp+0xe74>
+  .byte  68,15,40,21,194,209,0,0             // movaps        0xd1c2(%rip),%xmm10        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xe74>
   .byte  68,15,89,209                        // mulps         %xmm1,%xmm10
   .byte  102,69,15,91,210                    // cvtps2dq      %xmm10,%xmm10
   .byte  102,65,15,114,242,5                 // pslld         $0x5,%xmm10
@@ -39108,7 +39259,7 @@
   .byte  102,65,15,114,224,16                // psrad         $0x10,%xmm8
   .byte  102,68,15,107,192                   // packssdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1e2b2 <_sk_store_565_sse2+0x7b>
+  .byte  117,10                              // jne           1e5f0 <_sk_store_565_sse2+0x7b>
   .byte  102,71,15,214,4,80                  // movq          %xmm8,(%r8,%r10,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -39116,19 +39267,19 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,38                              // je            1e2ea <_sk_store_565_sse2+0xb3>
+  .byte  116,38                              // je            1e628 <_sk_store_565_sse2+0xb3>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            1e2dc <_sk_store_565_sse2+0xa5>
+  .byte  116,18                              // je            1e61a <_sk_store_565_sse2+0xa5>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,222                             // jne           1e2ae <_sk_store_565_sse2+0x77>
+  .byte  117,222                             // jne           1e5ec <_sk_store_565_sse2+0x77>
   .byte  102,65,15,197,192,4                 // pextrw        $0x4,%xmm8,%eax
   .byte  102,67,137,68,80,4                  // mov           %ax,0x4(%r8,%r10,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
   .byte  102,71,15,126,4,80                  // movd          %xmm8,(%r8,%r10,2)
-  .byte  235,196                             // jmp           1e2ae <_sk_store_565_sse2+0x77>
+  .byte  235,196                             // jmp           1e5ec <_sk_store_565_sse2+0x77>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,67,137,4,80                     // mov           %ax,(%r8,%r10,2)
-  .byte  235,184                             // jmp           1e2ae <_sk_store_565_sse2+0x77>
+  .byte  235,184                             // jmp           1e5ec <_sk_store_565_sse2+0x77>
 
 HIDDEN _sk_load_4444_sse2
 .globl _sk_load_4444_sse2
@@ -39142,45 +39293,45 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           1e373 <_sk_load_4444_sse2+0x7d>
+  .byte  117,98                              // jne           1e6b1 <_sk_load_4444_sse2+0x7d>
   .byte  243,67,15,126,28,80                 // movq          (%r8,%r10,2),%xmm3
   .byte  102,15,97,216                       // punpcklwd     %xmm0,%xmm3
-  .byte  102,15,111,5,253,208,0,0            // movdqa        0xd0fd(%rip),%xmm0        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
+  .byte  102,15,111,5,31,209,0,0             // movdqa        0xd11f(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,255,208,0,0                 // mulps         0xd0ff(%rip),%xmm0        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
-  .byte  102,15,111,13,7,209,0,0             // movdqa        0xd107(%rip),%xmm1        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
+  .byte  15,89,5,33,209,0,0                  // mulps         0xd121(%rip),%xmm0        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
+  .byte  102,15,111,13,41,209,0,0            // movdqa        0xd129(%rip),%xmm1        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,9,209,0,0                  // mulps         0xd109(%rip),%xmm1        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
-  .byte  102,15,111,21,17,209,0,0            // movdqa        0xd111(%rip),%xmm2        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
+  .byte  15,89,13,43,209,0,0                 // mulps         0xd12b(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
+  .byte  102,15,111,21,51,209,0,0            // movdqa        0xd133(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,19,209,0,0                 // mulps         0xd113(%rip),%xmm2        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
-  .byte  102,15,219,29,27,209,0,0            // pand          0xd11b(%rip),%xmm3        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
+  .byte  15,89,21,53,209,0,0                 // mulps         0xd135(%rip),%xmm2        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
+  .byte  102,15,219,29,61,209,0,0            // pand          0xd13d(%rip),%xmm3        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,33,209,0,0                 // mulps         0xd121(%rip),%xmm3        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
+  .byte  15,89,29,67,209,0,0                 // mulps         0xd143(%rip),%xmm3        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            1e3b3 <_sk_load_4444_sse2+0xbd>
+  .byte  116,51                              // je            1e6f1 <_sk_load_4444_sse2+0xbd>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1e39f <_sk_load_4444_sse2+0xa9>
+  .byte  116,21                              // je            1e6dd <_sk_load_4444_sse2+0xa9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           1e31b <_sk_load_4444_sse2+0x25>
+  .byte  117,139                             // jne           1e659 <_sk_load_4444_sse2+0x25>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,67,15,110,4,80                  // movd          (%r8,%r10,2),%xmm0
   .byte  242,15,112,192,212                  // pshuflw       $0xd4,%xmm0,%xmm0
   .byte  242,15,16,216                       // movsd         %xmm0,%xmm3
-  .byte  233,104,255,255,255                 // jmpq          1e31b <_sk_load_4444_sse2+0x25>
+  .byte  233,104,255,255,255                 // jmpq          1e659 <_sk_load_4444_sse2+0x25>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  233,90,255,255,255                  // jmpq          1e31b <_sk_load_4444_sse2+0x25>
+  .byte  233,90,255,255,255                  // jmpq          1e659 <_sk_load_4444_sse2+0x25>
 
 HIDDEN _sk_load_4444_dst_sse2
 .globl _sk_load_4444_dst_sse2
@@ -39194,68 +39345,82 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           1e43e <_sk_load_4444_dst_sse2+0x7d>
+  .byte  117,98                              // jne           1e77c <_sk_load_4444_dst_sse2+0x7d>
   .byte  243,67,15,126,60,80                 // movq          (%r8,%r10,2),%xmm7
   .byte  102,15,97,248                       // punpcklwd     %xmm0,%xmm7
-  .byte  102,15,111,37,50,208,0,0            // movdqa        0xd032(%rip),%xmm4        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
+  .byte  102,15,111,37,84,208,0,0            // movdqa        0xd054(%rip),%xmm4        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
   .byte  102,15,219,231                      // pand          %xmm7,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,37,52,208,0,0                 // mulps         0xd034(%rip),%xmm4        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
-  .byte  102,15,111,45,60,208,0,0            // movdqa        0xd03c(%rip),%xmm5        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
+  .byte  15,89,37,86,208,0,0                 // mulps         0xd056(%rip),%xmm4        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
+  .byte  102,15,111,45,94,208,0,0            // movdqa        0xd05e(%rip),%xmm5        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
   .byte  102,15,219,239                      // pand          %xmm7,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,45,62,208,0,0                 // mulps         0xd03e(%rip),%xmm5        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
-  .byte  102,15,111,53,70,208,0,0            // movdqa        0xd046(%rip),%xmm6        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
+  .byte  15,89,45,96,208,0,0                 // mulps         0xd060(%rip),%xmm5        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
+  .byte  102,15,111,53,104,208,0,0           // movdqa        0xd068(%rip),%xmm6        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
   .byte  102,15,219,247                      // pand          %xmm7,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,53,72,208,0,0                 // mulps         0xd048(%rip),%xmm6        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
-  .byte  102,15,219,61,80,208,0,0            // pand          0xd050(%rip),%xmm7        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
+  .byte  15,89,53,106,208,0,0                // mulps         0xd06a(%rip),%xmm6        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
+  .byte  102,15,219,61,114,208,0,0           // pand          0xd072(%rip),%xmm7        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
   .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  15,89,61,86,208,0,0                 // mulps         0xd056(%rip),%xmm7        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
+  .byte  15,89,61,120,208,0,0                // mulps         0xd078(%rip),%xmm7        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,51                              // je            1e47e <_sk_load_4444_dst_sse2+0xbd>
+  .byte  116,51                              // je            1e7bc <_sk_load_4444_dst_sse2+0xbd>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,21                              // je            1e46a <_sk_load_4444_dst_sse2+0xa9>
+  .byte  116,21                              // je            1e7a8 <_sk_load_4444_dst_sse2+0xa9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,139                             // jne           1e3e6 <_sk_load_4444_dst_sse2+0x25>
+  .byte  117,139                             // jne           1e724 <_sk_load_4444_dst_sse2+0x25>
   .byte  67,15,183,68,80,4                   // movzwl        0x4(%r8,%r10,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,112,252,69                   // pshufd        $0x45,%xmm4,%xmm7
   .byte  102,67,15,110,36,80                 // movd          (%r8,%r10,2),%xmm4
   .byte  242,15,112,228,212                  // pshuflw       $0xd4,%xmm4,%xmm4
   .byte  242,15,16,252                       // movsd         %xmm4,%xmm7
-  .byte  233,104,255,255,255                 // jmpq          1e3e6 <_sk_load_4444_dst_sse2+0x25>
+  .byte  233,104,255,255,255                 // jmpq          1e724 <_sk_load_4444_dst_sse2+0x25>
   .byte  67,15,183,4,80                      // movzwl        (%r8,%r10,2),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  233,90,255,255,255                  // jmpq          1e3e6 <_sk_load_4444_dst_sse2+0x25>
+  .byte  233,90,255,255,255                  // jmpq          1e724 <_sk_load_4444_dst_sse2+0x25>
 
 HIDDEN _sk_gather_4444_sse2
 .globl _sk_gather_4444_sse2
 FUNCTION(_sk_gather_4444_sse2)
 _sk_gather_4444_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,88,12                     // movss         0xc(%rax),%xmm3
+  .byte  15,198,219,0                        // shufps        $0x0,%xmm3,%xmm3
+  .byte  102,69,15,118,201                   // pcmpeqd       %xmm9,%xmm9
+  .byte  102,65,15,254,217                   // paddd         %xmm9,%xmm3
+  .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,208                           // maxps         %xmm0,%xmm2
+  .byte  15,93,211                           // minps         %xmm3,%xmm2
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
-  .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
-  .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,216,245                  // pshufd        $0xf5,%xmm0,%xmm3
+  .byte  102,15,244,217                      // pmuludq       %xmm1,%xmm3
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
+  .byte  102,15,112,203,232                  // pshufd        $0xe8,%xmm3,%xmm1
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,202                       // cvttps2dq     %xmm2,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,73,15,126,194                   // movq          %xmm0,%r10
+  .byte  102,73,15,126,202                   // movq          %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
   .byte  71,15,183,20,80                     // movzwl        (%r8,%r10,2),%r10d
@@ -39266,23 +39431,22 @@
   .byte  102,65,15,196,217,2                 // pinsrw        $0x2,%r9d,%xmm3
   .byte  65,15,183,4,64                      // movzwl        (%r8,%rax,2),%eax
   .byte  102,15,196,216,3                    // pinsrw        $0x3,%eax,%xmm3
-  .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  102,15,97,216                       // punpcklwd     %xmm0,%xmm3
-  .byte  102,15,111,5,7,207,0,0              // movdqa        0xcf07(%rip),%xmm0        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
+  .byte  102,65,15,97,216                    // punpcklwd     %xmm8,%xmm3
+  .byte  102,15,111,5,244,206,0,0            // movdqa        0xcef4(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xe84>
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,5,9,207,0,0                   // mulps         0xcf09(%rip),%xmm0        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
-  .byte  102,15,111,13,17,207,0,0            // movdqa        0xcf11(%rip),%xmm1        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
+  .byte  15,89,5,246,206,0,0                 // mulps         0xcef6(%rip),%xmm0        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xe94>
+  .byte  102,15,111,13,254,206,0,0           // movdqa        0xcefe(%rip),%xmm1        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xea4>
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,13,19,207,0,0                 // mulps         0xcf13(%rip),%xmm1        # 2b450 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
-  .byte  102,15,111,21,27,207,0,0            // movdqa        0xcf1b(%rip),%xmm2        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
+  .byte  15,89,13,0,207,0,0                  // mulps         0xcf00(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xeb4>
+  .byte  102,15,111,21,8,207,0,0             // movdqa        0xcf08(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xec4>
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,21,29,207,0,0                 // mulps         0xcf1d(%rip),%xmm2        # 2b470 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
-  .byte  102,15,219,29,37,207,0,0            // pand          0xcf25(%rip),%xmm3        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
+  .byte  15,89,21,10,207,0,0                 // mulps         0xcf0a(%rip),%xmm2        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xed4>
+  .byte  102,15,219,29,18,207,0,0            // pand          0xcf12(%rip),%xmm3        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xee4>
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,29,43,207,0,0                 // mulps         0xcf2b(%rip),%xmm3        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
+  .byte  15,89,29,24,207,0,0                 // mulps         0xcf18(%rip),%xmm3        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xef4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -39297,7 +39461,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  76,99,210                           // movslq        %edx,%r10
-  .byte  68,15,40,5,25,207,0,0               // movaps        0xcf19(%rip),%xmm8        # 2b4a0 <_sk_srcover_rgba_8888_sse2_lowp+0xf04>
+  .byte  68,15,40,5,6,207,0,0                // movaps        0xcf06(%rip),%xmm8        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0xf04>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
@@ -39319,7 +39483,7 @@
   .byte  102,65,15,114,224,16                // psrad         $0x10,%xmm8
   .byte  102,68,15,107,192                   // packssdw      %xmm0,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1e5f8 <_sk_store_4444_sse2+0x8f>
+  .byte  117,10                              // jne           1e96b <_sk_store_4444_sse2+0x8f>
   .byte  102,71,15,214,4,80                  // movq          %xmm8,(%r8,%r10,2)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -39327,19 +39491,19 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,38                              // je            1e630 <_sk_store_4444_sse2+0xc7>
+  .byte  116,38                              // je            1e9a3 <_sk_store_4444_sse2+0xc7>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,18                              // je            1e622 <_sk_store_4444_sse2+0xb9>
+  .byte  116,18                              // je            1e995 <_sk_store_4444_sse2+0xb9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,222                             // jne           1e5f4 <_sk_store_4444_sse2+0x8b>
+  .byte  117,222                             // jne           1e967 <_sk_store_4444_sse2+0x8b>
   .byte  102,65,15,197,192,4                 // pextrw        $0x4,%xmm8,%eax
   .byte  102,67,137,68,80,4                  // mov           %ax,0x4(%r8,%r10,2)
   .byte  242,69,15,112,192,232               // pshuflw       $0xe8,%xmm8,%xmm8
   .byte  102,71,15,126,4,80                  // movd          %xmm8,(%r8,%r10,2)
-  .byte  235,196                             // jmp           1e5f4 <_sk_store_4444_sse2+0x8b>
+  .byte  235,196                             // jmp           1e967 <_sk_store_4444_sse2+0x8b>
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,67,137,4,80                     // mov           %ax,(%r8,%r10,2)
-  .byte  235,184                             // jmp           1e5f4 <_sk_store_4444_sse2+0x8b>
+  .byte  235,184                             // jmp           1e967 <_sk_store_4444_sse2+0x8b>
 
 HIDDEN _sk_load_8888_sse2
 .globl _sk_load_8888_sse2
@@ -39353,13 +39517,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           1e6ba <_sk_load_8888_sse2+0x7e>
+  .byte  117,98                              // jne           1ea2d <_sk_load_8888_sse2+0x7e>
   .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,21,58,202,0,0            // movdqa        0xca3a(%rip),%xmm2        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,21,39,202,0,0            // movdqa        0xca27(%rip),%xmm2        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,118,203,0,0              // movaps        0xcb76(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,99,203,0,0               // movaps        0xcb63(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -39379,18 +39543,18 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            1e6f0 <_sk_load_8888_sse2+0xb4>
+  .byte  116,41                              // je            1ea63 <_sk_load_8888_sse2+0xb4>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            1e6e5 <_sk_load_8888_sse2+0xa9>
+  .byte  116,19                              // je            1ea58 <_sk_load_8888_sse2+0xa9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           1e65e <_sk_load_8888_sse2+0x22>
+  .byte  117,134                             // jne           1e9d1 <_sk_load_8888_sse2+0x22>
   .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
   .byte  102,68,15,112,200,69                // pshufd        $0x45,%xmm0,%xmm9
   .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          1e65e <_sk_load_8888_sse2+0x22>
+  .byte  233,110,255,255,255                 // jmpq          1e9d1 <_sk_load_8888_sse2+0x22>
   .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          1e65e <_sk_load_8888_sse2+0x22>
+  .byte  233,99,255,255,255                  // jmpq          1e9d1 <_sk_load_8888_sse2+0x22>
 
 HIDDEN _sk_load_8888_dst_sse2
 .globl _sk_load_8888_dst_sse2
@@ -39404,13 +39568,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           1e779 <_sk_load_8888_dst_sse2+0x7e>
+  .byte  117,98                              // jne           1eaec <_sk_load_8888_dst_sse2+0x7e>
   .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,53,123,201,0,0           // movdqa        0xc97b(%rip),%xmm6        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,53,104,201,0,0           // movdqa        0xc968(%rip),%xmm6        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,225                   // movdqa        %xmm9,%xmm4
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  68,15,40,5,183,202,0,0              // movaps        0xcab7(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,164,202,0,0              // movaps        0xcaa4(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,224                        // mulps         %xmm8,%xmm4
   .byte  102,65,15,111,233                   // movdqa        %xmm9,%xmm5
   .byte  102,15,114,213,8                    // psrld         $0x8,%xmm5
@@ -39430,41 +39594,54 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            1e7af <_sk_load_8888_dst_sse2+0xb4>
+  .byte  116,41                              // je            1eb22 <_sk_load_8888_dst_sse2+0xb4>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            1e7a4 <_sk_load_8888_dst_sse2+0xa9>
+  .byte  116,19                              // je            1eb17 <_sk_load_8888_dst_sse2+0xa9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           1e71d <_sk_load_8888_dst_sse2+0x22>
+  .byte  117,134                             // jne           1ea90 <_sk_load_8888_dst_sse2+0x22>
   .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
   .byte  102,68,15,112,204,69                // pshufd        $0x45,%xmm4,%xmm9
   .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          1e71d <_sk_load_8888_dst_sse2+0x22>
+  .byte  233,110,255,255,255                 // jmpq          1ea90 <_sk_load_8888_dst_sse2+0x22>
   .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          1e71d <_sk_load_8888_dst_sse2+0x22>
+  .byte  233,99,255,255,255                  // jmpq          1ea90 <_sk_load_8888_dst_sse2+0x22>
 
 HIDDEN _sk_gather_8888_sse2
 .globl _sk_gather_8888_sse2
 FUNCTION(_sk_gather_8888_sse2)
 _sk_gather_8888_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,65,15,91,201                    // cvttps2dq     %xmm9,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,73,15,126,194                   // movq          %xmm0,%r10
+  .byte  102,73,15,126,202                   // movq          %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
   .byte  102,67,15,110,4,144                 // movd          (%r8,%r10,4),%xmm0
@@ -39474,11 +39651,11 @@
   .byte  102,67,15,110,12,136                // movd          (%r8,%r9,4),%xmm1
   .byte  102,15,98,200                       // punpckldq     %xmm0,%xmm1
   .byte  102,68,15,108,201                   // punpcklqdq    %xmm1,%xmm9
-  .byte  102,15,111,21,101,200,0,0           // movdqa        0xc865(%rip),%xmm2        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,21,27,200,0,0            // movdqa        0xc81b(%rip),%xmm2        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  68,15,40,5,161,201,0,0              // movaps        0xc9a1(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,87,201,0,0               // movaps        0xc957(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -39507,7 +39684,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  68,15,40,5,34,200,0,0               // movaps        0xc822(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,216,199,0,0              // movaps        0xc7d8(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
@@ -39526,24 +39703,24 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,194                   // por           %xmm10,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1e90e <_sk_store_8888_sse2+0x7f>
+  .byte  117,10                              // jne           1ecb8 <_sk_store_8888_sse2+0x7f>
   .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,33                              // je            1e93c <_sk_store_8888_sse2+0xad>
+  .byte  116,33                              // je            1ece6 <_sk_store_8888_sse2+0xad>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            1e934 <_sk_store_8888_sse2+0xa5>
+  .byte  116,19                              // je            1ecde <_sk_store_8888_sse2+0xa5>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           1e90a <_sk_store_8888_sse2+0x7b>
+  .byte  117,227                             // jne           1ecb4 <_sk_store_8888_sse2+0x7b>
   .byte  102,69,15,112,200,78                // pshufd        $0x4e,%xmm8,%xmm9
   .byte  102,69,15,126,76,128,8              // movd          %xmm9,0x8(%r8,%rax,4)
   .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,206                             // jmp           1e90a <_sk_store_8888_sse2+0x7b>
+  .byte  235,206                             // jmp           1ecb4 <_sk_store_8888_sse2+0x7b>
   .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,198                             // jmp           1e90a <_sk_store_8888_sse2+0x7b>
+  .byte  235,198                             // jmp           1ecb4 <_sk_store_8888_sse2+0x7b>
 
 HIDDEN _sk_load_bgra_sse2
 .globl _sk_load_bgra_sse2
@@ -39557,13 +39734,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           1e9c2 <_sk_load_bgra_sse2+0x7e>
+  .byte  117,98                              // jne           1ed6c <_sk_load_bgra_sse2+0x7e>
   .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,5,50,199,0,0             // movdqa        0xc732(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,232,198,0,0            // movdqa        0xc6e8(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  15,91,209                           // cvtdq2ps      %xmm1,%xmm2
-  .byte  68,15,40,5,110,200,0,0              // movaps        0xc86e(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,36,200,0,0               // movaps        0xc824(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -39583,18 +39760,18 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            1e9f8 <_sk_load_bgra_sse2+0xb4>
+  .byte  116,41                              // je            1eda2 <_sk_load_bgra_sse2+0xb4>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            1e9ed <_sk_load_bgra_sse2+0xa9>
+  .byte  116,19                              // je            1ed97 <_sk_load_bgra_sse2+0xa9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           1e966 <_sk_load_bgra_sse2+0x22>
+  .byte  117,134                             // jne           1ed10 <_sk_load_bgra_sse2+0x22>
   .byte  102,65,15,110,68,128,8              // movd          0x8(%r8,%rax,4),%xmm0
   .byte  102,68,15,112,200,69                // pshufd        $0x45,%xmm0,%xmm9
   .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          1e966 <_sk_load_bgra_sse2+0x22>
+  .byte  233,110,255,255,255                 // jmpq          1ed10 <_sk_load_bgra_sse2+0x22>
   .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          1e966 <_sk_load_bgra_sse2+0x22>
+  .byte  233,99,255,255,255                  // jmpq          1ed10 <_sk_load_bgra_sse2+0x22>
 
 HIDDEN _sk_load_bgra_dst_sse2
 .globl _sk_load_bgra_dst_sse2
@@ -39608,13 +39785,13 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,98                              // jne           1ea81 <_sk_load_bgra_dst_sse2+0x7e>
+  .byte  117,98                              // jne           1ee2b <_sk_load_bgra_dst_sse2+0x7e>
   .byte  243,69,15,111,12,128                // movdqu        (%r8,%rax,4),%xmm9
-  .byte  102,15,111,37,115,198,0,0           // movdqa        0xc673(%rip),%xmm4        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,37,41,198,0,0            // movdqa        0xc629(%rip),%xmm4        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,233                   // movdqa        %xmm9,%xmm5
   .byte  102,15,219,236                      // pand          %xmm4,%xmm5
   .byte  15,91,245                           // cvtdq2ps      %xmm5,%xmm6
-  .byte  68,15,40,5,175,199,0,0              // movaps        0xc7af(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,101,199,0,0              // movaps        0xc765(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,240                        // mulps         %xmm8,%xmm6
   .byte  102,65,15,111,233                   // movdqa        %xmm9,%xmm5
   .byte  102,15,114,213,8                    // psrld         $0x8,%xmm5
@@ -39634,41 +39811,54 @@
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,41                              // je            1eab7 <_sk_load_bgra_dst_sse2+0xb4>
+  .byte  116,41                              // je            1ee61 <_sk_load_bgra_dst_sse2+0xb4>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            1eaac <_sk_load_bgra_dst_sse2+0xa9>
+  .byte  116,19                              // je            1ee56 <_sk_load_bgra_dst_sse2+0xa9>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,134                             // jne           1ea25 <_sk_load_bgra_dst_sse2+0x22>
+  .byte  117,134                             // jne           1edcf <_sk_load_bgra_dst_sse2+0x22>
   .byte  102,65,15,110,100,128,8             // movd          0x8(%r8,%rax,4),%xmm4
   .byte  102,68,15,112,204,69                // pshufd        $0x45,%xmm4,%xmm9
   .byte  102,69,15,18,12,128                 // movlpd        (%r8,%rax,4),%xmm9
-  .byte  233,110,255,255,255                 // jmpq          1ea25 <_sk_load_bgra_dst_sse2+0x22>
+  .byte  233,110,255,255,255                 // jmpq          1edcf <_sk_load_bgra_dst_sse2+0x22>
   .byte  102,69,15,110,12,128                // movd          (%r8,%rax,4),%xmm9
-  .byte  233,99,255,255,255                  // jmpq          1ea25 <_sk_load_bgra_dst_sse2+0x22>
+  .byte  233,99,255,255,255                  // jmpq          1edcf <_sk_load_bgra_dst_sse2+0x22>
 
 HIDDEN _sk_gather_bgra_sse2
 .globl _sk_gather_bgra_sse2
 FUNCTION(_sk_gather_bgra_sse2)
 _sk_gather_bgra_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,192                   // pcmpeqd       %xmm8,%xmm8
+  .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
+  .byte  68,15,95,200                        // maxps         %xmm0,%xmm9
+  .byte  68,15,93,202                        // minps         %xmm2,%xmm9
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,192                   // paddd         %xmm8,%xmm0
+  .byte  15,95,217                           // maxps         %xmm1,%xmm3
+  .byte  15,93,216                           // minps         %xmm0,%xmm3
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,65,15,91,201                    // cvttps2dq     %xmm9,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,73,15,126,194                   // movq          %xmm0,%r10
+  .byte  102,73,15,126,202                   // movq          %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
   .byte  102,67,15,110,4,144                 // movd          (%r8,%r10,4),%xmm0
@@ -39678,11 +39868,11 @@
   .byte  102,67,15,110,12,136                // movd          (%r8,%r9,4),%xmm1
   .byte  102,15,98,200                       // punpckldq     %xmm0,%xmm1
   .byte  102,68,15,108,201                   // punpcklqdq    %xmm1,%xmm9
-  .byte  102,15,111,5,93,197,0,0             // movdqa        0xc55d(%rip),%xmm0        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
+  .byte  102,15,111,5,220,196,0,0            // movdqa        0xc4dc(%rip),%xmm0        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0xb04>
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  15,91,209                           // cvtdq2ps      %xmm1,%xmm2
-  .byte  68,15,40,5,153,198,0,0              // movaps        0xc699(%rip),%xmm8        # 2b1f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
+  .byte  68,15,40,5,24,198,0,0               // movaps        0xc618(%rip),%xmm8        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xc54>
   .byte  65,15,89,208                        // mulps         %xmm8,%xmm2
   .byte  102,65,15,111,201                   // movdqa        %xmm9,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -39711,7 +39901,7 @@
   .byte  73,193,224,2                        // shl           $0x2,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
-  .byte  68,15,40,5,26,197,0,0               // movaps        0xc51a(%rip),%xmm8        # 2b0d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
+  .byte  68,15,40,5,153,196,0,0              // movaps        0xc499(%rip),%xmm8        # 2b430 <_sk_srcover_rgba_8888_sse2_lowp+0xb34>
   .byte  68,15,40,202                        // movaps        %xmm2,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  102,69,15,91,201                    // cvtps2dq      %xmm9,%xmm9
@@ -39730,24 +39920,24 @@
   .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
   .byte  102,69,15,235,194                   // por           %xmm10,%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,10                              // jne           1ec16 <_sk_store_bgra_sse2+0x7f>
+  .byte  117,10                              // jne           1eff7 <_sk_store_bgra_sse2+0x7f>
   .byte  243,69,15,127,4,128                 // movdqu        %xmm8,(%r8,%rax,4)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,137,249                          // mov           %edi,%r9d
   .byte  65,128,225,3                        // and           $0x3,%r9b
   .byte  65,128,249,1                        // cmp           $0x1,%r9b
-  .byte  116,33                              // je            1ec44 <_sk_store_bgra_sse2+0xad>
+  .byte  116,33                              // je            1f025 <_sk_store_bgra_sse2+0xad>
   .byte  65,128,249,2                        // cmp           $0x2,%r9b
-  .byte  116,19                              // je            1ec3c <_sk_store_bgra_sse2+0xa5>
+  .byte  116,19                              // je            1f01d <_sk_store_bgra_sse2+0xa5>
   .byte  65,128,249,3                        // cmp           $0x3,%r9b
-  .byte  117,227                             // jne           1ec12 <_sk_store_bgra_sse2+0x7b>
+  .byte  117,227                             // jne           1eff3 <_sk_store_bgra_sse2+0x7b>
   .byte  102,69,15,112,200,78                // pshufd        $0x4e,%xmm8,%xmm9
   .byte  102,69,15,126,76,128,8              // movd          %xmm9,0x8(%r8,%rax,4)
   .byte  102,69,15,214,4,128                 // movq          %xmm8,(%r8,%rax,4)
-  .byte  235,206                             // jmp           1ec12 <_sk_store_bgra_sse2+0x7b>
+  .byte  235,206                             // jmp           1eff3 <_sk_store_bgra_sse2+0x7b>
   .byte  102,69,15,126,4,128                 // movd          %xmm8,(%r8,%rax,4)
-  .byte  235,198                             // jmp           1ec12 <_sk_store_bgra_sse2+0x7b>
+  .byte  235,198                             // jmp           1eff3 <_sk_store_bgra_sse2+0x7b>
 
 HIDDEN _sk_load_f16_sse2
 .globl _sk_load_f16_sse2
@@ -39761,7 +39951,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,47,1,0,0                     // jne           1ed9b <_sk_load_f16_sse2+0x14f>
+  .byte  15,133,47,1,0,0                     // jne           1f17c <_sk_load_f16_sse2+0x14f>
   .byte  102,65,15,16,4,192                  // movupd        (%r8,%rax,8),%xmm0
   .byte  243,65,15,111,76,192,16             // movdqu        0x10(%r8,%rax,8),%xmm1
   .byte  102,68,15,40,192                    // movapd        %xmm0,%xmm8
@@ -39773,18 +39963,18 @@
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,65,15,97,202                    // punpcklwd     %xmm10,%xmm1
-  .byte  102,68,15,111,13,4,200,0,0          // movdqa        0xc804(%rip),%xmm9        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
+  .byte  102,68,15,111,13,131,199,0,0        // movdqa        0xc783(%rip),%xmm9        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
   .byte  102,68,15,111,225                   // movdqa        %xmm1,%xmm12
   .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,1,200,0,0          // movdqa        0xc801(%rip),%xmm11        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,29,128,199,0,0        // movdqa        0xc780(%rip),%xmm11        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
   .byte  102,65,15,219,203                   // pand          %xmm11,%xmm1
-  .byte  102,15,111,29,4,200,0,0             // movdqa        0xc804(%rip),%xmm3        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
+  .byte  102,15,111,29,131,199,0,0           // movdqa        0xc783(%rip),%xmm3        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
   .byte  102,65,15,114,244,16                // pslld         $0x10,%xmm12
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,102,193                      // pcmpgtd       %xmm1,%xmm0
   .byte  102,15,114,241,13                   // pslld         $0xd,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,37,243,199,0,0        // movdqa        0xc7f3(%rip),%xmm12        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
+  .byte  102,68,15,111,37,114,199,0,0        // movdqa        0xc772(%rip),%xmm12        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
   .byte  102,65,15,254,204                   // paddd         %xmm12,%xmm1
   .byte  102,15,223,193                      // pandn         %xmm1,%xmm0
   .byte  102,65,15,105,210                   // punpckhwd     %xmm10,%xmm2
@@ -39823,16 +40013,16 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  242,65,15,16,4,192                  // movsd         (%r8,%rax,8),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1edb4 <_sk_load_f16_sse2+0x168>
+  .byte  117,13                              // jne           1f195 <_sk_load_f16_sse2+0x168>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,197,254,255,255                 // jmpq          1ec79 <_sk_load_f16_sse2+0x2d>
+  .byte  233,197,254,255,255                 // jmpq          1f05a <_sk_load_f16_sse2+0x2d>
   .byte  102,65,15,22,68,192,8               // movhpd        0x8(%r8,%rax,8),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,176,254,255,255              // jb            1ec79 <_sk_load_f16_sse2+0x2d>
+  .byte  15,130,176,254,255,255              // jb            1f05a <_sk_load_f16_sse2+0x2d>
   .byte  243,65,15,126,76,192,16             // movq          0x10(%r8,%rax,8),%xmm1
-  .byte  233,164,254,255,255                 // jmpq          1ec79 <_sk_load_f16_sse2+0x2d>
+  .byte  233,164,254,255,255                 // jmpq          1f05a <_sk_load_f16_sse2+0x2d>
 
 HIDDEN _sk_load_f16_dst_sse2
 .globl _sk_load_f16_dst_sse2
@@ -39846,7 +40036,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,47,1,0,0                     // jne           1ef24 <_sk_load_f16_dst_sse2+0x14f>
+  .byte  15,133,47,1,0,0                     // jne           1f305 <_sk_load_f16_dst_sse2+0x14f>
   .byte  102,65,15,16,36,192                 // movupd        (%r8,%rax,8),%xmm4
   .byte  243,65,15,111,108,192,16            // movdqu        0x10(%r8,%rax,8),%xmm5
   .byte  102,68,15,40,196                    // movapd        %xmm4,%xmm8
@@ -39858,18 +40048,18 @@
   .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,65,15,97,234                    // punpcklwd     %xmm10,%xmm5
-  .byte  102,68,15,111,13,123,198,0,0        // movdqa        0xc67b(%rip),%xmm9        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
+  .byte  102,68,15,111,13,250,197,0,0        // movdqa        0xc5fa(%rip),%xmm9        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
   .byte  102,68,15,111,229                   // movdqa        %xmm5,%xmm12
   .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,120,198,0,0        // movdqa        0xc678(%rip),%xmm11        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
+  .byte  102,68,15,111,29,247,197,0,0        // movdqa        0xc5f7(%rip),%xmm11        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
   .byte  102,65,15,219,235                   // pand          %xmm11,%xmm5
-  .byte  102,15,111,61,123,198,0,0           // movdqa        0xc67b(%rip),%xmm7        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
+  .byte  102,15,111,61,250,197,0,0           // movdqa        0xc5fa(%rip),%xmm7        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
   .byte  102,65,15,114,244,16                // pslld         $0x10,%xmm12
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
   .byte  102,15,102,229                      // pcmpgtd       %xmm5,%xmm4
   .byte  102,15,114,245,13                   // pslld         $0xd,%xmm5
   .byte  102,65,15,235,236                   // por           %xmm12,%xmm5
-  .byte  102,68,15,111,37,106,198,0,0        // movdqa        0xc66a(%rip),%xmm12        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
+  .byte  102,68,15,111,37,233,197,0,0        // movdqa        0xc5e9(%rip),%xmm12        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
   .byte  102,65,15,254,236                   // paddd         %xmm12,%xmm5
   .byte  102,15,223,229                      // pandn         %xmm5,%xmm4
   .byte  102,65,15,105,242                   // punpckhwd     %xmm10,%xmm6
@@ -39908,39 +40098,53 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  242,65,15,16,36,192                 // movsd         (%r8,%rax,8),%xmm4
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1ef3d <_sk_load_f16_dst_sse2+0x168>
+  .byte  117,13                              // jne           1f31e <_sk_load_f16_dst_sse2+0x168>
   .byte  243,15,126,228                      // movq          %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
-  .byte  233,197,254,255,255                 // jmpq          1ee02 <_sk_load_f16_dst_sse2+0x2d>
+  .byte  233,197,254,255,255                 // jmpq          1f1e3 <_sk_load_f16_dst_sse2+0x2d>
   .byte  102,65,15,22,100,192,8              // movhpd        0x8(%r8,%rax,8),%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,176,254,255,255              // jb            1ee02 <_sk_load_f16_dst_sse2+0x2d>
+  .byte  15,130,176,254,255,255              // jb            1f1e3 <_sk_load_f16_dst_sse2+0x2d>
   .byte  243,65,15,126,108,192,16            // movq          0x10(%r8,%rax,8),%xmm5
-  .byte  233,164,254,255,255                 // jmpq          1ee02 <_sk_load_f16_dst_sse2+0x2d>
+  .byte  233,164,254,255,255                 // jmpq          1f1e3 <_sk_load_f16_dst_sse2+0x2d>
 
 HIDDEN _sk_gather_f16_sse2
 .globl _sk_gather_f16_sse2
 FUNCTION(_sk_gather_f16_sse2)
 _sk_gather_f16_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
+  .byte  243,15,16,80,12                     // movss         0xc(%rax),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,69,15,118,201                   // pcmpeqd       %xmm9,%xmm9
+  .byte  102,65,15,254,209                   // paddd         %xmm9,%xmm2
+  .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
+  .byte  15,87,219                           // xorps         %xmm3,%xmm3
+  .byte  15,95,216                           // maxps         %xmm0,%xmm3
+  .byte  15,93,218                           // minps         %xmm2,%xmm3
+  .byte  243,15,16,64,16                     // movss         0x10(%rax),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,209                           // maxps         %xmm1,%xmm2
+  .byte  15,93,208                           // minps         %xmm0,%xmm2
   .byte  76,139,0                            // mov           (%rax),%r8
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,80,8                     // movd          0x8(%rax),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,194                       // cvttps2dq     %xmm2,%xmm0
+  .byte  102,15,110,72,8                     // movd          0x8(%rax),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,72,15,126,200                   // movq          %xmm1,%rax
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,203                       // cvttps2dq     %xmm3,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,72,15,126,192                   // movq          %xmm0,%rax
   .byte  65,137,193                          // mov           %eax,%r9d
   .byte  72,193,232,32                       // shr           $0x20,%rax
-  .byte  102,73,15,126,194                   // movq          %xmm0,%r10
+  .byte  102,73,15,126,202                   // movq          %xmm1,%r10
   .byte  69,137,211                          // mov           %r10d,%r11d
   .byte  73,193,234,32                       // shr           $0x20,%r10
   .byte  243,67,15,126,4,208                 // movq          (%r8,%r10,8),%xmm0
@@ -39949,32 +40153,31 @@
   .byte  243,65,15,126,4,192                 // movq          (%r8,%rax,8),%xmm0
   .byte  243,67,15,126,20,200                // movq          (%r8,%r9,8),%xmm2
   .byte  102,15,108,208                      // punpcklqdq    %xmm0,%xmm2
-  .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
-  .byte  102,68,15,97,194                    // punpcklwd     %xmm2,%xmm8
+  .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
+  .byte  102,68,15,97,202                    // punpcklwd     %xmm2,%xmm9
   .byte  102,15,105,202                      // punpckhwd     %xmm2,%xmm1
-  .byte  102,65,15,111,208                   // movdqa        %xmm8,%xmm2
+  .byte  102,65,15,111,209                   // movdqa        %xmm9,%xmm2
   .byte  102,15,97,209                       // punpcklwd     %xmm1,%xmm2
-  .byte  102,68,15,105,193                   // punpckhwd     %xmm1,%xmm8
-  .byte  102,69,15,239,210                   // pxor          %xmm10,%xmm10
+  .byte  102,68,15,105,201                   // punpckhwd     %xmm1,%xmm9
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,65,15,97,202                    // punpcklwd     %xmm10,%xmm1
-  .byte  102,68,15,111,13,172,196,0,0        // movdqa        0xc4ac(%rip),%xmm9        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
+  .byte  102,65,15,97,200                    // punpcklwd     %xmm8,%xmm1
+  .byte  102,68,15,111,21,248,195,0,0        // movdqa        0xc3f8(%rip),%xmm10        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xf14>
   .byte  102,68,15,111,225                   // movdqa        %xmm1,%xmm12
-  .byte  102,69,15,219,225                   // pand          %xmm9,%xmm12
-  .byte  102,68,15,111,29,169,196,0,0        // movdqa        0xc4a9(%rip),%xmm11        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
+  .byte  102,69,15,219,226                   // pand          %xmm10,%xmm12
+  .byte  102,68,15,111,29,245,195,0,0        // movdqa        0xc3f5(%rip),%xmm11        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xf24>
   .byte  102,65,15,219,203                   // pand          %xmm11,%xmm1
-  .byte  102,15,111,29,172,196,0,0           // movdqa        0xc4ac(%rip),%xmm3        # 2b4d0 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
+  .byte  102,15,111,29,248,195,0,0           // movdqa        0xc3f8(%rip),%xmm3        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xf34>
   .byte  102,65,15,114,244,16                // pslld         $0x10,%xmm12
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,102,193                      // pcmpgtd       %xmm1,%xmm0
   .byte  102,15,114,241,13                   // pslld         $0xd,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,37,155,196,0,0        // movdqa        0xc49b(%rip),%xmm12        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
+  .byte  102,68,15,111,37,231,195,0,0        // movdqa        0xc3e7(%rip),%xmm12        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xf44>
   .byte  102,65,15,254,204                   // paddd         %xmm12,%xmm1
   .byte  102,15,223,193                      // pandn         %xmm1,%xmm0
-  .byte  102,65,15,105,210                   // punpckhwd     %xmm10,%xmm2
+  .byte  102,65,15,105,208                   // punpckhwd     %xmm8,%xmm2
   .byte  102,68,15,111,234                   // movdqa        %xmm2,%xmm13
-  .byte  102,69,15,219,233                   // pand          %xmm9,%xmm13
+  .byte  102,69,15,219,234                   // pand          %xmm10,%xmm13
   .byte  102,65,15,219,211                   // pand          %xmm11,%xmm2
   .byte  102,65,15,114,245,16                // pslld         $0x10,%xmm13
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
@@ -39983,10 +40186,10 @@
   .byte  102,65,15,235,213                   // por           %xmm13,%xmm2
   .byte  102,65,15,254,212                   // paddd         %xmm12,%xmm2
   .byte  102,15,223,202                      // pandn         %xmm2,%xmm1
-  .byte  102,69,15,111,232                   // movdqa        %xmm8,%xmm13
-  .byte  102,69,15,97,234                    // punpcklwd     %xmm10,%xmm13
+  .byte  102,69,15,111,233                   // movdqa        %xmm9,%xmm13
+  .byte  102,69,15,97,232                    // punpcklwd     %xmm8,%xmm13
   .byte  102,69,15,111,245                   // movdqa        %xmm13,%xmm14
-  .byte  102,69,15,219,241                   // pand          %xmm9,%xmm14
+  .byte  102,69,15,219,242                   // pand          %xmm10,%xmm14
   .byte  102,69,15,219,235                   // pand          %xmm11,%xmm13
   .byte  102,65,15,114,246,16                // pslld         $0x10,%xmm14
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
@@ -39995,15 +40198,15 @@
   .byte  102,69,15,235,238                   // por           %xmm14,%xmm13
   .byte  102,69,15,254,236                   // paddd         %xmm12,%xmm13
   .byte  102,65,15,223,213                   // pandn         %xmm13,%xmm2
-  .byte  102,69,15,105,194                   // punpckhwd     %xmm10,%xmm8
-  .byte  102,69,15,219,200                   // pand          %xmm8,%xmm9
-  .byte  102,69,15,219,195                   // pand          %xmm11,%xmm8
-  .byte  102,65,15,114,241,16                // pslld         $0x10,%xmm9
-  .byte  102,65,15,102,216                   // pcmpgtd       %xmm8,%xmm3
-  .byte  102,65,15,114,240,13                // pslld         $0xd,%xmm8
-  .byte  102,69,15,235,193                   // por           %xmm9,%xmm8
-  .byte  102,69,15,254,196                   // paddd         %xmm12,%xmm8
-  .byte  102,65,15,223,216                   // pandn         %xmm8,%xmm3
+  .byte  102,69,15,105,200                   // punpckhwd     %xmm8,%xmm9
+  .byte  102,69,15,219,209                   // pand          %xmm9,%xmm10
+  .byte  102,69,15,219,203                   // pand          %xmm11,%xmm9
+  .byte  102,65,15,114,242,16                // pslld         $0x10,%xmm10
+  .byte  102,65,15,102,217                   // pcmpgtd       %xmm9,%xmm3
+  .byte  102,65,15,114,241,13                // pslld         $0xd,%xmm9
+  .byte  102,69,15,235,202                   // por           %xmm10,%xmm9
+  .byte  102,69,15,254,204                   // paddd         %xmm12,%xmm9
+  .byte  102,65,15,223,217                   // pandn         %xmm9,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
 
@@ -40012,19 +40215,19 @@
 FUNCTION(_sk_store_f16_sse2)
 _sk_store_f16_sse2:
   .byte  15,41,124,36,232                    // movaps        %xmm7,-0x18(%rsp)
-  .byte  102,68,15,111,29,239,195,0,0        // movdqa        0xc3ef(%rip),%xmm11        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  102,68,15,111,29,59,195,0,0         // movdqa        0xc33b(%rip),%xmm11        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,69,15,219,195                   // pand          %xmm11,%xmm8
-  .byte  102,68,15,111,21,236,195,0,0        // movdqa        0xc3ec(%rip),%xmm10        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0xf64>
+  .byte  102,68,15,111,21,56,195,0,0         // movdqa        0xc338(%rip),%xmm10        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0xf64>
   .byte  102,68,15,111,240                   // movdqa        %xmm0,%xmm14
   .byte  102,69,15,219,242                   // pand          %xmm10,%xmm14
-  .byte  102,15,111,61,234,195,0,0           // movdqa        0xc3ea(%rip),%xmm7        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0xf74>
-  .byte  102,68,15,111,37,145,197,0,0        // movdqa        0xc591(%rip),%xmm12        # 2b6c0 <_sk_srcover_rgba_8888_sse2_lowp+0x1124>
+  .byte  102,15,111,61,54,195,0,0            // movdqa        0xc336(%rip),%xmm7        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0xf74>
+  .byte  102,68,15,111,37,221,196,0,0        // movdqa        0xc4dd(%rip),%xmm12        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0x1124>
   .byte  102,68,15,111,248                   // movdqa        %xmm0,%xmm15
   .byte  102,65,15,114,247,3                 // pslld         $0x3,%xmm15
   .byte  102,69,15,219,252                   // pand          %xmm12,%xmm15
   .byte  102,69,15,254,248                   // paddd         %xmm8,%xmm15
-  .byte  102,68,15,111,45,67,192,0,0         // movdqa        0xc043(%rip),%xmm13        # 2b190 <_sk_srcover_rgba_8888_sse2_lowp+0xbf4>
+  .byte  102,68,15,111,45,143,191,0,0        // movdqa        0xbf8f(%rip),%xmm13        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf4>
   .byte  102,69,15,254,253                   // paddd         %xmm13,%xmm15
   .byte  102,65,15,114,231,16                // psrad         $0x10,%xmm15
   .byte  102,68,15,111,199                   // movdqa        %xmm7,%xmm8
@@ -40080,7 +40283,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  72,99,194                           // movslq        %edx,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,37                              // jne           1f27f <_sk_store_f16_sse2+0x18c>
+  .byte  117,37                              // jne           1f693 <_sk_store_f16_sse2+0x18c>
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,65,15,98,254                    // punpckldq     %xmm14,%xmm7
   .byte  243,65,15,127,60,192                // movdqu        %xmm7,(%r8,%rax,8)
@@ -40093,13 +40296,13 @@
   .byte  102,69,15,98,206                    // punpckldq     %xmm14,%xmm9
   .byte  102,69,15,214,12,192                // movq          %xmm9,(%r8,%rax,8)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,225                             // je            1f276 <_sk_store_f16_sse2+0x183>
+  .byte  116,225                             // je            1f68a <_sk_store_f16_sse2+0x183>
   .byte  102,69,15,23,76,192,8               // movhpd        %xmm9,0x8(%r8,%rax,8)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,212                             // jb            1f276 <_sk_store_f16_sse2+0x183>
+  .byte  114,212                             // jb            1f68a <_sk_store_f16_sse2+0x183>
   .byte  102,69,15,106,198                   // punpckhdq     %xmm14,%xmm8
   .byte  102,69,15,214,68,192,16             // movq          %xmm8,0x10(%r8,%rax,8)
-  .byte  235,198                             // jmp           1f276 <_sk_store_f16_sse2+0x183>
+  .byte  235,198                             // jmp           1f68a <_sk_store_f16_sse2+0x183>
 
 HIDDEN _sk_load_u16_be_sse2
 .globl _sk_load_u16_be_sse2
@@ -40114,7 +40317,7 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,190,0,0,0                    // jne           1f395 <_sk_load_u16_be_sse2+0xe5>
+  .byte  15,133,190,0,0,0                    // jne           1f7a9 <_sk_load_u16_be_sse2+0xe5>
   .byte  102,65,15,16,4,64                   // movupd        (%r8,%rax,2),%xmm0
   .byte  243,65,15,111,76,64,16              // movdqu        0x10(%r8,%rax,2),%xmm1
   .byte  102,15,40,208                       // movapd        %xmm0,%xmm2
@@ -40131,7 +40334,7 @@
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,65,15,97,201                    // punpcklwd     %xmm9,%xmm1
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  68,15,40,5,88,191,0,0               // movaps        0xbf58(%rip),%xmm8        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
+  .byte  68,15,40,5,164,190,0,0              // movaps        0xbea4(%rip),%xmm8        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -40159,16 +40362,16 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  242,65,15,16,4,64                   // movsd         (%r8,%rax,2),%xmm0
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1f3ae <_sk_load_u16_be_sse2+0xfe>
+  .byte  117,13                              // jne           1f7c2 <_sk_load_u16_be_sse2+0xfe>
   .byte  243,15,126,192                      // movq          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
-  .byte  233,54,255,255,255                  // jmpq          1f2e4 <_sk_load_u16_be_sse2+0x34>
+  .byte  233,54,255,255,255                  // jmpq          1f6f8 <_sk_load_u16_be_sse2+0x34>
   .byte  102,65,15,22,68,64,8                // movhpd        0x8(%r8,%rax,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  15,130,33,255,255,255               // jb            1f2e4 <_sk_load_u16_be_sse2+0x34>
+  .byte  15,130,33,255,255,255               // jb            1f6f8 <_sk_load_u16_be_sse2+0x34>
   .byte  243,65,15,126,76,64,16              // movq          0x10(%r8,%rax,2),%xmm1
-  .byte  233,21,255,255,255                  // jmpq          1f2e4 <_sk_load_u16_be_sse2+0x34>
+  .byte  233,21,255,255,255                  // jmpq          1f6f8 <_sk_load_u16_be_sse2+0x34>
 
 HIDDEN _sk_load_rgb_u16_be_sse2
 .globl _sk_load_rgb_u16_be_sse2
@@ -40185,7 +40388,7 @@
   .byte  72,141,4,64                         // lea           (%rax,%rax,2),%rax
   .byte  72,193,248,32                       // sar           $0x20,%rax
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  15,133,175,0,0,0                    // jne           1f4a9 <_sk_load_rgb_u16_be_sse2+0xda>
+  .byte  15,133,175,0,0,0                    // jne           1f8bd <_sk_load_rgb_u16_be_sse2+0xda>
   .byte  243,65,15,111,20,64                 // movdqu        (%r8,%rax,2),%xmm2
   .byte  243,65,15,111,92,64,8               // movdqu        0x8(%r8,%rax,2),%xmm3
   .byte  102,15,115,219,4                    // psrldq        $0x4,%xmm3
@@ -40206,7 +40409,7 @@
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,65,15,97,200                    // punpcklwd     %xmm8,%xmm1
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  68,15,40,13,34,190,0,0              // movaps        0xbe22(%rip),%xmm9        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
+  .byte  68,15,40,13,110,189,0,0             // movaps        0xbd6e(%rip),%xmm9        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0xce4>
   .byte  65,15,89,193                        // mulps         %xmm9,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -40223,27 +40426,27 @@
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  65,15,89,209                        // mulps         %xmm9,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,73,187,0,0                 // movaps        0xbb49(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,149,186,0,0                // movaps        0xba95(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,20,64                 // movd          (%r8,%rax,2),%xmm2
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,84,64,4,2             // pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,13                              // jne           1f4ce <_sk_load_rgb_u16_be_sse2+0xff>
+  .byte  117,13                              // jne           1f8e2 <_sk_load_rgb_u16_be_sse2+0xff>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  233,80,255,255,255                  // jmpq          1f41e <_sk_load_rgb_u16_be_sse2+0x4f>
+  .byte  233,80,255,255,255                  // jmpq          1f832 <_sk_load_rgb_u16_be_sse2+0x4f>
   .byte  102,65,15,110,68,64,6               // movd          0x6(%r8,%rax,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,68,64,10,2            // pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,24                              // jb            1f4ff <_sk_load_rgb_u16_be_sse2+0x130>
+  .byte  114,24                              // jb            1f913 <_sk_load_rgb_u16_be_sse2+0x130>
   .byte  102,65,15,110,92,64,12              // movd          0xc(%r8,%rax,2),%xmm3
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,92,64,16,2            // pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  .byte  233,31,255,255,255                  // jmpq          1f41e <_sk_load_rgb_u16_be_sse2+0x4f>
+  .byte  233,31,255,255,255                  // jmpq          1f832 <_sk_load_rgb_u16_be_sse2+0x4f>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  233,22,255,255,255                  // jmpq          1f41e <_sk_load_rgb_u16_be_sse2+0x4f>
+  .byte  233,22,255,255,255                  // jmpq          1f832 <_sk_load_rgb_u16_be_sse2+0x4f>
 
 HIDDEN _sk_store_u16_be_sse2
 .globl _sk_store_u16_be_sse2
@@ -40257,7 +40460,7 @@
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  73,99,193                           // movslq        %r9d,%rax
-  .byte  68,15,40,21,2,192,0,0               // movaps        0xc002(%rip),%xmm10        # 2b530 <_sk_srcover_rgba_8888_sse2_lowp+0xf94>
+  .byte  68,15,40,21,78,191,0,0              // movaps        0xbf4e(%rip),%xmm10        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0xf94>
   .byte  68,15,40,192                        // movaps        %xmm0,%xmm8
   .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
   .byte  102,69,15,91,192                    // cvtps2dq      %xmm8,%xmm8
@@ -40302,7 +40505,7 @@
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
   .byte  102,69,15,98,209                    // punpckldq     %xmm9,%xmm10
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,21                              // jne           1f628 <_sk_store_u16_be_sse2+0x120>
+  .byte  117,21                              // jne           1fa3c <_sk_store_u16_be_sse2+0x120>
   .byte  69,15,17,20,64                      // movups        %xmm10,(%r8,%rax,2)
   .byte  102,69,15,106,193                   // punpckhdq     %xmm9,%xmm8
   .byte  243,69,15,127,68,64,16              // movdqu        %xmm8,0x10(%r8,%rax,2)
@@ -40310,13 +40513,13 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,214,20,64                 // movq          %xmm10,(%r8,%rax,2)
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,240                             // je            1f624 <_sk_store_u16_be_sse2+0x11c>
+  .byte  116,240                             // je            1fa38 <_sk_store_u16_be_sse2+0x11c>
   .byte  102,69,15,23,84,64,8                // movhpd        %xmm10,0x8(%r8,%rax,2)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,227                             // jb            1f624 <_sk_store_u16_be_sse2+0x11c>
+  .byte  114,227                             // jb            1fa38 <_sk_store_u16_be_sse2+0x11c>
   .byte  102,69,15,106,193                   // punpckhdq     %xmm9,%xmm8
   .byte  102,69,15,214,68,64,16              // movq          %xmm8,0x10(%r8,%rax,2)
-  .byte  235,213                             // jmp           1f624 <_sk_store_u16_be_sse2+0x11c>
+  .byte  235,213                             // jmp           1fa38 <_sk_store_u16_be_sse2+0x11c>
 
 HIDDEN _sk_load_f32_sse2
 .globl _sk_load_f32_sse2
@@ -40332,7 +40535,7 @@
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           1f6ba <_sk_load_f32_sse2+0x6b>
+  .byte  117,66                              // jne           1face <_sk_load_f32_sse2+0x6b>
   .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
   .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
   .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
@@ -40352,17 +40555,17 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           1f6cc <_sk_load_f32_sse2+0x7d>
+  .byte  117,8                               // jne           1fae0 <_sk_load_f32_sse2+0x7d>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
-  .byte  235,190                             // jmp           1f68a <_sk_load_f32_sse2+0x3b>
+  .byte  235,190                             // jmp           1fa9e <_sk_load_f32_sse2+0x3b>
   .byte  65,15,16,68,128,16                  // movups        0x10(%r8,%rax,4),%xmm0
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            1f6e0 <_sk_load_f32_sse2+0x91>
+  .byte  114,8                               // jb            1faf4 <_sk_load_f32_sse2+0x91>
   .byte  65,15,16,92,128,32                  // movups        0x20(%r8,%rax,4),%xmm3
-  .byte  235,170                             // jmp           1f68a <_sk_load_f32_sse2+0x3b>
+  .byte  235,170                             // jmp           1fa9e <_sk_load_f32_sse2+0x3b>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,165                             // jmp           1f68a <_sk_load_f32_sse2+0x3b>
+  .byte  235,165                             // jmp           1fa9e <_sk_load_f32_sse2+0x3b>
 
 HIDDEN _sk_load_f32_dst_sse2
 .globl _sk_load_f32_dst_sse2
@@ -40378,7 +40581,7 @@
   .byte  73,99,193                           // movslq        %r9d,%rax
   .byte  69,15,16,4,128                      // movups        (%r8,%rax,4),%xmm8
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,66                              // jne           1f750 <_sk_load_f32_dst_sse2+0x6b>
+  .byte  117,66                              // jne           1fb64 <_sk_load_f32_dst_sse2+0x6b>
   .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
   .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
   .byte  69,15,16,76,128,48                  // movups        0x30(%r8,%rax,4),%xmm9
@@ -40398,17 +40601,17 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  69,15,87,201                        // xorps         %xmm9,%xmm9
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  117,8                               // jne           1f762 <_sk_load_f32_dst_sse2+0x7d>
+  .byte  117,8                               // jne           1fb76 <_sk_load_f32_dst_sse2+0x7d>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  235,190                             // jmp           1f720 <_sk_load_f32_dst_sse2+0x3b>
+  .byte  235,190                             // jmp           1fb34 <_sk_load_f32_dst_sse2+0x3b>
   .byte  65,15,16,100,128,16                 // movups        0x10(%r8,%rax,4),%xmm4
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,8                               // jb            1f776 <_sk_load_f32_dst_sse2+0x91>
+  .byte  114,8                               // jb            1fb8a <_sk_load_f32_dst_sse2+0x91>
   .byte  65,15,16,124,128,32                 // movups        0x20(%r8,%rax,4),%xmm7
-  .byte  235,170                             // jmp           1f720 <_sk_load_f32_dst_sse2+0x3b>
+  .byte  235,170                             // jmp           1fb34 <_sk_load_f32_dst_sse2+0x3b>
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
-  .byte  235,165                             // jmp           1f720 <_sk_load_f32_dst_sse2+0x3b>
+  .byte  235,165                             // jmp           1fb34 <_sk_load_f32_dst_sse2+0x3b>
 
 HIDDEN _sk_store_f32_sse2
 .globl _sk_store_f32_sse2
@@ -40437,7 +40640,7 @@
   .byte  102,69,15,20,203                    // unpcklpd      %xmm11,%xmm9
   .byte  102,69,15,17,36,128                 // movupd        %xmm12,(%r8,%rax,4)
   .byte  72,133,255                          // test          %rdi,%rdi
-  .byte  117,29                              // jne           1f7f8 <_sk_store_f32_sse2+0x7d>
+  .byte  117,29                              // jne           1fc0c <_sk_store_f32_sse2+0x7d>
   .byte  102,69,15,21,211                    // unpckhpd      %xmm11,%xmm10
   .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
   .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
@@ -40445,69 +40648,31 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  72,131,255,1                        // cmp           $0x1,%rdi
-  .byte  116,246                             // je            1f7f4 <_sk_store_f32_sse2+0x79>
+  .byte  116,246                             // je            1fc08 <_sk_store_f32_sse2+0x79>
   .byte  69,15,17,68,128,16                  // movups        %xmm8,0x10(%r8,%rax,4)
   .byte  72,131,255,3                        // cmp           $0x3,%rdi
-  .byte  114,234                             // jb            1f7f4 <_sk_store_f32_sse2+0x79>
+  .byte  114,234                             // jb            1fc08 <_sk_store_f32_sse2+0x79>
   .byte  102,69,15,17,76,128,32              // movupd        %xmm9,0x20(%r8,%rax,4)
-  .byte  235,225                             // jmp           1f7f4 <_sk_store_f32_sse2+0x79>
-
-HIDDEN _sk_clamp_x_sse2
-.globl _sk_clamp_x_sse2
-FUNCTION(_sk_clamp_x_sse2)
-_sk_clamp_x_sse2:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  68,15,93,192                        // minps         %xmm0,%xmm8
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
-  .byte  255,224                             // jmpq          *%rax
-
-HIDDEN _sk_clamp_y_sse2
-.globl _sk_clamp_y_sse2
-FUNCTION(_sk_clamp_y_sse2)
-_sk_clamp_y_sse2:
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  68,15,95,193                        // maxps         %xmm1,%xmm8
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
-  .byte  68,15,93,193                        // minps         %xmm1,%xmm8
-  .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
-  .byte  255,224                             // jmpq          *%rax
+  .byte  235,225                             // jmp           1fc08 <_sk_store_f32_sse2+0x79>
 
 HIDDEN _sk_repeat_x_sse2
 .globl _sk_repeat_x_sse2
 FUNCTION(_sk_repeat_x_sse2)
 _sk_repeat_x_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  243,68,15,16,80,4                   // movss         0x4(%rax),%xmm10
-  .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
-  .byte  68,15,89,208                        // mulps         %xmm0,%xmm10
-  .byte  243,69,15,91,194                    // cvttps2dq     %xmm10,%xmm8
-  .byte  69,15,91,216                        // cvtdq2ps      %xmm8,%xmm11
-  .byte  69,15,194,211,1                     // cmpltps       %xmm11,%xmm10
-  .byte  68,15,84,21,95,183,0,0              // andps         0xb75f(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  69,15,92,218                        // subps         %xmm10,%xmm11
+  .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
+  .byte  243,68,15,16,72,4                   // movss         0x4(%rax),%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  69,15,89,217                        // mulps         %xmm9,%xmm11
-  .byte  65,15,92,195                        // subps         %xmm11,%xmm0
-  .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  68,15,93,192                        // minps         %xmm0,%xmm8
+  .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
+  .byte  243,69,15,91,209                    // cvttps2dq     %xmm9,%xmm10
+  .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
+  .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
+  .byte  68,15,84,13,253,182,0,0             // andps         0xb6fd(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  69,15,92,209                        // subps         %xmm9,%xmm10
+  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
+  .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
+  .byte  65,15,92,192                        // subps         %xmm8,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_repeat_y_sse2
@@ -40515,25 +40680,19 @@
 FUNCTION(_sk_repeat_y_sse2)
 _sk_repeat_y_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,68,15,16,8                      // movss         (%rax),%xmm9
-  .byte  243,68,15,16,80,4                   // movss         0x4(%rax),%xmm10
-  .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
-  .byte  68,15,89,209                        // mulps         %xmm1,%xmm10
-  .byte  243,69,15,91,194                    // cvttps2dq     %xmm10,%xmm8
-  .byte  69,15,91,216                        // cvtdq2ps      %xmm8,%xmm11
-  .byte  69,15,194,211,1                     // cmpltps       %xmm11,%xmm10
-  .byte  68,15,84,21,5,183,0,0               // andps         0xb705(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  69,15,92,218                        // subps         %xmm10,%xmm11
+  .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
+  .byte  243,68,15,16,72,4                   // movss         0x4(%rax),%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  69,15,89,217                        // mulps         %xmm9,%xmm11
-  .byte  65,15,92,203                        // subps         %xmm11,%xmm1
-  .byte  68,15,95,193                        // maxps         %xmm1,%xmm8
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
-  .byte  68,15,93,193                        // minps         %xmm1,%xmm8
+  .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
+  .byte  243,69,15,91,209                    // cvttps2dq     %xmm9,%xmm10
+  .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
+  .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
+  .byte  68,15,84,13,188,182,0,0             // andps         0xb6bc(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  69,15,92,209                        // subps         %xmm9,%xmm10
+  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
+  .byte  69,15,89,194                        // mulps         %xmm10,%xmm8
+  .byte  65,15,92,200                        // subps         %xmm8,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_mirror_x_sse2
@@ -40541,34 +40700,28 @@
 FUNCTION(_sk_mirror_x_sse2)
 _sk_mirror_x_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,68,15,16,16                     // movss         (%rax),%xmm10
-  .byte  243,68,15,16,88,4                   // movss         0x4(%rax),%xmm11
-  .byte  69,15,40,202                        // movaps        %xmm10,%xmm9
-  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  65,15,92,193                        // subps         %xmm9,%xmm0
-  .byte  243,69,15,88,210                    // addss         %xmm10,%xmm10
+  .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
+  .byte  243,68,15,16,72,4                   // movss         0x4(%rax),%xmm9
+  .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
-  .byte  243,68,15,89,29,158,180,0,0         // mulss         0xb49e(%rip),%xmm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
-  .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
-  .byte  68,15,89,216                        // mulps         %xmm0,%xmm11
-  .byte  243,69,15,91,195                    // cvttps2dq     %xmm11,%xmm8
-  .byte  69,15,91,224                        // cvtdq2ps      %xmm8,%xmm12
-  .byte  69,15,194,220,1                     // cmpltps       %xmm12,%xmm11
-  .byte  68,15,84,29,139,182,0,0             // andps         0xb68b(%rip),%xmm11        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  69,15,92,227                        // subps         %xmm11,%xmm12
-  .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
-  .byte  65,15,92,196                        // subps         %xmm12,%xmm0
-  .byte  65,15,92,193                        // subps         %xmm9,%xmm0
-  .byte  69,15,87,210                        // xorps         %xmm10,%xmm10
-  .byte  68,15,92,208                        // subps         %xmm0,%xmm10
-  .byte  68,15,84,208                        // andps         %xmm0,%xmm10
-  .byte  69,15,95,194                        // maxps         %xmm10,%xmm8
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,65,15,254,193                   // paddd         %xmm9,%xmm0
-  .byte  68,15,93,192                        // minps         %xmm0,%xmm8
+  .byte  65,15,92,194                        // subps         %xmm10,%xmm0
+  .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
+  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
+  .byte  243,68,15,89,13,110,180,0,0         // mulss         0xb46e(%rip),%xmm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
+  .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
+  .byte  243,69,15,91,217                    // cvttps2dq     %xmm9,%xmm11
+  .byte  69,15,91,219                        // cvtdq2ps      %xmm11,%xmm11
+  .byte  69,15,194,203,1                     // cmpltps       %xmm11,%xmm9
+  .byte  68,15,84,13,91,182,0,0              // andps         0xb65b(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
+  .byte  69,15,92,217                        // subps         %xmm9,%xmm11
+  .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
+  .byte  65,15,92,195                        // subps         %xmm11,%xmm0
+  .byte  65,15,92,194                        // subps         %xmm10,%xmm0
+  .byte  68,15,92,224                        // subps         %xmm0,%xmm12
+  .byte  65,15,84,196                        // andps         %xmm12,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_mirror_y_sse2
@@ -40576,34 +40729,28 @@
 FUNCTION(_sk_mirror_y_sse2)
 _sk_mirror_y_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,68,15,16,16                     // movss         (%rax),%xmm10
-  .byte  243,68,15,16,88,4                   // movss         0x4(%rax),%xmm11
-  .byte  69,15,40,202                        // movaps        %xmm10,%xmm9
-  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
-  .byte  65,15,92,201                        // subps         %xmm9,%xmm1
-  .byte  243,69,15,88,210                    // addss         %xmm10,%xmm10
+  .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
+  .byte  243,68,15,16,72,4                   // movss         0x4(%rax),%xmm9
+  .byte  69,15,40,208                        // movaps        %xmm8,%xmm10
   .byte  69,15,198,210,0                     // shufps        $0x0,%xmm10,%xmm10
-  .byte  243,68,15,89,29,25,180,0,0          // mulss         0xb419(%rip),%xmm11        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
-  .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
-  .byte  68,15,89,217                        // mulps         %xmm1,%xmm11
-  .byte  243,69,15,91,195                    // cvttps2dq     %xmm11,%xmm8
-  .byte  69,15,91,224                        // cvtdq2ps      %xmm8,%xmm12
-  .byte  69,15,194,220,1                     // cmpltps       %xmm12,%xmm11
-  .byte  68,15,84,29,6,182,0,0               // andps         0xb606(%rip),%xmm11        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
-  .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
-  .byte  69,15,92,227                        // subps         %xmm11,%xmm12
-  .byte  69,15,89,226                        // mulps         %xmm10,%xmm12
-  .byte  65,15,92,204                        // subps         %xmm12,%xmm1
-  .byte  65,15,92,201                        // subps         %xmm9,%xmm1
-  .byte  69,15,87,210                        // xorps         %xmm10,%xmm10
-  .byte  68,15,92,209                        // subps         %xmm1,%xmm10
-  .byte  68,15,84,209                        // andps         %xmm1,%xmm10
-  .byte  69,15,95,194                        // maxps         %xmm10,%xmm8
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,65,15,254,201                   // paddd         %xmm9,%xmm1
-  .byte  68,15,93,193                        // minps         %xmm1,%xmm8
+  .byte  65,15,92,202                        // subps         %xmm10,%xmm1
+  .byte  243,69,15,88,192                    // addss         %xmm8,%xmm8
+  .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
+  .byte  243,68,15,89,13,2,180,0,0           // mulss         0xb402(%rip),%xmm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
+  .byte  68,15,89,201                        // mulps         %xmm1,%xmm9
+  .byte  243,69,15,91,217                    // cvttps2dq     %xmm9,%xmm11
+  .byte  69,15,91,219                        // cvtdq2ps      %xmm11,%xmm11
+  .byte  69,15,194,203,1                     // cmpltps       %xmm11,%xmm9
+  .byte  68,15,84,13,239,181,0,0             // andps         0xb5ef(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  69,15,87,228                        // xorps         %xmm12,%xmm12
+  .byte  69,15,92,217                        // subps         %xmm9,%xmm11
+  .byte  69,15,89,216                        // mulps         %xmm8,%xmm11
+  .byte  65,15,92,203                        // subps         %xmm11,%xmm1
+  .byte  65,15,92,202                        // subps         %xmm10,%xmm1
+  .byte  68,15,92,225                        // subps         %xmm1,%xmm12
+  .byte  65,15,84,204                        // andps         %xmm12,%xmm1
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  65,15,40,200                        // movaps        %xmm8,%xmm1
   .byte  255,224                             // jmpq          *%rax
 
 HIDDEN _sk_clamp_x_1_sse2
@@ -40612,7 +40759,7 @@
 _sk_clamp_x_1_sse2:
   .byte  69,15,87,192                        // xorps         %xmm8,%xmm8
   .byte  68,15,95,192                        // maxps         %xmm0,%xmm8
-  .byte  68,15,93,5,189,181,0,0              // minps         0xb5bd(%rip),%xmm8        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,93,5,191,181,0,0              // minps         0xb5bf(%rip),%xmm8        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  65,15,40,192                        // movaps        %xmm8,%xmm0
   .byte  255,224                             // jmpq          *%rax
@@ -40625,7 +40772,7 @@
   .byte  69,15,91,192                        // cvtdq2ps      %xmm8,%xmm8
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,194,200,1                     // cmpltps       %xmm8,%xmm9
-  .byte  68,15,84,13,155,181,0,0             // andps         0xb59b(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,84,13,157,181,0,0             // andps         0xb59d(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,193                        // subps         %xmm9,%xmm8
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -40635,14 +40782,14 @@
 .globl _sk_mirror_x_1_sse2
 FUNCTION(_sk_mirror_x_1_sse2)
 _sk_mirror_x_1_sse2:
-  .byte  68,15,40,5,231,181,0,0              // movaps        0xb5e7(%rip),%xmm8        # 2b050 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
+  .byte  68,15,40,5,233,181,0,0              // movaps        0xb5e9(%rip),%xmm8        # 2b3b0 <_sk_srcover_rgba_8888_sse2_lowp+0xab4>
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,13,107,181,0,0             // movaps        0xb56b(%rip),%xmm9        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,13,109,181,0,0             // movaps        0xb56d(%rip),%xmm9        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  68,15,89,200                        // mulps         %xmm0,%xmm9
   .byte  243,69,15,91,209                    // cvttps2dq     %xmm9,%xmm10
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
   .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
-  .byte  68,15,84,13,97,181,0,0              // andps         0xb561(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,84,13,99,181,0,0              // andps         0xb563(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,87,219                        // xorps         %xmm11,%xmm11
   .byte  69,15,92,209                        // subps         %xmm9,%xmm10
   .byte  69,15,88,210                        // addps         %xmm10,%xmm10
@@ -40658,10 +40805,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse2)
 _sk_luminance_to_alpha_sse2:
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
-  .byte  15,89,5,135,186,0,0                 // mulps         0xba87(%rip),%xmm0        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xfa4>
-  .byte  15,89,13,144,186,0,0                // mulps         0xba90(%rip),%xmm1        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0xfb4>
+  .byte  15,89,5,137,186,0,0                 // mulps         0xba89(%rip),%xmm0        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0xfa4>
+  .byte  15,89,13,146,186,0,0                // mulps         0xba92(%rip),%xmm1        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0xfb4>
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,29,150,186,0,0                // mulps         0xba96(%rip),%xmm3        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0xfc4>
+  .byte  15,89,29,152,186,0,0                // mulps         0xba98(%rip),%xmm3        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0xfc4>
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -40973,9 +41120,9 @@
   .byte  72,139,24                           // mov           (%rax),%rbx
   .byte  76,139,112,8                        // mov           0x8(%rax),%r14
   .byte  72,255,203                          // dec           %rbx
-  .byte  120,7                               // js            1ff6a <_sk_evenly_spaced_gradient_sse2+0x18>
+  .byte  120,7                               // js            202c8 <_sk_evenly_spaced_gradient_sse2+0x18>
   .byte  243,72,15,42,203                    // cvtsi2ss      %rbx,%xmm1
-  .byte  235,21                              // jmp           1ff7f <_sk_evenly_spaced_gradient_sse2+0x2d>
+  .byte  235,21                              // jmp           202dd <_sk_evenly_spaced_gradient_sse2+0x2d>
   .byte  73,137,216                          // mov           %rbx,%r8
   .byte  73,209,232                          // shr           %r8
   .byte  131,227,1                           // and           $0x1,%ebx
@@ -41073,15 +41220,15 @@
 .globl _sk_gauss_a_to_rgba_sse2
 FUNCTION(_sk_gauss_a_to_rgba_sse2)
 _sk_gauss_a_to_rgba_sse2:
-  .byte  15,40,5,94,180,0,0                  // movaps        0xb45e(%rip),%xmm0        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0xfd4>
+  .byte  15,40,5,96,180,0,0                  // movaps        0xb460(%rip),%xmm0        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0xfd4>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,100,180,0,0                 // addps         0xb464(%rip),%xmm0        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0xfe4>
+  .byte  15,88,5,102,180,0,0                 // addps         0xb466(%rip),%xmm0        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xfe4>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,106,180,0,0                 // addps         0xb46a(%rip),%xmm0        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0xff4>
+  .byte  15,88,5,108,180,0,0                 // addps         0xb46c(%rip),%xmm0        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xff4>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,112,180,0,0                 // addps         0xb470(%rip),%xmm0        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1004>
+  .byte  15,88,5,114,180,0,0                 // addps         0xb472(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x1004>
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,5,118,180,0,0                 // addps         0xb476(%rip),%xmm0        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1014>
+  .byte  15,88,5,120,180,0,0                 // addps         0xb478(%rip),%xmm0        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0x1014>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
@@ -41096,7 +41243,7 @@
   .byte  76,139,0                            // mov           (%rax),%r8
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  73,131,248,2                        // cmp           $0x2,%r8
-  .byte  114,41                              // jb            2017f <_sk_gradient_sse2+0x38>
+  .byte  114,41                              // jb            204dd <_sk_gradient_sse2+0x38>
   .byte  76,139,72,72                        // mov           0x48(%rax),%r9
   .byte  73,255,200                          // dec           %r8
   .byte  73,131,193,4                        // add           $0x4,%r9
@@ -41107,7 +41254,7 @@
   .byte  102,15,250,202                      // psubd         %xmm2,%xmm1
   .byte  73,131,193,4                        // add           $0x4,%r9
   .byte  73,255,200                          // dec           %r8
-  .byte  117,230                             // jne           20165 <_sk_gradient_sse2+0x1e>
+  .byte  117,230                             // jne           204c3 <_sk_gradient_sse2+0x1e>
   .byte  65,86                               // push          %r14
   .byte  83                                  // push          %rbx
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
@@ -41247,29 +41394,29 @@
   .byte  69,15,94,220                        // divps         %xmm12,%xmm11
   .byte  69,15,40,227                        // movaps        %xmm11,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
-  .byte  68,15,40,45,6,178,0,0               // movaps        0xb206(%rip),%xmm13        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0x1024>
+  .byte  68,15,40,45,8,178,0,0               // movaps        0xb208(%rip),%xmm13        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0x1024>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
-  .byte  68,15,88,45,10,178,0,0              // addps         0xb20a(%rip),%xmm13        # 2b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0x1034>
+  .byte  68,15,88,45,12,178,0,0              // addps         0xb20c(%rip),%xmm13        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0x1034>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
-  .byte  68,15,88,45,14,178,0,0              // addps         0xb20e(%rip),%xmm13        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1044>
+  .byte  68,15,88,45,16,178,0,0              // addps         0xb210(%rip),%xmm13        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x1044>
   .byte  69,15,89,236                        // mulps         %xmm12,%xmm13
-  .byte  68,15,88,45,18,178,0,0              // addps         0xb212(%rip),%xmm13        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1054>
+  .byte  68,15,88,45,20,178,0,0              // addps         0xb214(%rip),%xmm13        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x1054>
   .byte  69,15,89,235                        // mulps         %xmm11,%xmm13
   .byte  69,15,194,202,1                     // cmpltps       %xmm10,%xmm9
-  .byte  68,15,40,21,17,178,0,0              // movaps        0xb211(%rip),%xmm10        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0x1064>
+  .byte  68,15,40,21,19,178,0,0              // movaps        0xb213(%rip),%xmm10        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0x1064>
   .byte  69,15,92,213                        // subps         %xmm13,%xmm10
   .byte  69,15,84,209                        // andps         %xmm9,%xmm10
   .byte  69,15,85,205                        // andnps        %xmm13,%xmm9
   .byte  69,15,86,202                        // orps          %xmm10,%xmm9
   .byte  68,15,194,192,1                     // cmpltps       %xmm0,%xmm8
-  .byte  68,15,40,21,212,171,0,0             // movaps        0xabd4(%rip),%xmm10        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,21,214,171,0,0             // movaps        0xabd6(%rip),%xmm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,92,209                        // subps         %xmm9,%xmm10
   .byte  69,15,84,208                        // andps         %xmm8,%xmm10
   .byte  69,15,85,193                        // andnps        %xmm9,%xmm8
   .byte  69,15,86,194                        // orps          %xmm10,%xmm8
   .byte  68,15,40,201                        // movaps        %xmm1,%xmm9
   .byte  68,15,194,200,1                     // cmpltps       %xmm0,%xmm9
-  .byte  68,15,40,21,195,171,0,0             // movaps        0xabc3(%rip),%xmm10        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,21,197,171,0,0             // movaps        0xabc5(%rip),%xmm10        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,208                        // subps         %xmm8,%xmm10
   .byte  69,15,84,209                        // andps         %xmm9,%xmm10
   .byte  69,15,85,200                        // andnps        %xmm8,%xmm9
@@ -41304,7 +41451,7 @@
   .byte  243,69,15,89,203                    // mulss         %xmm11,%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,88,200                        // addps         %xmm0,%xmm9
-  .byte  68,15,89,13,122,177,0,0             // mulps         0xb17a(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
+  .byte  68,15,89,13,124,177,0,0             // mulps         0xb17c(%rip),%xmm9        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
@@ -41312,7 +41459,7 @@
   .byte  243,69,15,89,219                    // mulss         %xmm11,%xmm11
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,92,227                        // subps         %xmm11,%xmm12
-  .byte  68,15,89,21,101,177,0,0             // mulps         0xb165(%rip),%xmm10        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
+  .byte  68,15,89,21,103,177,0,0             // mulps         0xb167(%rip),%xmm10        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
   .byte  69,15,89,212                        // mulps         %xmm12,%xmm10
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
@@ -41321,8 +41468,8 @@
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
-  .byte  68,15,87,13,13,176,0,0              // xorps         0xb00d(%rip),%xmm9        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
-  .byte  68,15,89,5,245,170,0,0              // mulps         0xaaf5(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,87,13,15,176,0,0              // xorps         0xb00f(%rip),%xmm9        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  68,15,89,5,247,170,0,0              // mulps         0xaaf7(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
@@ -41343,7 +41490,7 @@
   .byte  243,69,15,89,203                    // mulss         %xmm11,%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,88,200                        // addps         %xmm0,%xmm9
-  .byte  68,15,89,13,220,176,0,0             // mulps         0xb0dc(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
+  .byte  68,15,89,13,222,176,0,0             // mulps         0xb0de(%rip),%xmm9        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,40,225                        // movaps        %xmm1,%xmm12
   .byte  69,15,89,228                        // mulps         %xmm12,%xmm12
@@ -41351,7 +41498,7 @@
   .byte  243,69,15,89,219                    // mulss         %xmm11,%xmm11
   .byte  69,15,198,219,0                     // shufps        $0x0,%xmm11,%xmm11
   .byte  69,15,92,227                        // subps         %xmm11,%xmm12
-  .byte  68,15,89,21,199,176,0,0             // mulps         0xb0c7(%rip),%xmm10        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
+  .byte  68,15,89,21,201,176,0,0             // mulps         0xb0c9(%rip),%xmm10        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0x1084>
   .byte  69,15,89,212                        // mulps         %xmm12,%xmm10
   .byte  65,15,40,193                        // movaps        %xmm9,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
@@ -41360,8 +41507,8 @@
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  65,15,40,194                        // movaps        %xmm10,%xmm0
   .byte  65,15,92,193                        // subps         %xmm9,%xmm0
-  .byte  68,15,87,13,111,175,0,0             // xorps         0xaf6f(%rip),%xmm9        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
-  .byte  68,15,89,5,87,170,0,0               // mulps         0xaa57(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,87,13,113,175,0,0             // xorps         0xaf71(%rip),%xmm9        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  68,15,89,5,89,170,0,0               // mulps         0xaa59(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  65,15,89,192                        // mulps         %xmm8,%xmm0
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
@@ -41379,7 +41526,7 @@
   .byte  243,69,15,89,200                    // mulss         %xmm8,%xmm9
   .byte  69,15,198,201,0                     // shufps        $0x0,%xmm9,%xmm9
   .byte  68,15,88,200                        // addps         %xmm0,%xmm9
-  .byte  68,15,89,13,79,176,0,0              // mulps         0xb04f(%rip),%xmm9        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
+  .byte  68,15,89,13,81,176,0,0              // mulps         0xb051(%rip),%xmm9        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x1074>
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  68,15,40,209                        // movaps        %xmm1,%xmm10
   .byte  69,15,89,210                        // mulps         %xmm10,%xmm10
@@ -41387,7 +41534,7 @@
   .byte  243,69,15,89,192                    // mulss         %xmm8,%xmm8
   .byte  69,15,198,192,0                     // shufps        $0x0,%xmm8,%xmm8
   .byte  65,15,92,192                        // subps         %xmm8,%xmm0
-  .byte  15,87,5,11,175,0,0                  // xorps         0xaf0b(%rip),%xmm0        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
+  .byte  15,87,5,13,175,0,0                  // xorps         0xaf0d(%rip),%xmm0        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xf54>
   .byte  65,15,94,193                        // divps         %xmm9,%xmm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41430,7 +41577,7 @@
 FUNCTION(_sk_save_xy_sse2)
 _sk_save_xy_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,145,169,0,0              // movaps        0xa991(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,5,147,169,0,0              // movaps        0xa993(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  15,17,0                             // movups        %xmm0,(%rax)
   .byte  68,15,40,200                        // movaps        %xmm0,%xmm9
   .byte  69,15,88,200                        // addps         %xmm8,%xmm9
@@ -41438,7 +41585,7 @@
   .byte  69,15,91,210                        // cvtdq2ps      %xmm10,%xmm10
   .byte  69,15,40,217                        // movaps        %xmm9,%xmm11
   .byte  69,15,194,218,1                     // cmpltps       %xmm10,%xmm11
-  .byte  68,15,40,37,124,169,0,0             // movaps        0xa97c(%rip),%xmm12        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  68,15,40,37,126,169,0,0             // movaps        0xa97e(%rip),%xmm12        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,84,220                        // andps         %xmm12,%xmm11
   .byte  69,15,92,211                        // subps         %xmm11,%xmm10
   .byte  69,15,92,202                        // subps         %xmm10,%xmm9
@@ -41485,8 +41632,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,37,175,0,0                  // addps         0xaf25(%rip),%xmm0        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,221,168,0,0             // movaps        0xa8dd(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,5,39,175,0,0                  // addps         0xaf27(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,223,168,0,0             // movaps        0xa8df(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,128,0,0,0              // movups        %xmm9,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41499,7 +41646,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,172,168,0,0                 // addps         0xa8ac(%rip),%xmm0        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,88,5,174,168,0,0                 // addps         0xa8ae(%rip),%xmm0        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  68,15,17,128,128,0,0,0              // movups        %xmm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41511,8 +41658,8 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,222,174,0,0                // addps         0xaede(%rip),%xmm1        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,150,168,0,0             // movaps        0xa896(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,13,224,174,0,0                // addps         0xaee0(%rip),%xmm1        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,152,168,0,0             // movaps        0xa898(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  68,15,17,136,160,0,0,0              // movups        %xmm9,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41525,7 +41672,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,100,168,0,0                // addps         0xa864(%rip),%xmm1        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  15,88,13,102,168,0,0                // addps         0xa866(%rip),%xmm1        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  68,15,17,128,160,0,0,0              // movups        %xmm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41537,13 +41684,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,167,174,0,0                 // addps         0xaea7(%rip),%xmm0        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
-  .byte  68,15,40,13,79,168,0,0              // movaps        0xa84f(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,5,169,174,0,0                 // addps         0xaea9(%rip),%xmm0        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
+  .byte  68,15,40,13,81,168,0,0              // movaps        0xa851(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,155,174,0,0             // mulps         0xae9b(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,13,35,170,0,0              // addps         0xaa23(%rip),%xmm9        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,13,157,174,0,0             // mulps         0xae9d(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,13,37,170,0,0              // addps         0xaa25(%rip),%xmm9        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,128,0,0,0              // movups        %xmm9,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41556,16 +41703,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,82,174,0,0                  // addps         0xae52(%rip),%xmm0        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,10,168,0,0              // movaps        0xa80a(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,5,84,174,0,0                  // addps         0xae54(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,12,168,0,0              // movaps        0xa80c(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,110,174,0,0              // movaps        0xae6e(%rip),%xmm8        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,5,112,174,0,0              // movaps        0xae70(%rip),%xmm8        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,114,174,0,0              // addps         0xae72(%rip),%xmm8        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,5,116,174,0,0              // addps         0xae74(%rip),%xmm8        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,214,167,0,0              // addps         0xa7d6(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,5,216,167,0,0              // addps         0xa7d8(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,106,174,0,0              // addps         0xae6a(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,5,108,174,0,0              // addps         0xae6c(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,128,128,0,0,0              // movups        %xmm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41575,17 +41722,17 @@
 FUNCTION(_sk_bicubic_p1x_sse2)
 _sk_bicubic_p1x_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,180,167,0,0              // movaps        0xa7b4(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,5,182,167,0,0              // movaps        0xa7b6(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,72,64                      // movups        0x40(%rax),%xmm9
   .byte  65,15,88,192                        // addps         %xmm8,%xmm0
-  .byte  68,15,40,21,32,174,0,0              // movaps        0xae20(%rip),%xmm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,21,34,174,0,0              // movaps        0xae22(%rip),%xmm10        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,36,174,0,0              // addps         0xae24(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,21,38,174,0,0              // addps         0xae26(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,32,174,0,0              // addps         0xae20(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,21,34,174,0,0              // addps         0xae22(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,144,128,0,0,0              // movups        %xmm10,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41597,11 +41744,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,0                             // movups        (%rax),%xmm0
   .byte  68,15,16,64,64                      // movups        0x40(%rax),%xmm8
-  .byte  15,88,5,243,173,0,0                 // addps         0xadf3(%rip),%xmm0        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  15,88,5,245,173,0,0                 // addps         0xadf5(%rip),%xmm0        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,195,173,0,0              // mulps         0xadc3(%rip),%xmm8        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,5,75,169,0,0               // addps         0xa94b(%rip),%xmm8        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,5,197,173,0,0              // mulps         0xadc5(%rip),%xmm8        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,5,77,169,0,0               // addps         0xa94d(%rip),%xmm8        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,128,0,0,0              // movups        %xmm8,0x80(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41614,13 +41761,13 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,137,173,0,0                // addps         0xad89(%rip),%xmm1        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
-  .byte  68,15,40,13,49,167,0,0              // movaps        0xa731(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,13,139,173,0,0                // addps         0xad8b(%rip),%xmm1        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x10a4>
+  .byte  68,15,40,13,51,167,0,0              // movaps        0xa733(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
   .byte  69,15,40,193                        // movaps        %xmm9,%xmm8
   .byte  69,15,89,192                        // mulps         %xmm8,%xmm8
-  .byte  68,15,89,13,125,173,0,0             // mulps         0xad7d(%rip),%xmm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,13,5,169,0,0               // addps         0xa905(%rip),%xmm9        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,13,127,173,0,0             // mulps         0xad7f(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,13,7,169,0,0               // addps         0xa907(%rip),%xmm9        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,200                        // mulps         %xmm8,%xmm9
   .byte  68,15,17,136,160,0,0,0              // movups        %xmm9,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41633,16 +41780,16 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,51,173,0,0                 // addps         0xad33(%rip),%xmm1        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
-  .byte  68,15,40,13,235,166,0,0             // movaps        0xa6eb(%rip),%xmm9        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,88,13,53,173,0,0                 // addps         0xad35(%rip),%xmm1        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x1094>
+  .byte  68,15,40,13,237,166,0,0             // movaps        0xa6ed(%rip),%xmm9        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  69,15,92,200                        // subps         %xmm8,%xmm9
-  .byte  68,15,40,5,79,173,0,0               // movaps        0xad4f(%rip),%xmm8        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,5,81,173,0,0               // movaps        0xad51(%rip),%xmm8        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,83,173,0,0               // addps         0xad53(%rip),%xmm8        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,5,85,173,0,0               // addps         0xad55(%rip),%xmm8        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,183,166,0,0              // addps         0xa6b7(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,88,5,185,166,0,0              // addps         0xa6b9(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
-  .byte  68,15,88,5,75,173,0,0               // addps         0xad4b(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,5,77,173,0,0               // addps         0xad4d(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,128,160,0,0,0              // movups        %xmm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41652,17 +41799,17 @@
 FUNCTION(_sk_bicubic_p1y_sse2)
 _sk_bicubic_p1y_sse2:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  68,15,40,5,149,166,0,0              // movaps        0xa695(%rip),%xmm8        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
+  .byte  68,15,40,5,151,166,0,0              // movaps        0xa697(%rip),%xmm8        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0xa44>
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,72,96                      // movups        0x60(%rax),%xmm9
   .byte  65,15,88,200                        // addps         %xmm8,%xmm1
-  .byte  68,15,40,21,0,173,0,0               // movaps        0xad00(%rip),%xmm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
+  .byte  68,15,40,21,2,173,0,0               // movaps        0xad02(%rip),%xmm10        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10c4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,4,173,0,0               // addps         0xad04(%rip),%xmm10        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  68,15,88,21,6,173,0,0               // addps         0xad06(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
   .byte  69,15,88,208                        // addps         %xmm8,%xmm10
   .byte  69,15,89,209                        // mulps         %xmm9,%xmm10
-  .byte  68,15,88,21,0,173,0,0               // addps         0xad00(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
+  .byte  68,15,88,21,2,173,0,0               // addps         0xad02(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10e4>
   .byte  68,15,17,144,160,0,0,0              // movups        %xmm10,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -41674,11 +41821,11 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,16,72,32                         // movups        0x20(%rax),%xmm1
   .byte  68,15,16,64,96                      // movups        0x60(%rax),%xmm8
-  .byte  15,88,13,210,172,0,0                // addps         0xacd2(%rip),%xmm1        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
+  .byte  15,88,13,212,172,0,0                // addps         0xacd4(%rip),%xmm1        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10d4>
   .byte  69,15,40,200                        // movaps        %xmm8,%xmm9
   .byte  69,15,89,201                        // mulps         %xmm9,%xmm9
-  .byte  68,15,89,5,162,172,0,0              // mulps         0xaca2(%rip),%xmm8        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
-  .byte  68,15,88,5,42,168,0,0               // addps         0xa82a(%rip),%xmm8        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
+  .byte  68,15,89,5,164,172,0,0              // mulps         0xaca4(%rip),%xmm8        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10b4>
+  .byte  68,15,88,5,44,168,0,0               // addps         0xa82c(%rip),%xmm8        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0xc44>
   .byte  69,15,89,193                        // mulps         %xmm9,%xmm8
   .byte  68,15,17,128,160,0,0,0              // movups        %xmm8,0xa0(%rax)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -41823,7 +41970,7 @@
   .byte  102,65,15,254,205                   // paddd         %xmm13,%xmm1
   .byte  102,68,15,127,108,36,208            // movdqa        %xmm13,-0x30(%rsp)
   .byte  102,15,254,217                      // paddd         %xmm1,%xmm3
-  .byte  102,68,15,111,5,233,170,0,0         // movdqa        0xaae9(%rip),%xmm8        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,68,15,111,5,235,170,0,0         // movdqa        0xaaeb(%rip),%xmm8        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,112,195,245                  // pshufd        $0xf5,%xmm3,%xmm0
   .byte  102,65,15,244,216                   // pmuludq       %xmm8,%xmm3
   .byte  102,65,15,244,192                   // pmuludq       %xmm8,%xmm0
@@ -41862,7 +42009,7 @@
   .byte  243,66,15,16,44,139                 // movss         (%rbx,%r9,4),%xmm5
   .byte  15,20,236                           // unpcklps      %xmm4,%xmm5
   .byte  102,15,20,221                       // unpcklpd      %xmm5,%xmm3
-  .byte  102,68,15,111,37,176,163,0,0        // movdqa        0xa3b0(%rip),%xmm12        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,37,178,163,0,0        // movdqa        0xa3b2(%rip),%xmm12        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,196                   // paddd         %xmm12,%xmm0
   .byte  102,15,112,224,78                   // pshufd        $0x4e,%xmm0,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
@@ -41878,7 +42025,7 @@
   .byte  243,66,15,16,36,139                 // movss         (%rbx,%r9,4),%xmm4
   .byte  15,20,224                           // unpcklps      %xmm0,%xmm4
   .byte  102,15,20,236                       // unpcklpd      %xmm4,%xmm5
-  .byte  15,40,37,213,169,0,0                // movaps        0xa9d5(%rip),%xmm4        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
+  .byte  15,40,37,215,169,0,0                // movaps        0xa9d7(%rip),%xmm4        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
   .byte  68,15,88,220                        // addps         %xmm4,%xmm11
   .byte  68,15,41,92,36,192                  // movaps        %xmm11,-0x40(%rsp)
   .byte  68,15,40,223                        // movaps        %xmm7,%xmm11
@@ -41914,7 +42061,7 @@
   .byte  15,20,249                           // unpcklps      %xmm1,%xmm7
   .byte  102,15,20,252                       // unpcklpd      %xmm4,%xmm7
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,15,250,13,74,169,0,0            // psubd         0xa94a(%rip),%xmm1        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,13,76,169,0,0            // psubd         0xa94c(%rip),%xmm1        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,225,78                   // pshufd        $0x4e,%xmm1,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42004,7 +42151,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,233                           // unpcklps      %xmm1,%xmm5
   .byte  102,15,20,221                       // unpcklpd      %xmm5,%xmm3
-  .byte  102,68,15,111,45,34,161,0,0         // movdqa        0xa122(%rip),%xmm13        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,45,36,161,0,0         // movdqa        0xa124(%rip),%xmm13        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,197                   // paddd         %xmm13,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,73,15,126,200                   // movq          %xmm1,%r8
@@ -42101,7 +42248,7 @@
   .byte  102,15,111,206                      // movdqa        %xmm6,%xmm1
   .byte  102,65,15,254,202                   // paddd         %xmm10,%xmm1
   .byte  102,15,112,209,245                  // pshufd        $0xf5,%xmm1,%xmm2
-  .byte  102,15,111,29,229,165,0,0           // movdqa        0xa5e5(%rip),%xmm3        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,29,231,165,0,0           // movdqa        0xa5e7(%rip),%xmm3        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,203                      // pmuludq       %xmm3,%xmm1
   .byte  102,15,244,211                      // pmuludq       %xmm3,%xmm2
   .byte  102,15,111,251                      // movdqa        %xmm3,%xmm7
@@ -42139,7 +42286,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,236                           // unpcklps      %xmm4,%xmm5
   .byte  102,15,20,213                       // unpcklpd      %xmm5,%xmm2
-  .byte  102,15,111,5,181,158,0,0            // movdqa        0x9eb5(%rip),%xmm0        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,111,5,183,158,0,0            // movdqa        0x9eb7(%rip),%xmm0        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,254,216                      // paddd         %xmm0,%xmm3
   .byte  102,15,112,227,78                   // pshufd        $0x4e,%xmm3,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
@@ -42220,7 +42367,7 @@
   .byte  102,15,111,214                      // movdqa        %xmm6,%xmm2
   .byte  102,65,15,254,212                   // paddd         %xmm12,%xmm2
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,13,194,163,0,0           // movdqa        0xa3c2(%rip),%xmm1        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,196,163,0,0           // movdqa        0xa3c4(%rip),%xmm1        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
   .byte  102,15,244,193                      // pmuludq       %xmm1,%xmm0
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
@@ -42242,7 +42389,7 @@
   .byte  68,15,20,209                        // unpcklps      %xmm1,%xmm10
   .byte  102,68,15,20,210                    // unpcklpd      %xmm2,%xmm10
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  102,15,250,13,103,163,0,0           // psubd         0xa367(%rip),%xmm1        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,13,105,163,0,0           // psubd         0xa369(%rip),%xmm1        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42257,7 +42404,7 @@
   .byte  243,15,16,20,131                    // movss         (%rbx,%rax,4),%xmm2
   .byte  15,20,209                           // unpcklps      %xmm1,%xmm2
   .byte  102,15,20,226                       // unpcklpd      %xmm2,%xmm4
-  .byte  102,15,254,5,146,156,0,0            // paddd         0x9c92(%rip),%xmm0        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,5,148,156,0,0            // paddd         0x9c94(%rip),%xmm0        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,73,15,126,200                   // movq          %xmm1,%r8
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
@@ -42294,7 +42441,7 @@
   .byte  15,20,199                           // unpcklps      %xmm7,%xmm0
   .byte  102,15,20,193                       // unpcklpd      %xmm1,%xmm0
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,15,250,13,113,162,0,0           // psubd         0xa271(%rip),%xmm1        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,13,115,162,0,0           // psubd         0xa273(%rip),%xmm1        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,249,78                   // pshufd        $0x4e,%xmm1,%xmm7
   .byte  102,73,15,126,248                   // movq          %xmm7,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42309,7 +42456,7 @@
   .byte  243,15,16,52,131                    // movss         (%rbx,%rax,4),%xmm6
   .byte  15,20,247                           // unpcklps      %xmm7,%xmm6
   .byte  102,15,20,206                       // unpcklpd      %xmm6,%xmm1
-  .byte  102,15,254,21,156,155,0,0           // paddd         0x9b9c(%rip),%xmm2        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,21,158,155,0,0           // paddd         0x9b9e(%rip),%xmm2        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,112,242,78                   // pshufd        $0x4e,%xmm2,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
@@ -42455,7 +42602,7 @@
   .byte  102,65,15,254,210                   // paddd         %xmm10,%xmm2
   .byte  102,15,111,220                      // movdqa        %xmm4,%xmm3
   .byte  102,15,254,218                      // paddd         %xmm2,%xmm3
-  .byte  102,15,111,37,180,159,0,0           // movdqa        0x9fb4(%rip),%xmm4        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,37,182,159,0,0           // movdqa        0x9fb6(%rip),%xmm4        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,112,195,245                  // pshufd        $0xf5,%xmm3,%xmm0
   .byte  102,15,244,220                      // pmuludq       %xmm4,%xmm3
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
@@ -42494,7 +42641,7 @@
   .byte  243,66,15,16,52,139                 // movss         (%rbx,%r9,4),%xmm6
   .byte  15,20,244                           // unpcklps      %xmm4,%xmm6
   .byte  102,15,20,238                       // unpcklpd      %xmm6,%xmm5
-  .byte  102,15,254,5,126,152,0,0            // paddd         0x987e(%rip),%xmm0        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,5,128,152,0,0            // paddd         0x9880(%rip),%xmm0        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,112,224,78                   // pshufd        $0x4e,%xmm0,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
   .byte  102,73,15,126,193                   // movq          %xmm0,%r9
@@ -42509,7 +42656,7 @@
   .byte  243,66,15,16,52,139                 // movss         (%rbx,%r9,4),%xmm6
   .byte  15,20,244                           // unpcklps      %xmm4,%xmm6
   .byte  102,15,20,222                       // unpcklpd      %xmm6,%xmm3
-  .byte  15,40,53,168,158,0,0                // movaps        0x9ea8(%rip),%xmm6        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
+  .byte  15,40,53,170,158,0,0                // movaps        0x9eaa(%rip),%xmm6        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f4>
   .byte  68,15,88,198                        // addps         %xmm6,%xmm8
   .byte  68,15,41,68,36,176                  // movaps        %xmm8,-0x50(%rsp)
   .byte  68,15,88,254                        // addps         %xmm6,%xmm15
@@ -42527,7 +42674,7 @@
   .byte  102,65,15,254,215                   // paddd         %xmm15,%xmm2
   .byte  102,68,15,127,124,36,224            // movdqa        %xmm15,-0x20(%rsp)
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,13,94,158,0,0            // movdqa        0x9e5e(%rip),%xmm1        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,13,96,158,0,0            // movdqa        0x9e60(%rip),%xmm1        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
   .byte  102,15,244,193                      // pmuludq       %xmm1,%xmm0
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
@@ -42548,7 +42695,7 @@
   .byte  15,20,240                           // unpcklps      %xmm0,%xmm6
   .byte  102,15,20,242                       // unpcklpd      %xmm2,%xmm6
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
-  .byte  102,15,250,5,9,158,0,0              // psubd         0x9e09(%rip),%xmm0        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,5,11,158,0,0             // psubd         0x9e0b(%rip),%xmm0        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,208,78                   // pshufd        $0x4e,%xmm0,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
@@ -42563,7 +42710,7 @@
   .byte  243,68,15,16,28,131                 // movss         (%rbx,%rax,4),%xmm11
   .byte  68,15,20,216                        // unpcklps      %xmm0,%xmm11
   .byte  102,65,15,20,211                    // unpcklpd      %xmm11,%xmm2
-  .byte  102,15,254,13,49,151,0,0            // paddd         0x9731(%rip),%xmm1        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,13,51,151,0,0            // paddd         0x9733(%rip),%xmm1        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
   .byte  102,73,15,126,192                   // movq          %xmm0,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -42601,7 +42748,7 @@
   .byte  102,65,15,111,194                   // movdqa        %xmm10,%xmm0
   .byte  102,15,254,68,36,160                // paddd         -0x60(%rsp),%xmm0
   .byte  102,15,112,216,245                  // pshufd        $0xf5,%xmm0,%xmm3
-  .byte  102,15,111,37,8,157,0,0             // movdqa        0x9d08(%rip),%xmm4        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,37,10,157,0,0            // movdqa        0x9d0a(%rip),%xmm4        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
   .byte  102,15,244,220                      // pmuludq       %xmm4,%xmm3
   .byte  102,68,15,111,220                   // movdqa        %xmm4,%xmm11
@@ -42639,7 +42786,7 @@
   .byte  243,15,16,60,131                    // movss         (%rbx,%rax,4),%xmm7
   .byte  15,20,253                           // unpcklps      %xmm5,%xmm7
   .byte  102,15,20,199                       // unpcklpd      %xmm7,%xmm0
-  .byte  102,68,15,111,5,212,149,0,0         // movdqa        0x95d4(%rip),%xmm8        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,5,214,149,0,0         // movdqa        0x95d6(%rip),%xmm8        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,224                   // paddd         %xmm8,%xmm4
   .byte  102,15,112,236,78                   // pshufd        $0x4e,%xmm4,%xmm5
   .byte  102,73,15,126,232                   // movq          %xmm5,%r8
@@ -42785,7 +42932,7 @@
   .byte  243,15,16,36,131                    // movss         (%rbx,%rax,4),%xmm4
   .byte  15,20,226                           // unpcklps      %xmm2,%xmm4
   .byte  102,15,20,252                       // unpcklpd      %xmm4,%xmm7
-  .byte  102,68,15,111,61,46,147,0,0         // movdqa        0x932e(%rip),%xmm15        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,61,48,147,0,0         // movdqa        0x9330(%rip),%xmm15        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,207                   // paddd         %xmm15,%xmm1
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
@@ -42868,7 +43015,7 @@
   .byte  102,65,15,111,217                   // movdqa        %xmm9,%xmm3
   .byte  102,65,15,254,216                   // paddd         %xmm8,%xmm3
   .byte  102,15,112,211,245                  // pshufd        $0xf5,%xmm3,%xmm2
-  .byte  102,15,111,45,61,152,0,0            // movdqa        0x983d(%rip),%xmm5        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,45,63,152,0,0            // movdqa        0x983f(%rip),%xmm5        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,221                      // pmuludq       %xmm5,%xmm3
   .byte  102,15,244,213                      // pmuludq       %xmm5,%xmm2
   .byte  102,15,112,234,232                  // pshufd        $0xe8,%xmm2,%xmm5
@@ -42889,7 +43036,7 @@
   .byte  68,15,20,198                        // unpcklps      %xmm6,%xmm8
   .byte  102,68,15,20,197                    // unpcklpd      %xmm5,%xmm8
   .byte  102,15,111,234                      // movdqa        %xmm2,%xmm5
-  .byte  102,15,250,45,230,151,0,0           // psubd         0x97e6(%rip),%xmm5        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,45,232,151,0,0           // psubd         0x97e8(%rip),%xmm5        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,245,78                   // pshufd        $0x4e,%xmm5,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,232                   // movq          %xmm5,%rax
@@ -42921,7 +43068,7 @@
   .byte  102,15,20,214                       // unpcklpd      %xmm6,%xmm2
   .byte  102,69,15,254,205                   // paddd         %xmm13,%xmm9
   .byte  102,65,15,112,233,245               // pshufd        $0xf5,%xmm9,%xmm5
-  .byte  102,15,111,29,68,151,0,0            // movdqa        0x9744(%rip),%xmm3        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,29,70,151,0,0            // movdqa        0x9746(%rip),%xmm3        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,68,15,244,203                   // pmuludq       %xmm3,%xmm9
   .byte  102,15,244,235                      // pmuludq       %xmm3,%xmm5
   .byte  102,15,112,237,232                  // pshufd        $0xe8,%xmm5,%xmm5
@@ -42942,7 +43089,7 @@
   .byte  69,15,20,233                        // unpcklps      %xmm9,%xmm13
   .byte  102,68,15,20,237                    // unpcklpd      %xmm5,%xmm13
   .byte  102,65,15,111,239                   // movdqa        %xmm15,%xmm5
-  .byte  102,15,250,45,228,150,0,0           // psubd         0x96e4(%rip),%xmm5        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,45,230,150,0,0           // psubd         0x96e6(%rip),%xmm5        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,221,78                   // pshufd        $0x4e,%xmm5,%xmm3
   .byte  102,73,15,126,216                   // movq          %xmm3,%r8
   .byte  102,72,15,126,232                   // movq          %xmm5,%rax
@@ -42957,7 +43104,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,235                           // unpcklps      %xmm3,%xmm5
   .byte  102,15,20,245                       // unpcklpd      %xmm5,%xmm6
-  .byte  102,68,15,111,13,14,144,0,0         // movdqa        0x900e(%rip),%xmm9        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,13,16,144,0,0         // movdqa        0x9010(%rip),%xmm9        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,69,15,254,249                   // paddd         %xmm9,%xmm15
   .byte  102,65,15,112,223,78                // pshufd        $0x4e,%xmm15,%xmm3
   .byte  102,73,15,126,216                   // movq          %xmm3,%r8
@@ -43019,7 +43166,7 @@
   .byte  102,65,15,111,195                   // movdqa        %xmm11,%xmm0
   .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
   .byte  102,15,112,200,245                  // pshufd        $0xf5,%xmm0,%xmm1
-  .byte  102,15,111,21,127,149,0,0           // movdqa        0x957f(%rip),%xmm2        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,21,129,149,0,0           // movdqa        0x9581(%rip),%xmm2        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,194                      // pmuludq       %xmm2,%xmm0
   .byte  102,15,244,202                      // pmuludq       %xmm2,%xmm1
   .byte  102,68,15,111,234                   // movdqa        %xmm2,%xmm13
@@ -43212,7 +43359,7 @@
   .byte  68,15,20,238                        // unpcklps      %xmm6,%xmm13
   .byte  102,68,15,20,234                    // unpcklpd      %xmm2,%xmm13
   .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
-  .byte  102,15,250,21,27,146,0,0            // psubd         0x921b(%rip),%xmm2        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,21,29,146,0,0            // psubd         0x921d(%rip),%xmm2        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,242,78                   // pshufd        $0x4e,%xmm2,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
@@ -43272,7 +43419,7 @@
   .byte  102,68,15,111,116,36,160            // movdqa        -0x60(%rsp),%xmm14
   .byte  102,65,15,254,198                   // paddd         %xmm14,%xmm0
   .byte  102,15,112,200,245                  // pshufd        $0xf5,%xmm0,%xmm1
-  .byte  102,68,15,111,5,250,144,0,0         // movdqa        0x90fa(%rip),%xmm8        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,68,15,111,5,252,144,0,0         // movdqa        0x90fc(%rip),%xmm8        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,65,15,244,192                   // pmuludq       %xmm8,%xmm0
   .byte  102,65,15,244,200                   // pmuludq       %xmm8,%xmm1
   .byte  102,65,15,111,240                   // movdqa        %xmm8,%xmm6
@@ -43310,7 +43457,7 @@
   .byte  243,15,16,44,131                    // movss         (%rbx,%rax,4),%xmm5
   .byte  15,20,235                           // unpcklps      %xmm3,%xmm5
   .byte  102,15,20,205                       // unpcklpd      %xmm5,%xmm1
-  .byte  102,68,15,111,5,200,137,0,0         // movdqa        0x89c8(%rip),%xmm8        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,68,15,111,5,202,137,0,0         // movdqa        0x89ca(%rip),%xmm8        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,65,15,254,208                   // paddd         %xmm8,%xmm2
   .byte  102,15,112,218,78                   // pshufd        $0x4e,%xmm2,%xmm3
   .byte  102,73,15,126,216                   // movq          %xmm3,%r8
@@ -43393,7 +43540,7 @@
   .byte  102,15,254,208                      // paddd         %xmm0,%xmm2
   .byte  102,15,111,240                      // movdqa        %xmm0,%xmm6
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,37,212,142,0,0           // movdqa        0x8ed4(%rip),%xmm4        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
+  .byte  102,15,111,37,214,142,0,0           // movdqa        0x8ed6(%rip),%xmm4        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x1104>
   .byte  102,15,244,212                      // pmuludq       %xmm4,%xmm2
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
   .byte  102,15,112,200,232                  // pshufd        $0xe8,%xmm0,%xmm1
@@ -43414,7 +43561,7 @@
   .byte  68,15,20,193                        // unpcklps      %xmm1,%xmm8
   .byte  102,68,15,20,194                    // unpcklpd      %xmm2,%xmm8
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  102,15,250,13,125,142,0,0           // psubd         0x8e7d(%rip),%xmm1        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,13,127,142,0,0           // psubd         0x8e7f(%rip),%xmm1        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,73,15,126,208                   // movq          %xmm2,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -43429,7 +43576,7 @@
   .byte  243,15,16,20,131                    // movss         (%rbx,%rax,4),%xmm2
   .byte  15,20,209                           // unpcklps      %xmm1,%xmm2
   .byte  102,68,15,20,242                    // unpcklpd      %xmm2,%xmm14
-  .byte  102,15,254,5,166,135,0,0            // paddd         0x87a6(%rip),%xmm0        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,5,168,135,0,0            // paddd         0x87a8(%rip),%xmm0        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,73,15,126,200                   // movq          %xmm1,%r8
   .byte  102,72,15,126,192                   // movq          %xmm0,%rax
@@ -43467,7 +43614,7 @@
   .byte  15,20,198                           // unpcklps      %xmm6,%xmm0
   .byte  102,15,20,193                       // unpcklpd      %xmm1,%xmm0
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
-  .byte  102,15,250,13,133,141,0,0           // psubd         0x8d85(%rip),%xmm1        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
+  .byte  102,15,250,13,135,141,0,0           // psubd         0x8d87(%rip),%xmm1        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0x1114>
   .byte  102,15,112,241,78                   // pshufd        $0x4e,%xmm1,%xmm6
   .byte  102,73,15,126,240                   // movq          %xmm6,%r8
   .byte  102,72,15,126,200                   // movq          %xmm1,%rax
@@ -43482,7 +43629,7 @@
   .byte  243,15,16,36,131                    // movss         (%rbx,%rax,4),%xmm4
   .byte  15,20,230                           // unpcklps      %xmm6,%xmm4
   .byte  102,15,20,204                       // unpcklpd      %xmm4,%xmm1
-  .byte  102,15,254,21,176,134,0,0           // paddd         0x86b0(%rip),%xmm2        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
+  .byte  102,15,254,21,178,134,0,0           // paddd         0x86b2(%rip),%xmm2        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0xa84>
   .byte  102,15,112,226,78                   // pshufd        $0x4e,%xmm2,%xmm4
   .byte  102,73,15,126,224                   // movq          %xmm4,%r8
   .byte  102,72,15,126,208                   // movq          %xmm2,%rax
@@ -43541,7 +43688,7 @@
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  65,15,88,215                        // addps         %xmm15,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,156,133,0,0                // movaps        0x859c(%rip),%xmm3        # 2aff0 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
+  .byte  15,40,29,158,133,0,0                // movaps        0x859e(%rip),%xmm3        # 2b350 <_sk_srcover_rgba_8888_sse2_lowp+0xa54>
   .byte  15,40,100,36,96                     // movaps        0x60(%rsp),%xmm4
   .byte  15,40,108,36,112                    // movaps        0x70(%rsp),%xmm5
   .byte  15,40,180,36,128,0,0,0              // movaps        0x80(%rsp),%xmm6
@@ -43549,6 +43696,8 @@
   .byte  72,129,196,160,0,0,0                // add           $0xa0,%rsp
   .byte  91                                  // pop           %rbx
   .byte  255,224                             // jmpq          *%rax
+  .byte  144                                 // nop
+  .byte  144                                 // nop
 
 HIDDEN _sk_start_pipeline_hsw_lowp
 .globl _sk_start_pipeline_hsw_lowp
@@ -43571,13 +43720,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,151,0,0,0                    // jae           22b42 <_sk_start_pipeline_hsw_lowp+0xca>
+  .byte  15,131,151,0,0,0                    // jae           22ea2 <_sk_start_pipeline_hsw_lowp+0xca>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,16                        // lea           0x10(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
-  .byte  119,67                              // ja            22b04 <_sk_start_pipeline_hsw_lowp+0x8c>
+  .byte  119,67                              // ja            22e64 <_sk_start_pipeline_hsw_lowp+0x8c>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
@@ -43596,10 +43745,10 @@
   .byte  73,131,196,32                       // add           $0x20,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,193                             // jbe           22ac5 <_sk_start_pipeline_hsw_lowp+0x4d>
+  .byte  118,193                             // jbe           22e25 <_sk_start_pipeline_hsw_lowp+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,41                              // je            22b35 <_sk_start_pipeline_hsw_lowp+0xbd>
+  .byte  116,41                              // je            22e95 <_sk_start_pipeline_hsw_lowp+0xbd>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -43613,7 +43762,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  15,133,117,255,255,255              // jne           22ab7 <_sk_start_pipeline_hsw_lowp+0x3f>
+  .byte  15,133,117,255,255,255              // jne           22e17 <_sk_start_pipeline_hsw_lowp+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -43647,7 +43796,7 @@
 FUNCTION(_sk_black_color_hsw_lowp)
 _sk_black_color_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,66,129,0,0       // vpbroadcastw  0x8142(%rip),%ymm3        # 2acc0 <_sk_srcover_rgba_8888_sse2_lowp+0x724>
+  .byte  196,226,125,121,29,66,129,0,0       // vpbroadcastw  0x8142(%rip),%ymm3        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0x724>
   .byte  197,252,87,192                      // vxorps        %ymm0,%ymm0,%ymm0
   .byte  197,244,87,201                      // vxorps        %ymm1,%ymm1,%ymm1
   .byte  197,236,87,210                      // vxorps        %ymm2,%ymm2,%ymm2
@@ -43658,7 +43807,7 @@
 FUNCTION(_sk_white_color_hsw_lowp)
 _sk_white_color_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,5,43,129,0,0        // vpbroadcastw  0x812b(%rip),%ymm0        # 2acc2 <_sk_srcover_rgba_8888_sse2_lowp+0x726>
+  .byte  196,226,125,121,5,43,129,0,0        // vpbroadcastw  0x812b(%rip),%ymm0        # 2b022 <_sk_srcover_rgba_8888_sse2_lowp+0x726>
   .byte  197,253,111,200                     // vmovdqa       %ymm0,%ymm1
   .byte  197,253,111,208                     // vmovdqa       %ymm0,%ymm2
   .byte  197,253,111,216                     // vmovdqa       %ymm0,%ymm3
@@ -43669,8 +43818,8 @@
 FUNCTION(_sk_set_rgb_hsw_lowp)
 _sk_set_rgb_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  197,122,16,5,53,130,0,0             // vmovss        0x8235(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
-  .byte  197,250,16,21,93,130,0,0            // vmovss        0x825d(%rip),%xmm2        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  197,122,16,5,53,130,0,0             // vmovss        0x8235(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,250,16,21,93,130,0,0            // vmovss        0x825d(%rip),%xmm2        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  197,250,16,0                        // vmovss        (%rax),%xmm0
   .byte  196,226,57,153,194                  // vfmadd132ss   %xmm2,%xmm8,%xmm0
   .byte  197,122,44,192                      // vcvttss2si    %xmm0,%r8d
@@ -43693,7 +43842,7 @@
 FUNCTION(_sk_premul_hsw_lowp)
 _sk_premul_hsw_lowp:
   .byte  197,229,213,192                     // vpmullw       %ymm0,%ymm3,%ymm0
-  .byte  196,98,125,121,5,186,128,0,0        // vpbroadcastw  0x80ba(%rip),%ymm8        # 2acc4 <_sk_srcover_rgba_8888_sse2_lowp+0x728>
+  .byte  196,98,125,121,5,186,128,0,0        // vpbroadcastw  0x80ba(%rip),%ymm8        # 2b024 <_sk_srcover_rgba_8888_sse2_lowp+0x728>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,229,213,201                     // vpmullw       %ymm1,%ymm3,%ymm1
@@ -43741,7 +43890,7 @@
 .globl _sk_invert_hsw_lowp
 FUNCTION(_sk_invert_hsw_lowp)
 _sk_invert_hsw_lowp:
-  .byte  196,98,125,121,5,81,128,0,0         // vpbroadcastw  0x8051(%rip),%ymm8        # 2acc6 <_sk_srcover_rgba_8888_sse2_lowp+0x72a>
+  .byte  196,98,125,121,5,81,128,0,0         // vpbroadcastw  0x8051(%rip),%ymm8        # 2b026 <_sk_srcover_rgba_8888_sse2_lowp+0x72a>
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
   .byte  197,189,249,201                     // vpsubw        %ymm1,%ymm8,%ymm1
   .byte  197,189,249,210                     // vpsubw        %ymm2,%ymm8,%ymm2
@@ -43765,7 +43914,7 @@
 FUNCTION(_sk_srcatop_hsw_lowp)
 _sk_srcatop_hsw_lowp:
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
-  .byte  196,98,125,121,5,30,128,0,0         // vpbroadcastw  0x801e(%rip),%ymm8        # 2acc8 <_sk_srcover_rgba_8888_sse2_lowp+0x72c>
+  .byte  196,98,125,121,5,30,128,0,0         // vpbroadcastw  0x801e(%rip),%ymm8        # 2b028 <_sk_srcover_rgba_8888_sse2_lowp+0x72c>
   .byte  197,189,249,219                     // vpsubw        %ymm3,%ymm8,%ymm3
   .byte  197,101,213,204                     // vpmullw       %ymm4,%ymm3,%ymm9
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -43792,7 +43941,7 @@
 FUNCTION(_sk_dstatop_hsw_lowp)
 _sk_dstatop_hsw_lowp:
   .byte  197,93,213,195                      // vpmullw       %ymm3,%ymm4,%ymm8
-  .byte  196,98,125,121,13,190,127,0,0       // vpbroadcastw  0x7fbe(%rip),%ymm9        # 2acca <_sk_srcover_rgba_8888_sse2_lowp+0x72e>
+  .byte  196,98,125,121,13,190,127,0,0       // vpbroadcastw  0x7fbe(%rip),%ymm9        # 2b02a <_sk_srcover_rgba_8888_sse2_lowp+0x72e>
   .byte  197,53,249,215                      // vpsubw        %ymm7,%ymm9,%ymm10
   .byte  197,173,213,192                     // vpmullw       %ymm0,%ymm10,%ymm0
   .byte  196,65,61,253,193                   // vpaddw        %ymm9,%ymm8,%ymm8
@@ -43819,7 +43968,7 @@
 FUNCTION(_sk_srcin_hsw_lowp)
 _sk_srcin_hsw_lowp:
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
-  .byte  196,98,125,121,5,91,127,0,0         // vpbroadcastw  0x7f5b(%rip),%ymm8        # 2accc <_sk_srcover_rgba_8888_sse2_lowp+0x730>
+  .byte  196,98,125,121,5,91,127,0,0         // vpbroadcastw  0x7f5b(%rip),%ymm8        # 2b02c <_sk_srcover_rgba_8888_sse2_lowp+0x730>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,197,213,201                     // vpmullw       %ymm1,%ymm7,%ymm1
@@ -43839,7 +43988,7 @@
 FUNCTION(_sk_dstin_hsw_lowp)
 _sk_dstin_hsw_lowp:
   .byte  197,221,213,195                     // vpmullw       %ymm3,%ymm4,%ymm0
-  .byte  196,98,125,121,5,24,127,0,0         // vpbroadcastw  0x7f18(%rip),%ymm8        # 2acce <_sk_srcover_rgba_8888_sse2_lowp+0x732>
+  .byte  196,98,125,121,5,24,127,0,0         // vpbroadcastw  0x7f18(%rip),%ymm8        # 2b02e <_sk_srcover_rgba_8888_sse2_lowp+0x732>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,213,213,203                     // vpmullw       %ymm3,%ymm5,%ymm1
@@ -43858,7 +44007,7 @@
 .globl _sk_srcout_hsw_lowp
 FUNCTION(_sk_srcout_hsw_lowp)
 _sk_srcout_hsw_lowp:
-  .byte  196,98,125,121,5,217,126,0,0        // vpbroadcastw  0x7ed9(%rip),%ymm8        # 2acd0 <_sk_srcover_rgba_8888_sse2_lowp+0x734>
+  .byte  196,98,125,121,5,217,126,0,0        // vpbroadcastw  0x7ed9(%rip),%ymm8        # 2b030 <_sk_srcover_rgba_8888_sse2_lowp+0x734>
   .byte  197,61,249,207                      // vpsubw        %ymm7,%ymm8,%ymm9
   .byte  197,181,213,192                     // vpmullw       %ymm0,%ymm9,%ymm0
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -43879,7 +44028,7 @@
 .globl _sk_dstout_hsw_lowp
 FUNCTION(_sk_dstout_hsw_lowp)
 _sk_dstout_hsw_lowp:
-  .byte  196,98,125,121,5,146,126,0,0        // vpbroadcastw  0x7e92(%rip),%ymm8        # 2acd2 <_sk_srcover_rgba_8888_sse2_lowp+0x736>
+  .byte  196,98,125,121,5,146,126,0,0        // vpbroadcastw  0x7e92(%rip),%ymm8        # 2b032 <_sk_srcover_rgba_8888_sse2_lowp+0x736>
   .byte  197,189,249,219                     // vpsubw        %ymm3,%ymm8,%ymm3
   .byte  197,229,213,196                     // vpmullw       %ymm4,%ymm3,%ymm0
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -43900,7 +44049,7 @@
 .globl _sk_srcover_hsw_lowp
 FUNCTION(_sk_srcover_hsw_lowp)
 _sk_srcover_hsw_lowp:
-  .byte  196,98,125,121,5,75,126,0,0         // vpbroadcastw  0x7e4b(%rip),%ymm8        # 2acd4 <_sk_srcover_rgba_8888_sse2_lowp+0x738>
+  .byte  196,98,125,121,5,75,126,0,0         // vpbroadcastw  0x7e4b(%rip),%ymm8        # 2b034 <_sk_srcover_rgba_8888_sse2_lowp+0x738>
   .byte  197,61,249,203                      // vpsubw        %ymm3,%ymm8,%ymm9
   .byte  197,53,213,212                      // vpmullw       %ymm4,%ymm9,%ymm10
   .byte  196,65,45,253,208                   // vpaddw        %ymm8,%ymm10,%ymm10
@@ -43925,7 +44074,7 @@
 .globl _sk_dstover_hsw_lowp
 FUNCTION(_sk_dstover_hsw_lowp)
 _sk_dstover_hsw_lowp:
-  .byte  196,98,125,121,5,240,125,0,0        // vpbroadcastw  0x7df0(%rip),%ymm8        # 2acd6 <_sk_srcover_rgba_8888_sse2_lowp+0x73a>
+  .byte  196,98,125,121,5,240,125,0,0        // vpbroadcastw  0x7df0(%rip),%ymm8        # 2b036 <_sk_srcover_rgba_8888_sse2_lowp+0x73a>
   .byte  197,61,249,207                      // vpsubw        %ymm7,%ymm8,%ymm9
   .byte  197,181,213,192                     // vpmullw       %ymm0,%ymm9,%ymm0
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
@@ -43951,7 +44100,7 @@
 FUNCTION(_sk_modulate_hsw_lowp)
 _sk_modulate_hsw_lowp:
   .byte  197,221,213,192                     // vpmullw       %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,5,149,125,0,0        // vpbroadcastw  0x7d95(%rip),%ymm8        # 2acd8 <_sk_srcover_rgba_8888_sse2_lowp+0x73c>
+  .byte  196,98,125,121,5,149,125,0,0        // vpbroadcastw  0x7d95(%rip),%ymm8        # 2b038 <_sk_srcover_rgba_8888_sse2_lowp+0x73c>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,213,213,201                     // vpmullw       %ymm1,%ymm5,%ymm1
@@ -43970,7 +44119,7 @@
 .globl _sk_multiply_hsw_lowp
 FUNCTION(_sk_multiply_hsw_lowp)
 _sk_multiply_hsw_lowp:
-  .byte  196,98,125,121,5,86,125,0,0         // vpbroadcastw  0x7d56(%rip),%ymm8        # 2acda <_sk_srcover_rgba_8888_sse2_lowp+0x73e>
+  .byte  196,98,125,121,5,86,125,0,0         // vpbroadcastw  0x7d56(%rip),%ymm8        # 2b03a <_sk_srcover_rgba_8888_sse2_lowp+0x73e>
   .byte  197,61,249,203                      // vpsubw        %ymm3,%ymm8,%ymm9
   .byte  197,53,213,212                      // vpmullw       %ymm4,%ymm9,%ymm10
   .byte  196,65,93,253,216                   // vpaddw        %ymm8,%ymm4,%ymm11
@@ -44006,7 +44155,7 @@
 FUNCTION(_sk_plus__hsw_lowp)
 _sk_plus__hsw_lowp:
   .byte  197,221,253,192                     // vpaddw        %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,5,204,124,0,0        // vpbroadcastw  0x7ccc(%rip),%ymm8        # 2acdc <_sk_srcover_rgba_8888_sse2_lowp+0x740>
+  .byte  196,98,125,121,5,204,124,0,0        // vpbroadcastw  0x7ccc(%rip),%ymm8        # 2b03c <_sk_srcover_rgba_8888_sse2_lowp+0x740>
   .byte  196,194,125,58,192                  // vpminuw       %ymm8,%ymm0,%ymm0
   .byte  197,213,253,201                     // vpaddw        %ymm1,%ymm5,%ymm1
   .byte  196,194,117,58,200                  // vpminuw       %ymm8,%ymm1,%ymm1
@@ -44023,7 +44172,7 @@
 _sk_screen_hsw_lowp:
   .byte  197,93,253,192                      // vpaddw        %ymm0,%ymm4,%ymm8
   .byte  197,221,213,192                     // vpmullw       %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,13,153,124,0,0       // vpbroadcastw  0x7c99(%rip),%ymm9        # 2acde <_sk_srcover_rgba_8888_sse2_lowp+0x742>
+  .byte  196,98,125,121,13,153,124,0,0       // vpbroadcastw  0x7c99(%rip),%ymm9        # 2b03e <_sk_srcover_rgba_8888_sse2_lowp+0x742>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
@@ -44049,7 +44198,7 @@
 .globl _sk_xor__hsw_lowp
 FUNCTION(_sk_xor__hsw_lowp)
 _sk_xor__hsw_lowp:
-  .byte  196,98,125,121,5,62,124,0,0         // vpbroadcastw  0x7c3e(%rip),%ymm8        # 2ace0 <_sk_srcover_rgba_8888_sse2_lowp+0x744>
+  .byte  196,98,125,121,5,62,124,0,0         // vpbroadcastw  0x7c3e(%rip),%ymm8        # 2b040 <_sk_srcover_rgba_8888_sse2_lowp+0x744>
   .byte  197,61,249,207                      // vpsubw        %ymm7,%ymm8,%ymm9
   .byte  197,181,213,192                     // vpmullw       %ymm0,%ymm9,%ymm0
   .byte  197,61,249,211                      // vpsubw        %ymm3,%ymm8,%ymm10
@@ -44083,7 +44232,7 @@
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
   .byte  197,93,213,203                      // vpmullw       %ymm3,%ymm4,%ymm9
   .byte  196,194,125,62,193                  // vpmaxuw       %ymm9,%ymm0,%ymm0
-  .byte  196,98,125,121,13,194,123,0,0       // vpbroadcastw  0x7bc2(%rip),%ymm9        # 2ace2 <_sk_srcover_rgba_8888_sse2_lowp+0x746>
+  .byte  196,98,125,121,13,194,123,0,0       // vpbroadcastw  0x7bc2(%rip),%ymm9        # 2b042 <_sk_srcover_rgba_8888_sse2_lowp+0x746>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
@@ -44117,7 +44266,7 @@
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
   .byte  197,93,213,203                      // vpmullw       %ymm3,%ymm4,%ymm9
   .byte  196,194,125,58,193                  // vpminuw       %ymm9,%ymm0,%ymm0
-  .byte  196,98,125,121,13,67,123,0,0        // vpbroadcastw  0x7b43(%rip),%ymm9        # 2ace4 <_sk_srcover_rgba_8888_sse2_lowp+0x748>
+  .byte  196,98,125,121,13,67,123,0,0        // vpbroadcastw  0x7b43(%rip),%ymm9        # 2b044 <_sk_srcover_rgba_8888_sse2_lowp+0x748>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
@@ -44151,10 +44300,10 @@
   .byte  197,197,213,192                     // vpmullw       %ymm0,%ymm7,%ymm0
   .byte  197,93,213,203                      // vpmullw       %ymm3,%ymm4,%ymm9
   .byte  196,194,125,58,193                  // vpminuw       %ymm9,%ymm0,%ymm0
-  .byte  196,98,125,121,13,196,122,0,0       // vpbroadcastw  0x7ac4(%rip),%ymm9        # 2ace6 <_sk_srcover_rgba_8888_sse2_lowp+0x74a>
+  .byte  196,98,125,121,13,196,122,0,0       // vpbroadcastw  0x7ac4(%rip),%ymm9        # 2b046 <_sk_srcover_rgba_8888_sse2_lowp+0x74a>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,7                   // vpsrlw        $0x7,%ymm0,%ymm0
-  .byte  196,98,125,121,21,179,122,0,0       // vpbroadcastw  0x7ab3(%rip),%ymm10        # 2ace8 <_sk_srcover_rgba_8888_sse2_lowp+0x74c>
+  .byte  196,98,125,121,21,179,122,0,0       // vpbroadcastw  0x7ab3(%rip),%ymm10        # 2b048 <_sk_srcover_rgba_8888_sse2_lowp+0x74c>
   .byte  196,193,125,219,194                 // vpand         %ymm10,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
   .byte  197,85,253,193                      // vpaddw        %ymm1,%ymm5,%ymm8
@@ -44187,10 +44336,10 @@
 _sk_exclusion_hsw_lowp:
   .byte  197,93,253,192                      // vpaddw        %ymm0,%ymm4,%ymm8
   .byte  197,221,213,192                     // vpmullw       %ymm0,%ymm4,%ymm0
-  .byte  196,98,125,121,13,56,122,0,0        // vpbroadcastw  0x7a38(%rip),%ymm9        # 2acea <_sk_srcover_rgba_8888_sse2_lowp+0x74e>
+  .byte  196,98,125,121,13,56,122,0,0        // vpbroadcastw  0x7a38(%rip),%ymm9        # 2b04a <_sk_srcover_rgba_8888_sse2_lowp+0x74e>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,7                   // vpsrlw        $0x7,%ymm0,%ymm0
-  .byte  196,98,125,121,21,39,122,0,0        // vpbroadcastw  0x7a27(%rip),%ymm10        # 2acec <_sk_srcover_rgba_8888_sse2_lowp+0x750>
+  .byte  196,98,125,121,21,39,122,0,0        // vpbroadcastw  0x7a27(%rip),%ymm10        # 2b04c <_sk_srcover_rgba_8888_sse2_lowp+0x750>
   .byte  196,193,125,219,194                 // vpand         %ymm10,%ymm0,%ymm0
   .byte  197,189,249,192                     // vpsubw        %ymm0,%ymm8,%ymm0
   .byte  197,85,253,193                      // vpaddw        %ymm1,%ymm5,%ymm8
@@ -44218,7 +44367,7 @@
 FUNCTION(_sk_hardlight_hsw_lowp)
 _sk_hardlight_hsw_lowp:
   .byte  197,125,253,192                     // vpaddw        %ymm0,%ymm0,%ymm8
-  .byte  196,98,125,121,13,196,121,0,0       // vpbroadcastw  0x79c4(%rip),%ymm9        # 2acf0 <_sk_srcover_rgba_8888_sse2_lowp+0x754>
+  .byte  196,98,125,121,13,196,121,0,0       // vpbroadcastw  0x79c4(%rip),%ymm9        # 2b050 <_sk_srcover_rgba_8888_sse2_lowp+0x754>
   .byte  196,65,101,239,209                  // vpxor         %ymm9,%ymm3,%ymm10
   .byte  196,65,61,239,217                   // vpxor         %ymm9,%ymm8,%ymm11
   .byte  196,65,37,101,218                   // vpcmpgtw      %ymm10,%ymm11,%ymm11
@@ -44246,7 +44395,7 @@
   .byte  197,101,249,210                     // vpsubw        %ymm2,%ymm3,%ymm10
   .byte  197,69,249,246                      // vpsubw        %ymm6,%ymm7,%ymm14
   .byte  196,65,45,213,214                   // vpmullw       %ymm14,%ymm10,%ymm10
-  .byte  196,98,125,121,53,59,121,0,0        // vpbroadcastw  0x793b(%rip),%ymm14        # 2acee <_sk_srcover_rgba_8888_sse2_lowp+0x752>
+  .byte  196,98,125,121,53,59,121,0,0        // vpbroadcastw  0x793b(%rip),%ymm14        # 2b04e <_sk_srcover_rgba_8888_sse2_lowp+0x752>
   .byte  196,65,45,253,210                   // vpaddw        %ymm10,%ymm10,%ymm10
   .byte  196,65,61,249,194                   // vpsubw        %ymm10,%ymm8,%ymm8
   .byte  197,13,249,215                      // vpsubw        %ymm7,%ymm14,%ymm10
@@ -44283,7 +44432,7 @@
 FUNCTION(_sk_overlay_hsw_lowp)
 _sk_overlay_hsw_lowp:
   .byte  197,93,253,196                      // vpaddw        %ymm4,%ymm4,%ymm8
-  .byte  196,98,125,121,13,176,120,0,0       // vpbroadcastw  0x78b0(%rip),%ymm9        # 2acf4 <_sk_srcover_rgba_8888_sse2_lowp+0x758>
+  .byte  196,98,125,121,13,176,120,0,0       // vpbroadcastw  0x78b0(%rip),%ymm9        # 2b054 <_sk_srcover_rgba_8888_sse2_lowp+0x758>
   .byte  196,65,69,239,209                   // vpxor         %ymm9,%ymm7,%ymm10
   .byte  196,65,61,239,193                   // vpxor         %ymm9,%ymm8,%ymm8
   .byte  196,65,61,101,218                   // vpcmpgtw      %ymm10,%ymm8,%ymm11
@@ -44307,7 +44456,7 @@
   .byte  196,65,21,253,237                   // vpaddw        %ymm13,%ymm13,%ymm13
   .byte  196,65,61,249,237                   // vpsubw        %ymm13,%ymm8,%ymm13
   .byte  196,67,13,76,229,192                // vpblendvb     %ymm12,%ymm13,%ymm14,%ymm12
-  .byte  196,98,125,121,45,56,120,0,0        // vpbroadcastw  0x7838(%rip),%ymm13        # 2acf2 <_sk_srcover_rgba_8888_sse2_lowp+0x756>
+  .byte  196,98,125,121,45,56,120,0,0        // vpbroadcastw  0x7838(%rip),%ymm13        # 2b052 <_sk_srcover_rgba_8888_sse2_lowp+0x756>
   .byte  197,77,253,246                      // vpaddw        %ymm6,%ymm6,%ymm14
   .byte  196,65,13,239,201                   // vpxor         %ymm9,%ymm14,%ymm9
   .byte  196,65,53,101,202                   // vpcmpgtw      %ymm10,%ymm9,%ymm9
@@ -44359,10 +44508,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            235b0 <_sk_load_8888_hsw_lowp+0x52>
+  .byte  119,55                              // ja            23910 <_sk_load_8888_hsw_lowp+0x52>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,161,1,0,0                 // lea           0x1a1(%rip),%r9        # 23728 <_sk_load_8888_hsw_lowp+0x1ca>
+  .byte  76,141,13,161,1,0,0                 // lea           0x1a1(%rip),%r9        # 23a88 <_sk_load_8888_hsw_lowp+0x1ca>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44372,10 +44521,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,12,144              // vmovd         (%r8,%rdx,4),%xmm1
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
-  .byte  233,39,1,0,0                        // jmpq          236d7 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          23a37 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
   .byte  196,193,126,111,68,144,32           // vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  .byte  233,21,1,0,0                        // jmpq          236d7 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          23a37 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
@@ -44384,7 +44533,7 @@
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  196,227,125,2,201,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   .byte  197,253,111,195                     // vmovdqa       %ymm3,%ymm0
-  .byte  233,229,0,0,0                       // jmpq          236d7 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          23a37 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44400,7 +44549,7 @@
   .byte  196,193,122,111,12,144              // vmovdqu       (%r8,%rdx,4),%xmm1
   .byte  196,227,117,2,200,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   .byte  197,125,127,192                     // vmovdqa       %ymm8,%ymm0
-  .byte  233,138,0,0,0                       // jmpq          236d7 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          23a37 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,40           // vmovd         0x28(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44410,7 +44559,7 @@
   .byte  196,193,121,110,76,144,32           // vmovd         0x20(%r8,%rdx,4),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
-  .byte  235,81                              // jmp           236d7 <_sk_load_8888_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           23a37 <_sk_load_8888_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,56           // vmovd         0x38(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44430,7 +44579,7 @@
   .byte  196,227,101,14,200,170              // vpblendw      $0xaa,%ymm0,%ymm3,%ymm1
   .byte  196,227,109,14,192,170              // vpblendw      $0xaa,%ymm0,%ymm2,%ymm0
   .byte  196,226,125,43,201                  // vpackusdw     %ymm1,%ymm0,%ymm1
-  .byte  197,125,111,5,0,118,0,0             // vmovdqa       0x7600(%rip),%ymm8        # 2ad00 <_sk_srcover_rgba_8888_sse2_lowp+0x764>
+  .byte  197,125,111,5,0,118,0,0             // vmovdqa       0x7600(%rip),%ymm8        # 2b060 <_sk_srcover_rgba_8888_sse2_lowp+0x764>
   .byte  196,193,117,219,192                 // vpand         %ymm8,%ymm1,%ymm0
   .byte  197,245,113,209,8                   // vpsrlw        $0x8,%ymm1,%ymm1
   .byte  197,229,114,211,16                  // vpsrld        $0x10,%ymm3,%ymm3
@@ -44441,7 +44590,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  121,254                             // jns           23728 <_sk_load_8888_hsw_lowp+0x1ca>
+  .byte  121,254                             // jns           23a88 <_sk_load_8888_hsw_lowp+0x1ca>
   .byte  255                                 // (bad)
   .byte  255,176,254,255,255,154             // pushq         -0x65000002(%rax)
   .byte  254                                 // (bad)
@@ -44466,7 +44615,7 @@
   .byte  255                                 // (bad)
   .byte  59,255                              // cmp           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,37,255,255,255,156              // jmpq          *-0x63000001(%rip)        # ffffffff9d023754 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffff9cff91b8>
+  .byte  255,37,255,255,255,156              // jmpq          *-0x63000001(%rip)        # ffffffff9d023ab4 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffff9cff91b8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,136,255,255,255,116             // decl          0x74ffffff(%rax)
@@ -44489,10 +44638,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            237b6 <_sk_load_8888_dst_hsw_lowp+0x52>
+  .byte  119,55                              // ja            23b16 <_sk_load_8888_dst_hsw_lowp+0x52>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 23930 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 23c90 <_sk_load_8888_dst_hsw_lowp+0x1cc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44502,10 +44651,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,44,144              // vmovd         (%r8,%rdx,4),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,39,1,0,0                        // jmpq          238dd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          23c3d <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
   .byte  196,193,126,111,100,144,32          // vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  .byte  233,21,1,0,0                        // jmpq          238dd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          23c3d <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -44514,7 +44663,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,229,0,0,0                       // jmpq          238dd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          23c3d <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44530,7 +44679,7 @@
   .byte  196,193,122,111,44,144              // vmovdqu       (%r8,%rdx,4),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,138,0,0,0                       // jmpq          238dd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          23c3d <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,40          // vmovd         0x28(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44540,7 +44689,7 @@
   .byte  196,193,121,110,108,144,32          // vmovd         0x20(%r8,%rdx,4),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
-  .byte  235,81                              // jmp           238dd <_sk_load_8888_dst_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           23c3d <_sk_load_8888_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,56          // vmovd         0x38(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44560,7 +44709,7 @@
   .byte  196,227,69,14,236,170               // vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   .byte  196,227,77,14,228,170               // vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   .byte  196,226,93,43,237                   // vpackusdw     %ymm5,%ymm4,%ymm5
-  .byte  197,125,111,5,26,116,0,0            // vmovdqa       0x741a(%rip),%ymm8        # 2ad20 <_sk_srcover_rgba_8888_sse2_lowp+0x784>
+  .byte  197,125,111,5,26,116,0,0            // vmovdqa       0x741a(%rip),%ymm8        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0x784>
   .byte  196,193,85,219,224                  // vpand         %ymm8,%ymm5,%ymm4
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,197,114,215,16                  // vpsrld        $0x10,%ymm7,%ymm7
@@ -44571,7 +44720,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,254                             // ja            23930 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  .byte  119,254                             // ja            23c90 <_sk_load_8888_dst_hsw_lowp+0x1cc>
   .byte  255                                 // (bad)
   .byte  255,174,254,255,255,152             // ljmp          *-0x67000002(%rsi)
   .byte  254                                 // (bad)
@@ -44632,20 +44781,20 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,30                              // ja            239ed <_sk_store_8888_hsw_lowp+0x81>
+  .byte  119,30                              // ja            23d4d <_sk_store_8888_hsw_lowp+0x81>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 23a9c <_sk_store_8888_hsw_lowp+0x130>
+  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 23dfc <_sk_store_8888_hsw_lowp+0x130>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
-  .byte  233,171,0,0,0                       // jmpq          23a98 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  233,171,0,0,0                       // jmpq          23df8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  196,65,126,127,76,144,32            // vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  .byte  233,153,0,0,0                       // jmpq          23a98 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  233,153,0,0,0                       // jmpq          23df8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
-  .byte  233,134,0,0,0                       // jmpq          23a98 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  233,134,0,0,0                       // jmpq          23df8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -44653,12 +44802,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
   .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
-  .byte  235,85                              // jmp           23a98 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  235,85                              // jmp           23df8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,121,22,76,144,40,2           // vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   .byte  196,67,121,22,76,144,36,1           // vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   .byte  196,65,121,126,76,144,32            // vmovd         %xmm9,0x20(%r8,%rdx,4)
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
-  .byte  235,54                              // jmp           23a98 <_sk_store_8888_hsw_lowp+0x12c>
+  .byte  235,54                              // jmp           23df8 <_sk_store_8888_hsw_lowp+0x12c>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,84,144,56,2           // vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -44715,10 +44864,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            23b2a <_sk_load_bgra_hsw_lowp+0x52>
+  .byte  119,55                              // ja            23e8a <_sk_load_bgra_hsw_lowp+0x52>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 23ca4 <_sk_load_bgra_hsw_lowp+0x1cc>
+  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 24004 <_sk_load_bgra_hsw_lowp+0x1cc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44728,10 +44877,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,12,144              // vmovd         (%r8,%rdx,4),%xmm1
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
-  .byte  233,39,1,0,0                        // jmpq          23c51 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          23fb1 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
   .byte  196,193,126,111,68,144,32           // vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  .byte  233,21,1,0,0                        // jmpq          23c51 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          23fb1 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,8            // vmovd         0x8(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,229,239,219                     // vpxor         %ymm3,%ymm3,%ymm3
@@ -44740,7 +44889,7 @@
   .byte  197,249,112,201,232                 // vpshufd       $0xe8,%xmm1,%xmm1
   .byte  196,227,125,2,201,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   .byte  197,253,111,195                     // vmovdqa       %ymm3,%ymm0
-  .byte  233,229,0,0,0                       // jmpq          23c51 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          23fb1 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,24           // vmovd         0x18(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44756,7 +44905,7 @@
   .byte  196,193,122,111,12,144              // vmovdqu       (%r8,%rdx,4),%xmm1
   .byte  196,227,117,2,200,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   .byte  197,125,127,192                     // vmovdqa       %ymm8,%ymm0
-  .byte  233,138,0,0,0                       // jmpq          23c51 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          23fb1 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,40           // vmovd         0x28(%r8,%rdx,4),%xmm0
   .byte  196,226,121,89,192                  // vpbroadcastq  %xmm0,%xmm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44766,7 +44915,7 @@
   .byte  196,193,121,110,76,144,32           // vmovd         0x20(%r8,%rdx,4),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   .byte  196,193,126,111,12,144              // vmovdqu       (%r8,%rdx,4),%ymm1
-  .byte  235,81                              // jmp           23c51 <_sk_load_bgra_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           23fb1 <_sk_load_bgra_hsw_lowp+0x179>
   .byte  196,193,121,110,68,144,56           // vmovd         0x38(%r8,%rdx,4),%xmm0
   .byte  196,226,125,89,192                  // vpbroadcastq  %xmm0,%ymm0
   .byte  197,245,239,201                     // vpxor         %ymm1,%ymm1,%ymm1
@@ -44786,7 +44935,7 @@
   .byte  196,227,125,14,209,170              // vpblendw      $0xaa,%ymm1,%ymm0,%ymm2
   .byte  196,227,101,14,201,170              // vpblendw      $0xaa,%ymm1,%ymm3,%ymm1
   .byte  196,226,117,43,202                  // vpackusdw     %ymm2,%ymm1,%ymm1
-  .byte  197,125,111,5,198,112,0,0           // vmovdqa       0x70c6(%rip),%ymm8        # 2ad40 <_sk_srcover_rgba_8888_sse2_lowp+0x7a4>
+  .byte  197,125,111,5,198,112,0,0           // vmovdqa       0x70c6(%rip),%ymm8        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x7a4>
   .byte  196,193,117,219,208                 // vpand         %ymm8,%ymm1,%ymm2
   .byte  197,245,113,209,8                   // vpsrlw        $0x8,%ymm1,%ymm1
   .byte  197,253,114,208,16                  // vpsrld        $0x10,%ymm0,%ymm0
@@ -44797,7 +44946,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,254                             // ja            23ca4 <_sk_load_bgra_hsw_lowp+0x1cc>
+  .byte  119,254                             // ja            24004 <_sk_load_bgra_hsw_lowp+0x1cc>
   .byte  255                                 // (bad)
   .byte  255,174,254,255,255,152             // ljmp          *-0x67000002(%rsi)
   .byte  254                                 // (bad)
@@ -44844,10 +44993,10 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,55                              // ja            23d32 <_sk_load_bgra_dst_hsw_lowp+0x52>
+  .byte  119,55                              // ja            24092 <_sk_load_bgra_dst_hsw_lowp+0x52>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 23eac <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  .byte  76,141,13,163,1,0,0                 // lea           0x1a3(%rip),%r9        # 2420c <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44857,10 +45006,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,44,144              // vmovd         (%r8,%rdx,4),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,39,1,0,0                        // jmpq          23e59 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,39,1,0,0                        // jmpq          241b9 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
   .byte  196,193,126,111,100,144,32          // vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  .byte  233,21,1,0,0                        // jmpq          23e59 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,21,1,0,0                        // jmpq          241b9 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,8           // vmovd         0x8(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -44869,7 +45018,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,229,0,0,0                       // jmpq          23e59 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,229,0,0,0                       // jmpq          241b9 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,24          // vmovd         0x18(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44885,7 +45034,7 @@
   .byte  196,193,122,111,44,144              // vmovdqu       (%r8,%rdx,4),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,138,0,0,0                       // jmpq          23e59 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  233,138,0,0,0                       // jmpq          241b9 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,40          // vmovd         0x28(%r8,%rdx,4),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44895,7 +45044,7 @@
   .byte  196,193,121,110,108,144,32          // vmovd         0x20(%r8,%rdx,4),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,44,144              // vmovdqu       (%r8,%rdx,4),%ymm5
-  .byte  235,81                              // jmp           23e59 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  .byte  235,81                              // jmp           241b9 <_sk_load_bgra_dst_hsw_lowp+0x179>
   .byte  196,193,121,110,100,144,56          // vmovd         0x38(%r8,%rdx,4),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -44915,7 +45064,7 @@
   .byte  196,227,93,14,245,170               // vpblendw      $0xaa,%ymm5,%ymm4,%ymm6
   .byte  196,227,69,14,237,170               // vpblendw      $0xaa,%ymm5,%ymm7,%ymm5
   .byte  196,226,85,43,238                   // vpackusdw     %ymm6,%ymm5,%ymm5
-  .byte  197,125,111,5,222,110,0,0           // vmovdqa       0x6ede(%rip),%ymm8        # 2ad60 <_sk_srcover_rgba_8888_sse2_lowp+0x7c4>
+  .byte  197,125,111,5,222,110,0,0           // vmovdqa       0x6ede(%rip),%ymm8        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x7c4>
   .byte  196,193,85,219,240                  // vpand         %ymm8,%ymm5,%ymm6
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,221,114,212,16                  // vpsrld        $0x10,%ymm4,%ymm4
@@ -44926,7 +45075,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,254                             // ja            23eac <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  .byte  119,254                             // ja            2420c <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   .byte  255                                 // (bad)
   .byte  255,174,254,255,255,152             // ljmp          *-0x67000002(%rsi)
   .byte  254                                 // (bad)
@@ -44987,20 +45136,20 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,30                              // ja            23f69 <_sk_store_bgra_hsw_lowp+0x81>
+  .byte  119,30                              // ja            242c9 <_sk_store_bgra_hsw_lowp+0x81>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 24018 <_sk_store_bgra_hsw_lowp+0x130>
+  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 24378 <_sk_store_bgra_hsw_lowp+0x130>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,4,144                // vmovd         %xmm8,(%r8,%rdx,4)
-  .byte  233,171,0,0,0                       // jmpq          24014 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  233,171,0,0,0                       // jmpq          24374 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
   .byte  196,65,126,127,76,144,32            // vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  .byte  233,153,0,0,0                       // jmpq          24014 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  233,153,0,0,0                       // jmpq          24374 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,121,22,68,144,8,2            // vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  196,65,121,214,4,144                // vmovq         %xmm8,(%r8,%rdx,4)
-  .byte  233,134,0,0,0                       // jmpq          24014 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  233,134,0,0,0                       // jmpq          24374 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,76,144,24,2           // vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -45008,12 +45157,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,76,144,16            // vmovd         %xmm9,0x10(%r8,%rdx,4)
   .byte  196,65,122,127,4,144                // vmovdqu       %xmm8,(%r8,%rdx,4)
-  .byte  235,85                              // jmp           24014 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  235,85                              // jmp           24374 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,121,22,76,144,40,2           // vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   .byte  196,67,121,22,76,144,36,1           // vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   .byte  196,65,121,126,76,144,32            // vmovd         %xmm9,0x20(%r8,%rdx,4)
   .byte  196,65,126,127,4,144                // vmovdqu       %ymm8,(%r8,%rdx,4)
-  .byte  235,54                              // jmp           24014 <_sk_store_bgra_hsw_lowp+0x12c>
+  .byte  235,54                              // jmp           24374 <_sk_store_bgra_hsw_lowp+0x12c>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,84,144,56,2           // vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -45070,24 +45219,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            24093 <_sk_load_565_hsw_lowp+0x3f>
+  .byte  119,37                              // ja            243f3 <_sk_load_565_hsw_lowp+0x3f>
   .byte  197,253,239,192                     // vpxor         %ymm0,%ymm0,%ymm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,132,1,0,0                 // lea           0x184(%rip),%r9        # 24200 <_sk_load_565_hsw_lowp+0x1ac>
+  .byte  76,141,13,132,1,0,0                 // lea           0x184(%rip),%r9        # 24560 <_sk_load_565_hsw_lowp+0x1ac>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,8,1,0,0                         // jmpq          2419b <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,8,1,0,0                         // jmpq          244fb <_sk_load_565_hsw_lowp+0x147>
   .byte  196,193,126,111,4,80                // vmovdqu       (%r8,%rdx,2),%ymm0
-  .byte  233,253,0,0,0                       // jmpq          2419b <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,253,0,0,0                       // jmpq          244fb <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,117,56,192,1                // vinserti128   $0x1,%xmm0,%ymm1,%ymm0
   .byte  196,193,121,110,12,80               // vmovd         (%r8,%rdx,2),%xmm1
   .byte  196,227,125,2,193,1                 // vpblendd      $0x1,%ymm1,%ymm0,%ymm0
-  .byte  233,218,0,0,0                       // jmpq          2419b <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,218,0,0,0                       // jmpq          244fb <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,117,56,192,1                // vinserti128   $0x1,%xmm0,%ymm1,%ymm0
@@ -45097,7 +45246,7 @@
   .byte  196,227,125,2,193,15                // vpblendd      $0xf,%ymm1,%ymm0,%ymm0
   .byte  196,193,122,126,12,80               // vmovq         (%r8,%rdx,2),%xmm1
   .byte  196,227,125,2,193,3                 // vpblendd      $0x3,%ymm1,%ymm0,%ymm0
-  .byte  233,155,0,0,0                       // jmpq          2419b <_sk_load_565_hsw_lowp+0x147>
+  .byte  233,155,0,0,0                       // jmpq          244fb <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,20,2          // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -45109,7 +45258,7 @@
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   .byte  196,193,122,111,12,80               // vmovdqu       (%r8,%rdx,2),%xmm1
   .byte  196,227,117,2,192,240               // vpblendd      $0xf0,%ymm0,%ymm1,%ymm0
-  .byte  235,83                              // jmp           2419b <_sk_load_565_hsw_lowp+0x147>
+  .byte  235,83                              // jmp           244fb <_sk_load_565_hsw_lowp+0x147>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,193,121,196,76,80,28,6          // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm0,%xmm1
   .byte  196,227,125,56,193,1                // vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -45123,13 +45272,13 @@
   .byte  196,193,122,111,20,80               // vmovdqu       (%r8,%rdx,2),%xmm2
   .byte  196,227,109,56,201,1                // vinserti128   $0x1,%xmm1,%ymm2,%ymm1
   .byte  196,227,117,2,192,192               // vpblendd      $0xc0,%ymm0,%ymm1,%ymm0
-  .byte  196,226,125,121,13,220,107,0,0      // vpbroadcastw  0x6bdc(%rip),%ymm1        # 2ad80 <_sk_srcover_rgba_8888_sse2_lowp+0x7e4>
+  .byte  196,226,125,121,13,220,107,0,0      // vpbroadcastw  0x6bdc(%rip),%ymm1        # 2b0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x7e4>
   .byte  197,237,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm2
   .byte  197,237,219,201                     // vpand         %ymm1,%ymm2,%ymm1
   .byte  197,237,113,208,5                   // vpsrlw        $0x5,%ymm0,%ymm2
-  .byte  196,226,125,121,29,199,107,0,0      // vpbroadcastw  0x6bc7(%rip),%ymm3        # 2ad82 <_sk_srcover_rgba_8888_sse2_lowp+0x7e6>
+  .byte  196,226,125,121,29,199,107,0,0      // vpbroadcastw  0x6bc7(%rip),%ymm3        # 2b0e2 <_sk_srcover_rgba_8888_sse2_lowp+0x7e6>
   .byte  197,237,219,211                     // vpand         %ymm3,%ymm2,%ymm2
-  .byte  196,226,125,121,29,188,107,0,0      // vpbroadcastw  0x6bbc(%rip),%ymm3        # 2ad84 <_sk_srcover_rgba_8888_sse2_lowp+0x7e8>
+  .byte  196,226,125,121,29,188,107,0,0      // vpbroadcastw  0x6bbc(%rip),%ymm3        # 2b0e4 <_sk_srcover_rgba_8888_sse2_lowp+0x7e8>
   .byte  197,253,219,219                     // vpand         %ymm3,%ymm0,%ymm3
   .byte  197,253,113,208,13                  // vpsrlw        $0xd,%ymm0,%ymm0
   .byte  197,245,235,192                     // vpor          %ymm0,%ymm1,%ymm0
@@ -45140,7 +45289,7 @@
   .byte  197,229,113,211,2                   // vpsrlw        $0x2,%ymm3,%ymm3
   .byte  197,237,235,211                     // vpor          %ymm3,%ymm2,%ymm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,138,107,0,0      // vpbroadcastw  0x6b8a(%rip),%ymm3        # 2ad86 <_sk_srcover_rgba_8888_sse2_lowp+0x7ea>
+  .byte  196,226,125,121,29,138,107,0,0      // vpbroadcastw  0x6b8a(%rip),%ymm3        # 2b0e6 <_sk_srcover_rgba_8888_sse2_lowp+0x7ea>
   .byte  255,224                             // jmpq          *%rax
   .byte  102,144                             // xchg          %ax,%ax
   .byte  133,254                             // test          %edi,%esi
@@ -45195,24 +45344,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2427b <_sk_load_565_dst_hsw_lowp+0x3f>
+  .byte  119,37                              // ja            245db <_sk_load_565_dst_hsw_lowp+0x3f>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,132,1,0,0                 // lea           0x184(%rip),%r9        # 243e8 <_sk_load_565_dst_hsw_lowp+0x1ac>
+  .byte  76,141,13,132,1,0,0                 // lea           0x184(%rip),%r9        # 24748 <_sk_load_565_dst_hsw_lowp+0x1ac>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,8,1,0,0                         // jmpq          24383 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,8,1,0,0                         // jmpq          246e3 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  196,193,126,111,36,80               // vmovdqu       (%r8,%rdx,2),%ymm4
-  .byte  233,253,0,0,0                       // jmpq          24383 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,253,0,0,0                       // jmpq          246e3 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,4,2           // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,85,56,228,1                 // vinserti128   $0x1,%xmm4,%ymm5,%ymm4
   .byte  196,193,121,110,44,80               // vmovd         (%r8,%rdx,2),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
-  .byte  233,218,0,0,0                       // jmpq          24383 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,218,0,0,0                       // jmpq          246e3 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,12,6          // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,85,56,228,1                 // vinserti128   $0x1,%xmm4,%ymm5,%ymm4
@@ -45222,7 +45371,7 @@
   .byte  196,227,93,2,229,15                 // vpblendd      $0xf,%ymm5,%ymm4,%ymm4
   .byte  196,193,122,126,44,80               // vmovq         (%r8,%rdx,2),%xmm5
   .byte  196,227,93,2,229,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm4
-  .byte  233,155,0,0,0                       // jmpq          24383 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  233,155,0,0,0                       // jmpq          246e3 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,20,2          // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -45234,7 +45383,7 @@
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
   .byte  196,193,122,111,44,80               // vmovdqu       (%r8,%rdx,2),%xmm5
   .byte  196,227,85,2,228,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm4
-  .byte  235,83                              // jmp           24383 <_sk_load_565_dst_hsw_lowp+0x147>
+  .byte  235,83                              // jmp           246e3 <_sk_load_565_dst_hsw_lowp+0x147>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,193,89,196,108,80,28,6          // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm4,%xmm5
   .byte  196,227,93,56,229,1                 // vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -45248,13 +45397,13 @@
   .byte  196,193,122,111,52,80               // vmovdqu       (%r8,%rdx,2),%xmm6
   .byte  196,227,77,56,237,1                 // vinserti128   $0x1,%xmm5,%ymm6,%ymm5
   .byte  196,227,85,2,228,192                // vpblendd      $0xc0,%ymm4,%ymm5,%ymm4
-  .byte  196,226,125,121,45,252,105,0,0      // vpbroadcastw  0x69fc(%rip),%ymm5        # 2ad88 <_sk_srcover_rgba_8888_sse2_lowp+0x7ec>
+  .byte  196,226,125,121,45,252,105,0,0      // vpbroadcastw  0x69fc(%rip),%ymm5        # 2b0e8 <_sk_srcover_rgba_8888_sse2_lowp+0x7ec>
   .byte  197,205,113,212,8                   // vpsrlw        $0x8,%ymm4,%ymm6
   .byte  197,205,219,237                     // vpand         %ymm5,%ymm6,%ymm5
   .byte  197,205,113,212,5                   // vpsrlw        $0x5,%ymm4,%ymm6
-  .byte  196,226,125,121,61,231,105,0,0      // vpbroadcastw  0x69e7(%rip),%ymm7        # 2ad8a <_sk_srcover_rgba_8888_sse2_lowp+0x7ee>
+  .byte  196,226,125,121,61,231,105,0,0      // vpbroadcastw  0x69e7(%rip),%ymm7        # 2b0ea <_sk_srcover_rgba_8888_sse2_lowp+0x7ee>
   .byte  197,205,219,247                     // vpand         %ymm7,%ymm6,%ymm6
-  .byte  196,226,125,121,61,220,105,0,0      // vpbroadcastw  0x69dc(%rip),%ymm7        # 2ad8c <_sk_srcover_rgba_8888_sse2_lowp+0x7f0>
+  .byte  196,226,125,121,61,220,105,0,0      // vpbroadcastw  0x69dc(%rip),%ymm7        # 2b0ec <_sk_srcover_rgba_8888_sse2_lowp+0x7f0>
   .byte  197,221,219,255                     // vpand         %ymm7,%ymm4,%ymm7
   .byte  197,221,113,212,13                  // vpsrlw        $0xd,%ymm4,%ymm4
   .byte  197,213,235,228                     // vpor          %ymm4,%ymm5,%ymm4
@@ -45265,7 +45414,7 @@
   .byte  197,197,113,215,2                   // vpsrlw        $0x2,%ymm7,%ymm7
   .byte  197,205,235,247                     // vpor          %ymm7,%ymm6,%ymm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,61,170,105,0,0      // vpbroadcastw  0x69aa(%rip),%ymm7        # 2ad8e <_sk_srcover_rgba_8888_sse2_lowp+0x7f2>
+  .byte  196,226,125,121,61,170,105,0,0      // vpbroadcastw  0x69aa(%rip),%ymm7        # 2b0ee <_sk_srcover_rgba_8888_sse2_lowp+0x7f2>
   .byte  255,224                             // jmpq          *%rax
   .byte  102,144                             // xchg          %ax,%ax
   .byte  133,254                             // test          %edi,%esi
@@ -45316,10 +45465,10 @@
   .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  77,1,192                            // add           %r8,%r8
   .byte  76,3,0                              // add           (%rax),%r8
-  .byte  196,98,125,121,5,83,105,0,0         // vpbroadcastw  0x6953(%rip),%ymm8        # 2ad90 <_sk_srcover_rgba_8888_sse2_lowp+0x7f4>
+  .byte  196,98,125,121,5,83,105,0,0         // vpbroadcastw  0x6953(%rip),%ymm8        # 2b0f0 <_sk_srcover_rgba_8888_sse2_lowp+0x7f4>
   .byte  197,181,113,240,8                   // vpsllw        $0x8,%ymm0,%ymm9
   .byte  196,65,53,219,192                   // vpand         %ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,66,105,0,0        // vpbroadcastw  0x6942(%rip),%ymm9        # 2ad92 <_sk_srcover_rgba_8888_sse2_lowp+0x7f6>
+  .byte  196,98,125,121,13,66,105,0,0        // vpbroadcastw  0x6942(%rip),%ymm9        # 2b0f2 <_sk_srcover_rgba_8888_sse2_lowp+0x7f6>
   .byte  197,173,113,241,3                   // vpsllw        $0x3,%ymm1,%ymm10
   .byte  196,65,45,219,201                   // vpand         %ymm9,%ymm10,%ymm9
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
@@ -45329,31 +45478,31 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,31                              // ja            24492 <_sk_store_565_hsw_lowp+0x6e>
+  .byte  119,31                              // ja            247f2 <_sk_store_565_hsw_lowp+0x6e>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 24540 <_sk_store_565_hsw_lowp+0x11c>
+  .byte  76,141,13,195,0,0,0                 // lea           0xc3(%rip),%r9        # 248a0 <_sk_store_565_hsw_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,67,121,21,4,80,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
-  .byte  233,167,0,0,0                       // jmpq          24539 <_sk_store_565_hsw_lowp+0x115>
+  .byte  233,167,0,0,0                       // jmpq          24899 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,65,126,127,4,80                 // vmovdqu       %ymm8,(%r8,%rdx,2)
-  .byte  233,156,0,0,0                       // jmpq          24539 <_sk_store_565_hsw_lowp+0x115>
+  .byte  233,156,0,0,0                       // jmpq          24899 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,67,121,21,68,80,4,2             // vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  196,65,121,126,4,80                 // vmovd         %xmm8,(%r8,%rdx,2)
-  .byte  233,137,0,0,0                       // jmpq          24539 <_sk_store_565_hsw_lowp+0x115>
+  .byte  233,137,0,0,0                       // jmpq          24899 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,67,121,21,68,80,12,6            // vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
   .byte  196,67,121,21,68,80,10,5            // vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
   .byte  196,67,121,21,68,80,8,4             // vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   .byte  196,65,121,214,4,80                 // vmovq         %xmm8,(%r8,%rdx,2)
-  .byte  235,105                             // jmp           24539 <_sk_store_565_hsw_lowp+0x115>
+  .byte  235,105                             // jmp           24899 <_sk_store_565_hsw_lowp+0x115>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,20,2            // vpextrw       $0x2,%xmm9,0x14(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,18,1            // vpextrw       $0x1,%xmm9,0x12(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,16,0            // vpextrw       $0x0,%xmm9,0x10(%r8,%rdx,2)
-  .byte  235,55                              // jmp           24533 <_sk_store_565_hsw_lowp+0x10f>
+  .byte  235,55                              // jmp           24893 <_sk_store_565_hsw_lowp+0x10f>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,21,76,80,28,6            // vpextrw       $0x6,%xmm9,0x1c(%r8,%rdx,2)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -45376,7 +45525,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  120,255                             // js            24555 <_sk_store_565_hsw_lowp+0x131>
+  .byte  120,255                             // js            248b5 <_sk_store_565_hsw_lowp+0x131>
   .byte  255                                 // (bad)
   .byte  255,112,255                         // pushq         -0x1(%rax)
   .byte  255                                 // (bad)
@@ -45412,38 +45561,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            245b8 <_sk_load_a8_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            24918 <_sk_load_a8_hsw_lowp+0x3c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,219,0,0,0                 // lea           0xdb(%rip),%r9        # 2467c <_sk_load_a8_hsw_lowp+0x100>
+  .byte  76,141,13,219,0,0,0                 // lea           0xdb(%rip),%r9        # 249dc <_sk_load_a8_hsw_lowp+0x100>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,175,0,0,0                       // jmpq          24667 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          249c7 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  196,193,122,111,4,16                // vmovdqu       (%r8,%rdx,1),%xmm0
-  .byte  233,164,0,0,0                       // jmpq          24667 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          249c7 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,227,121,14,193,1                // vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,132,0,0,0                       // jmpq          24667 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          249c7 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  235,90                              // jmp           24667 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           249c7 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,122,126,12,16               // vmovq         (%r8,%rdx,1),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  235,48                              // jmp           24667 <_sk_load_a8_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           249c7 <_sk_load_a8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -45503,38 +45652,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            246f4 <_sk_load_a8_dst_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            24a54 <_sk_load_a8_dst_hsw_lowp+0x3c>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,219,0,0,0                 // lea           0xdb(%rip),%r9        # 247b8 <_sk_load_a8_dst_hsw_lowp+0x100>
+  .byte  76,141,13,219,0,0,0                 // lea           0xdb(%rip),%r9        # 24b18 <_sk_load_a8_dst_hsw_lowp+0x100>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,175,0,0,0                       // jmpq          247a3 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          24b03 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  196,193,122,111,36,16               // vmovdqu       (%r8,%rdx,1),%xmm4
-  .byte  233,164,0,0,0                       // jmpq          247a3 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          24b03 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,227,89,14,229,1                 // vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,132,0,0,0                       // jmpq          247a3 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          24b03 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  235,90                              // jmp           247a3 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           24b03 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,122,126,44,16               // vmovq         (%r8,%rdx,1),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  235,48                              // jmp           247a3 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           24b03 <_sk_load_a8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -45591,7 +45740,7 @@
   .byte  76,15,175,193                       // imul          %rcx,%r8
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  196,195,125,57,216,1                // vextracti128  $0x1,%ymm3,%xmm8
-  .byte  197,121,111,13,193,110,0,0          // vmovdqa       0x6ec1(%rip),%xmm9        # 2b6d0 <_sk_srcover_rgba_8888_sse2_lowp+0x1134>
+  .byte  197,121,111,13,193,110,0,0          // vmovdqa       0x6ec1(%rip),%xmm9        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0x1134>
   .byte  196,66,57,0,193                     // vpshufb       %xmm9,%xmm8,%xmm8
   .byte  196,66,97,0,201                     // vpshufb       %xmm9,%xmm3,%xmm9
   .byte  196,65,49,108,192                   // vpunpcklqdq   %xmm8,%xmm9,%xmm8
@@ -45599,28 +45748,28 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,28                              // ja            24844 <_sk_store_a8_hsw_lowp+0x50>
+  .byte  119,28                              // ja            24ba4 <_sk_store_a8_hsw_lowp+0x50>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 248c4 <_sk_store_a8_hsw_lowp+0xd0>
+  .byte  76,141,13,146,0,0,0                 // lea           0x92(%rip),%r9        # 24c24 <_sk_store_a8_hsw_lowp+0xd0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,67,121,20,4,16,0                // vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
-  .byte  235,121                             // jmp           248bd <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,121                             // jmp           24c1d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,65,122,127,4,16                 // vmovdqu       %xmm8,(%r8,%rdx,1)
-  .byte  235,113                             // jmp           248bd <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,113                             // jmp           24c1d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,67,121,20,68,16,2,2             // vpextrb       $0x2,%xmm8,0x2(%r8,%rdx,1)
   .byte  196,67,121,21,4,16,0                // vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
-  .byte  235,96                              // jmp           248bd <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,96                              // jmp           24c1d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,67,121,20,68,16,6,6             // vpextrb       $0x6,%xmm8,0x6(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,5,5             // vpextrb       $0x5,%xmm8,0x5(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,4,4             // vpextrb       $0x4,%xmm8,0x4(%r8,%rdx,1)
   .byte  196,65,121,126,4,16                 // vmovd         %xmm8,(%r8,%rdx,1)
-  .byte  235,64                              // jmp           248bd <_sk_store_a8_hsw_lowp+0xc9>
+  .byte  235,64                              // jmp           24c1d <_sk_store_a8_hsw_lowp+0xc9>
   .byte  196,67,121,20,68,16,10,10           // vpextrb       $0xa,%xmm8,0xa(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,9,9             // vpextrb       $0x9,%xmm8,0x9(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,8,8             // vpextrb       $0x8,%xmm8,0x8(%r8,%rdx,1)
-  .byte  235,32                              // jmp           248b7 <_sk_store_a8_hsw_lowp+0xc3>
+  .byte  235,32                              // jmp           24c17 <_sk_store_a8_hsw_lowp+0xc3>
   .byte  196,67,121,20,68,16,14,14           // vpextrb       $0xe,%xmm8,0xe(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,13,13           // vpextrb       $0xd,%xmm8,0xd(%r8,%rdx,1)
   .byte  196,67,121,20,68,16,12,12           // vpextrb       $0xc,%xmm8,0xc(%r8,%rdx,1)
@@ -45629,7 +45778,7 @@
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  119,255                             // ja            248c5 <_sk_store_a8_hsw_lowp+0xd1>
+  .byte  119,255                             // ja            24c25 <_sk_store_a8_hsw_lowp+0xd1>
   .byte  255                                 // (bad)
   .byte  255,144,255,255,255,136             // callq         *-0x77000001(%rax)
   .byte  255                                 // (bad)
@@ -45676,38 +45825,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            2493c <_sk_load_g8_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            24c9c <_sk_load_g8_hsw_lowp+0x3c>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,227,0,0,0                 // lea           0xe3(%rip),%r9        # 24a08 <_sk_load_g8_hsw_lowp+0x108>
+  .byte  76,141,13,227,0,0,0                 // lea           0xe3(%rip),%r9        # 24d68 <_sk_load_g8_hsw_lowp+0x108>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,192                     // vmovd         %eax,%xmm0
-  .byte  233,175,0,0,0                       // jmpq          249eb <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          24d4b <_sk_load_g8_hsw_lowp+0xeb>
   .byte  196,193,122,111,4,16                // vmovdqu       (%r8,%rdx,1),%xmm0
-  .byte  233,164,0,0,0                       // jmpq          249eb <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          24d4b <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,200                     // vmovd         %eax,%xmm1
   .byte  196,227,121,14,193,1                // vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  233,132,0,0,0                       // jmpq          249eb <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          24d4b <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,121,110,12,16               // vmovd         (%r8,%rdx,1),%xmm1
   .byte  196,227,121,2,193,1                 // vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  .byte  235,90                              // jmp           249eb <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           24d4b <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,193,122,126,12,16               // vmovq         (%r8,%rdx,1),%xmm1
   .byte  196,227,113,2,192,12                // vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  .byte  235,48                              // jmp           249eb <_sk_load_g8_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           24d4b <_sk_load_g8_hsw_lowp+0xeb>
   .byte  197,249,239,192                     // vpxor         %xmm0,%xmm0,%xmm0
   .byte  196,195,121,32,68,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   .byte  196,195,121,32,68,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -45717,7 +45866,7 @@
   .byte  196,227,113,2,192,8                 // vpblendd      $0x8,%xmm0,%xmm1,%xmm0
   .byte  196,226,125,48,192                  // vpmovzxbw     %xmm0,%ymm0
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,29,153,99,0,0       // vpbroadcastw  0x6399(%rip),%ymm3        # 2ad94 <_sk_srcover_rgba_8888_sse2_lowp+0x7f8>
+  .byte  196,226,125,121,29,153,99,0,0       // vpbroadcastw  0x6399(%rip),%ymm3        # 2b0f4 <_sk_srcover_rgba_8888_sse2_lowp+0x7f8>
   .byte  197,253,111,200                     // vmovdqa       %ymm0,%ymm1
   .byte  197,253,111,208                     // vmovdqa       %ymm0,%ymm2
   .byte  255,224                             // jmpq          *%rax
@@ -45731,7 +45880,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           24a15 <_sk_load_g8_hsw_lowp+0x115>
+  .byte  123,255                             // jnp           24d75 <_sk_load_g8_hsw_lowp+0x115>
   .byte  255                                 // (bad)
   .byte  255,115,255                         // pushq         -0x1(%rbx)
   .byte  255                                 // (bad)
@@ -45769,38 +45918,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,37                              // ja            24a80 <_sk_load_g8_dst_hsw_lowp+0x3c>
+  .byte  119,37                              // ja            24de0 <_sk_load_g8_dst_hsw_lowp+0x3c>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,227,0,0,0                 // lea           0xe3(%rip),%r9        # 24b4c <_sk_load_g8_dst_hsw_lowp+0x108>
+  .byte  76,141,13,227,0,0,0                 // lea           0xe3(%rip),%r9        # 24eac <_sk_load_g8_dst_hsw_lowp+0x108>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,249,110,224                     // vmovd         %eax,%xmm4
-  .byte  233,175,0,0,0                       // jmpq          24b2f <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  233,175,0,0,0                       // jmpq          24e8f <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  196,193,122,111,36,16               // vmovdqu       (%r8,%rdx,1),%xmm4
-  .byte  233,164,0,0,0                       // jmpq          24b2f <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  233,164,0,0,0                       // jmpq          24e8f <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,2,2            // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,249,110,232                     // vmovd         %eax,%xmm5
   .byte  196,227,89,14,229,1                 // vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  233,132,0,0,0                       // jmpq          24b2f <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  233,132,0,0,0                       // jmpq          24e8f <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,6,6            // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,5,5            // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,4,4            // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,121,110,44,16               // vmovd         (%r8,%rdx,1),%xmm5
   .byte  196,227,89,2,229,1                  // vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  .byte  235,90                              // jmp           24b2f <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  235,90                              // jmp           24e8f <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,10,10          // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,9,9            // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,8,8            // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,193,122,126,44,16               // vmovq         (%r8,%rdx,1),%xmm5
   .byte  196,227,81,2,228,12                 // vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  .byte  235,48                              // jmp           24b2f <_sk_load_g8_dst_hsw_lowp+0xeb>
+  .byte  235,48                              // jmp           24e8f <_sk_load_g8_dst_hsw_lowp+0xeb>
   .byte  197,217,239,228                     // vpxor         %xmm4,%xmm4,%xmm4
   .byte  196,195,89,32,100,16,14,14          // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   .byte  196,195,89,32,100,16,13,13          // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -45810,7 +45959,7 @@
   .byte  196,227,81,2,228,8                  // vpblendd      $0x8,%xmm4,%xmm5,%xmm4
   .byte  196,226,125,48,228                  // vpmovzxbw     %xmm4,%ymm4
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  196,226,125,121,61,87,98,0,0        // vpbroadcastw  0x6257(%rip),%ymm7        # 2ad96 <_sk_srcover_rgba_8888_sse2_lowp+0x7fa>
+  .byte  196,226,125,121,61,87,98,0,0        // vpbroadcastw  0x6257(%rip),%ymm7        # 2b0f6 <_sk_srcover_rgba_8888_sse2_lowp+0x7fa>
   .byte  197,253,111,236                     // vmovdqa       %ymm4,%ymm5
   .byte  197,253,111,244                     // vmovdqa       %ymm4,%ymm6
   .byte  255,224                             // jmpq          *%rax
@@ -45824,7 +45973,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           24b59 <_sk_load_g8_dst_hsw_lowp+0x115>
+  .byte  123,255                             // jnp           24eb9 <_sk_load_g8_dst_hsw_lowp+0x115>
   .byte  255                                 // (bad)
   .byte  255,115,255                         // pushq         -0x1(%rbx)
   .byte  255                                 // (bad)
@@ -45854,12 +46003,12 @@
 .globl _sk_luminance_to_alpha_hsw_lowp
 FUNCTION(_sk_luminance_to_alpha_hsw_lowp)
 _sk_luminance_to_alpha_hsw_lowp:
-  .byte  196,226,125,121,29,7,98,0,0         // vpbroadcastw  0x6207(%rip),%ymm3        # 2ad98 <_sk_srcover_rgba_8888_sse2_lowp+0x7fc>
+  .byte  196,226,125,121,29,7,98,0,0         // vpbroadcastw  0x6207(%rip),%ymm3        # 2b0f8 <_sk_srcover_rgba_8888_sse2_lowp+0x7fc>
   .byte  197,253,213,195                     // vpmullw       %ymm3,%ymm0,%ymm0
-  .byte  196,226,125,121,29,252,97,0,0       // vpbroadcastw  0x61fc(%rip),%ymm3        # 2ad9a <_sk_srcover_rgba_8888_sse2_lowp+0x7fe>
+  .byte  196,226,125,121,29,252,97,0,0       // vpbroadcastw  0x61fc(%rip),%ymm3        # 2b0fa <_sk_srcover_rgba_8888_sse2_lowp+0x7fe>
   .byte  197,245,213,203                     // vpmullw       %ymm3,%ymm1,%ymm1
   .byte  197,245,253,192                     // vpaddw        %ymm0,%ymm1,%ymm0
-  .byte  196,226,125,121,13,237,97,0,0       // vpbroadcastw  0x61ed(%rip),%ymm1        # 2ad9c <_sk_srcover_rgba_8888_sse2_lowp+0x800>
+  .byte  196,226,125,121,13,237,97,0,0       // vpbroadcastw  0x61ed(%rip),%ymm1        # 2b0fc <_sk_srcover_rgba_8888_sse2_lowp+0x800>
   .byte  197,237,213,201                     // vpmullw       %ymm1,%ymm2,%ymm1
   .byte  197,253,253,193                     // vpaddw        %ymm1,%ymm0,%ymm0
   .byte  197,229,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm3
@@ -45875,13 +46024,13 @@
 _sk_scale_1_float_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,122,16,0                        // vmovss        (%rax),%xmm8
-  .byte  197,122,16,13,58,98,0,0             // vmovss        0x623a(%rip),%xmm9        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  196,98,57,169,13,1,98,0,0           // vfmadd213ss   0x6201(%rip),%xmm8,%xmm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,122,16,13,58,98,0,0             // vmovss        0x623a(%rip),%xmm9        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,57,169,13,1,98,0,0           // vfmadd213ss   0x6201(%rip),%xmm8,%xmm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,122,44,193                  // vcvttss2si    %xmm9,%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
   .byte  196,66,125,121,192                  // vpbroadcastw  %xmm8,%ymm8
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,121,13,160,97,0,0        // vpbroadcastw  0x61a0(%rip),%ymm9        # 2ad9e <_sk_srcover_rgba_8888_sse2_lowp+0x802>
+  .byte  196,98,125,121,13,160,97,0,0        // vpbroadcastw  0x61a0(%rip),%ymm9        # 2b0fe <_sk_srcover_rgba_8888_sse2_lowp+0x802>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,213,201                     // vpmullw       %ymm1,%ymm8,%ymm1
@@ -45902,12 +46051,12 @@
 _sk_lerp_1_float_hsw_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  197,122,16,0                        // vmovss        (%rax),%xmm8
-  .byte  197,122,16,13,208,97,0,0            // vmovss        0x61d0(%rip),%xmm9        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  196,98,57,169,13,151,97,0,0         // vfmadd213ss   0x6197(%rip),%xmm8,%xmm9        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  197,122,16,13,208,97,0,0            // vmovss        0x61d0(%rip),%xmm9        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  196,98,57,169,13,151,97,0,0         // vfmadd213ss   0x6197(%rip),%xmm8,%xmm9        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  196,193,122,44,193                  // vcvttss2si    %xmm9,%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
   .byte  196,66,125,121,192                  // vpbroadcastw  %xmm8,%ymm8
-  .byte  196,98,125,121,13,60,97,0,0         // vpbroadcastw  0x613c(%rip),%ymm9        # 2ada0 <_sk_srcover_rgba_8888_sse2_lowp+0x804>
+  .byte  196,98,125,121,13,60,97,0,0         // vpbroadcastw  0x613c(%rip),%ymm9        # 2b100 <_sk_srcover_rgba_8888_sse2_lowp+0x804>
   .byte  196,65,53,249,208                   // vpsubw        %ymm8,%ymm9,%ymm10
   .byte  197,45,213,220                      // vpmullw       %ymm4,%ymm10,%ymm11
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
@@ -45944,38 +46093,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            24d02 <_sk_scale_u8_hsw_lowp+0x3d>
+  .byte  119,38                              // ja            25062 <_sk_scale_u8_hsw_lowp+0x3d>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,21,1,0,0                  // lea           0x115(%rip),%r9        # 24e00 <_sk_scale_u8_hsw_lowp+0x13b>
+  .byte  76,141,13,21,1,0,0                  // lea           0x115(%rip),%r9        # 25160 <_sk_scale_u8_hsw_lowp+0x13b>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,179,0,0,0                       // jmpq          24db5 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  233,179,0,0,0                       // jmpq          25115 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,122,111,4,16                 // vmovdqu       (%r8,%rdx,1),%xmm8
-  .byte  233,168,0,0,0                       // jmpq          24db5 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  233,168,0,0,0                       // jmpq          25115 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,2,2              // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,67,57,14,193,1                  // vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,135,0,0,0                       // jmpq          24db5 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  233,135,0,0,0                       // jmpq          25115 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,6,6              // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,5,5              // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,4,4              // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  235,92                              // jmp           24db5 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  235,92                              // jmp           25115 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,10,10            // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,9,9              // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,8,8              // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,122,126,12,16                // vmovq         (%r8,%rdx,1),%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  235,49                              // jmp           24db5 <_sk_scale_u8_hsw_lowp+0xf0>
+  .byte  235,49                              // jmp           25115 <_sk_scale_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,14,14            // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,13,13            // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -45985,7 +46134,7 @@
   .byte  196,67,49,2,192,8                   // vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   .byte  196,66,125,48,192                   // vpmovzxbw     %xmm8,%ymm8
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,121,13,219,95,0,0        // vpbroadcastw  0x5fdb(%rip),%ymm9        # 2ada2 <_sk_srcover_rgba_8888_sse2_lowp+0x806>
+  .byte  196,98,125,121,13,219,95,0,0        // vpbroadcastw  0x5fdb(%rip),%ymm9        # 2b102 <_sk_srcover_rgba_8888_sse2_lowp+0x806>
   .byte  196,193,125,253,193                 // vpaddw        %ymm9,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,189,213,201                     // vpmullw       %ymm1,%ymm8,%ymm1
@@ -46006,7 +46155,7 @@
   .byte  255,26                              // lcall         *(%rdx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,75               // decl          0x4bffffff(%rip)        # 4c024e0c <_sk_srcover_rgba_8888_sse2_lowp+0x4bffa870>
+  .byte  255,13,255,255,255,75               // decl          0x4bffffff(%rip)        # 4c02516c <_sk_srcover_rgba_8888_sse2_lowp+0x4bffa870>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,67,255                          // incl          -0x1(%rbx)
@@ -46045,38 +46194,38 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            24e79 <_sk_lerp_u8_hsw_lowp+0x3d>
+  .byte  119,38                              // ja            251d9 <_sk_lerp_u8_hsw_lowp+0x3d>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,58,1,0,0                  // lea           0x13a(%rip),%r9        # 24f9c <_sk_lerp_u8_hsw_lowp+0x160>
+  .byte  76,141,13,58,1,0,0                  // lea           0x13a(%rip),%r9        # 252fc <_sk_lerp_u8_hsw_lowp+0x160>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,179,0,0,0                       // jmpq          24f2c <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  233,179,0,0,0                       // jmpq          2528c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,122,111,4,16                 // vmovdqu       (%r8,%rdx,1),%xmm8
-  .byte  233,168,0,0,0                       // jmpq          24f2c <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  233,168,0,0,0                       // jmpq          2528c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,2,2              // vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   .byte  65,15,183,4,16                      // movzwl        (%r8,%rdx,1),%eax
   .byte  197,121,110,200                     // vmovd         %eax,%xmm9
   .byte  196,67,57,14,193,1                  // vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  233,135,0,0,0                       // jmpq          24f2c <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  233,135,0,0,0                       // jmpq          2528c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,6,6              // vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,5,5              // vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,4,4              // vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,121,110,12,16                // vmovd         (%r8,%rdx,1),%xmm9
   .byte  196,67,57,2,193,1                   // vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  .byte  235,92                              // jmp           24f2c <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  235,92                              // jmp           2528c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,10,10            // vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,9,9              // vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,8,8              // vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,65,122,126,12,16                // vmovq         (%r8,%rdx,1),%xmm9
   .byte  196,67,49,2,192,12                  // vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  .byte  235,49                              // jmp           24f2c <_sk_lerp_u8_hsw_lowp+0xf0>
+  .byte  235,49                              // jmp           2528c <_sk_lerp_u8_hsw_lowp+0xf0>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,67,57,32,68,16,14,14            // vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   .byte  196,67,57,32,68,16,13,13            // vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -46085,7 +46234,7 @@
   .byte  196,67,49,34,76,16,8,2              // vpinsrd       $0x2,0x8(%r8,%rdx,1),%xmm9,%xmm9
   .byte  196,67,49,2,192,8                   // vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   .byte  196,66,125,48,192                   // vpmovzxbw     %xmm8,%ymm8
-  .byte  196,98,125,121,13,106,94,0,0        // vpbroadcastw  0x5e6a(%rip),%ymm9        # 2ada4 <_sk_srcover_rgba_8888_sse2_lowp+0x808>
+  .byte  196,98,125,121,13,106,94,0,0        // vpbroadcastw  0x5e6a(%rip),%ymm9        # 2b104 <_sk_srcover_rgba_8888_sse2_lowp+0x808>
   .byte  196,65,61,239,209                   // vpxor         %ymm9,%ymm8,%ymm10
   .byte  197,45,213,220                      // vpmullw       %ymm4,%ymm10,%ymm11
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
@@ -46117,7 +46266,7 @@
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  232,254,255,255,38                  // callq         27024fa7 <_sk_srcover_rgba_8888_sse2_lowp+0x26ffaa0b>
+  .byte  232,254,255,255,38                  // callq         27025307 <_sk_srcover_rgba_8888_sse2_lowp+0x26ffaa0b>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,30                              // lcall         *(%rsi)
@@ -46138,7 +46287,7 @@
   .byte  255,52,255                          // pushq         (%rdi,%rdi,8)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  124,255                             // jl            24fc9 <_sk_lerp_u8_hsw_lowp+0x18d>
+  .byte  124,255                             // jl            25329 <_sk_lerp_u8_hsw_lowp+0x18d>
   .byte  255                                 // (bad)
   .byte  255,116,255,255                     // pushq         -0x1(%rdi,%rdi,8)
   .byte  255,108,255,255                     // ljmp          *-0x1(%rdi,%rdi,8)
@@ -46159,24 +46308,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            25018 <_sk_scale_565_hsw_lowp+0x40>
+  .byte  119,38                              // ja            25378 <_sk_scale_565_hsw_lowp+0x40>
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,255,1,0,0                 // lea           0x1ff(%rip),%r9        # 25200 <_sk_scale_565_hsw_lowp+0x228>
+  .byte  76,141,13,255,1,0,0                 // lea           0x1ff(%rip),%r9        # 25560 <_sk_scale_565_hsw_lowp+0x228>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,12,1,0,0                        // jmpq          25124 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,12,1,0,0                        // jmpq          25484 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,126,111,4,80                 // vmovdqu       (%r8,%rdx,2),%ymm8
-  .byte  233,1,1,0,0                         // jmpq          25124 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,1,1,0,0                         // jmpq          25484 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,1                   // vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  .byte  233,221,0,0,0                       // jmpq          25124 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,221,0,0,0                       // jmpq          25484 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -46186,7 +46335,7 @@
   .byte  196,67,61,2,193,15                  // vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,3                   // vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  .byte  233,157,0,0,0                       // jmpq          25124 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  233,157,0,0,0                       // jmpq          25484 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,20,2            // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -46198,7 +46347,7 @@
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   .byte  196,65,122,111,12,80                // vmovdqu       (%r8,%rdx,2),%xmm9
   .byte  196,67,53,2,192,240                 // vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  .byte  235,84                              // jmp           25124 <_sk_scale_565_hsw_lowp+0x14c>
+  .byte  235,84                              // jmp           25484 <_sk_scale_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,28,6            // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -46212,13 +46361,13 @@
   .byte  196,65,122,111,20,80                // vmovdqu       (%r8,%rdx,2),%xmm10
   .byte  196,67,45,56,201,1                  // vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   .byte  196,67,53,2,192,192                 // vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,121,92,0,0        // vpbroadcastw  0x5c79(%rip),%ymm9        # 2ada6 <_sk_srcover_rgba_8888_sse2_lowp+0x80a>
+  .byte  196,98,125,121,13,121,92,0,0        // vpbroadcastw  0x5c79(%rip),%ymm9        # 2b106 <_sk_srcover_rgba_8888_sse2_lowp+0x80a>
   .byte  196,193,45,113,208,8                // vpsrlw        $0x8,%ymm8,%ymm10
   .byte  196,65,45,219,201                   // vpand         %ymm9,%ymm10,%ymm9
   .byte  196,193,45,113,208,5                // vpsrlw        $0x5,%ymm8,%ymm10
-  .byte  196,98,125,121,29,97,92,0,0         // vpbroadcastw  0x5c61(%rip),%ymm11        # 2ada8 <_sk_srcover_rgba_8888_sse2_lowp+0x80c>
+  .byte  196,98,125,121,29,97,92,0,0         // vpbroadcastw  0x5c61(%rip),%ymm11        # 2b108 <_sk_srcover_rgba_8888_sse2_lowp+0x80c>
   .byte  196,65,45,219,211                   // vpand         %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,85,92,0,0         // vpbroadcastw  0x5c55(%rip),%ymm11        # 2adaa <_sk_srcover_rgba_8888_sse2_lowp+0x80e>
+  .byte  196,98,125,121,29,85,92,0,0         // vpbroadcastw  0x5c55(%rip),%ymm11        # 2b10a <_sk_srcover_rgba_8888_sse2_lowp+0x80e>
   .byte  196,65,61,219,219                   // vpand         %ymm11,%ymm8,%ymm11
   .byte  196,193,61,113,208,13               // vpsrlw        $0xd,%ymm8,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
@@ -46228,7 +46377,7 @@
   .byte  196,193,45,113,243,3                // vpsllw        $0x3,%ymm11,%ymm10
   .byte  196,193,37,113,211,2                // vpsrlw        $0x2,%ymm11,%ymm11
   .byte  196,65,45,235,211                   // vpor          %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,28,92,0,0         // vpbroadcastw  0x5c1c(%rip),%ymm11        # 2adac <_sk_srcover_rgba_8888_sse2_lowp+0x810>
+  .byte  196,98,125,121,29,28,92,0,0         // vpbroadcastw  0x5c1c(%rip),%ymm11        # 2b10c <_sk_srcover_rgba_8888_sse2_lowp+0x810>
   .byte  196,65,101,239,227                  // vpxor         %ymm11,%ymm3,%ymm12
   .byte  196,65,69,239,219                   // vpxor         %ymm11,%ymm7,%ymm11
   .byte  196,65,37,101,220                   // vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -46238,7 +46387,7 @@
   .byte  196,66,21,62,232                    // vpmaxuw       %ymm8,%ymm13,%ymm13
   .byte  196,67,21,76,220,176                // vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
-  .byte  196,98,125,121,5,232,91,0,0         // vpbroadcastw  0x5be8(%rip),%ymm8        # 2adae <_sk_srcover_rgba_8888_sse2_lowp+0x812>
+  .byte  196,98,125,121,5,232,91,0,0         // vpbroadcastw  0x5be8(%rip),%ymm8        # 2b10e <_sk_srcover_rgba_8888_sse2_lowp+0x812>
   .byte  196,193,125,253,192                 // vpaddw        %ymm8,%ymm0,%ymm0
   .byte  197,253,113,208,8                   // vpsrlw        $0x8,%ymm0,%ymm0
   .byte  197,181,213,201                     // vpmullw       %ymm1,%ymm9,%ymm1
@@ -46302,24 +46451,24 @@
   .byte  36,15                               // and           $0xf,%al
   .byte  254,200                             // dec           %al
   .byte  60,14                               // cmp           $0xe,%al
-  .byte  119,38                              // ja            2527c <_sk_lerp_565_hsw_lowp+0x40>
+  .byte  119,38                              // ja            255dc <_sk_lerp_565_hsw_lowp+0x40>
   .byte  196,65,61,239,192                   // vpxor         %ymm8,%ymm8,%ymm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,51,2,0,0                  // lea           0x233(%rip),%r9        # 25498 <_sk_lerp_565_hsw_lowp+0x25c>
+  .byte  76,141,13,51,2,0,0                  // lea           0x233(%rip),%r9        # 257f8 <_sk_lerp_565_hsw_lowp+0x25c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  197,121,110,192                     // vmovd         %eax,%xmm8
-  .byte  233,12,1,0,0                        // jmpq          25388 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,12,1,0,0                        // jmpq          256e8 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,126,111,4,80                 // vmovdqu       (%r8,%rdx,2),%ymm8
-  .byte  233,1,1,0,0                         // jmpq          25388 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,1,1,0,0                         // jmpq          256e8 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,4,2             // vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   .byte  196,65,121,110,12,80                // vmovd         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,1                   // vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  .byte  233,221,0,0,0                       // jmpq          25388 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,221,0,0,0                       // jmpq          256e8 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,12,6            // vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,53,56,192,1                  // vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -46329,7 +46478,7 @@
   .byte  196,67,61,2,193,15                  // vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   .byte  196,65,122,126,12,80                // vmovq         (%r8,%rdx,2),%xmm9
   .byte  196,67,61,2,193,3                   // vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  .byte  233,157,0,0,0                       // jmpq          25388 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  233,157,0,0,0                       // jmpq          256e8 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,20,2            // vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -46341,7 +46490,7 @@
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   .byte  196,65,122,111,12,80                // vmovdqu       (%r8,%rdx,2),%xmm9
   .byte  196,67,53,2,192,240                 // vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  .byte  235,84                              // jmp           25388 <_sk_lerp_565_hsw_lowp+0x14c>
+  .byte  235,84                              // jmp           256e8 <_sk_lerp_565_hsw_lowp+0x14c>
   .byte  196,65,57,239,192                   // vpxor         %xmm8,%xmm8,%xmm8
   .byte  196,65,57,196,76,80,28,6            // vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   .byte  196,67,61,56,193,1                  // vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -46355,13 +46504,13 @@
   .byte  196,65,122,111,20,80                // vmovdqu       (%r8,%rdx,2),%xmm10
   .byte  196,67,45,56,201,1                  // vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   .byte  196,67,53,2,192,192                 // vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  .byte  196,98,125,121,13,31,90,0,0         // vpbroadcastw  0x5a1f(%rip),%ymm9        # 2adb0 <_sk_srcover_rgba_8888_sse2_lowp+0x814>
+  .byte  196,98,125,121,13,31,90,0,0         // vpbroadcastw  0x5a1f(%rip),%ymm9        # 2b110 <_sk_srcover_rgba_8888_sse2_lowp+0x814>
   .byte  196,193,45,113,208,8                // vpsrlw        $0x8,%ymm8,%ymm10
   .byte  196,65,45,219,201                   // vpand         %ymm9,%ymm10,%ymm9
   .byte  196,193,45,113,208,5                // vpsrlw        $0x5,%ymm8,%ymm10
-  .byte  196,98,125,121,29,7,90,0,0          // vpbroadcastw  0x5a07(%rip),%ymm11        # 2adb2 <_sk_srcover_rgba_8888_sse2_lowp+0x816>
+  .byte  196,98,125,121,29,7,90,0,0          // vpbroadcastw  0x5a07(%rip),%ymm11        # 2b112 <_sk_srcover_rgba_8888_sse2_lowp+0x816>
   .byte  196,65,45,219,211                   // vpand         %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,251,89,0,0        // vpbroadcastw  0x59fb(%rip),%ymm11        # 2adb4 <_sk_srcover_rgba_8888_sse2_lowp+0x818>
+  .byte  196,98,125,121,29,251,89,0,0        // vpbroadcastw  0x59fb(%rip),%ymm11        # 2b114 <_sk_srcover_rgba_8888_sse2_lowp+0x818>
   .byte  196,65,61,219,219                   // vpand         %ymm11,%ymm8,%ymm11
   .byte  196,193,61,113,208,13               // vpsrlw        $0xd,%ymm8,%ymm8
   .byte  196,65,53,235,192                   // vpor          %ymm8,%ymm9,%ymm8
@@ -46371,7 +46520,7 @@
   .byte  196,193,45,113,243,3                // vpsllw        $0x3,%ymm11,%ymm10
   .byte  196,193,37,113,211,2                // vpsrlw        $0x2,%ymm11,%ymm11
   .byte  196,65,45,235,211                   // vpor          %ymm11,%ymm10,%ymm10
-  .byte  196,98,125,121,29,194,89,0,0        // vpbroadcastw  0x59c2(%rip),%ymm11        # 2adb6 <_sk_srcover_rgba_8888_sse2_lowp+0x81a>
+  .byte  196,98,125,121,29,194,89,0,0        // vpbroadcastw  0x59c2(%rip),%ymm11        # 2b116 <_sk_srcover_rgba_8888_sse2_lowp+0x81a>
   .byte  196,65,101,239,227                  // vpxor         %ymm11,%ymm3,%ymm12
   .byte  196,65,69,239,219                   // vpxor         %ymm11,%ymm7,%ymm11
   .byte  196,65,37,101,220                   // vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -46380,7 +46529,7 @@
   .byte  196,66,53,62,234                    // vpmaxuw       %ymm10,%ymm9,%ymm13
   .byte  196,66,21,62,232                    // vpmaxuw       %ymm8,%ymm13,%ymm13
   .byte  196,67,21,76,220,176                // vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
-  .byte  196,98,125,121,37,146,89,0,0        // vpbroadcastw  0x5992(%rip),%ymm12        # 2adb8 <_sk_srcover_rgba_8888_sse2_lowp+0x81c>
+  .byte  196,98,125,121,37,146,89,0,0        // vpbroadcastw  0x5992(%rip),%ymm12        # 2b118 <_sk_srcover_rgba_8888_sse2_lowp+0x81c>
   .byte  196,65,61,239,236                   // vpxor         %ymm12,%ymm8,%ymm13
   .byte  197,21,213,236                      // vpmullw       %ymm4,%ymm13,%ymm13
   .byte  197,189,213,192                     // vpmullw       %ymm0,%ymm8,%ymm0
@@ -46461,9 +46610,9 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,194                       // movzbl        %r10b,%r8d
   .byte  65,128,248,14                       // cmp           $0xe,%r8b
-  .byte  119,51                              // ja            25530 <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
+  .byte  119,51                              // ja            25890 <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  76,141,29,236,2,0,0                 // lea           0x2ec(%rip),%r11        # 257f4 <_sk_srcover_rgba_8888_hsw_lowp+0x320>
+  .byte  76,141,29,236,2,0,0                 // lea           0x2ec(%rip),%r11        # 25b54 <_sk_srcover_rgba_8888_hsw_lowp+0x320>
   .byte  75,99,4,131                         // movslq        (%r11,%r8,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -46473,10 +46622,10 @@
   .byte  255,224                             // jmpq          *%rax
   .byte  196,193,121,110,41                  // vmovd         (%r9),%xmm5
   .byte  197,221,239,228                     // vpxor         %ymm4,%ymm4,%ymm4
-  .byte  233,22,1,0,0                        // jmpq          25646 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,22,1,0,0                        // jmpq          259a6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,126,111,41                  // vmovdqu       (%r9),%ymm5
   .byte  196,193,126,111,97,32               // vmovdqu       0x20(%r9),%ymm4
-  .byte  233,6,1,0,0                         // jmpq          25646 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,6,1,0,0                         // jmpq          259a6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,8                // vmovd         0x8(%r9),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,197,239,255                     // vpxor         %ymm7,%ymm7,%ymm7
@@ -46485,7 +46634,7 @@
   .byte  197,249,112,237,232                 // vpshufd       $0xe8,%xmm5,%xmm5
   .byte  196,227,93,2,237,3                  // vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   .byte  197,253,111,231                     // vmovdqa       %ymm7,%ymm4
-  .byte  233,216,0,0,0                       // jmpq          25646 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,216,0,0,0                       // jmpq          259a6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,24               // vmovd         0x18(%r9),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -46501,7 +46650,7 @@
   .byte  196,193,122,111,41                  // vmovdqu       (%r9),%xmm5
   .byte  196,227,85,2,236,240                // vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   .byte  197,125,127,196                     // vmovdqa       %ymm8,%ymm4
-  .byte  233,129,0,0,0                       // jmpq          25646 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  233,129,0,0,0                       // jmpq          259a6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,40               // vmovd         0x28(%r9),%xmm4
   .byte  196,226,121,89,228                  // vpbroadcastq  %xmm4,%xmm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -46511,7 +46660,7 @@
   .byte  196,193,121,110,105,32              // vmovd         0x20(%r9),%xmm5
   .byte  196,227,93,2,229,1                  // vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   .byte  196,193,126,111,41                  // vmovdqu       (%r9),%ymm5
-  .byte  235,76                              // jmp           25646 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  .byte  235,76                              // jmp           259a6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   .byte  196,193,121,110,97,56               // vmovd         0x38(%r9),%xmm4
   .byte  196,226,125,89,228                  // vpbroadcastq  %xmm4,%ymm4
   .byte  197,213,239,237                     // vpxor         %ymm5,%ymm5,%ymm5
@@ -46531,9 +46680,9 @@
   .byte  196,227,69,14,236,170               // vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   .byte  196,227,77,14,228,170               // vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   .byte  196,226,93,43,237                   // vpackusdw     %ymm5,%ymm4,%ymm5
-  .byte  197,125,111,5,81,87,0,0             // vmovdqa       0x5751(%rip),%ymm8        # 2adc0 <_sk_srcover_rgba_8888_sse2_lowp+0x824>
+  .byte  197,125,111,5,81,87,0,0             // vmovdqa       0x5751(%rip),%ymm8        # 2b120 <_sk_srcover_rgba_8888_sse2_lowp+0x824>
   .byte  196,193,85,219,224                  // vpand         %ymm8,%ymm5,%ymm4
-  .byte  196,98,125,121,13,99,87,0,0         // vpbroadcastw  0x5763(%rip),%ymm9        # 2ade0 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
+  .byte  196,98,125,121,13,99,87,0,0         // vpbroadcastw  0x5763(%rip),%ymm9        # 2b140 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   .byte  197,213,113,213,8                   // vpsrlw        $0x8,%ymm5,%ymm5
   .byte  197,197,114,215,16                  // vpsrld        $0x10,%ymm7,%ymm7
   .byte  197,205,114,214,16                  // vpsrld        $0x10,%ymm6,%ymm6
@@ -46572,19 +46721,19 @@
   .byte  196,193,53,114,243,16               // vpslld        $0x10,%ymm11,%ymm9
   .byte  196,65,53,235,202                   // vpor          %ymm10,%ymm9,%ymm9
   .byte  65,128,250,14                       // cmp           $0xe,%r10b
-  .byte  119,26                              // ja            25757 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
-  .byte  76,141,21,236,0,0,0                 // lea           0xec(%rip),%r10        # 25830 <_sk_srcover_rgba_8888_hsw_lowp+0x35c>
+  .byte  119,26                              // ja            25ab7 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
+  .byte  76,141,21,236,0,0,0                 // lea           0xec(%rip),%r10        # 25b90 <_sk_srcover_rgba_8888_hsw_lowp+0x35c>
   .byte  75,99,4,130                         // movslq        (%r10,%r8,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  196,65,121,126,1                    // vmovd         %xmm8,(%r9)
-  .byte  233,151,0,0,0                       // jmpq          257ee <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  233,151,0,0,0                       // jmpq          25b4e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,65,126,127,1                    // vmovdqu       %ymm8,(%r9)
   .byte  196,65,126,127,73,32                // vmovdqu       %ymm9,0x20(%r9)
-  .byte  233,135,0,0,0                       // jmpq          257ee <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  233,135,0,0,0                       // jmpq          25b4e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,121,22,65,8,2                // vpextrd       $0x2,%xmm8,0x8(%r9)
   .byte  196,65,121,214,1                    // vmovq         %xmm8,(%r9)
-  .byte  235,121                             // jmp           257ee <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  235,121                             // jmp           25b4e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,67,121,22,73,24,2               // vpextrd       $0x2,%xmm9,0x18(%r9)
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
@@ -46592,12 +46741,12 @@
   .byte  196,67,125,57,193,1                 // vextracti128  $0x1,%ymm8,%xmm9
   .byte  196,65,121,126,73,16                // vmovd         %xmm9,0x10(%r9)
   .byte  196,65,122,127,1                    // vmovdqu       %xmm8,(%r9)
-  .byte  235,76                              // jmp           257ee <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  235,76                              // jmp           25b4e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,121,22,73,40,2               // vpextrd       $0x2,%xmm9,0x28(%r9)
   .byte  196,67,121,22,73,36,1               // vpextrd       $0x1,%xmm9,0x24(%r9)
   .byte  196,65,121,126,73,32                // vmovd         %xmm9,0x20(%r9)
   .byte  196,65,126,127,1                    // vmovdqu       %ymm8,(%r9)
-  .byte  235,49                              // jmp           257ee <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  .byte  235,49                              // jmp           25b4e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
   .byte  196,67,121,22,81,56,2               // vpextrd       $0x2,%xmm10,0x38(%r9)
   .byte  196,67,125,57,202,1                 // vextracti128  $0x1,%ymm9,%xmm10
@@ -46645,7 +46794,7 @@
   .byte  255,6                               // incl          (%rsi)
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,62               // lcall         *0x3effffff(%rip)        # 3f025834 <_sk_srcover_rgba_8888_sse2_lowp+0x3effb298>
+  .byte  255,29,255,255,255,62               // lcall         *0x3effffff(%rip)        # 3f025b94 <_sk_srcover_rgba_8888_sse2_lowp+0x3effb298>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,55                              // pushq         (%rdi)
@@ -46663,7 +46812,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  121,255                             // jns           25855 <_sk_srcover_rgba_8888_hsw_lowp+0x381>
+  .byte  121,255                             // jns           25bb5 <_sk_srcover_rgba_8888_hsw_lowp+0x381>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -46696,13 +46845,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,131,0,0,0                    // jae           25922 <_sk_start_pipeline_sse41_lowp+0xb6>
+  .byte  15,131,131,0,0,0                    // jae           25c82 <_sk_start_pipeline_sse41_lowp+0xb6>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,59                              // ja            258f0 <_sk_start_pipeline_sse41_lowp+0x84>
+  .byte  119,59                              // ja            25c50 <_sk_start_pipeline_sse41_lowp+0x84>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -46721,10 +46870,10 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,201                             // jbe           258b9 <_sk_start_pipeline_sse41_lowp+0x4d>
+  .byte  118,201                             // jbe           25c19 <_sk_start_pipeline_sse41_lowp+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,33                              // je            25919 <_sk_start_pipeline_sse41_lowp+0xad>
+  .byte  116,33                              // je            25c79 <_sk_start_pipeline_sse41_lowp+0xad>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -46738,7 +46887,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,137                             // jne           258ab <_sk_start_pipeline_sse41_lowp+0x3f>
+  .byte  117,137                             // jne           25c0b <_sk_start_pipeline_sse41_lowp+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -46781,7 +46930,7 @@
 FUNCTION(_sk_black_color_sse41_lowp)
 _sk_black_color_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,251,85,0,0                 // movaps        0x55fb(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,29,251,85,0,0                 // movaps        0x55fb(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -46792,7 +46941,7 @@
 FUNCTION(_sk_white_color_sse41_lowp)
 _sk_white_color_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,231,85,0,0                  // movaps        0x55e7(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,5,231,85,0,0                  // movaps        0x55e7(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -46803,10 +46952,10 @@
 FUNCTION(_sk_set_rgb_sse41_lowp)
 _sk_set_rgb_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,15,16,21,102,84,0,0             // movss         0x5466(%rip),%xmm2        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  243,15,16,21,102,84,0,0             // movss         0x5466(%rip),%xmm2        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  243,15,16,0                         // movss         (%rax),%xmm0
   .byte  243,15,89,194                       // mulss         %xmm2,%xmm0
-  .byte  243,68,15,16,5,37,84,0,0            // movss         0x5425(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,16,5,37,84,0,0            // movss         0x5425(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  243,65,15,88,192                    // addss         %xmm8,%xmm0
   .byte  243,68,15,44,192                    // cvttss2si     %xmm0,%r8d
   .byte  102,65,15,110,192                   // movd          %r8d,%xmm0
@@ -46833,7 +46982,7 @@
 FUNCTION(_sk_premul_sse41_lowp)
 _sk_premul_sse41_lowp:
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,89,85,0,0           // movdqa        0x5559(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,89,85,0,0           // movdqa        0x5559(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
@@ -46881,7 +47030,7 @@
 .globl _sk_invert_sse41_lowp
 FUNCTION(_sk_invert_sse41_lowp)
 _sk_invert_sse41_lowp:
-  .byte  102,68,15,111,5,247,84,0,0          // movdqa        0x54f7(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,247,84,0,0          // movdqa        0x54f7(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,200                   // psubw         %xmm0,%xmm9
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -46913,7 +47062,7 @@
 _sk_srcatop_sse41_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,15,111,29,155,84,0,0            // movdqa        0x549b(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,111,29,155,84,0,0            // movdqa        0x549b(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,111,203                   // movdqa        %xmm3,%xmm9
   .byte  102,69,15,249,200                   // psubw         %xmm8,%xmm9
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
@@ -46945,7 +47094,7 @@
 _sk_dstatop_sse41_lowp:
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
   .byte  102,68,15,213,195                   // pmullw        %xmm3,%xmm8
-  .byte  102,68,15,111,13,27,84,0,0          // movdqa        0x541b(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,27,84,0,0          // movdqa        0x541b(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,253,193                   // paddw         %xmm9,%xmm8
   .byte  102,68,15,111,213                   // movdqa        %xmm5,%xmm10
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
@@ -46974,7 +47123,7 @@
 FUNCTION(_sk_srcin_sse41_lowp)
 _sk_srcin_sse41_lowp:
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,68,15,111,5,166,83,0,0          // movdqa        0x53a6(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,166,83,0,0          // movdqa        0x53a6(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,207                      // pmullw        %xmm7,%xmm1
@@ -46995,7 +47144,7 @@
 _sk_dstin_sse41_lowp:
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,93,83,0,0           // movdqa        0x535d(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,93,83,0,0           // movdqa        0x535d(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -47016,7 +47165,7 @@
 .globl _sk_srcout_sse41_lowp
 FUNCTION(_sk_srcout_sse41_lowp)
 _sk_srcout_sse41_lowp:
-  .byte  102,68,15,111,5,20,83,0,0           // movdqa        0x5314(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,20,83,0,0           // movdqa        0x5314(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -47039,7 +47188,7 @@
 FUNCTION(_sk_dstout_sse41_lowp)
 _sk_dstout_sse41_lowp:
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,68,15,111,5,189,82,0,0          // movdqa        0x52bd(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,189,82,0,0          // movdqa        0x52bd(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,249,216                      // psubw         %xmm0,%xmm3
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
@@ -47064,7 +47213,7 @@
 .globl _sk_srcover_sse41_lowp
 FUNCTION(_sk_srcover_sse41_lowp)
 _sk_srcover_sse41_lowp:
-  .byte  102,68,15,111,13,99,82,0,0          // movdqa        0x5263(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,99,82,0,0          // movdqa        0x5263(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -47093,7 +47242,7 @@
 .globl _sk_dstover_sse41_lowp
 FUNCTION(_sk_dstover_sse41_lowp)
 _sk_dstover_sse41_lowp:
-  .byte  102,68,15,111,5,233,81,0,0          // movdqa        0x51e9(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,233,81,0,0          // movdqa        0x51e9(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -47120,7 +47269,7 @@
 FUNCTION(_sk_modulate_sse41_lowp)
 _sk_modulate_sse41_lowp:
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
-  .byte  102,68,15,111,5,130,81,0,0          // movdqa        0x5182(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,130,81,0,0          // movdqa        0x5182(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
@@ -47139,7 +47288,7 @@
 .globl _sk_multiply_sse41_lowp
 FUNCTION(_sk_multiply_sse41_lowp)
 _sk_multiply_sse41_lowp:
-  .byte  102,68,15,111,13,65,81,0,0          // movdqa        0x5141(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,65,81,0,0          // movdqa        0x5141(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -47182,7 +47331,7 @@
 FUNCTION(_sk_plus__sse41_lowp)
 _sk_plus__sse41_lowp:
   .byte  102,15,253,196                      // paddw         %xmm4,%xmm0
-  .byte  102,68,15,111,5,134,80,0,0          // movdqa        0x5086(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,134,80,0,0          // movdqa        0x5086(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,56,58,192                 // pminuw        %xmm8,%xmm0
   .byte  102,15,253,205                      // paddw         %xmm5,%xmm1
   .byte  102,65,15,56,58,200                 // pminuw        %xmm8,%xmm1
@@ -47202,7 +47351,7 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,21,64,80,0,0          // movdqa        0x5040(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,64,80,0,0          // movdqa        0x5040(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -47234,7 +47383,7 @@
 FUNCTION(_sk_xor__sse41_lowp)
 _sk_xor__sse41_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,111,13,190,79,0,0         // movdqa        0x4fbe(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,190,79,0,0         // movdqa        0x4fbe(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,68,15,249,215                   // psubw         %xmm7,%xmm10
   .byte  102,65,15,213,194                   // pmullw        %xmm10,%xmm0
@@ -47277,7 +47426,7 @@
   .byte  102,68,15,213,207                   // pmullw        %xmm7,%xmm9
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,65,15,56,62,201                 // pmaxuw        %xmm9,%xmm1
-  .byte  102,68,15,111,13,5,79,0,0           // movdqa        0x4f05(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,5,79,0,0           // movdqa        0x4f05(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -47321,7 +47470,7 @@
   .byte  102,68,15,213,207                   // pmullw        %xmm7,%xmm9
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,65,15,56,58,201                 // pminuw        %xmm9,%xmm1
-  .byte  102,68,15,111,13,72,78,0,0          // movdqa        0x4e48(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,72,78,0,0          // movdqa        0x4e48(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -47365,10 +47514,10 @@
   .byte  102,68,15,213,207                   // pmullw        %xmm7,%xmm9
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,65,15,56,58,201                 // pminuw        %xmm9,%xmm1
-  .byte  102,68,15,111,13,139,77,0,0         // movdqa        0x4d8b(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,139,77,0,0         // movdqa        0x4d8b(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,21,216,84,0,0         // movdqa        0x54d8(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
+  .byte  102,68,15,111,21,216,84,0,0         // movdqa        0x54d8(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
   .byte  102,65,15,219,202                   // pand          %xmm10,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,68,15,111,221                   // movdqa        %xmm5,%xmm11
@@ -47410,10 +47559,10 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,13,199,76,0,0         // movdqa        0x4cc7(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,199,76,0,0         // movdqa        0x4cc7(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,21,20,84,0,0          // movdqa        0x5414(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
+  .byte  102,68,15,111,21,20,84,0,0          // movdqa        0x5414(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
   .byte  102,65,15,219,202                   // pand          %xmm10,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -47449,14 +47598,14 @@
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  102,68,15,111,29,34,76,0,0          // movdqa        0x4c22(%rip),%xmm11        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,29,34,76,0,0          // movdqa        0x4c22(%rip),%xmm11        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,249,220                   // psubw         %xmm12,%xmm11
   .byte  102,65,15,111,227                   // movdqa        %xmm11,%xmm4
   .byte  102,65,15,213,224                   // pmullw        %xmm8,%xmm4
   .byte  102,68,15,111,251                   // movdqa        %xmm3,%xmm15
   .byte  102,69,15,249,248                   // psubw         %xmm8,%xmm15
   .byte  102,69,15,253,192                   // paddw         %xmm8,%xmm8
-  .byte  102,68,15,111,13,107,83,0,0         // movdqa        0x536b(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,13,107,83,0,0         // movdqa        0x536b(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,68,15,111,243                   // movdqa        %xmm3,%xmm14
   .byte  102,69,15,239,241                   // pxor          %xmm9,%xmm14
   .byte  102,65,15,111,196                   // movdqa        %xmm12,%xmm0
@@ -47503,7 +47652,7 @@
   .byte  102,68,15,111,232                   // movdqa        %xmm0,%xmm13
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,56,16,210                 // pblendvb      %xmm0,%xmm10,%xmm2
-  .byte  102,68,15,111,13,19,75,0,0          // movdqa        0x4b13(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,19,75,0,0          // movdqa        0x4b13(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,249,195                      // psubw         %xmm3,%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
@@ -47542,7 +47691,7 @@
 _sk_overlay_sse41_lowp:
   .byte  102,68,15,111,231                   // movdqa        %xmm7,%xmm12
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  102,68,15,111,29,118,74,0,0         // movdqa        0x4a76(%rip),%xmm11        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,29,118,74,0,0         // movdqa        0x4a76(%rip),%xmm11        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,249,220                   // psubw         %xmm12,%xmm11
   .byte  102,65,15,111,195                   // movdqa        %xmm11,%xmm0
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
@@ -47554,7 +47703,7 @@
   .byte  102,68,15,249,252                   // psubw         %xmm4,%xmm15
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,192                      // paddw         %xmm0,%xmm0
-  .byte  102,68,15,111,13,167,81,0,0         // movdqa        0x51a7(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,13,167,81,0,0         // movdqa        0x51a7(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,69,15,111,212                   // movdqa        %xmm12,%xmm10
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
   .byte  102,69,15,213,254                   // pmullw        %xmm14,%xmm15
@@ -47600,7 +47749,7 @@
   .byte  102,15,253,210                      // paddw         %xmm2,%xmm2
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,56,16,210                 // pblendvb      %xmm0,%xmm10,%xmm2
-  .byte  102,68,15,111,13,89,73,0,0          // movdqa        0x4959(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,89,73,0,0          // movdqa        0x4959(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,249,195                      // psubw         %xmm3,%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
@@ -47643,49 +47792,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            266e9 <_sk_load_8888_sse41_lowp+0x44>
+  .byte  119,41                              // ja            26a49 <_sk_load_8888_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,241,0,0,0                 // lea           0xf1(%rip),%r9        # 267c0 <_sk_load_8888_sse41_lowp+0x11b>
+  .byte  76,141,13,241,0,0,0                 // lea           0xf1(%rip),%r9        # 26b20 <_sk_load_8888_sse41_lowp+0x11b>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,20,144                // movd          (%r8,%rdx,4),%xmm2
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           26742 <_sk_load_8888_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           26aa2 <_sk_load_8888_sse41_lowp+0x9d>
   .byte  243,65,15,111,20,144                // movdqu        (%r8,%rdx,4),%xmm2
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           26742 <_sk_load_8888_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           26aa2 <_sk_load_8888_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  243,65,15,126,20,144                // movq          (%r8,%rdx,4),%xmm2
   .byte  102,65,15,58,14,208,240             // pblendw       $0xf0,%xmm8,%xmm2
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  235,37                              // jmp           26742 <_sk_load_8888_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           26aa2 <_sk_load_8888_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,20,144                // movdqu        (%r8,%rdx,4),%xmm2
-  .byte  102,15,111,5,182,79,0,0             // movdqa        0x4fb6(%rip),%xmm0        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
+  .byte  102,15,111,5,182,79,0,0             // movdqa        0x4fb6(%rip),%xmm0        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,15,56,0,200                     // pshufb        %xmm0,%xmm1
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,56,0,216                     // pshufb        %xmm0,%xmm3
   .byte  102,15,108,203                      // punpcklqdq    %xmm3,%xmm1
-  .byte  102,68,15,111,13,22,72,0,0          // movdqa        0x4816(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,22,72,0,0          // movdqa        0x4816(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,193                   // pand          %xmm9,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,68,15,111,21,143,79,0,0         // movdqa        0x4f8f(%rip),%xmm10        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,21,143,79,0,0         // movdqa        0x4f8f(%rip),%xmm10        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
   .byte  102,65,15,56,0,218                  // pshufb        %xmm10,%xmm3
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,219                   // punpcklqdq    %xmm11,%xmm3
-  .byte  102,68,15,111,21,124,79,0,0         // movdqa        0x4f7c(%rip),%xmm10        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,124,79,0,0         // movdqa        0x4f7c(%rip),%xmm10        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
   .byte  102,65,15,56,0,210                  // pshufb        %xmm10,%xmm2
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,208                   // punpcklqdq    %xmm8,%xmm2
@@ -47701,7 +47850,7 @@
   .byte  56,255                              // cmp           %bh,%bh
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  124,255                             // jl            267cd <_sk_load_8888_sse41_lowp+0x128>
+  .byte  124,255                             // jl            26b2d <_sk_load_8888_sse41_lowp+0x128>
   .byte  255                                 // (bad)
   .byte  255,115,255                         // pushq         -0x1(%rbx)
   .byte  255                                 // (bad)
@@ -47724,49 +47873,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            26820 <_sk_load_8888_dst_sse41_lowp+0x44>
+  .byte  119,41                              // ja            26b80 <_sk_load_8888_dst_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 268f8 <_sk_load_8888_dst_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 26c58 <_sk_load_8888_dst_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,52,144                // movd          (%r8,%rdx,4),%xmm6
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           26879 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           26bd9 <_sk_load_8888_dst_sse41_lowp+0x9d>
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           26879 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           26bd9 <_sk_load_8888_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  243,65,15,126,52,144                // movq          (%r8,%rdx,4),%xmm6
   .byte  102,65,15,58,14,240,240             // pblendw       $0xf0,%xmm8,%xmm6
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,37                              // jmp           26879 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           26bd9 <_sk_load_8888_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
-  .byte  102,15,111,37,127,78,0,0            // movdqa        0x4e7f(%rip),%xmm4        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
+  .byte  102,15,111,37,127,78,0,0            // movdqa        0x4e7f(%rip),%xmm4        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,15,56,0,236                     // pshufb        %xmm4,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,252                     // pshufb        %xmm4,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,13,223,70,0,0         // movdqa        0x46df(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,223,70,0,0         // movdqa        0x46df(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,225                   // pand          %xmm9,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,21,88,78,0,0          // movdqa        0x4e58(%rip),%xmm10        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,21,88,78,0,0          // movdqa        0x4e58(%rip),%xmm10        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,65,15,56,0,250                  // pshufb        %xmm10,%xmm7
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,251                   // punpcklqdq    %xmm11,%xmm7
-  .byte  102,68,15,111,21,69,78,0,0          // movdqa        0x4e45(%rip),%xmm10        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,69,78,0,0          // movdqa        0x4e45(%rip),%xmm10        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
   .byte  102,65,15,56,0,242                  // pshufb        %xmm10,%xmm6
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,240                   // punpcklqdq    %xmm8,%xmm6
@@ -47782,7 +47931,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           26905 <_sk_load_8888_dst_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           26c65 <_sk_load_8888_dst_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -47819,20 +47968,20 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            2699a <_sk_store_8888_sse41_lowp+0x86>
+  .byte  119,27                              // ja            26cfa <_sk_store_8888_sse41_lowp+0x86>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 269e0 <_sk_store_8888_sse41_lowp+0xcc>
+  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 26d40 <_sk_store_8888_sse41_lowp+0xcc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           269d9 <_sk_store_8888_sse41_lowp+0xc5>
+  .byte  235,63                              // jmp           26d39 <_sk_store_8888_sse41_lowp+0xc5>
   .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  243,69,15,127,76,144,16             // movdqu        %xmm9,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           269d9 <_sk_store_8888_sse41_lowp+0xc5>
+  .byte  235,48                              // jmp           26d39 <_sk_store_8888_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           269d9 <_sk_store_8888_sse41_lowp+0xc5>
+  .byte  235,31                              // jmp           26d39 <_sk_store_8888_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  102,69,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  102,69,15,126,76,144,16             // movd          %xmm9,0x10(%r8,%rdx,4)
@@ -47876,49 +48025,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            26a40 <_sk_load_bgra_sse41_lowp+0x44>
+  .byte  119,41                              // ja            26da0 <_sk_load_bgra_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 26b18 <_sk_load_bgra_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 26e78 <_sk_load_bgra_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,4,144                 // movd          (%r8,%rdx,4),%xmm0
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           26a99 <_sk_load_bgra_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           26df9 <_sk_load_bgra_sse41_lowp+0x9d>
   .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           26a99 <_sk_load_bgra_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           26df9 <_sk_load_bgra_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  243,65,15,126,4,144                 // movq          (%r8,%rdx,4),%xmm0
   .byte  102,65,15,58,14,192,240             // pblendw       $0xf0,%xmm8,%xmm0
   .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
-  .byte  235,37                              // jmp           26a99 <_sk_load_bgra_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           26df9 <_sk_load_bgra_sse41_lowp+0x9d>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,4,144                 // movdqu        (%r8,%rdx,4),%xmm0
-  .byte  102,15,111,21,95,76,0,0             // movdqa        0x4c5f(%rip),%xmm2        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
+  .byte  102,15,111,21,95,76,0,0             // movdqa        0x4c5f(%rip),%xmm2        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,56,0,202                     // pshufb        %xmm2,%xmm1
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,56,0,218                     // pshufb        %xmm2,%xmm3
   .byte  102,15,108,203                      // punpcklqdq    %xmm3,%xmm1
-  .byte  102,68,15,111,13,191,68,0,0         // movdqa        0x44bf(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,191,68,0,0         // movdqa        0x44bf(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,65,15,219,209                   // pand          %xmm9,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,68,15,111,21,56,76,0,0          // movdqa        0x4c38(%rip),%xmm10        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,21,56,76,0,0          // movdqa        0x4c38(%rip),%xmm10        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,65,15,56,0,218                  // pshufb        %xmm10,%xmm3
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,219                   // punpcklqdq    %xmm11,%xmm3
-  .byte  102,68,15,111,21,37,76,0,0          // movdqa        0x4c25(%rip),%xmm10        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,37,76,0,0          // movdqa        0x4c25(%rip),%xmm10        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
   .byte  102,65,15,56,0,194                  // pshufb        %xmm10,%xmm0
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,192                   // punpcklqdq    %xmm8,%xmm0
@@ -47934,7 +48083,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           26b25 <_sk_load_bgra_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           26e85 <_sk_load_bgra_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -47956,49 +48105,49 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            26b78 <_sk_load_bgra_dst_sse41_lowp+0x44>
+  .byte  119,41                              // ja            26ed8 <_sk_load_bgra_dst_sse41_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 26c50 <_sk_load_bgra_dst_sse41_lowp+0x11c>
+  .byte  76,141,13,242,0,0,0                 // lea           0xf2(%rip),%r9        # 26fb0 <_sk_load_bgra_dst_sse41_lowp+0x11c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,36,144                // movd          (%r8,%rdx,4),%xmm4
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           26bd1 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  .byte  235,89                              // jmp           26f31 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   .byte  243,65,15,111,36,144                // movdqu        (%r8,%rdx,4),%xmm4
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           26bd1 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  .byte  235,74                              // jmp           26f31 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  243,65,15,126,36,144                // movq          (%r8,%rdx,4),%xmm4
   .byte  102,65,15,58,14,224,240             // pblendw       $0xf0,%xmm8,%xmm4
   .byte  102,68,15,111,197                   // movdqa        %xmm5,%xmm8
-  .byte  235,37                              // jmp           26bd1 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  .byte  235,37                              // jmp           26f31 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,36,144                // movdqu        (%r8,%rdx,4),%xmm4
-  .byte  102,15,111,53,39,75,0,0             // movdqa        0x4b27(%rip),%xmm6        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
+  .byte  102,15,111,53,39,75,0,0             // movdqa        0x4b27(%rip),%xmm6        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,56,0,238                     // pshufb        %xmm6,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,254                     // pshufb        %xmm6,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,13,135,67,0,0         // movdqa        0x4387(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,135,67,0,0         // movdqa        0x4387(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,65,15,219,241                   // pand          %xmm9,%xmm6
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,21,0,75,0,0           // movdqa        0x4b00(%rip),%xmm10        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,21,0,75,0,0           // movdqa        0x4b00(%rip),%xmm10        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,65,15,56,0,250                  // pshufb        %xmm10,%xmm7
   .byte  102,69,15,111,216                   // movdqa        %xmm8,%xmm11
   .byte  102,69,15,56,0,218                  // pshufb        %xmm10,%xmm11
   .byte  102,65,15,108,251                   // punpcklqdq    %xmm11,%xmm7
-  .byte  102,68,15,111,21,237,74,0,0         // movdqa        0x4aed(%rip),%xmm10        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,21,237,74,0,0         // movdqa        0x4aed(%rip),%xmm10        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
   .byte  102,65,15,56,0,226                  // pshufb        %xmm10,%xmm4
   .byte  102,69,15,56,0,194                  // pshufb        %xmm10,%xmm8
   .byte  102,65,15,108,224                   // punpcklqdq    %xmm8,%xmm4
@@ -48014,7 +48163,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           26c5d <_sk_load_bgra_dst_sse41_lowp+0x129>
+  .byte  123,255                             // jnp           26fbd <_sk_load_bgra_dst_sse41_lowp+0x129>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -48051,20 +48200,20 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            26cf2 <_sk_store_bgra_sse41_lowp+0x86>
+  .byte  119,27                              // ja            27052 <_sk_store_bgra_sse41_lowp+0x86>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 26d38 <_sk_store_bgra_sse41_lowp+0xcc>
+  .byte  76,141,13,87,0,0,0                  // lea           0x57(%rip),%r9        # 27098 <_sk_store_bgra_sse41_lowp+0xcc>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,4,144                 // movd          %xmm8,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           26d31 <_sk_store_bgra_sse41_lowp+0xc5>
+  .byte  235,63                              // jmp           27091 <_sk_store_bgra_sse41_lowp+0xc5>
   .byte  243,69,15,127,4,144                 // movdqu        %xmm8,(%r8,%rdx,4)
   .byte  243,69,15,127,76,144,16             // movdqu        %xmm9,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           26d31 <_sk_store_bgra_sse41_lowp+0xc5>
+  .byte  235,48                              // jmp           27091 <_sk_store_bgra_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,4,144                 // movq          %xmm8,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           26d31 <_sk_store_bgra_sse41_lowp+0xc5>
+  .byte  235,31                              // jmp           27091 <_sk_store_bgra_sse41_lowp+0xc5>
   .byte  102,69,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   .byte  102,69,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   .byte  102,69,15,126,76,144,16             // movd          %xmm9,0x10(%r8,%rdx,4)
@@ -48108,23 +48257,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            26d90 <_sk_load_565_sse41_lowp+0x3c>
+  .byte  119,34                              // ja            270f0 <_sk_load_565_sse41_lowp+0x3c>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 26e40 <_sk_load_565_sse41_lowp+0xec>
+  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 271a0 <_sk_load_565_sse41_lowp+0xec>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,74                              // jmp           26dda <_sk_load_565_sse41_lowp+0x86>
+  .byte  235,74                              // jmp           2713a <_sk_load_565_sse41_lowp+0x86>
   .byte  243,65,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm0
-  .byte  235,66                              // jmp           26dda <_sk_load_565_sse41_lowp+0x86>
+  .byte  235,66                              // jmp           2713a <_sk_load_565_sse41_lowp+0x86>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,76,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm1
   .byte  102,65,15,110,4,80                  // movd          (%r8,%rdx,2),%xmm0
   .byte  102,15,58,14,193,252                // pblendw       $0xfc,%xmm1,%xmm0
-  .byte  235,40                              // jmp           26dda <_sk_load_565_sse41_lowp+0x86>
+  .byte  235,40                              // jmp           2713a <_sk_load_565_sse41_lowp+0x86>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,65,15,196,76,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm1
   .byte  102,65,15,196,76,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm1
@@ -48133,11 +48282,11 @@
   .byte  102,15,58,14,193,240                // pblendw       $0xf0,%xmm1,%xmm0
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
-  .byte  102,15,219,29,69,73,0,0             // pand          0x4945(%rip),%xmm3        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,15,219,29,69,73,0,0             // pand          0x4945(%rip),%xmm3        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,13,68,73,0,0             // pand          0x4944(%rip),%xmm1        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,15,111,21,76,73,0,0             // movdqa        0x494c(%rip),%xmm2        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,15,219,13,68,73,0,0             // pand          0x4944(%rip),%xmm1        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,15,111,21,76,73,0,0             // movdqa        0x494c(%rip),%xmm2        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,195                      // por           %xmm3,%xmm0
@@ -48150,7 +48299,7 @@
   .byte  102,15,113,210,2                    // psrlw         $0x2,%xmm2
   .byte  102,15,235,211                      // por           %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,66,65,0,0                  // movaps        0x4142(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,29,66,65,0,0                  // movaps        0x4142(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  255,224                             // jmpq          *%rax
   .byte  69,255                              // rex.RB        (bad)
   .byte  255                                 // (bad)
@@ -48161,7 +48310,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           26e55 <_sk_load_565_sse41_lowp+0x101>
+  .byte  126,255                             // jle           271b5 <_sk_load_565_sse41_lowp+0x101>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -48180,23 +48329,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            26e98 <_sk_load_565_dst_sse41_lowp+0x3c>
+  .byte  119,34                              // ja            271f8 <_sk_load_565_dst_sse41_lowp+0x3c>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 26f48 <_sk_load_565_dst_sse41_lowp+0xec>
+  .byte  76,141,13,196,0,0,0                 // lea           0xc4(%rip),%r9        # 272a8 <_sk_load_565_dst_sse41_lowp+0xec>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,74                              // jmp           26ee2 <_sk_load_565_dst_sse41_lowp+0x86>
+  .byte  235,74                              // jmp           27242 <_sk_load_565_dst_sse41_lowp+0x86>
   .byte  243,65,15,111,36,80                 // movdqu        (%r8,%rdx,2),%xmm4
-  .byte  235,66                              // jmp           26ee2 <_sk_load_565_dst_sse41_lowp+0x86>
+  .byte  235,66                              // jmp           27242 <_sk_load_565_dst_sse41_lowp+0x86>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,65,15,196,108,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm5
   .byte  102,65,15,110,36,80                 // movd          (%r8,%rdx,2),%xmm4
   .byte  102,15,58,14,229,252                // pblendw       $0xfc,%xmm5,%xmm4
-  .byte  235,40                              // jmp           26ee2 <_sk_load_565_dst_sse41_lowp+0x86>
+  .byte  235,40                              // jmp           27242 <_sk_load_565_dst_sse41_lowp+0x86>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,65,15,196,108,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm5
   .byte  102,65,15,196,108,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm5
@@ -48205,11 +48354,11 @@
   .byte  102,15,58,14,229,240                // pblendw       $0xf0,%xmm5,%xmm4
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,15,113,215,8                    // psrlw         $0x8,%xmm7
-  .byte  102,15,219,61,61,72,0,0             // pand          0x483d(%rip),%xmm7        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,15,219,61,61,72,0,0             // pand          0x483d(%rip),%xmm7        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,113,213,5                    // psrlw         $0x5,%xmm5
-  .byte  102,15,219,45,60,72,0,0             // pand          0x483c(%rip),%xmm5        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,15,111,53,68,72,0,0             // movdqa        0x4844(%rip),%xmm6        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,15,219,45,60,72,0,0             // pand          0x483c(%rip),%xmm5        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,15,111,53,68,72,0,0             // movdqa        0x4844(%rip),%xmm6        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,15,219,244                      // pand          %xmm4,%xmm6
   .byte  102,15,113,212,13                   // psrlw         $0xd,%xmm4
   .byte  102,15,235,231                      // por           %xmm7,%xmm4
@@ -48222,7 +48371,7 @@
   .byte  102,15,113,214,2                    // psrlw         $0x2,%xmm6
   .byte  102,15,235,247                      // por           %xmm7,%xmm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,58,64,0,0                  // movaps        0x403a(%rip),%xmm7        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,61,58,64,0,0                  // movaps        0x403a(%rip),%xmm7        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  255,224                             // jmpq          *%rax
   .byte  69,255                              // rex.RB        (bad)
   .byte  255                                 // (bad)
@@ -48233,7 +48382,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  126,255                             // jle           26f5d <_sk_load_565_dst_sse41_lowp+0x101>
+  .byte  126,255                             // jle           272bd <_sk_load_565_dst_sse41_lowp+0x101>
   .byte  255                                 // (bad)
   .byte  255,114,255                         // pushq         -0x1(%rdx)
   .byte  255                                 // (bad)
@@ -48250,10 +48399,10 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,65,15,113,240,8                 // psllw         $0x8,%xmm8
-  .byte  102,68,15,219,5,216,71,0,0          // pand          0x47d8(%rip),%xmm8        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0x11c4>
+  .byte  102,68,15,219,5,216,71,0,0          // pand          0x47d8(%rip),%xmm8        # 2bac0 <_sk_srcover_rgba_8888_sse2_lowp+0x11c4>
   .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
   .byte  102,65,15,113,241,3                 // psllw         $0x3,%xmm9
-  .byte  102,68,15,219,13,212,71,0,0         // pand          0x47d4(%rip),%xmm9        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0x11d4>
+  .byte  102,68,15,219,13,212,71,0,0         // pand          0x47d4(%rip),%xmm9        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0x11d4>
   .byte  102,69,15,235,200                   // por           %xmm8,%xmm9
   .byte  102,68,15,111,194                   // movdqa        %xmm2,%xmm8
   .byte  102,65,15,113,208,3                 // psrlw         $0x3,%xmm8
@@ -48262,19 +48411,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            26fd8 <_sk_store_565_sse41_lowp+0x74>
+  .byte  119,29                              // ja            27338 <_sk_store_565_sse41_lowp+0x74>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,83,0,0,0                  // lea           0x53(%rip),%r9        # 27018 <_sk_store_565_sse41_lowp+0xb4>
+  .byte  76,141,13,83,0,0,0                  // lea           0x53(%rip),%r9        # 27378 <_sk_store_565_sse41_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,58,21,4,80,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,2)
-  .byte  235,58                              // jmp           27012 <_sk_store_565_sse41_lowp+0xae>
+  .byte  235,58                              // jmp           27372 <_sk_store_565_sse41_lowp+0xae>
   .byte  243,69,15,127,4,80                  // movdqu        %xmm8,(%r8,%rdx,2)
-  .byte  235,50                              // jmp           27012 <_sk_store_565_sse41_lowp+0xae>
+  .byte  235,50                              // jmp           27372 <_sk_store_565_sse41_lowp+0xae>
   .byte  102,69,15,58,21,68,80,4,2           // pextrw        $0x2,%xmm8,0x4(%r8,%rdx,2)
   .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
-  .byte  235,33                              // jmp           27012 <_sk_store_565_sse41_lowp+0xae>
+  .byte  235,33                              // jmp           27372 <_sk_store_565_sse41_lowp+0xae>
   .byte  102,69,15,58,21,68,80,12,6          // pextrw        $0x6,%xmm8,0xc(%r8,%rdx,2)
   .byte  102,69,15,58,21,68,80,10,5          // pextrw        $0x5,%xmm8,0xa(%r8,%rdx,2)
   .byte  102,69,15,58,21,68,80,8,4           // pextrw        $0x4,%xmm8,0x8(%r8,%rdx,2)
@@ -48294,7 +48443,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  235,255                             // jmp           27029 <_sk_store_565_sse41_lowp+0xc5>
+  .byte  235,255                             // jmp           27389 <_sk_store_565_sse41_lowp+0xc5>
   .byte  255                                 // (bad)
   .byte  255,226                             // jmpq          *%rdx
   .byte  255                                 // (bad)
@@ -48316,18 +48465,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            2706d <_sk_load_a8_sse41_lowp+0x39>
+  .byte  119,34                              // ja            273cd <_sk_load_a8_sse41_lowp+0x39>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,143,0,0,0                 // lea           0x8f(%rip),%r9        # 270e8 <_sk_load_a8_sse41_lowp+0xb4>
+  .byte  76,141,13,143,0,0,0                 // lea           0x8f(%rip),%r9        # 27448 <_sk_load_a8_sse41_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  235,100                             // jmp           270d1 <_sk_load_a8_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           27431 <_sk_load_a8_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,28,16               // pmovzxbw      (%r8,%rdx,1),%xmm3
-  .byte  235,91                              // jmp           270d1 <_sk_load_a8_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           27431 <_sk_load_a8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,2                    // pinsrw        $0x2,%eax,%xmm0
@@ -48335,7 +48484,7 @@
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,56,48,217                    // pmovzxbw      %xmm1,%xmm3
   .byte  102,15,58,14,216,252                // pblendw       $0xfc,%xmm0,%xmm3
-  .byte  235,54                              // jmp           270d1 <_sk_load_a8_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           27431 <_sk_load_a8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,6                    // pinsrw        $0x6,%eax,%xmm0
@@ -48346,13 +48495,13 @@
   .byte  102,65,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm1
   .byte  102,15,56,48,217                    // pmovzxbw      %xmm1,%xmm3
   .byte  102,15,58,14,216,240                // pblendw       $0xf0,%xmm0,%xmm3
-  .byte  102,15,219,29,167,62,0,0            // pand          0x3ea7(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,29,167,62,0,0            // pand          0x3ea7(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  122,255                             // jp            270e9 <_sk_load_a8_sse41_lowp+0xb5>
+  .byte  122,255                             // jp            27449 <_sk_load_a8_sse41_lowp+0xb5>
   .byte  255                                 // (bad)
   .byte  255,157,255,255,255,142             // lcall         *-0x71000001(%rbp)
   .byte  255                                 // (bad)
@@ -48383,18 +48532,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            2713d <_sk_load_a8_dst_sse41_lowp+0x39>
+  .byte  119,34                              // ja            2749d <_sk_load_a8_dst_sse41_lowp+0x39>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,143,0,0,0                 // lea           0x8f(%rip),%r9        # 271b8 <_sk_load_a8_dst_sse41_lowp+0xb4>
+  .byte  76,141,13,143,0,0,0                 // lea           0x8f(%rip),%r9        # 27518 <_sk_load_a8_dst_sse41_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  235,100                             // jmp           271a1 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           27501 <_sk_load_a8_dst_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,60,16               // pmovzxbw      (%r8,%rdx,1),%xmm7
-  .byte  235,91                              // jmp           271a1 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           27501 <_sk_load_a8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,2                    // pinsrw        $0x2,%eax,%xmm4
@@ -48402,7 +48551,7 @@
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,56,48,253                    // pmovzxbw      %xmm5,%xmm7
   .byte  102,15,58,14,252,252                // pblendw       $0xfc,%xmm4,%xmm7
-  .byte  235,54                              // jmp           271a1 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           27501 <_sk_load_a8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,6                    // pinsrw        $0x6,%eax,%xmm4
@@ -48413,13 +48562,13 @@
   .byte  102,65,15,110,44,16                 // movd          (%r8,%rdx,1),%xmm5
   .byte  102,15,56,48,253                    // pmovzxbw      %xmm5,%xmm7
   .byte  102,15,58,14,252,240                // pblendw       $0xf0,%xmm4,%xmm7
-  .byte  102,15,219,61,215,61,0,0            // pand          0x3dd7(%rip),%xmm7        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,61,215,61,0,0            // pand          0x3dd7(%rip),%xmm7        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  122,255                             // jp            271b9 <_sk_load_a8_dst_sse41_lowp+0xb5>
+  .byte  122,255                             // jp            27519 <_sk_load_a8_dst_sse41_lowp+0xb5>
   .byte  255                                 // (bad)
   .byte  255,157,255,255,255,142             // lcall         *-0x71000001(%rbp)
   .byte  255                                 // (bad)
@@ -48450,28 +48599,28 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            27208 <_sk_store_a8_sse41_lowp+0x34>
+  .byte  119,29                              // ja            27568 <_sk_store_a8_sse41_lowp+0x34>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,131,0,0,0                 // lea           0x83(%rip),%r9        # 27278 <_sk_store_a8_sse41_lowp+0xa4>
+  .byte  76,141,13,131,0,0,0                 // lea           0x83(%rip),%r9        # 275d8 <_sk_store_a8_sse41_lowp+0xa4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,58,20,28,16,0             // pextrb        $0x0,%xmm3,(%r8,%rdx,1)
-  .byte  235,105                             // jmp           27271 <_sk_store_a8_sse41_lowp+0x9d>
+  .byte  235,105                             // jmp           275d1 <_sk_store_a8_sse41_lowp+0x9d>
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,56,0,5,185,68,0,0         // pshufb        0x44b9(%rip),%xmm8        # 2b6d0 <_sk_srcover_rgba_8888_sse2_lowp+0x1134>
+  .byte  102,68,15,56,0,5,185,68,0,0         // pshufb        0x44b9(%rip),%xmm8        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0x1134>
   .byte  102,69,15,214,4,16                  // movq          %xmm8,(%r8,%rdx,1)
-  .byte  235,82                              // jmp           27271 <_sk_store_a8_sse41_lowp+0x9d>
+  .byte  235,82                              // jmp           275d1 <_sk_store_a8_sse41_lowp+0x9d>
   .byte  102,65,15,58,20,92,16,2,4           // pextrb        $0x4,%xmm3,0x2(%r8,%rdx,1)
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,56,0,5,89,61,0,0          // pshufb        0x3d59(%rip),%xmm8        # 2af90 <_sk_srcover_rgba_8888_sse2_lowp+0x9f4>
+  .byte  102,68,15,56,0,5,89,61,0,0          // pshufb        0x3d59(%rip),%xmm8        # 2b2f0 <_sk_srcover_rgba_8888_sse2_lowp+0x9f4>
   .byte  102,69,15,58,21,4,16,0              // pextrw        $0x0,%xmm8,(%r8,%rdx,1)
-  .byte  235,48                              // jmp           27271 <_sk_store_a8_sse41_lowp+0x9d>
+  .byte  235,48                              // jmp           275d1 <_sk_store_a8_sse41_lowp+0x9d>
   .byte  102,65,15,58,20,92,16,6,12          // pextrb        $0xc,%xmm3,0x6(%r8,%rdx,1)
   .byte  102,65,15,58,20,92,16,5,10          // pextrb        $0xa,%xmm3,0x5(%r8,%rdx,1)
   .byte  102,65,15,58,20,92,16,4,8           // pextrb        $0x8,%xmm3,0x4(%r8,%rdx,1)
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,56,0,5,53,61,0,0          // pshufb        0x3d35(%rip),%xmm8        # 2afa0 <_sk_srcover_rgba_8888_sse2_lowp+0xa04>
+  .byte  102,68,15,56,0,5,53,61,0,0          // pshufb        0x3d35(%rip),%xmm8        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0xa04>
   .byte  102,69,15,126,4,16                  // movd          %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
@@ -48507,18 +48656,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            272cd <_sk_load_g8_sse41_lowp+0x39>
+  .byte  119,34                              // ja            2762d <_sk_load_g8_sse41_lowp+0x39>
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 2734c <_sk_load_g8_sse41_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 276ac <_sk_load_g8_sse41_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,100                             // jmp           27331 <_sk_load_g8_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           27691 <_sk_load_g8_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,4,16                // pmovzxbw      (%r8,%rdx,1),%xmm0
-  .byte  235,91                              // jmp           27331 <_sk_load_g8_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           27691 <_sk_load_g8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,15,196,200,2                    // pinsrw        $0x2,%eax,%xmm1
@@ -48526,7 +48675,7 @@
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,56,48,192                    // pmovzxbw      %xmm0,%xmm0
   .byte  102,15,58,14,193,252                // pblendw       $0xfc,%xmm1,%xmm0
-  .byte  235,54                              // jmp           27331 <_sk_load_g8_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           27691 <_sk_load_g8_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,15,196,200,6                    // pinsrw        $0x6,%eax,%xmm1
@@ -48537,13 +48686,13 @@
   .byte  102,65,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm0
   .byte  102,15,56,48,192                    // pmovzxbw      %xmm0,%xmm0
   .byte  102,15,58,14,193,240                // pblendw       $0xf0,%xmm1,%xmm0
-  .byte  102,15,219,5,71,60,0,0              // pand          0x3c47(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,5,71,60,0,0              // pand          0x3c47(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,62,60,0,0                  // movaps        0x3c3e(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,29,62,60,0,0                  // movaps        0x3c3e(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
-  .byte  118,255                             // jbe           2734d <_sk_load_g8_sse41_lowp+0xb9>
+  .byte  118,255                             // jbe           276ad <_sk_load_g8_sse41_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,138             // lcall         *-0x75000001(%rcx)
   .byte  255                                 // (bad)
@@ -48572,18 +48721,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            273a1 <_sk_load_g8_dst_sse41_lowp+0x39>
+  .byte  119,34                              // ja            27701 <_sk_load_g8_dst_sse41_lowp+0x39>
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 27420 <_sk_load_g8_dst_sse41_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 27780 <_sk_load_g8_dst_sse41_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,100                             // jmp           27405 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  .byte  235,100                             // jmp           27765 <_sk_load_g8_dst_sse41_lowp+0x9d>
   .byte  102,65,15,56,48,36,16               // pmovzxbw      (%r8,%rdx,1),%xmm4
-  .byte  235,91                              // jmp           27405 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  .byte  235,91                              // jmp           27765 <_sk_load_g8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,15,196,232,2                    // pinsrw        $0x2,%eax,%xmm5
@@ -48591,7 +48740,7 @@
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,56,48,228                    // pmovzxbw      %xmm4,%xmm4
   .byte  102,15,58,14,229,252                // pblendw       $0xfc,%xmm5,%xmm4
-  .byte  235,54                              // jmp           27405 <_sk_load_g8_dst_sse41_lowp+0x9d>
+  .byte  235,54                              // jmp           27765 <_sk_load_g8_dst_sse41_lowp+0x9d>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,237                      // pxor          %xmm5,%xmm5
   .byte  102,15,196,232,6                    // pinsrw        $0x6,%eax,%xmm5
@@ -48602,13 +48751,13 @@
   .byte  102,65,15,110,36,16                 // movd          (%r8,%rdx,1),%xmm4
   .byte  102,15,56,48,228                    // pmovzxbw      %xmm4,%xmm4
   .byte  102,15,58,14,229,240                // pblendw       $0xf0,%xmm5,%xmm4
-  .byte  102,15,219,37,115,59,0,0            // pand          0x3b73(%rip),%xmm4        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,37,115,59,0,0            // pand          0x3b73(%rip),%xmm4        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,106,59,0,0                 // movaps        0x3b6a(%rip),%xmm7        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,61,106,59,0,0                 // movaps        0x3b6a(%rip),%xmm7        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
-  .byte  118,255                             // jbe           27421 <_sk_load_g8_dst_sse41_lowp+0xb9>
+  .byte  118,255                             // jbe           27781 <_sk_load_g8_dst_sse41_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,153,255,255,255,138             // lcall         *-0x75000001(%rcx)
   .byte  255                                 // (bad)
@@ -48630,10 +48779,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse41_lowp)
 _sk_luminance_to_alpha_sse41_lowp:
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
-  .byte  102,15,213,5,56,67,0,0              // pmullw        0x4338(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0x11e4>
-  .byte  102,15,213,13,64,67,0,0             // pmullw        0x4340(%rip),%xmm1        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0x11f4>
+  .byte  102,15,213,5,56,67,0,0              // pmullw        0x4338(%rip),%xmm0        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0x11e4>
+  .byte  102,15,213,13,64,67,0,0             // pmullw        0x4340(%rip),%xmm1        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0x11f4>
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
-  .byte  102,15,213,29,68,67,0,0             // pmullw        0x4344(%rip),%xmm3        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1204>
+  .byte  102,15,213,29,68,67,0,0             // pmullw        0x4344(%rip),%xmm3        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0x1204>
   .byte  102,15,253,217                      // paddw         %xmm1,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -48648,14 +48797,14 @@
 _sk_scale_1_float_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,143,57,0,0           // mulss         0x398f(%rip),%xmm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  243,68,15,88,5,86,57,0,0            // addss         0x3956(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,89,5,143,57,0,0           // mulss         0x398f(%rip),%xmm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  243,68,15,88,5,86,57,0,0            // addss         0x3956(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,206,58,0,0         // movdqa        0x3ace(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,206,58,0,0         // movdqa        0x3ace(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -48676,13 +48825,13 @@
 _sk_lerp_1_float_sse41_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,23,57,0,0            // mulss         0x3917(%rip),%xmm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  243,68,15,88,5,222,56,0,0           // addss         0x38de(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,89,5,23,57,0,0            // mulss         0x3917(%rip),%xmm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  243,68,15,88,5,222,56,0,0           // addss         0x38de(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
-  .byte  102,68,15,111,13,91,58,0,0          // movdqa        0x3a5b(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,91,58,0,0          // movdqa        0x3a5b(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -48722,18 +48871,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            275dc <_sk_scale_u8_sse41_lowp+0x3b>
+  .byte  119,36                              // ja            2793c <_sk_scale_u8_sse41_lowp+0x3b>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,221,0,0,0                 // lea           0xdd(%rip),%r9        # 276a4 <_sk_scale_u8_sse41_lowp+0x103>
+  .byte  76,141,13,221,0,0,0                 // lea           0xdd(%rip),%r9        # 27a04 <_sk_scale_u8_sse41_lowp+0x103>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,111                             // jmp           2764b <_sk_scale_u8_sse41_lowp+0xaa>
+  .byte  235,111                             // jmp           279ab <_sk_scale_u8_sse41_lowp+0xaa>
   .byte  102,69,15,56,48,4,16                // pmovzxbw      (%r8,%rdx,1),%xmm8
-  .byte  235,102                             // jmp           2764b <_sk_scale_u8_sse41_lowp+0xaa>
+  .byte  235,102                             // jmp           279ab <_sk_scale_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,2                 // pinsrw        $0x2,%eax,%xmm9
@@ -48741,7 +48890,7 @@
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,252             // pblendw       $0xfc,%xmm9,%xmm8
-  .byte  235,60                              // jmp           2764b <_sk_scale_u8_sse41_lowp+0xaa>
+  .byte  235,60                              // jmp           279ab <_sk_scale_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,6                 // pinsrw        $0x6,%eax,%xmm9
@@ -48752,9 +48901,9 @@
   .byte  102,69,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,240             // pblendw       $0xf0,%xmm9,%xmm8
-  .byte  102,68,15,219,5,44,57,0,0           // pand          0x392c(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,219,5,44,57,0,0           // pand          0x392c(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,30,57,0,0          // movdqa        0x391e(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,30,57,0,0          // movdqa        0x391e(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -48779,7 +48928,7 @@
   .byte  255,148,255,255,255,136,255         // callq         *-0x770001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  124,255                             // jl            276b9 <_sk_scale_u8_sse41_lowp+0x118>
+  .byte  124,255                             // jl            27a19 <_sk_scale_u8_sse41_lowp+0x118>
   .byte  255                                 // (bad)
   .byte  255,107,255                         // ljmp          *-0x1(%rbx)
   .byte  255                                 // (bad)
@@ -48797,18 +48946,18 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            276fb <_sk_lerp_u8_sse41_lowp+0x3b>
+  .byte  119,36                              // ja            27a5b <_sk_lerp_u8_sse41_lowp+0x3b>
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 27804 <_sk_lerp_u8_sse41_lowp+0x144>
+  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 27b64 <_sk_lerp_u8_sse41_lowp+0x144>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,111                             // jmp           2776a <_sk_lerp_u8_sse41_lowp+0xaa>
+  .byte  235,111                             // jmp           27aca <_sk_lerp_u8_sse41_lowp+0xaa>
   .byte  102,69,15,56,48,4,16                // pmovzxbw      (%r8,%rdx,1),%xmm8
-  .byte  235,102                             // jmp           2776a <_sk_lerp_u8_sse41_lowp+0xaa>
+  .byte  235,102                             // jmp           27aca <_sk_lerp_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,2                 // pinsrw        $0x2,%eax,%xmm9
@@ -48816,7 +48965,7 @@
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,252             // pblendw       $0xfc,%xmm9,%xmm8
-  .byte  235,60                              // jmp           2776a <_sk_lerp_u8_sse41_lowp+0xaa>
+  .byte  235,60                              // jmp           27aca <_sk_lerp_u8_sse41_lowp+0xaa>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,201                   // pxor          %xmm9,%xmm9
   .byte  102,68,15,196,200,6                 // pinsrw        $0x6,%eax,%xmm9
@@ -48827,8 +48976,8 @@
   .byte  102,69,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm8
   .byte  102,69,15,56,48,192                 // pmovzxbw      %xmm8,%xmm8
   .byte  102,69,15,58,14,193,240             // pblendw       $0xf0,%xmm9,%xmm8
-  .byte  102,68,15,219,5,13,56,0,0           // pand          0x380d(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
-  .byte  102,68,15,111,21,4,56,0,0           // movdqa        0x3804(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,219,5,13,56,0,0           // pand          0x380d(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,4,56,0,0           // movdqa        0x3804(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,239,202                   // pxor          %xmm10,%xmm9
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
@@ -48858,7 +49007,7 @@
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  235,254                             // jmp           27804 <_sk_lerp_u8_sse41_lowp+0x144>
+  .byte  235,254                             // jmp           27b64 <_sk_lerp_u8_sse41_lowp+0x144>
   .byte  255                                 // (bad)
   .byte  255,17                              // callq         *(%rcx)
   .byte  255                                 // (bad)
@@ -48892,23 +49041,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,35                              // ja            27862 <_sk_scale_565_sse41_lowp+0x42>
+  .byte  119,35                              // ja            27bc2 <_sk_scale_565_sse41_lowp+0x42>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,111,1,0,0                 // lea           0x16f(%rip),%r9        # 279bc <_sk_scale_565_sse41_lowp+0x19c>
+  .byte  76,141,13,111,1,0,0                 // lea           0x16f(%rip),%r9        # 27d1c <_sk_scale_565_sse41_lowp+0x19c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
-  .byte  235,76                              // jmp           278ae <_sk_scale_565_sse41_lowp+0x8e>
+  .byte  235,76                              // jmp           27c0e <_sk_scale_565_sse41_lowp+0x8e>
   .byte  243,69,15,111,12,80                 // movdqu        (%r8,%rdx,2),%xmm9
-  .byte  235,68                              // jmp           278ae <_sk_scale_565_sse41_lowp+0x8e>
+  .byte  235,68                              // jmp           27c0e <_sk_scale_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  102,69,15,110,12,80                 // movd          (%r8,%rdx,2),%xmm9
   .byte  102,68,15,58,14,200,252             // pblendw       $0xfc,%xmm0,%xmm9
-  .byte  235,41                              // jmp           278ae <_sk_scale_565_sse41_lowp+0x8e>
+  .byte  235,41                              // jmp           27c0e <_sk_scale_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -48917,11 +49066,11 @@
   .byte  102,68,15,58,14,200,240             // pblendw       $0xf0,%xmm0,%xmm9
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
-  .byte  102,15,219,5,112,62,0,0             // pand          0x3e70(%rip),%xmm0        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,15,219,5,112,62,0,0             // pand          0x3e70(%rip),%xmm0        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,65,15,113,210,5                 // psrlw         $0x5,%xmm10
-  .byte  102,68,15,219,21,108,62,0,0         // pand          0x3e6c(%rip),%xmm10        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,68,15,111,29,115,62,0,0         // movdqa        0x3e73(%rip),%xmm11        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,68,15,219,21,108,62,0,0         // pand          0x3e6c(%rip),%xmm10        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,29,115,62,0,0         // movdqa        0x3e73(%rip),%xmm11        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,69,15,219,217                   // pand          %xmm9,%xmm11
   .byte  102,65,15,113,209,13                // psrlw         $0xd,%xmm9
   .byte  102,68,15,235,200                   // por           %xmm0,%xmm9
@@ -48933,7 +49082,7 @@
   .byte  102,15,113,240,3                    // psllw         $0x3,%xmm0
   .byte  102,65,15,113,211,2                 // psrlw         $0x2,%xmm11
   .byte  102,68,15,235,216                   // por           %xmm0,%xmm11
-  .byte  102,15,111,5,209,61,0,0             // movdqa        0x3dd1(%rip),%xmm0        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,15,111,5,209,61,0,0             // movdqa        0x3dd1(%rip),%xmm0        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,68,15,111,227                   // movdqa        %xmm3,%xmm12
   .byte  102,68,15,239,224                   // pxor          %xmm0,%xmm12
   .byte  102,15,239,199                      // pxor          %xmm7,%xmm0
@@ -48946,7 +49095,7 @@
   .byte  102,69,15,56,62,225                 // pmaxuw        %xmm9,%xmm12
   .byte  102,69,15,56,16,229                 // pblendvb      %xmm0,%xmm13,%xmm12
   .byte  102,69,15,213,200                   // pmullw        %xmm8,%xmm9
-  .byte  102,15,111,5,25,54,0,0              // movdqa        0x3619(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,111,5,25,54,0,0              // movdqa        0x3619(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,253,200                   // paddw         %xmm0,%xmm9
   .byte  102,65,15,113,209,8                 // psrlw         $0x8,%xmm9
   .byte  102,68,15,213,209                   // pmullw        %xmm1,%xmm10
@@ -49000,23 +49149,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,35                              // ja            27a1a <_sk_lerp_565_sse41_lowp+0x42>
+  .byte  119,35                              // ja            27d7a <_sk_lerp_565_sse41_lowp+0x42>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,187,1,0,0                 // lea           0x1bb(%rip),%r9        # 27bc0 <_sk_lerp_565_sse41_lowp+0x1e8>
+  .byte  76,141,13,187,1,0,0                 // lea           0x1bb(%rip),%r9        # 27f20 <_sk_lerp_565_sse41_lowp+0x1e8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
-  .byte  235,76                              // jmp           27a66 <_sk_lerp_565_sse41_lowp+0x8e>
+  .byte  235,76                              // jmp           27dc6 <_sk_lerp_565_sse41_lowp+0x8e>
   .byte  243,69,15,111,12,80                 // movdqu        (%r8,%rdx,2),%xmm9
-  .byte  235,68                              // jmp           27a66 <_sk_lerp_565_sse41_lowp+0x8e>
+  .byte  235,68                              // jmp           27dc6 <_sk_lerp_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  102,69,15,110,12,80                 // movd          (%r8,%rdx,2),%xmm9
   .byte  102,68,15,58,14,200,252             // pblendw       $0xfc,%xmm0,%xmm9
-  .byte  235,41                              // jmp           27a66 <_sk_lerp_565_sse41_lowp+0x8e>
+  .byte  235,41                              // jmp           27dc6 <_sk_lerp_565_sse41_lowp+0x8e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -49025,11 +49174,11 @@
   .byte  102,68,15,58,14,200,240             // pblendw       $0xf0,%xmm0,%xmm9
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
-  .byte  102,15,219,5,184,60,0,0             // pand          0x3cb8(%rip),%xmm0        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,15,219,5,184,60,0,0             // pand          0x3cb8(%rip),%xmm0        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,65,15,113,210,5                 // psrlw         $0x5,%xmm10
-  .byte  102,68,15,219,21,180,60,0,0         // pand          0x3cb4(%rip),%xmm10        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,68,15,111,29,187,60,0,0         // movdqa        0x3cbb(%rip),%xmm11        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,68,15,219,21,180,60,0,0         // pand          0x3cb4(%rip),%xmm10        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,29,187,60,0,0         // movdqa        0x3cbb(%rip),%xmm11        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,69,15,219,217                   // pand          %xmm9,%xmm11
   .byte  102,65,15,113,209,13                // psrlw         $0xd,%xmm9
   .byte  102,68,15,235,200                   // por           %xmm0,%xmm9
@@ -49041,7 +49190,7 @@
   .byte  102,15,113,240,3                    // psllw         $0x3,%xmm0
   .byte  102,65,15,113,211,2                 // psrlw         $0x2,%xmm11
   .byte  102,68,15,235,216                   // por           %xmm0,%xmm11
-  .byte  102,15,111,5,25,60,0,0              // movdqa        0x3c19(%rip),%xmm0        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,15,111,5,25,60,0,0              // movdqa        0x3c19(%rip),%xmm0        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,68,15,111,227                   // movdqa        %xmm3,%xmm12
   .byte  102,68,15,239,224                   // pxor          %xmm0,%xmm12
   .byte  102,15,239,199                      // pxor          %xmm7,%xmm0
@@ -49053,7 +49202,7 @@
   .byte  102,69,15,56,62,227                 // pmaxuw        %xmm11,%xmm12
   .byte  102,69,15,56,62,225                 // pmaxuw        %xmm9,%xmm12
   .byte  102,69,15,56,16,229                 // pblendvb      %xmm0,%xmm13,%xmm12
-  .byte  102,68,15,111,45,101,52,0,0         // movdqa        0x3465(%rip),%xmm13        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,45,101,52,0,0         // movdqa        0x3465(%rip),%xmm13        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,111,193                   // movdqa        %xmm9,%xmm0
   .byte  102,65,15,239,197                   // pxor          %xmm13,%xmm0
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
@@ -49117,48 +49266,48 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,202                       // movzbl        %r10b,%r9d
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,38                              // ja            27c27 <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
+  .byte  119,38                              // ja            27f87 <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  76,141,29,23,2,0,0                  // lea           0x217(%rip),%r11        # 27e24 <_sk_srcover_rgba_8888_sse41_lowp+0x248>
+  .byte  76,141,29,23,2,0,0                  // lea           0x217(%rip),%r11        # 28184 <_sk_srcover_rgba_8888_sse41_lowp+0x248>
   .byte  75,99,4,139                         // movslq        (%r11,%r9,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,110,52,144                // movd          (%r8,%rdx,4),%xmm6
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,89                              // jmp           27c80 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  .byte  235,89                              // jmp           27fe0 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,74                              // jmp           27c80 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  .byte  235,74                              // jmp           27fe0 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  243,65,15,126,52,144                // movq          (%r8,%rdx,4),%xmm6
   .byte  102,65,15,58,14,240,240             // pblendw       $0xf0,%xmm8,%xmm6
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,37                              // jmp           27c80 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  .byte  235,37                              // jmp           27fe0 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,69,15,58,34,68,144,20,1         // pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   .byte  102,69,15,58,34,68,144,16,0         // pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   .byte  243,65,15,111,52,144                // movdqu        (%r8,%rdx,4),%xmm6
-  .byte  102,15,111,37,120,58,0,0            // movdqa        0x3a78(%rip),%xmm4        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
+  .byte  102,15,111,37,120,58,0,0            // movdqa        0x3a78(%rip),%xmm4        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0x1164>
   .byte  102,15,111,238                      // movdqa        %xmm6,%xmm5
   .byte  102,15,56,0,236                     // pshufb        %xmm4,%xmm5
   .byte  102,65,15,111,248                   // movdqa        %xmm8,%xmm7
   .byte  102,15,56,0,252                     // pshufb        %xmm4,%xmm7
   .byte  102,15,108,239                      // punpcklqdq    %xmm7,%xmm5
-  .byte  102,68,15,111,37,216,50,0,0         // movdqa        0x32d8(%rip),%xmm12        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,37,216,50,0,0         // movdqa        0x32d8(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,228                   // pand          %xmm12,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
-  .byte  102,68,15,111,13,81,58,0,0          // movdqa        0x3a51(%rip),%xmm9        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
+  .byte  102,68,15,111,13,81,58,0,0          // movdqa        0x3a51(%rip),%xmm9        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0x1174>
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,65,15,56,0,249                  // pshufb        %xmm9,%xmm7
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
   .byte  102,69,15,56,0,209                  // pshufb        %xmm9,%xmm10
   .byte  102,65,15,108,250                   // punpcklqdq    %xmm10,%xmm7
-  .byte  102,68,15,111,13,62,58,0,0          // movdqa        0x3a3e(%rip),%xmm9        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
+  .byte  102,68,15,111,13,62,58,0,0          // movdqa        0x3a3e(%rip),%xmm9        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0x1184>
   .byte  102,65,15,56,0,241                  // pshufb        %xmm9,%xmm6
   .byte  102,69,15,56,0,193                  // pshufb        %xmm9,%xmm8
   .byte  102,65,15,108,240                   // punpcklqdq    %xmm8,%xmm6
@@ -49200,19 +49349,19 @@
   .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
   .byte  102,65,15,235,196                   // por           %xmm12,%xmm0
   .byte  65,128,250,6                        // cmp           $0x6,%r10b
-  .byte  119,24                              // ja            27dca <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
-  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 27e40 <_sk_srcover_rgba_8888_sse41_lowp+0x264>
+  .byte  119,24                              // ja            2812a <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
+  .byte  76,141,21,135,0,0,0                 // lea           0x87(%rip),%r10        # 281a0 <_sk_srcover_rgba_8888_sse41_lowp+0x264>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,65,15,126,4,144                 // movd          %xmm0,(%r8,%rdx,4)
-  .byte  235,63                              // jmp           27e09 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  .byte  235,63                              // jmp           28169 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   .byte  243,65,15,127,4,144                 // movdqu        %xmm0,(%r8,%rdx,4)
   .byte  243,65,15,127,76,144,16             // movdqu        %xmm1,0x10(%r8,%rdx,4)
-  .byte  235,48                              // jmp           27e09 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  .byte  235,48                              // jmp           28169 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   .byte  102,65,15,58,22,68,144,8,2          // pextrd        $0x2,%xmm0,0x8(%r8,%rdx,4)
   .byte  102,65,15,214,4,144                 // movq          %xmm0,(%r8,%rdx,4)
-  .byte  235,31                              // jmp           27e09 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  .byte  235,31                              // jmp           28169 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   .byte  102,65,15,58,22,76,144,24,2         // pextrd        $0x2,%xmm1,0x18(%r8,%rdx,4)
   .byte  102,65,15,58,22,76,144,20,1         // pextrd        $0x1,%xmm1,0x14(%r8,%rdx,4)
   .byte  102,65,15,126,76,144,16             // movd          %xmm1,0x10(%r8,%rdx,4)
@@ -49277,13 +49426,13 @@
   .byte  73,137,246                          // mov           %rsi,%r14
   .byte  72,137,77,192                       // mov           %rcx,-0x40(%rbp)
   .byte  72,57,203                           // cmp           %rcx,%rbx
-  .byte  15,131,131,0,0,0                    // jae           27f12 <_sk_start_pipeline_sse2_lowp+0xb6>
+  .byte  15,131,131,0,0,0                    // jae           28272 <_sk_start_pipeline_sse2_lowp+0xb6>
   .byte  72,139,69,208                       // mov           -0x30(%rbp),%rax
   .byte  72,141,64,8                         // lea           0x8(%rax),%rax
   .byte  72,137,69,200                       // mov           %rax,-0x38(%rbp)
   .byte  76,57,125,200                       // cmp           %r15,-0x38(%rbp)
   .byte  72,139,85,208                       // mov           -0x30(%rbp),%rdx
-  .byte  119,59                              // ja            27ee0 <_sk_start_pipeline_sse2_lowp+0x84>
+  .byte  119,59                              // ja            28240 <_sk_start_pipeline_sse2_lowp+0x84>
   .byte  76,139,101,208                      // mov           -0x30(%rbp),%r12
   .byte  49,255                              // xor           %edi,%edi
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -49302,10 +49451,10 @@
   .byte  73,131,196,16                       // add           $0x10,%r12
   .byte  77,57,252                           // cmp           %r15,%r12
   .byte  73,137,212                          // mov           %rdx,%r12
-  .byte  118,201                             // jbe           27ea9 <_sk_start_pipeline_sse2_lowp+0x4d>
+  .byte  118,201                             // jbe           28209 <_sk_start_pipeline_sse2_lowp+0x4d>
   .byte  76,137,255                          // mov           %r15,%rdi
   .byte  72,41,215                           // sub           %rdx,%rdi
-  .byte  116,33                              // je            27f09 <_sk_start_pipeline_sse2_lowp+0xad>
+  .byte  116,33                              // je            28269 <_sk_start_pipeline_sse2_lowp+0xad>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -49319,7 +49468,7 @@
   .byte  65,255,213                          // callq         *%r13
   .byte  72,255,195                          // inc           %rbx
   .byte  72,59,93,192                        // cmp           -0x40(%rbp),%rbx
-  .byte  117,137                             // jne           27e9b <_sk_start_pipeline_sse2_lowp+0x3f>
+  .byte  117,137                             // jne           281fb <_sk_start_pipeline_sse2_lowp+0x3f>
   .byte  72,131,196,24                       // add           $0x18,%rsp
   .byte  91                                  // pop           %rbx
   .byte  65,92                               // pop           %r12
@@ -49362,7 +49511,7 @@
 FUNCTION(_sk_black_color_sse2_lowp)
 _sk_black_color_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,11,48,0,0                  // movaps        0x300b(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,29,11,48,0,0                  // movaps        0x300b(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -49373,7 +49522,7 @@
 FUNCTION(_sk_white_color_sse2_lowp)
 _sk_white_color_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,5,247,47,0,0                  // movaps        0x2ff7(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,5,247,47,0,0                  // movaps        0x2ff7(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -49384,10 +49533,10 @@
 FUNCTION(_sk_set_rgb_sse2_lowp)
 _sk_set_rgb_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  243,15,16,21,118,46,0,0             // movss         0x2e76(%rip),%xmm2        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  243,15,16,21,118,46,0,0             // movss         0x2e76(%rip),%xmm2        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   .byte  243,15,16,0                         // movss         (%rax),%xmm0
   .byte  243,15,89,194                       // mulss         %xmm2,%xmm0
-  .byte  243,68,15,16,5,53,46,0,0            // movss         0x2e35(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,16,5,53,46,0,0            // movss         0x2e35(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  243,65,15,88,192                    // addss         %xmm8,%xmm0
   .byte  243,68,15,44,192                    // cvttss2si     %xmm0,%r8d
   .byte  102,65,15,110,192                   // movd          %r8d,%xmm0
@@ -49414,7 +49563,7 @@
 FUNCTION(_sk_premul_sse2_lowp)
 _sk_premul_sse2_lowp:
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,105,47,0,0          // movdqa        0x2f69(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,105,47,0,0          // movdqa        0x2f69(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
@@ -49462,7 +49611,7 @@
 .globl _sk_invert_sse2_lowp
 FUNCTION(_sk_invert_sse2_lowp)
 _sk_invert_sse2_lowp:
-  .byte  102,68,15,111,5,7,47,0,0            // movdqa        0x2f07(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,7,47,0,0            // movdqa        0x2f07(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,200                   // psubw         %xmm0,%xmm9
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -49494,7 +49643,7 @@
 _sk_srcatop_sse2_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,15,111,29,171,46,0,0            // movdqa        0x2eab(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,111,29,171,46,0,0            // movdqa        0x2eab(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,111,203                   // movdqa        %xmm3,%xmm9
   .byte  102,69,15,249,200                   // psubw         %xmm8,%xmm9
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
@@ -49526,7 +49675,7 @@
 _sk_dstatop_sse2_lowp:
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
   .byte  102,68,15,213,195                   // pmullw        %xmm3,%xmm8
-  .byte  102,68,15,111,13,43,46,0,0          // movdqa        0x2e2b(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,43,46,0,0          // movdqa        0x2e2b(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,253,193                   // paddw         %xmm9,%xmm8
   .byte  102,68,15,111,213                   // movdqa        %xmm5,%xmm10
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
@@ -49555,7 +49704,7 @@
 FUNCTION(_sk_srcin_sse2_lowp)
 _sk_srcin_sse2_lowp:
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,68,15,111,5,182,45,0,0          // movdqa        0x2db6(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,182,45,0,0          // movdqa        0x2db6(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,207                      // pmullw        %xmm7,%xmm1
@@ -49576,7 +49725,7 @@
 _sk_dstin_sse2_lowp:
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,68,15,111,5,109,45,0,0          // movdqa        0x2d6d(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,109,45,0,0          // movdqa        0x2d6d(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -49597,7 +49746,7 @@
 .globl _sk_srcout_sse2_lowp
 FUNCTION(_sk_srcout_sse2_lowp)
 _sk_srcout_sse2_lowp:
-  .byte  102,68,15,111,5,36,45,0,0           // movdqa        0x2d24(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,36,45,0,0           // movdqa        0x2d24(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -49620,7 +49769,7 @@
 FUNCTION(_sk_dstout_sse2_lowp)
 _sk_dstout_sse2_lowp:
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,68,15,111,5,205,44,0,0          // movdqa        0x2ccd(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,205,44,0,0          // movdqa        0x2ccd(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  102,15,249,216                      // psubw         %xmm0,%xmm3
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
@@ -49645,7 +49794,7 @@
 .globl _sk_srcover_sse2_lowp
 FUNCTION(_sk_srcover_sse2_lowp)
 _sk_srcover_sse2_lowp:
-  .byte  102,68,15,111,13,115,44,0,0         // movdqa        0x2c73(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,115,44,0,0         // movdqa        0x2c73(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -49674,7 +49823,7 @@
 .globl _sk_dstover_sse2_lowp
 FUNCTION(_sk_dstover_sse2_lowp)
 _sk_dstover_sse2_lowp:
-  .byte  102,68,15,111,5,249,43,0,0          // movdqa        0x2bf9(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,249,43,0,0          // movdqa        0x2bf9(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,68,15,249,207                   // psubw         %xmm7,%xmm9
   .byte  102,65,15,213,193                   // pmullw        %xmm9,%xmm0
@@ -49701,7 +49850,7 @@
 FUNCTION(_sk_modulate_sse2_lowp)
 _sk_modulate_sse2_lowp:
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
-  .byte  102,68,15,111,5,146,43,0,0          // movdqa        0x2b92(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,146,43,0,0          // movdqa        0x2b92(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,192                   // paddw         %xmm8,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
@@ -49720,7 +49869,7 @@
 .globl _sk_multiply_sse2_lowp
 FUNCTION(_sk_multiply_sse2_lowp)
 _sk_multiply_sse2_lowp:
-  .byte  102,68,15,111,13,81,43,0,0          // movdqa        0x2b51(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,81,43,0,0          // movdqa        0x2b51(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,193                   // movdqa        %xmm9,%xmm8
   .byte  102,68,15,249,195                   // psubw         %xmm3,%xmm8
   .byte  102,69,15,111,208                   // movdqa        %xmm8,%xmm10
@@ -49765,12 +49914,12 @@
   .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,253,204                      // paddw         %xmm4,%xmm1
-  .byte  102,68,15,111,21,189,50,0,0         // movdqa        0x32bd(%rip),%xmm10        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0x1214>
+  .byte  102,68,15,111,21,189,50,0,0         // movdqa        0x32bd(%rip),%xmm10        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0x1214>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,217,194                   // psubusw       %xmm10,%xmm0
   .byte  102,69,15,239,228                   // pxor          %xmm12,%xmm12
   .byte  102,65,15,117,196                   // pcmpeqw       %xmm12,%xmm0
-  .byte  102,68,15,111,29,113,42,0,0         // movdqa        0x2a71(%rip),%xmm11        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,29,113,42,0,0         // movdqa        0x2a71(%rip),%xmm11        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  102,65,15,223,195                   // pandn         %xmm11,%xmm0
   .byte  102,15,235,193                      // por           %xmm1,%xmm0
@@ -49809,7 +49958,7 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,21,209,41,0,0         // movdqa        0x29d1(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,209,41,0,0         // movdqa        0x29d1(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -49841,7 +49990,7 @@
 FUNCTION(_sk_xor__sse2_lowp)
 _sk_xor__sse2_lowp:
   .byte  102,68,15,111,195                   // movdqa        %xmm3,%xmm8
-  .byte  102,68,15,111,13,79,41,0,0          // movdqa        0x294f(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,79,41,0,0          // movdqa        0x294f(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,209                   // movdqa        %xmm9,%xmm10
   .byte  102,68,15,249,215                   // psubw         %xmm7,%xmm10
   .byte  102,65,15,213,194                   // pmullw        %xmm10,%xmm0
@@ -49883,7 +50032,7 @@
   .byte  102,65,15,253,194                   // paddw         %xmm10,%xmm0
   .byte  102,68,15,213,215                   // pmullw        %xmm7,%xmm10
   .byte  102,68,15,213,227                   // pmullw        %xmm3,%xmm12
-  .byte  102,68,15,111,13,10,48,0,0          // movdqa        0x300a(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,13,10,48,0,0          // movdqa        0x300a(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,69,15,111,218                   // movdqa        %xmm10,%xmm11
   .byte  102,69,15,239,217                   // pxor          %xmm9,%xmm11
   .byte  102,65,15,111,204                   // movdqa        %xmm12,%xmm1
@@ -49892,7 +50041,7 @@
   .byte  102,68,15,219,225                   // pand          %xmm1,%xmm12
   .byte  102,65,15,223,202                   // pandn         %xmm10,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,21,105,40,0,0         // movdqa        0x2869(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,105,40,0,0         // movdqa        0x2869(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -49948,7 +50097,7 @@
   .byte  102,65,15,253,196                   // paddw         %xmm12,%xmm0
   .byte  102,68,15,213,231                   // pmullw        %xmm7,%xmm12
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
-  .byte  102,68,15,111,13,225,46,0,0         // movdqa        0x2ee1(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,13,225,46,0,0         // movdqa        0x2ee1(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,69,15,111,220                   // movdqa        %xmm12,%xmm11
   .byte  102,69,15,239,217                   // pxor          %xmm9,%xmm11
   .byte  102,65,15,111,202                   // movdqa        %xmm10,%xmm1
@@ -49957,7 +50106,7 @@
   .byte  102,68,15,219,225                   // pand          %xmm1,%xmm12
   .byte  102,65,15,223,202                   // pandn         %xmm10,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,21,64,39,0,0          // movdqa        0x2740(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,64,39,0,0          // movdqa        0x2740(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -50013,7 +50162,7 @@
   .byte  102,65,15,253,196                   // paddw         %xmm12,%xmm0
   .byte  102,68,15,213,231                   // pmullw        %xmm7,%xmm12
   .byte  102,68,15,213,211                   // pmullw        %xmm3,%xmm10
-  .byte  102,68,15,111,13,184,45,0,0         // movdqa        0x2db8(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,13,184,45,0,0         // movdqa        0x2db8(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,69,15,111,220                   // movdqa        %xmm12,%xmm11
   .byte  102,69,15,239,217                   // pxor          %xmm9,%xmm11
   .byte  102,65,15,111,202                   // movdqa        %xmm10,%xmm1
@@ -50022,10 +50171,10 @@
   .byte  102,68,15,219,225                   // pand          %xmm1,%xmm12
   .byte  102,65,15,223,202                   // pandn         %xmm10,%xmm1
   .byte  102,65,15,235,204                   // por           %xmm12,%xmm1
-  .byte  102,68,15,111,21,23,38,0,0          // movdqa        0x2617(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,23,38,0,0          // movdqa        0x2617(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,202                   // paddw         %xmm10,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,29,100,45,0,0         // movdqa        0x2d64(%rip),%xmm11        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
+  .byte  102,68,15,111,29,100,45,0,0         // movdqa        0x2d64(%rip),%xmm11        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
   .byte  102,65,15,219,203                   // pand          %xmm11,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,68,15,111,229                   // movdqa        %xmm5,%xmm12
@@ -50080,10 +50229,10 @@
   .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
-  .byte  102,68,15,111,13,20,37,0,0          // movdqa        0x2514(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,20,37,0,0          // movdqa        0x2514(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,201                   // paddw         %xmm9,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,68,15,111,21,97,44,0,0          // movdqa        0x2c61(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
+  .byte  102,68,15,111,21,97,44,0,0          // movdqa        0x2c61(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0x1144>
   .byte  102,65,15,219,202                   // pand          %xmm10,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
@@ -50119,7 +50268,7 @@
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,68,15,111,194                   // movdqa        %xmm2,%xmm8
   .byte  102,68,15,111,200                   // movdqa        %xmm0,%xmm9
-  .byte  102,15,111,21,112,36,0,0            // movdqa        0x2470(%rip),%xmm2        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,111,21,112,36,0,0            // movdqa        0x2470(%rip),%xmm2        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,111,226                   // movdqa        %xmm2,%xmm12
   .byte  102,68,15,249,231                   // psubw         %xmm7,%xmm12
   .byte  102,65,15,111,196                   // movdqa        %xmm12,%xmm0
@@ -50132,7 +50281,7 @@
   .byte  102,68,15,111,243                   // movdqa        %xmm3,%xmm14
   .byte  102,69,15,249,241                   // psubw         %xmm9,%xmm14
   .byte  102,69,15,253,201                   // paddw         %xmm9,%xmm9
-  .byte  102,15,111,21,156,43,0,0            // movdqa        0x2b9c(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,15,111,21,156,43,0,0            // movdqa        0x2b9c(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,15,111,199                      // movdqa        %xmm7,%xmm0
   .byte  102,68,15,111,215                   // movdqa        %xmm7,%xmm10
   .byte  102,15,111,231                      // movdqa        %xmm7,%xmm4
@@ -50151,7 +50300,7 @@
   .byte  102,68,15,219,232                   // pand          %xmm0,%xmm13
   .byte  102,65,15,223,193                   // pandn         %xmm9,%xmm0
   .byte  102,65,15,235,197                   // por           %xmm13,%xmm0
-  .byte  102,15,253,5,207,35,0,0             // paddw         0x23cf(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,253,5,207,35,0,0             // paddw         0x23cf(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,199                   // paddw         %xmm15,%xmm0
   .byte  102,69,15,111,204                   // movdqa        %xmm12,%xmm9
   .byte  102,68,15,213,201                   // pmullw        %xmm1,%xmm9
@@ -50174,7 +50323,7 @@
   .byte  102,65,15,219,249                   // pand          %xmm9,%xmm7
   .byte  102,68,15,223,201                   // pandn         %xmm1,%xmm9
   .byte  102,68,15,235,207                   // por           %xmm7,%xmm9
-  .byte  102,68,15,253,13,90,35,0,0          // paddw         0x235a(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,253,13,90,35,0,0          // paddw         0x235a(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,253,205                   // paddw         %xmm13,%xmm9
   .byte  102,69,15,213,224                   // pmullw        %xmm8,%xmm12
   .byte  102,69,15,111,251                   // movdqa        %xmm11,%xmm15
@@ -50196,7 +50345,7 @@
   .byte  102,68,15,219,210                   // pand          %xmm2,%xmm10
   .byte  102,65,15,223,208                   // pandn         %xmm8,%xmm2
   .byte  102,65,15,235,210                   // por           %xmm10,%xmm2
-  .byte  102,68,15,111,5,234,34,0,0          // movdqa        0x22ea(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,234,34,0,0          // movdqa        0x22ea(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,208                   // paddw         %xmm8,%xmm2
   .byte  102,65,15,253,215                   // paddw         %xmm15,%xmm2
   .byte  102,68,15,213,220                   // pmullw        %xmm4,%xmm11
@@ -50224,7 +50373,7 @@
   .byte  102,15,127,124,36,232               // movdqa        %xmm7,-0x18(%rsp)
   .byte  102,68,15,111,193                   // movdqa        %xmm1,%xmm8
   .byte  102,68,15,111,248                   // movdqa        %xmm0,%xmm15
-  .byte  102,15,111,53,123,34,0,0            // movdqa        0x227b(%rip),%xmm6        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,111,53,123,34,0,0            // movdqa        0x227b(%rip),%xmm6        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,111,222                   // movdqa        %xmm6,%xmm11
   .byte  102,69,15,249,222                   // psubw         %xmm14,%xmm11
   .byte  102,65,15,111,203                   // movdqa        %xmm11,%xmm1
@@ -50246,7 +50395,7 @@
   .byte  102,15,253,201                      // paddw         %xmm1,%xmm1
   .byte  102,69,15,111,225                   // movdqa        %xmm9,%xmm12
   .byte  102,68,15,249,225                   // psubw         %xmm1,%xmm12
-  .byte  102,15,111,13,127,41,0,0            // movdqa        0x297f(%rip),%xmm1        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,15,111,13,127,41,0,0            // movdqa        0x297f(%rip),%xmm1        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,69,15,111,238                   // movdqa        %xmm14,%xmm13
   .byte  102,68,15,239,233                   // pxor          %xmm1,%xmm13
   .byte  102,15,239,249                      // pxor          %xmm1,%xmm7
@@ -50273,7 +50422,7 @@
   .byte  102,68,15,213,197                   // pmullw        %xmm5,%xmm8
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,15,253,228                      // paddw         %xmm4,%xmm4
-  .byte  102,15,111,61,254,40,0,0            // movdqa        0x28fe(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,15,111,61,254,40,0,0            // movdqa        0x28fe(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,15,239,231                      // pxor          %xmm7,%xmm4
   .byte  102,65,15,101,229                   // pcmpgtw       %xmm13,%xmm4
   .byte  102,69,15,253,192                   // paddw         %xmm8,%xmm8
@@ -50333,27 +50482,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            28f08 <_sk_load_8888_sse2_lowp+0x44>
+  .byte  119,41                              // ja            29268 <_sk_load_8888_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 29004 <_sk_load_8888_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 29364 <_sk_load_8888_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,28,144                 // movss         (%r8,%rdx,4),%xmm3
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           28f6e <_sk_load_8888_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           292ce <_sk_load_8888_sse2_lowp+0xaa>
   .byte  102,65,15,16,28,144                 // movupd        (%r8,%rdx,4),%xmm3
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           28f6e <_sk_load_8888_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           292ce <_sk_load_8888_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,216                    // movapd        %xmm8,%xmm3
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  235,52                              // jmp           28f6e <_sk_load_8888_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           292ce <_sk_load_8888_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  243,65,15,16,68,144,20              // movss         0x14(%r8,%rdx,4),%xmm0
@@ -50370,7 +50519,7 @@
   .byte  102,15,114,240,16                   // pslld         $0x10,%xmm0
   .byte  102,15,114,224,16                   // psrad         $0x10,%xmm0
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,68,15,111,13,232,31,0,0         // movdqa        0x1fe8(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,232,31,0,0         // movdqa        0x1fe8(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,65,15,219,193                   // pand          %xmm9,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -50423,27 +50572,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            29064 <_sk_load_8888_dst_sse2_lowp+0x44>
+  .byte  119,41                              // ja            293c4 <_sk_load_8888_dst_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 29160 <_sk_load_8888_dst_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 294c0 <_sk_load_8888_dst_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           290ca <_sk_load_8888_dst_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           2942a <_sk_load_8888_dst_sse2_lowp+0xaa>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           290ca <_sk_load_8888_dst_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           2942a <_sk_load_8888_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           290ca <_sk_load_8888_dst_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           2942a <_sk_load_8888_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -50460,7 +50609,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,13,140,30,0,0         // movdqa        0x1e8c(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,140,30,0,0         // movdqa        0x1e8c(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,225                   // pand          %xmm9,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -50528,21 +50677,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            291ff <_sk_store_8888_sse2_lowp+0x83>
+  .byte  119,27                              // ja            2955f <_sk_store_8888_sse2_lowp+0x83>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 29250 <_sk_store_8888_sse2_lowp+0xd4>
+  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 295b0 <_sk_store_8888_sse2_lowp+0xd4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,12,144                // movd          %xmm9,(%r8,%rdx,4)
-  .byte  235,75                              // jmp           2924a <_sk_store_8888_sse2_lowp+0xce>
+  .byte  235,75                              // jmp           295aa <_sk_store_8888_sse2_lowp+0xce>
   .byte  243,69,15,127,12,144                // movdqu        %xmm9,(%r8,%rdx,4)
   .byte  243,69,15,127,68,144,16             // movdqu        %xmm8,0x10(%r8,%rdx,4)
-  .byte  235,60                              // jmp           2924a <_sk_store_8888_sse2_lowp+0xce>
+  .byte  235,60                              // jmp           295aa <_sk_store_8888_sse2_lowp+0xce>
   .byte  102,69,15,112,193,78                // pshufd        $0x4e,%xmm9,%xmm8
   .byte  102,69,15,126,68,144,8              // movd          %xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,12,144                // movq          %xmm9,(%r8,%rdx,4)
-  .byte  235,39                              // jmp           2924a <_sk_store_8888_sse2_lowp+0xce>
+  .byte  235,39                              // jmp           295aa <_sk_store_8888_sse2_lowp+0xce>
   .byte  102,69,15,112,208,78                // pshufd        $0x4e,%xmm8,%xmm10
   .byte  102,69,15,126,84,144,24             // movd          %xmm10,0x18(%r8,%rdx,4)
   .byte  102,69,15,112,208,229               // pshufd        $0xe5,%xmm8,%xmm10
@@ -50587,27 +50736,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            292b0 <_sk_load_bgra_sse2_lowp+0x44>
+  .byte  119,41                              // ja            29610 <_sk_load_bgra_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 293ac <_sk_load_bgra_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 2970c <_sk_load_bgra_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,28,144                 // movss         (%r8,%rdx,4),%xmm3
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           29316 <_sk_load_bgra_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           29676 <_sk_load_bgra_sse2_lowp+0xaa>
   .byte  102,65,15,16,28,144                 // movupd        (%r8,%rdx,4),%xmm3
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           29316 <_sk_load_bgra_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           29676 <_sk_load_bgra_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,8              // movd          0x8(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,216                    // movapd        %xmm8,%xmm3
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
-  .byte  235,52                              // jmp           29316 <_sk_load_bgra_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           29676 <_sk_load_bgra_sse2_lowp+0xaa>
   .byte  102,65,15,110,68,144,24             // movd          0x18(%r8,%rdx,4),%xmm0
   .byte  102,68,15,112,192,69                // pshufd        $0x45,%xmm0,%xmm8
   .byte  243,65,15,16,68,144,20              // movss         0x14(%r8,%rdx,4),%xmm0
@@ -50624,7 +50773,7 @@
   .byte  102,15,114,240,16                   // pslld         $0x10,%xmm0
   .byte  102,15,114,224,16                   // psrad         $0x10,%xmm0
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,68,15,111,13,64,28,0,0          // movdqa        0x1c40(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,64,28,0,0          // movdqa        0x1c40(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,65,15,219,209                   // pand          %xmm9,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -50677,27 +50826,27 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,41                              // ja            2940c <_sk_load_bgra_dst_sse2_lowp+0x44>
+  .byte  119,41                              // ja            2976c <_sk_load_bgra_dst_sse2_lowp+0x44>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 29508 <_sk_load_bgra_dst_sse2_lowp+0x140>
+  .byte  76,141,13,22,1,0,0                  // lea           0x116(%rip),%r9        # 29868 <_sk_load_bgra_dst_sse2_lowp+0x140>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           29472 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  .byte  235,102                             // jmp           297d2 <_sk_load_bgra_dst_sse2_lowp+0xaa>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           29472 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  .byte  235,87                              // jmp           297d2 <_sk_load_bgra_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           29472 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  .byte  235,52                              // jmp           297d2 <_sk_load_bgra_dst_sse2_lowp+0xaa>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -50714,7 +50863,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,13,228,26,0,0         // movdqa        0x1ae4(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,228,26,0,0         // movdqa        0x1ae4(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,65,15,219,241                   // pand          %xmm9,%xmm6
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -50782,21 +50931,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,27                              // ja            295a7 <_sk_store_bgra_sse2_lowp+0x83>
+  .byte  119,27                              // ja            29907 <_sk_store_bgra_sse2_lowp+0x83>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 295f8 <_sk_store_bgra_sse2_lowp+0xd4>
+  .byte  76,141,13,98,0,0,0                  // lea           0x62(%rip),%r9        # 29958 <_sk_store_bgra_sse2_lowp+0xd4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,12,144                // movd          %xmm9,(%r8,%rdx,4)
-  .byte  235,75                              // jmp           295f2 <_sk_store_bgra_sse2_lowp+0xce>
+  .byte  235,75                              // jmp           29952 <_sk_store_bgra_sse2_lowp+0xce>
   .byte  243,69,15,127,12,144                // movdqu        %xmm9,(%r8,%rdx,4)
   .byte  243,69,15,127,68,144,16             // movdqu        %xmm8,0x10(%r8,%rdx,4)
-  .byte  235,60                              // jmp           295f2 <_sk_store_bgra_sse2_lowp+0xce>
+  .byte  235,60                              // jmp           29952 <_sk_store_bgra_sse2_lowp+0xce>
   .byte  102,69,15,112,193,78                // pshufd        $0x4e,%xmm9,%xmm8
   .byte  102,69,15,126,68,144,8              // movd          %xmm8,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,12,144                // movq          %xmm9,(%r8,%rdx,4)
-  .byte  235,39                              // jmp           295f2 <_sk_store_bgra_sse2_lowp+0xce>
+  .byte  235,39                              // jmp           29952 <_sk_store_bgra_sse2_lowp+0xce>
   .byte  102,69,15,112,208,78                // pshufd        $0x4e,%xmm8,%xmm10
   .byte  102,69,15,126,84,144,24             // movd          %xmm10,0x18(%r8,%rdx,4)
   .byte  102,69,15,112,208,229               // pshufd        $0xe5,%xmm8,%xmm10
@@ -50841,23 +50990,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            29650 <_sk_load_565_sse2_lowp+0x3c>
+  .byte  119,34                              // ja            299b0 <_sk_load_565_sse2_lowp+0x3c>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,188,0,0,0                 // lea           0xbc(%rip),%r9        # 296f8 <_sk_load_565_sse2_lowp+0xe4>
+  .byte  76,141,13,188,0,0,0                 // lea           0xbc(%rip),%r9        # 29a58 <_sk_load_565_sse2_lowp+0xe4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,66                              // jmp           29692 <_sk_load_565_sse2_lowp+0x7e>
+  .byte  235,66                              // jmp           299f2 <_sk_load_565_sse2_lowp+0x7e>
   .byte  243,65,15,111,4,80                  // movdqu        (%r8,%rdx,2),%xmm0
-  .byte  235,58                              // jmp           29692 <_sk_load_565_sse2_lowp+0x7e>
+  .byte  235,58                              // jmp           299f2 <_sk_load_565_sse2_lowp+0x7e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   .byte  243,65,15,16,12,80                  // movss         (%r8,%rdx,2),%xmm1
   .byte  243,15,16,193                       // movss         %xmm1,%xmm0
-  .byte  235,34                              // jmp           29692 <_sk_load_565_sse2_lowp+0x7e>
+  .byte  235,34                              // jmp           299f2 <_sk_load_565_sse2_lowp+0x7e>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,65,15,196,68,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   .byte  102,65,15,196,68,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -50865,11 +51014,11 @@
   .byte  102,65,15,18,4,80                   // movlpd        (%r8,%rdx,2),%xmm0
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
-  .byte  102,15,219,29,141,32,0,0            // pand          0x208d(%rip),%xmm3        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,15,219,29,141,32,0,0            // pand          0x208d(%rip),%xmm3        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,13,140,32,0,0            // pand          0x208c(%rip),%xmm1        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,15,111,21,148,32,0,0            // movdqa        0x2094(%rip),%xmm2        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,15,219,13,140,32,0,0            // pand          0x208c(%rip),%xmm1        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,15,111,21,148,32,0,0            // movdqa        0x2094(%rip),%xmm2        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,195                      // por           %xmm3,%xmm0
@@ -50882,7 +51031,7 @@
   .byte  102,15,113,210,2                    // psrlw         $0x2,%xmm2
   .byte  102,15,235,211                      // por           %xmm3,%xmm2
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,138,24,0,0                 // movaps        0x188a(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,29,138,24,0,0                 // movaps        0x188a(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  255,224                             // jmpq          *%rax
   .byte  77,255                              // rex.WRB       (bad)
   .byte  255                                 // (bad)
@@ -50908,23 +51057,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            29750 <_sk_load_565_dst_sse2_lowp+0x3c>
+  .byte  119,34                              // ja            29ab0 <_sk_load_565_dst_sse2_lowp+0x3c>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,188,0,0,0                 // lea           0xbc(%rip),%r9        # 297f8 <_sk_load_565_dst_sse2_lowp+0xe4>
+  .byte  76,141,13,188,0,0,0                 // lea           0xbc(%rip),%r9        # 29b58 <_sk_load_565_dst_sse2_lowp+0xe4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,66                              // jmp           29792 <_sk_load_565_dst_sse2_lowp+0x7e>
+  .byte  235,66                              // jmp           29af2 <_sk_load_565_dst_sse2_lowp+0x7e>
   .byte  243,65,15,111,36,80                 // movdqu        (%r8,%rdx,2),%xmm4
-  .byte  235,58                              // jmp           29792 <_sk_load_565_dst_sse2_lowp+0x7e>
+  .byte  235,58                              // jmp           29af2 <_sk_load_565_dst_sse2_lowp+0x7e>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,65,15,196,100,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm4
   .byte  243,65,15,16,44,80                  // movss         (%r8,%rdx,2),%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,34                              // jmp           29792 <_sk_load_565_dst_sse2_lowp+0x7e>
+  .byte  235,34                              // jmp           29af2 <_sk_load_565_dst_sse2_lowp+0x7e>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,65,15,196,100,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm4
   .byte  102,65,15,196,100,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm4
@@ -50932,11 +51081,11 @@
   .byte  102,65,15,18,36,80                  // movlpd        (%r8,%rdx,2),%xmm4
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
   .byte  102,15,113,215,8                    // psrlw         $0x8,%xmm7
-  .byte  102,15,219,61,141,31,0,0            // pand          0x1f8d(%rip),%xmm7        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,15,219,61,141,31,0,0            // pand          0x1f8d(%rip),%xmm7        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,113,213,5                    // psrlw         $0x5,%xmm5
-  .byte  102,15,219,45,140,31,0,0            // pand          0x1f8c(%rip),%xmm5        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,15,111,53,148,31,0,0            // movdqa        0x1f94(%rip),%xmm6        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,15,219,45,140,31,0,0            // pand          0x1f8c(%rip),%xmm5        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,15,111,53,148,31,0,0            // movdqa        0x1f94(%rip),%xmm6        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,15,219,244                      // pand          %xmm4,%xmm6
   .byte  102,15,113,212,13                   // psrlw         $0xd,%xmm4
   .byte  102,15,235,231                      // por           %xmm7,%xmm4
@@ -50949,7 +51098,7 @@
   .byte  102,15,113,214,2                    // psrlw         $0x2,%xmm6
   .byte  102,15,235,247                      // por           %xmm7,%xmm6
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,138,23,0,0                 // movaps        0x178a(%rip),%xmm7        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,61,138,23,0,0                 // movaps        0x178a(%rip),%xmm7        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  255,224                             // jmpq          *%rax
   .byte  77,255                              // rex.WRB       (bad)
   .byte  255                                 // (bad)
@@ -50973,10 +51122,10 @@
   .byte  76,3,0                              // add           (%rax),%r8
   .byte  102,68,15,111,192                   // movdqa        %xmm0,%xmm8
   .byte  102,65,15,113,240,8                 // psllw         $0x8,%xmm8
-  .byte  102,68,15,219,5,40,31,0,0           // pand          0x1f28(%rip),%xmm8        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0x11c4>
+  .byte  102,68,15,219,5,40,31,0,0           // pand          0x1f28(%rip),%xmm8        # 2bac0 <_sk_srcover_rgba_8888_sse2_lowp+0x11c4>
   .byte  102,68,15,111,201                   // movdqa        %xmm1,%xmm9
   .byte  102,65,15,113,241,3                 // psllw         $0x3,%xmm9
-  .byte  102,68,15,219,13,36,31,0,0          // pand          0x1f24(%rip),%xmm9        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0x11d4>
+  .byte  102,68,15,219,13,36,31,0,0          // pand          0x1f24(%rip),%xmm9        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0x11d4>
   .byte  102,69,15,235,200                   // por           %xmm8,%xmm9
   .byte  102,68,15,111,194                   // movdqa        %xmm2,%xmm8
   .byte  102,65,15,113,208,3                 // psrlw         $0x3,%xmm8
@@ -50985,21 +51134,21 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,31                              // ja            2988a <_sk_store_565_sse2_lowp+0x76>
+  .byte  119,31                              // ja            29bea <_sk_store_565_sse2_lowp+0x76>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,95,0,0,0                  // lea           0x5f(%rip),%r9        # 298d4 <_sk_store_565_sse2_lowp+0xc0>
+  .byte  76,141,13,95,0,0,0                  // lea           0x5f(%rip),%r9        # 29c34 <_sk_store_565_sse2_lowp+0xc0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,65,137,4,80                     // mov           %ax,(%r8,%rdx,2)
-  .byte  235,70                              // jmp           298d0 <_sk_store_565_sse2_lowp+0xbc>
+  .byte  235,70                              // jmp           29c30 <_sk_store_565_sse2_lowp+0xbc>
   .byte  243,69,15,127,4,80                  // movdqu        %xmm8,(%r8,%rdx,2)
-  .byte  235,62                              // jmp           298d0 <_sk_store_565_sse2_lowp+0xbc>
+  .byte  235,62                              // jmp           29c30 <_sk_store_565_sse2_lowp+0xbc>
   .byte  102,65,15,197,192,2                 // pextrw        $0x2,%xmm8,%eax
   .byte  102,65,137,68,80,4                  // mov           %ax,0x4(%r8,%rdx,2)
   .byte  102,69,15,126,4,80                  // movd          %xmm8,(%r8,%rdx,2)
-  .byte  235,42                              // jmp           298d0 <_sk_store_565_sse2_lowp+0xbc>
+  .byte  235,42                              // jmp           29c30 <_sk_store_565_sse2_lowp+0xbc>
   .byte  102,65,15,197,192,6                 // pextrw        $0x6,%xmm8,%eax
   .byte  102,65,137,68,80,12                 // mov           %ax,0xc(%r8,%rdx,2)
   .byte  102,65,15,197,192,5                 // pextrw        $0x5,%xmm8,%eax
@@ -51043,19 +51192,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            29929 <_sk_load_a8_sse2_lowp+0x39>
+  .byte  119,34                              // ja            29c89 <_sk_load_a8_sse2_lowp+0x39>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,139,0,0,0                 // lea           0x8b(%rip),%r9        # 299a0 <_sk_load_a8_sse2_lowp+0xb0>
+  .byte  76,141,13,139,0,0,0                 // lea           0x8b(%rip),%r9        # 29d00 <_sk_load_a8_sse2_lowp+0xb0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,216                      // movd          %eax,%xmm3
-  .byte  235,97                              // jmp           2998a <_sk_load_a8_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           29cea <_sk_load_a8_sse2_lowp+0x9a>
   .byte  243,65,15,126,28,16                 // movq          (%r8,%rdx,1),%xmm3
   .byte  102,15,96,216                       // punpcklbw     %xmm0,%xmm3
-  .byte  235,85                              // jmp           2998a <_sk_load_a8_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           29cea <_sk_load_a8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,216,2                    // pinsrw        $0x2,%eax,%xmm3
@@ -51063,7 +51212,7 @@
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  243,15,16,216                       // movss         %xmm0,%xmm3
-  .byte  235,51                              // jmp           2998a <_sk_load_a8_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           29cea <_sk_load_a8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,216,6                    // pinsrw        $0x6,%eax,%xmm3
@@ -51074,14 +51223,14 @@
   .byte  102,65,15,110,4,16                  // movd          (%r8,%rdx,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  242,15,16,216                       // movsd         %xmm0,%xmm3
-  .byte  102,15,219,29,238,21,0,0            // pand          0x15ee(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,29,238,21,0,0            // pand          0x15ee(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  126,255                             // jle           299a1 <_sk_load_a8_sse2_lowp+0xb1>
+  .byte  126,255                             // jle           29d01 <_sk_load_a8_sse2_lowp+0xb1>
   .byte  255                                 // (bad)
   .byte  255,164,255,255,255,149,255         // jmpq          *-0x6a0001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -51111,19 +51260,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            299f5 <_sk_load_a8_dst_sse2_lowp+0x39>
+  .byte  119,34                              // ja            29d55 <_sk_load_a8_dst_sse2_lowp+0x39>
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,139,0,0,0                 // lea           0x8b(%rip),%r9        # 29a6c <_sk_load_a8_dst_sse2_lowp+0xb0>
+  .byte  76,141,13,139,0,0,0                 // lea           0x8b(%rip),%r9        # 29dcc <_sk_load_a8_dst_sse2_lowp+0xb0>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,248                      // movd          %eax,%xmm7
-  .byte  235,97                              // jmp           29a56 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           29db6 <_sk_load_a8_dst_sse2_lowp+0x9a>
   .byte  243,65,15,126,60,16                 // movq          (%r8,%rdx,1),%xmm7
   .byte  102,15,96,248                       // punpcklbw     %xmm0,%xmm7
-  .byte  235,85                              // jmp           29a56 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           29db6 <_sk_load_a8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  102,15,196,248,2                    // pinsrw        $0x2,%eax,%xmm7
@@ -51131,7 +51280,7 @@
   .byte  102,15,110,224                      // movd          %eax,%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  243,15,16,252                       // movss         %xmm4,%xmm7
-  .byte  235,51                              // jmp           29a56 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           29db6 <_sk_load_a8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  102,15,196,248,6                    // pinsrw        $0x6,%eax,%xmm7
@@ -51142,14 +51291,14 @@
   .byte  102,65,15,110,36,16                 // movd          (%r8,%rdx,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  242,15,16,252                       // movsd         %xmm4,%xmm7
-  .byte  102,15,219,61,34,21,0,0             // pand          0x1522(%rip),%xmm7        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,61,34,21,0,0             // pand          0x1522(%rip),%xmm7        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  126,255                             // jle           29a6d <_sk_load_a8_dst_sse2_lowp+0xb1>
+  .byte  126,255                             // jle           29dcd <_sk_load_a8_dst_sse2_lowp+0xb1>
   .byte  255                                 // (bad)
   .byte  255,164,255,255,255,149,255         // jmpq          *-0x6a0001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -51179,42 +51328,42 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,29                              // ja            29abc <_sk_store_a8_sse2_lowp+0x34>
+  .byte  119,29                              // ja            29e1c <_sk_store_a8_sse2_lowp+0x34>
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 29b3c <_sk_store_a8_sse2_lowp+0xb4>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 29e9c <_sk_store_a8_sse2_lowp+0xb4>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,15,126,216                      // movd          %xmm3,%eax
   .byte  65,136,4,16                         // mov           %al,(%r8,%rdx,1)
-  .byte  235,123                             // jmp           29b37 <_sk_store_a8_sse2_lowp+0xaf>
-  .byte  102,68,15,111,5,187,20,0,0          // movdqa        0x14bb(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  235,123                             // jmp           29e97 <_sk_store_a8_sse2_lowp+0xaf>
+  .byte  102,68,15,111,5,187,20,0,0          // movdqa        0x14bb(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,219,195                   // pand          %xmm3,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,69,15,214,4,16                  // movq          %xmm8,(%r8,%rdx,1)
-  .byte  235,96                              // jmp           29b37 <_sk_store_a8_sse2_lowp+0xaf>
+  .byte  235,96                              // jmp           29e97 <_sk_store_a8_sse2_lowp+0xaf>
   .byte  102,15,197,195,2                    // pextrw        $0x2,%xmm3,%eax
   .byte  65,136,68,16,2                      // mov           %al,0x2(%r8,%rdx,1)
-  .byte  102,68,15,111,5,150,20,0,0          // movdqa        0x1496(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,150,20,0,0          // movdqa        0x1496(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,219,195                   // pand          %xmm3,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,68,15,126,192                   // movd          %xmm8,%eax
   .byte  102,65,137,4,16                     // mov           %ax,(%r8,%rdx,1)
-  .byte  235,55                              // jmp           29b37 <_sk_store_a8_sse2_lowp+0xaf>
+  .byte  235,55                              // jmp           29e97 <_sk_store_a8_sse2_lowp+0xaf>
   .byte  102,15,197,195,6                    // pextrw        $0x6,%xmm3,%eax
   .byte  65,136,68,16,6                      // mov           %al,0x6(%r8,%rdx,1)
   .byte  102,15,197,195,5                    // pextrw        $0x5,%xmm3,%eax
   .byte  65,136,68,16,5                      // mov           %al,0x5(%r8,%rdx,1)
   .byte  102,15,197,195,4                    // pextrw        $0x4,%xmm3,%eax
   .byte  65,136,68,16,4                      // mov           %al,0x4(%r8,%rdx,1)
-  .byte  102,68,15,111,5,89,20,0,0           // movdqa        0x1459(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,89,20,0,0           // movdqa        0x1459(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,68,15,219,195                   // pand          %xmm3,%xmm8
   .byte  102,69,15,103,192                   // packuswb      %xmm8,%xmm8
   .byte  102,69,15,126,4,16                  // movd          %xmm8,(%r8,%rdx,1)
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  144                                 // nop
-  .byte  118,255                             // jbe           29b3d <_sk_store_a8_sse2_lowp+0xb5>
+  .byte  118,255                             // jbe           29e9d <_sk_store_a8_sse2_lowp+0xb5>
   .byte  255                                 // (bad)
   .byte  255,165,255,255,255,155             // jmpq          *-0x64000001(%rbp)
   .byte  255                                 // (bad)
@@ -51245,19 +51394,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            29b91 <_sk_load_g8_sse2_lowp+0x39>
+  .byte  119,34                              // ja            29ef1 <_sk_load_g8_sse2_lowp+0x39>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 29c10 <_sk_load_g8_sse2_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 29f70 <_sk_load_g8_sse2_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,192                      // movd          %eax,%xmm0
-  .byte  235,97                              // jmp           29bf2 <_sk_load_g8_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           29f52 <_sk_load_g8_sse2_lowp+0x9a>
   .byte  243,65,15,126,4,16                  // movq          (%r8,%rdx,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
-  .byte  235,85                              // jmp           29bf2 <_sk_load_g8_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           29f52 <_sk_load_g8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,2                    // pinsrw        $0x2,%eax,%xmm0
@@ -51265,7 +51414,7 @@
   .byte  102,15,110,200                      // movd          %eax,%xmm1
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  243,15,16,193                       // movss         %xmm1,%xmm0
-  .byte  235,51                              // jmp           29bf2 <_sk_load_g8_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           29f52 <_sk_load_g8_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,192,6                    // pinsrw        $0x6,%eax,%xmm0
@@ -51276,14 +51425,14 @@
   .byte  102,65,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm1
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  102,15,219,5,134,19,0,0             // pand          0x1386(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,5,134,19,0,0             // pand          0x1386(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,29,125,19,0,0                 // movaps        0x137d(%rip),%xmm3        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,29,125,19,0,0                 // movaps        0x137d(%rip),%xmm3        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  118,255                             // jbe           29c11 <_sk_load_g8_sse2_lowp+0xb9>
+  .byte  118,255                             // jbe           29f71 <_sk_load_g8_sse2_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,156,255,255,255,141,255         // lcall         *-0x720001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -51311,19 +51460,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            29c65 <_sk_load_g8_dst_sse2_lowp+0x39>
+  .byte  119,34                              // ja            29fc5 <_sk_load_g8_dst_sse2_lowp+0x39>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 29ce4 <_sk_load_g8_dst_sse2_lowp+0xb8>
+  .byte  76,141,13,147,0,0,0                 // lea           0x93(%rip),%r9        # 2a044 <_sk_load_g8_dst_sse2_lowp+0xb8>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,15,110,224                      // movd          %eax,%xmm4
-  .byte  235,97                              // jmp           29cc6 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  .byte  235,97                              // jmp           2a026 <_sk_load_g8_dst_sse2_lowp+0x9a>
   .byte  243,65,15,126,36,16                 // movq          (%r8,%rdx,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
-  .byte  235,85                              // jmp           29cc6 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  .byte  235,85                              // jmp           2a026 <_sk_load_g8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,2                    // pinsrw        $0x2,%eax,%xmm4
@@ -51331,7 +51480,7 @@
   .byte  102,15,110,232                      // movd          %eax,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,51                              // jmp           29cc6 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  .byte  235,51                              // jmp           2a026 <_sk_load_g8_dst_sse2_lowp+0x9a>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,224,6                    // pinsrw        $0x6,%eax,%xmm4
@@ -51342,14 +51491,14 @@
   .byte  102,65,15,110,44,16                 // movd          (%r8,%rdx,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  102,15,219,37,178,18,0,0            // pand          0x12b2(%rip),%xmm4        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,219,37,178,18,0,0            // pand          0x12b2(%rip),%xmm4        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  72,173                              // lods          %ds:(%rsi),%rax
-  .byte  15,40,61,169,18,0,0                 // movaps        0x12a9(%rip),%xmm7        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  15,40,61,169,18,0,0                 // movaps        0x12a9(%rip),%xmm7        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  118,255                             // jbe           29ce5 <_sk_load_g8_dst_sse2_lowp+0xb9>
+  .byte  118,255                             // jbe           2a045 <_sk_load_g8_dst_sse2_lowp+0xb9>
   .byte  255                                 // (bad)
   .byte  255,156,255,255,255,141,255         // lcall         *-0x720001(%rdi,%rdi,8)
   .byte  255                                 // (bad)
@@ -51370,10 +51519,10 @@
 FUNCTION(_sk_luminance_to_alpha_sse2_lowp)
 _sk_luminance_to_alpha_sse2_lowp:
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
-  .byte  102,15,213,5,116,26,0,0             // pmullw        0x1a74(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0x11e4>
-  .byte  102,15,213,13,124,26,0,0            // pmullw        0x1a7c(%rip),%xmm1        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0x11f4>
+  .byte  102,15,213,5,116,26,0,0             // pmullw        0x1a74(%rip),%xmm0        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0x11e4>
+  .byte  102,15,213,13,124,26,0,0            // pmullw        0x1a7c(%rip),%xmm1        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0x11f4>
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
-  .byte  102,15,213,29,128,26,0,0            // pmullw        0x1a80(%rip),%xmm3        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0x1204>
+  .byte  102,15,213,29,128,26,0,0            // pmullw        0x1a80(%rip),%xmm3        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0x1204>
   .byte  102,15,253,217                      // paddw         %xmm1,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
   .byte  72,173                              // lods          %ds:(%rsi),%rax
@@ -51388,14 +51537,14 @@
 _sk_scale_1_float_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,203,16,0,0           // mulss         0x10cb(%rip),%xmm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  243,68,15,88,5,146,16,0,0           // addss         0x1092(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,89,5,203,16,0,0           // mulss         0x10cb(%rip),%xmm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  243,68,15,88,5,146,16,0,0           // addss         0x1092(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,10,18,0,0          // movdqa        0x120a(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,10,18,0,0          // movdqa        0x120a(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -51416,13 +51565,13 @@
 _sk_lerp_1_float_sse2_lowp:
   .byte  72,173                              // lods          %ds:(%rsi),%rax
   .byte  243,68,15,16,0                      // movss         (%rax),%xmm8
-  .byte  243,68,15,89,5,83,16,0,0            // mulss         0x1053(%rip),%xmm8        # 2ae14 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
-  .byte  243,68,15,88,5,26,16,0,0            // addss         0x101a(%rip),%xmm8        # 2ade4 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  .byte  243,68,15,89,5,83,16,0,0            // mulss         0x1053(%rip),%xmm8        # 2b174 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  .byte  243,68,15,88,5,26,16,0,0            // addss         0x101a(%rip),%xmm8        # 2b144 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   .byte  243,65,15,44,192                    // cvttss2si     %xmm8,%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
   .byte  242,69,15,112,192,0                 // pshuflw       $0x0,%xmm8,%xmm8
   .byte  102,69,15,112,192,80                // pshufd        $0x50,%xmm8,%xmm8
-  .byte  102,68,15,111,13,151,17,0,0         // movdqa        0x1197(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,151,17,0,0         // movdqa        0x1197(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -51462,19 +51611,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            29ea0 <_sk_scale_u8_sse2_lowp+0x3b>
+  .byte  119,36                              // ja            2a200 <_sk_scale_u8_sse2_lowp+0x3b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,221,0,0,0                 // lea           0xdd(%rip),%r9        # 29f68 <_sk_scale_u8_sse2_lowp+0x103>
+  .byte  76,141,13,221,0,0,0                 // lea           0xdd(%rip),%r9        # 2a2c8 <_sk_scale_u8_sse2_lowp+0x103>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,109                             // jmp           29f0d <_sk_scale_u8_sse2_lowp+0xa8>
+  .byte  235,109                             // jmp           2a26d <_sk_scale_u8_sse2_lowp+0xa8>
   .byte  243,69,15,126,4,16                  // movq          (%r8,%rdx,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
-  .byte  235,96                              // jmp           29f0d <_sk_scale_u8_sse2_lowp+0xa8>
+  .byte  235,96                              // jmp           2a26d <_sk_scale_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,2                 // pinsrw        $0x2,%eax,%xmm8
@@ -51482,7 +51631,7 @@
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  243,69,15,16,193                    // movss         %xmm9,%xmm8
-  .byte  235,57                              // jmp           29f0d <_sk_scale_u8_sse2_lowp+0xa8>
+  .byte  235,57                              // jmp           2a26d <_sk_scale_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,6                 // pinsrw        $0x6,%eax,%xmm8
@@ -51493,9 +51642,9 @@
   .byte  102,69,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  102,68,15,219,5,106,16,0,0          // pand          0x106a(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,219,5,106,16,0,0          // pand          0x106a(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,213,192                   // pmullw        %xmm8,%xmm0
-  .byte  102,68,15,111,13,92,16,0,0          // movdqa        0x105c(%rip),%xmm9        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,13,92,16,0,0          // movdqa        0x105c(%rip),%xmm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,253,193                   // paddw         %xmm9,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,65,15,213,200                   // pmullw        %xmm8,%xmm1
@@ -51521,7 +51670,7 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  125,255                             // jge           29f7d <_sk_scale_u8_sse2_lowp+0x118>
+  .byte  125,255                             // jge           2a2dd <_sk_scale_u8_sse2_lowp+0x118>
   .byte  255                                 // (bad)
   .byte  255,108,255,255                     // ljmp          *-0x1(%rdi,%rdi,8)
   .byte  255                                 // .byte         0xff
@@ -51538,19 +51687,19 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,36                              // ja            29fbf <_sk_lerp_u8_sse2_lowp+0x3b>
+  .byte  119,36                              // ja            2a31f <_sk_lerp_u8_sse2_lowp+0x3b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 2a0c8 <_sk_lerp_u8_sse2_lowp+0x144>
+  .byte  76,141,13,30,1,0,0                  // lea           0x11e(%rip),%r9        # 2a428 <_sk_lerp_u8_sse2_lowp+0x144>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,182,4,16                      // movzbl        (%r8,%rdx,1),%eax
   .byte  102,68,15,110,192                   // movd          %eax,%xmm8
-  .byte  235,109                             // jmp           2a02c <_sk_lerp_u8_sse2_lowp+0xa8>
+  .byte  235,109                             // jmp           2a38c <_sk_lerp_u8_sse2_lowp+0xa8>
   .byte  243,69,15,126,4,16                  // movq          (%r8,%rdx,1),%xmm8
   .byte  102,68,15,96,192                    // punpcklbw     %xmm0,%xmm8
-  .byte  235,96                              // jmp           2a02c <_sk_lerp_u8_sse2_lowp+0xa8>
+  .byte  235,96                              // jmp           2a38c <_sk_lerp_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,2                   // movzbl        0x2(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,2                 // pinsrw        $0x2,%eax,%xmm8
@@ -51558,7 +51707,7 @@
   .byte  102,68,15,110,200                   // movd          %eax,%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  243,69,15,16,193                    // movss         %xmm9,%xmm8
-  .byte  235,57                              // jmp           2a02c <_sk_lerp_u8_sse2_lowp+0xa8>
+  .byte  235,57                              // jmp           2a38c <_sk_lerp_u8_sse2_lowp+0xa8>
   .byte  65,15,182,68,16,6                   // movzbl        0x6(%r8,%rdx,1),%eax
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
   .byte  102,68,15,196,192,6                 // pinsrw        $0x6,%eax,%xmm8
@@ -51569,8 +51718,8 @@
   .byte  102,69,15,110,12,16                 // movd          (%r8,%rdx,1),%xmm9
   .byte  102,68,15,96,200                    // punpcklbw     %xmm0,%xmm9
   .byte  242,69,15,16,193                    // movsd         %xmm9,%xmm8
-  .byte  102,68,15,219,5,75,15,0,0           // pand          0xf4b(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
-  .byte  102,68,15,111,21,66,15,0,0          // movdqa        0xf42(%rip),%xmm10        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,219,5,75,15,0,0           // pand          0xf4b(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,21,66,15,0,0          // movdqa        0xf42(%rip),%xmm10        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,69,15,111,200                   // movdqa        %xmm8,%xmm9
   .byte  102,69,15,239,202                   // pxor          %xmm10,%xmm9
   .byte  102,69,15,111,217                   // movdqa        %xmm9,%xmm11
@@ -51600,9 +51749,9 @@
   .byte  102,65,15,111,216                   // movdqa        %xmm8,%xmm3
   .byte  255,224                             // jmpq          *%rax
   .byte  15,31,0                             // nopl          (%rax)
-  .byte  235,254                             // jmp           2a0c8 <_sk_lerp_u8_sse2_lowp+0x144>
+  .byte  235,254                             // jmp           2a428 <_sk_lerp_u8_sse2_lowp+0x144>
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,4                // callq         *0x4ffffff(%rip)        # 502a0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x4fffb34>
+  .byte  255,21,255,255,255,4                // callq         *0x4ffffff(%rip)        # 502a430 <_sk_srcover_rgba_8888_sse2_lowp+0x4fffb34>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,84,255,255                      // callq         *-0x1(%rdi,%rdi,8)
@@ -51632,23 +51781,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            2a12f <_sk_scale_565_sse2_lowp+0x4b>
+  .byte  119,34                              // ja            2a48f <_sk_scale_565_sse2_lowp+0x4b>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,229,1,0,0                 // lea           0x1e5(%rip),%r9        # 2a300 <_sk_scale_565_sse2_lowp+0x21c>
+  .byte  76,141,13,229,1,0,0                 // lea           0x1e5(%rip),%r9        # 2a660 <_sk_scale_565_sse2_lowp+0x21c>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,240                      // movd          %eax,%xmm6
-  .byte  235,67                              // jmp           2a172 <_sk_scale_565_sse2_lowp+0x8e>
+  .byte  235,67                              // jmp           2a4d2 <_sk_scale_565_sse2_lowp+0x8e>
   .byte  243,65,15,111,52,80                 // movdqu        (%r8,%rdx,2),%xmm6
-  .byte  235,59                              // jmp           2a172 <_sk_scale_565_sse2_lowp+0x8e>
+  .byte  235,59                              // jmp           2a4d2 <_sk_scale_565_sse2_lowp+0x8e>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  102,65,15,196,116,80,4,2            // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm6
   .byte  243,69,15,16,12,80                  // movss         (%r8,%rdx,2),%xmm9
   .byte  243,65,15,16,241                    // movss         %xmm9,%xmm6
-  .byte  235,34                              // jmp           2a172 <_sk_scale_565_sse2_lowp+0x8e>
+  .byte  235,34                              // jmp           2a4d2 <_sk_scale_565_sse2_lowp+0x8e>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  102,65,15,196,116,80,12,6           // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm6
   .byte  102,65,15,196,116,80,10,5           // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm6
@@ -51656,11 +51805,11 @@
   .byte  102,65,15,18,52,80                  // movlpd        (%r8,%rdx,2),%xmm6
   .byte  102,68,15,111,222                   // movdqa        %xmm6,%xmm11
   .byte  102,65,15,113,211,8                 // psrlw         $0x8,%xmm11
-  .byte  102,68,15,219,29,170,21,0,0         // pand          0x15aa(%rip),%xmm11        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,68,15,219,29,170,21,0,0         // pand          0x15aa(%rip),%xmm11        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,68,15,111,206                   // movdqa        %xmm6,%xmm9
   .byte  102,65,15,113,209,5                 // psrlw         $0x5,%xmm9
-  .byte  102,68,15,219,13,166,21,0,0         // pand          0x15a6(%rip),%xmm9        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,68,15,111,21,173,21,0,0         // movdqa        0x15ad(%rip),%xmm10        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,68,15,219,13,166,21,0,0         // pand          0x15a6(%rip),%xmm9        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,21,173,21,0,0         // movdqa        0x15ad(%rip),%xmm10        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,68,15,219,214                   // pand          %xmm6,%xmm10
   .byte  102,15,113,214,13                   // psrlw         $0xd,%xmm6
   .byte  102,65,15,235,243                   // por           %xmm11,%xmm6
@@ -51672,7 +51821,7 @@
   .byte  102,65,15,113,243,3                 // psllw         $0x3,%xmm11
   .byte  102,65,15,113,210,2                 // psrlw         $0x2,%xmm10
   .byte  102,69,15,235,211                   // por           %xmm11,%xmm10
-  .byte  102,68,15,111,37,9,21,0,0           // movdqa        0x1509(%rip),%xmm12        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,37,9,21,0,0           // movdqa        0x1509(%rip),%xmm12        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,68,15,111,235                   // movdqa        %xmm3,%xmm13
   .byte  102,69,15,239,236                   // pxor          %xmm12,%xmm13
   .byte  102,68,15,111,223                   // movdqa        %xmm7,%xmm11
@@ -51713,7 +51862,7 @@
   .byte  102,68,15,213,201                   // pmullw        %xmm1,%xmm9
   .byte  102,68,15,213,210                   // pmullw        %xmm2,%xmm10
   .byte  102,68,15,213,219                   // pmullw        %xmm3,%xmm11
-  .byte  102,15,111,5,203,12,0,0             // movdqa        0xccb(%rip),%xmm0        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,15,111,5,203,12,0,0             // movdqa        0xccb(%rip),%xmm0        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,253,240                      // paddw         %xmm0,%xmm6
   .byte  102,68,15,253,200                   // paddw         %xmm0,%xmm9
   .byte  102,68,15,253,208                   // paddw         %xmm0,%xmm10
@@ -51760,23 +51909,23 @@
   .byte  36,7                                // and           $0x7,%al
   .byte  254,200                             // dec           %al
   .byte  60,6                                // cmp           $0x6,%al
-  .byte  119,34                              // ja            2a367 <_sk_lerp_565_sse2_lowp+0x4b>
+  .byte  119,34                              // ja            2a6c7 <_sk_lerp_565_sse2_lowp+0x4b>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  15,182,192                          // movzbl        %al,%eax
-  .byte  76,141,13,45,2,0,0                  // lea           0x22d(%rip),%r9        # 2a580 <_sk_lerp_565_sse2_lowp+0x264>
+  .byte  76,141,13,45,2,0,0                  // lea           0x22d(%rip),%r9        # 2a8e0 <_sk_lerp_565_sse2_lowp+0x264>
   .byte  73,99,4,129                         // movslq        (%r9,%rax,4),%rax
   .byte  76,1,200                            // add           %r9,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  65,15,183,4,80                      // movzwl        (%r8,%rdx,2),%eax
   .byte  102,15,110,208                      // movd          %eax,%xmm2
-  .byte  235,67                              // jmp           2a3aa <_sk_lerp_565_sse2_lowp+0x8e>
+  .byte  235,67                              // jmp           2a70a <_sk_lerp_565_sse2_lowp+0x8e>
   .byte  243,65,15,111,20,80                 // movdqu        (%r8,%rdx,2),%xmm2
-  .byte  235,59                              // jmp           2a3aa <_sk_lerp_565_sse2_lowp+0x8e>
+  .byte  235,59                              // jmp           2a70a <_sk_lerp_565_sse2_lowp+0x8e>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  102,65,15,196,84,80,4,2             // pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm2
   .byte  243,69,15,16,12,80                  // movss         (%r8,%rdx,2),%xmm9
   .byte  243,65,15,16,209                    // movss         %xmm9,%xmm2
-  .byte  235,34                              // jmp           2a3aa <_sk_lerp_565_sse2_lowp+0x8e>
+  .byte  235,34                              // jmp           2a70a <_sk_lerp_565_sse2_lowp+0x8e>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  102,65,15,196,84,80,12,6            // pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm2
   .byte  102,65,15,196,84,80,10,5            // pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm2
@@ -51784,11 +51933,11 @@
   .byte  102,65,15,18,20,80                  // movlpd        (%r8,%rdx,2),%xmm2
   .byte  102,68,15,111,218                   // movdqa        %xmm2,%xmm11
   .byte  102,65,15,113,211,8                 // psrlw         $0x8,%xmm11
-  .byte  102,68,15,219,29,114,19,0,0         // pand          0x1372(%rip),%xmm11        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
+  .byte  102,68,15,219,29,114,19,0,0         // pand          0x1372(%rip),%xmm11        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0x1194>
   .byte  102,68,15,111,202                   // movdqa        %xmm2,%xmm9
   .byte  102,65,15,113,209,5                 // psrlw         $0x5,%xmm9
-  .byte  102,68,15,219,13,110,19,0,0         // pand          0x136e(%rip),%xmm9        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
-  .byte  102,68,15,111,21,117,19,0,0         // movdqa        0x1375(%rip),%xmm10        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
+  .byte  102,68,15,219,13,110,19,0,0         // pand          0x136e(%rip),%xmm9        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0x11a4>
+  .byte  102,68,15,111,21,117,19,0,0         // movdqa        0x1375(%rip),%xmm10        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0x11b4>
   .byte  102,68,15,219,210                   // pand          %xmm2,%xmm10
   .byte  102,15,113,210,13                   // psrlw         $0xd,%xmm2
   .byte  102,65,15,235,211                   // por           %xmm11,%xmm2
@@ -51800,7 +51949,7 @@
   .byte  102,65,15,113,243,3                 // psllw         $0x3,%xmm11
   .byte  102,65,15,113,210,2                 // psrlw         $0x2,%xmm10
   .byte  102,69,15,235,211                   // por           %xmm11,%xmm10
-  .byte  102,68,15,111,37,209,18,0,0         // movdqa        0x12d1(%rip),%xmm12        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
+  .byte  102,68,15,111,37,209,18,0,0         // movdqa        0x12d1(%rip),%xmm12        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0x1154>
   .byte  102,68,15,111,235                   // movdqa        %xmm3,%xmm13
   .byte  102,69,15,239,236                   // pxor          %xmm12,%xmm13
   .byte  102,68,15,111,223                   // movdqa        %xmm7,%xmm11
@@ -51839,7 +51988,7 @@
   .byte  102,69,15,235,222                   // por           %xmm14,%xmm11
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,213,209                      // pmullw        %xmm1,%xmm2
-  .byte  102,68,15,111,5,157,10,0,0          // movdqa        0xa9d(%rip),%xmm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,5,157,10,0,0          // movdqa        0xa9d(%rip),%xmm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,65,15,239,192                   // pxor          %xmm8,%xmm0
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
   .byte  102,65,15,253,208                   // paddw         %xmm8,%xmm2
@@ -51908,26 +52057,26 @@
   .byte  65,254,202                          // dec           %r10b
   .byte  69,15,182,202                       // movzbl        %r10b,%r9d
   .byte  65,128,249,6                        // cmp           $0x6,%r9b
-  .byte  119,38                              // ja            2a5e7 <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
+  .byte  119,38                              // ja            2a947 <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  76,141,29,67,2,0,0                  // lea           0x243(%rip),%r11        # 2a810 <_sk_srcover_rgba_8888_sse2_lowp+0x274>
+  .byte  76,141,29,67,2,0,0                  // lea           0x243(%rip),%r11        # 2ab70 <_sk_srcover_rgba_8888_sse2_lowp+0x274>
   .byte  75,99,4,139                         // movslq        (%r11,%r9,4),%rax
   .byte  76,1,216                            // add           %r11,%rax
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  255,224                             // jmpq          *%rax
   .byte  243,65,15,16,60,144                 // movss         (%r8,%rdx,4),%xmm7
   .byte  102,69,15,239,192                   // pxor          %xmm8,%xmm8
-  .byte  235,102                             // jmp           2a64d <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  .byte  235,102                             // jmp           2a9ad <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   .byte  102,65,15,16,60,144                 // movupd        (%r8,%rdx,4),%xmm7
   .byte  243,69,15,111,68,144,16             // movdqu        0x10(%r8,%rdx,4),%xmm8
-  .byte  235,87                              // jmp           2a64d <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  .byte  235,87                              // jmp           2a9ad <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   .byte  102,65,15,110,100,144,8             // movd          0x8(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,69,15,18,4,144                  // movlpd        (%r8,%rdx,4),%xmm8
   .byte  102,65,15,40,248                    // movapd        %xmm8,%xmm7
   .byte  102,68,15,111,196                   // movdqa        %xmm4,%xmm8
-  .byte  235,52                              // jmp           2a64d <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  .byte  235,52                              // jmp           2a9ad <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   .byte  102,65,15,110,100,144,24            // movd          0x18(%r8,%rdx,4),%xmm4
   .byte  102,68,15,112,196,69                // pshufd        $0x45,%xmm4,%xmm8
   .byte  243,65,15,16,100,144,20             // movss         0x14(%r8,%rdx,4),%xmm4
@@ -51944,7 +52093,7 @@
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,114,228,16                   // psrad         $0x10,%xmm4
   .byte  102,15,107,236                      // packssdw      %xmm4,%xmm5
-  .byte  102,68,15,111,37,9,9,0,0            // movdqa        0x909(%rip),%xmm12        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
+  .byte  102,68,15,111,37,9,9,0,0            // movdqa        0x909(%rip),%xmm12        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9e4>
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,65,15,219,228                   // pand          %xmm12,%xmm4
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -52002,20 +52151,20 @@
   .byte  102,15,105,193                      // punpckhwd     %xmm1,%xmm0
   .byte  102,15,235,194                      // por           %xmm2,%xmm0
   .byte  65,128,250,6                        // cmp           $0x6,%r10b
-  .byte  119,24                              // ja            2a7af <_sk_srcover_rgba_8888_sse2_lowp+0x213>
-  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 2a82c <_sk_srcover_rgba_8888_sse2_lowp+0x290>
+  .byte  119,24                              // ja            2ab0f <_sk_srcover_rgba_8888_sse2_lowp+0x213>
+  .byte  76,141,21,142,0,0,0                 // lea           0x8e(%rip),%r10        # 2ab8c <_sk_srcover_rgba_8888_sse2_lowp+0x290>
   .byte  75,99,4,138                         // movslq        (%r10,%r9,4),%rax
   .byte  76,1,208                            // add           %r10,%rax
   .byte  255,224                             // jmpq          *%rax
   .byte  102,69,15,126,36,144                // movd          %xmm12,(%r8,%rdx,4)
-  .byte  235,73                              // jmp           2a7f8 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  .byte  235,73                              // jmp           2ab58 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   .byte  243,69,15,127,36,144                // movdqu        %xmm12,(%r8,%rdx,4)
   .byte  243,65,15,127,68,144,16             // movdqu        %xmm0,0x10(%r8,%rdx,4)
-  .byte  235,58                              // jmp           2a7f8 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  .byte  235,58                              // jmp           2ab58 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   .byte  102,65,15,112,196,78                // pshufd        $0x4e,%xmm12,%xmm0
   .byte  102,65,15,126,68,144,8              // movd          %xmm0,0x8(%r8,%rdx,4)
   .byte  102,69,15,214,36,144                // movq          %xmm12,(%r8,%rdx,4)
-  .byte  235,37                              // jmp           2a7f8 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  .byte  235,37                              // jmp           2ab58 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
   .byte  102,65,15,126,76,144,24             // movd          %xmm1,0x18(%r8,%rdx,4)
   .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
@@ -52048,7 +52197,7 @@
   .byte  254                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  123,255                             // jnp           2a82d <_sk_srcover_rgba_8888_sse2_lowp+0x291>
+  .byte  123,255                             // jnp           2ab8d <_sk_srcover_rgba_8888_sse2_lowp+0x291>
   .byte  255                                 // (bad)
   .byte  255,159,255,255,255,146             // lcall         *-0x6d000001(%rdi)
   .byte  255                                 // (bad)
@@ -52114,16 +52263,16 @@
   .byte  0,1                                 // add           %al,(%rcx)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02a8c8 <_sk_srcover_rgba_8888_sse2_lowp+0xa00032c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ac28 <_sk_srcover_rgba_8888_sse2_lowp+0xa00032c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202a8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x12000334>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ac30 <_sk_srcover_rgba_8888_sse2_lowp+0x12000334>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02a8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00033c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ac38 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00033c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302a8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000344>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ac40 <_sk_srcover_rgba_8888_sse2_lowp+0x3000344>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52166,16 +52315,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02a928 <_sk_srcover_rgba_8888_sse2_lowp+0xa00038c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ac88 <_sk_srcover_rgba_8888_sse2_lowp+0xa00038c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202a930 <_sk_srcover_rgba_8888_sse2_lowp+0x12000394>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ac90 <_sk_srcover_rgba_8888_sse2_lowp+0x12000394>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02a938 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00039c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ac98 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00039c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302a940 <_sk_srcover_rgba_8888_sse2_lowp+0x30003a4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302aca0 <_sk_srcover_rgba_8888_sse2_lowp+0x30003a4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52218,16 +52367,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02a988 <_sk_srcover_rgba_8888_sse2_lowp+0xa0003ec>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ace8 <_sk_srcover_rgba_8888_sse2_lowp+0xa0003ec>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202a990 <_sk_srcover_rgba_8888_sse2_lowp+0x120003f4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202acf0 <_sk_srcover_rgba_8888_sse2_lowp+0x120003f4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02a998 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0003fc>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02acf8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0003fc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302a9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000404>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ad00 <_sk_srcover_rgba_8888_sse2_lowp+0x3000404>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52270,16 +52419,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02a9e8 <_sk_srcover_rgba_8888_sse2_lowp+0xa00044c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ad48 <_sk_srcover_rgba_8888_sse2_lowp+0xa00044c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202a9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x12000454>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ad50 <_sk_srcover_rgba_8888_sse2_lowp+0x12000454>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02a9f8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00045c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ad58 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00045c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302aa00 <_sk_srcover_rgba_8888_sse2_lowp+0x3000464>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ad60 <_sk_srcover_rgba_8888_sse2_lowp+0x3000464>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52322,16 +52471,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02aa48 <_sk_srcover_rgba_8888_sse2_lowp+0xa0004ac>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ada8 <_sk_srcover_rgba_8888_sse2_lowp+0xa0004ac>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202aa50 <_sk_srcover_rgba_8888_sse2_lowp+0x120004b4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202adb0 <_sk_srcover_rgba_8888_sse2_lowp+0x120004b4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02aa58 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0004bc>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02adb8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0004bc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302aa60 <_sk_srcover_rgba_8888_sse2_lowp+0x30004c4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302adc0 <_sk_srcover_rgba_8888_sse2_lowp+0x30004c4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52374,16 +52523,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02aaa8 <_sk_srcover_rgba_8888_sse2_lowp+0xa00050c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ae08 <_sk_srcover_rgba_8888_sse2_lowp+0xa00050c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202aab0 <_sk_srcover_rgba_8888_sse2_lowp+0x12000514>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ae10 <_sk_srcover_rgba_8888_sse2_lowp+0x12000514>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02aab8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00051c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ae18 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00051c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302aac0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000524>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ae20 <_sk_srcover_rgba_8888_sse2_lowp+0x3000524>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52426,16 +52575,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ab08 <_sk_srcover_rgba_8888_sse2_lowp+0xa00056c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ae68 <_sk_srcover_rgba_8888_sse2_lowp+0xa00056c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ab10 <_sk_srcover_rgba_8888_sse2_lowp+0x12000574>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ae70 <_sk_srcover_rgba_8888_sse2_lowp+0x12000574>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ab18 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00057c>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ae78 <_sk_srcover_rgba_8888_sse2_lowp+0x1a00057c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ab20 <_sk_srcover_rgba_8888_sse2_lowp+0x3000584>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ae80 <_sk_srcover_rgba_8888_sse2_lowp+0x3000584>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52478,16 +52627,16 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02ab68 <_sk_srcover_rgba_8888_sse2_lowp+0xa0005cc>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02aec8 <_sk_srcover_rgba_8888_sse2_lowp+0xa0005cc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202ab70 <_sk_srcover_rgba_8888_sse2_lowp+0x120005d4>
+  .byte  255,13,255,255,255,17               // decl          0x11ffffff(%rip)        # 1202aed0 <_sk_srcover_rgba_8888_sse2_lowp+0x120005d4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02ab78 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0005dc>
+  .byte  255,21,255,255,255,25               // callq         *0x19ffffff(%rip)        # 1a02aed8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0005dc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302ab80 <_sk_srcover_rgba_8888_sse2_lowp+0x30005e4>
+  .byte  255,29,255,255,255,2                // lcall         *0x2ffffff(%rip)        # 302aee0 <_sk_srcover_rgba_8888_sse2_lowp+0x30005e4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -52758,7 +52907,7 @@
   .byte  0,255                               // add           %bh,%bh
   .byte  0,0                                 // add           %al,(%rax)
   .byte  248                                 // clc
-  .byte  224,255                             // loopne        2ad93 <.const+0x533>
+  .byte  224,255                             // loopne        2b0f3 <.const+0x533>
   .byte  255,0                               // incl          (%rax)
   .byte  255,0                               // incl          (%rax)
   .byte  54,0,183,0,19,0,255                 // add           %dh,%ss:-0xffed00(%rdi)
@@ -52811,14 +52960,14 @@
   .byte  252                                 // cld
   .byte  190,0,0,128,191                     // mov           $0xbf800000,%esi
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        2ae48 <.literal4+0x64>
+  .byte  224,64                              // loopne        2b1a8 <.literal4+0x64>
   .byte  154                                 // (bad)
   .byte  153                                 // cltd
   .byte  153                                 // cltd
   .byte  62,61,10,23,63,174                  // ds            cmp $0xae3f170a,%eax
-  .byte  71,225,61                           // rex.RXB       loope 2ae51 <.literal4+0x6d>
+  .byte  71,225,61                           // rex.RXB       loope 2b1b1 <.literal4+0x6d>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            2ae5b <.literal4+0x77>
+  .byte  127,67                              // jg            2b1bb <.literal4+0x77>
   .byte  145                                 // xchg          %eax,%ecx
   .byte  131,158,61,92,143,50,63             // sbbl          $0x3f,0x328f5c3d(%rsi)
   .byte  10,215                              // or            %bh,%dl
@@ -52851,7 +53000,7 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  8,33                                // or            %ah,(%rcx)
   .byte  132,55                              // test          %dh,(%rdi)
-  .byte  224,7                               // loopne        2ae71 <.literal4+0x8d>
+  .byte  224,7                               // loopne        2b1d1 <.literal4+0x8d>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  33,8                                // and           %ecx,(%rax)
   .byte  2,58                                // add           (%rdx),%bh
@@ -52862,8 +53011,8 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,52,255                            // add           %dh,(%rdi,%rdi,8)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2ae84 <.literal4+0xa0>
-  .byte  119,115                             // ja            2aef9 <.literal4+0x115>
+  .byte  127,0                               // jg            2b1e4 <.literal4+0xa0>
+  .byte  119,115                             // ja            2b259 <.literal4+0x115>
   .byte  248                                 // clc
   .byte  194,117,191                         // retq          $0xbf75
   .byte  191,63,249,68,180                   // mov           $0xb444f93f,%edi
@@ -52886,12 +53035,12 @@
   .byte  190,80,128,3,62                     // mov           $0x3e038050,%esi
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           2af0f <.literal4+0x12b>
+  .byte  118,63                              // jbe           2b26f <.literal4+0x12b>
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  248                                 // clc
   .byte  65,0,0                              // add           %al,(%r8)
-  .byte  124,66                              // jl            2af1e <.literal4+0x13a>
+  .byte  124,66                              // jl            2b27e <.literal4+0x13a>
   .byte  0,240                               // add           %dh,%al
   .byte  0,0                                 // add           %al,(%rax)
   .byte  137,136,136,55,0,15                 // mov           %ecx,0xf003788(%rax)
@@ -52901,9 +53050,9 @@
   .byte  137,136,136,59,15,0                 // mov           %ecx,0xf3b88(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  137,136,136,61,0,0                  // mov           %ecx,0x3d88(%rax)
-  .byte  112,65                              // jo            2af41 <.literal4+0x15d>
+  .byte  112,65                              // jo            2b2a1 <.literal4+0x15d>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            2af4b <.literal4+0x167>
+  .byte  127,71                              // jg            2b2ab <.literal4+0x167>
   .byte  208                                 // (bad)
   .byte  179,89                              // mov           $0x59,%bl
   .byte  62,89                               // ds            pop %rcx
@@ -52930,15 +53079,15 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  128,0,0                             // addb          $0x0,(%rax)
   .byte  0,191,0,0,192,191                   // add           %bh,-0x40400000(%rdi)
-  .byte  114,28                              // jb            2af6a <.literal4+0x186>
+  .byte  114,28                              // jb            2b2ca <.literal4+0x186>
   .byte  199                                 // (bad)
   .byte  62,0,0                              // add           %al,%ds:(%rax)
   .byte  192,63,85                           // sarb          $0x55,(%rdi)
   .byte  85                                  // push          %rbp
   .byte  149                                 // xchg          %eax,%ebp
   .byte  191,57,142,99,61                    // mov           $0x3d638e39,%edi
-  .byte  114,249                             // jb            2af57 <.literal4+0x173>
-  .byte  127,63                              // jg            2af9f <_sk_srcover_rgba_8888_sse2_lowp+0xa03>
+  .byte  114,249                             // jb            2b2b7 <.literal4+0x173>
+  .byte  127,63                              // jg            2b2ff <_sk_srcover_rgba_8888_sse2_lowp+0xa03>
   .byte  3,0                                 // add           (%rax),%eax
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,4,0                               // add           %al,(%rax,%rax,1)
@@ -52947,7 +53096,7 @@
   .byte  56,255                              // cmp           %bh,%bh
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2af71 <.literal4+0x18d>
+  .byte  127,0                               // jg            2b2d1 <.literal4+0x18d>
   .byte  0,128,56,0,64,254                   // add           %al,-0x1bfffc8(%rax)
   .byte  255                                 // .byte         0xff
 
@@ -53050,11 +53199,11 @@
   .byte  0,128,191,0,0,128                   // add           %al,-0x7fffff41(%rax)
   .byte  191,0,0,224,64                      // mov           $0x40e00000,%edi
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        2b0a8 <.literal16+0x128>
+  .byte  224,64                              // loopne        2b408 <.literal16+0x128>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        2b0ac <.literal16+0x12c>
+  .byte  224,64                              // loopne        2b40c <.literal16+0x12c>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,64                              // loopne        2b0b0 <.literal16+0x130>
+  .byte  224,64                              // loopne        2b410 <.literal16+0x130>
   .byte  154                                 // (bad)
   .byte  153                                 // cltd
   .byte  153                                 // cltd
@@ -53074,13 +53223,13 @@
   .byte  10,23                               // or            (%rdi),%dl
   .byte  63                                  // (bad)
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 2b0d1 <.literal16+0x151>
+  .byte  71,225,61                           // rex.RXB       loope 2b431 <.literal16+0x151>
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 2b0d5 <.literal16+0x155>
+  .byte  71,225,61                           // rex.RXB       loope 2b435 <.literal16+0x155>
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 2b0d9 <.literal16+0x159>
+  .byte  71,225,61                           // rex.RXB       loope 2b439 <.literal16+0x159>
   .byte  174                                 // scas          %es:(%rdi),%al
-  .byte  71,225,61                           // rex.RXB       loope 2b0dd <.literal16+0x15d>
+  .byte  71,225,61                           // rex.RXB       loope 2b43d <.literal16+0x15d>
   .byte  255,0                               // incl          (%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  255,0                               // incl          (%rax)
@@ -53091,10 +53240,10 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  1,255                               // add           %edi,%edi
   .byte  255                                 // (bad)
-  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02b0b8 <_sk_srcover_rgba_8888_sse2_lowp+0xa000b1c>
+  .byte  255,5,255,255,255,9                 // incl          0x9ffffff(%rip)        # a02b418 <_sk_srcover_rgba_8888_sse2_lowp+0xa000b1c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  255,13,255,255,255,2                // decl          0x2ffffff(%rip)        # 302b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000b24>
+  .byte  255,13,255,255,255,2                // decl          0x2ffffff(%rip)        # 302b420 <_sk_srcover_rgba_8888_sse2_lowp+0x3000b24>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255,6                               // incl          (%rsi)
@@ -53109,11 +53258,11 @@
   .byte  255,0                               // incl          (%rax)
   .byte  0,127,67                            // add           %bh,0x43(%rdi)
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            2b11b <.literal16+0x19b>
+  .byte  127,67                              // jg            2b47b <.literal16+0x19b>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            2b11f <.literal16+0x19f>
+  .byte  127,67                              // jg            2b47f <.literal16+0x19f>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  127,67                              // jg            2b123 <.literal16+0x1a3>
+  .byte  127,67                              // jg            2b483 <.literal16+0x1a3>
   .byte  145                                 // xchg          %eax,%ecx
   .byte  131,158,61,145,131,158,61           // sbbl          $0x3d,-0x617c6ec3(%rsi)
   .byte  145                                 // xchg          %eax,%ecx
@@ -53264,13 +53413,13 @@
   .byte  132,55                              // test          %dh,(%rdi)
   .byte  8,33                                // or            %ah,(%rcx)
   .byte  132,55                              // test          %dh,(%rdi)
-  .byte  224,7                               // loopne        2b229 <.literal16+0x2a9>
+  .byte  224,7                               // loopne        2b589 <.literal16+0x2a9>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,7                               // loopne        2b22d <.literal16+0x2ad>
+  .byte  224,7                               // loopne        2b58d <.literal16+0x2ad>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,7                               // loopne        2b231 <.literal16+0x2b1>
+  .byte  224,7                               // loopne        2b591 <.literal16+0x2b1>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  224,7                               // loopne        2b235 <.literal16+0x2b5>
+  .byte  224,7                               // loopne        2b595 <.literal16+0x2b5>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  33,8                                // and           %ecx,(%rax)
   .byte  2,58                                // add           (%rdx),%bh
@@ -53324,17 +53473,17 @@
   .byte  0,0                                 // add           %al,(%rax)
   .byte  52,255                              // xor           $0xff,%al
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b2a4 <.literal16+0x324>
+  .byte  127,0                               // jg            2b604 <.literal16+0x324>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b2a8 <.literal16+0x328>
+  .byte  127,0                               // jg            2b608 <.literal16+0x328>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b2ac <.literal16+0x32c>
+  .byte  127,0                               // jg            2b60c <.literal16+0x32c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b2b0 <.literal16+0x330>
-  .byte  119,115                             // ja            2b325 <.literal16+0x3a5>
+  .byte  127,0                               // jg            2b610 <.literal16+0x330>
+  .byte  119,115                             // ja            2b685 <.literal16+0x3a5>
   .byte  248                                 // clc
   .byte  194,119,115                         // retq          $0x7377
   .byte  248                                 // clc
@@ -53345,7 +53494,7 @@
   .byte  194,117,191                         // retq          $0xbf75
   .byte  191,63,117,191,191                  // mov           $0xbfbf753f,%edi
   .byte  63                                  // (bad)
-  .byte  117,191                             // jne           2b289 <.literal16+0x309>
+  .byte  117,191                             // jne           2b5e9 <.literal16+0x309>
   .byte  191,63,117,191,191                  // mov           $0xbfbf753f,%edi
   .byte  63                                  // (bad)
   .byte  249                                 // stc
@@ -53357,7 +53506,7 @@
   .byte  249                                 // stc
   .byte  68,180,62                           // rex.R         mov $0x3e,%spl
   .byte  163,233,220,63,163,233,220,63,163   // movabs        %eax,0xa33fdce9a33fdce9
-  .byte  233,220,63,163,233                  // jmpq          ffffffffe9a5f2ca <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe9a34d2e>
+  .byte  233,220,63,163,233                  // jmpq          ffffffffe9a5f62a <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe9a34d2e>
   .byte  220,63                              // fdivrl        (%rdi)
   .byte  81                                  // push          %rcx
   .byte  140,242                             // mov           %?,%edx
@@ -53447,16 +53596,16 @@
   .byte  128,3,62                            // addb          $0x3e,(%rbx)
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           2b413 <.literal16+0x493>
+  .byte  118,63                              // jbe           2b773 <.literal16+0x493>
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           2b417 <.literal16+0x497>
+  .byte  118,63                              // jbe           2b777 <.literal16+0x497>
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           2b41b <.literal16+0x49b>
+  .byte  118,63                              // jbe           2b77b <.literal16+0x49b>
   .byte  31                                  // (bad)
   .byte  215                                 // xlat          %ds:(%rbx)
-  .byte  118,63                              // jbe           2b41f <.literal16+0x49f>
+  .byte  118,63                              // jbe           2b77f <.literal16+0x49f>
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%rax)
@@ -53477,13 +53626,13 @@
   .byte  65,0,0                              // add           %al,(%r8)
   .byte  248                                 // clc
   .byte  65,0,0                              // add           %al,(%r8)
-  .byte  124,66                              // jl            2b456 <.literal16+0x4d6>
+  .byte  124,66                              // jl            2b7b6 <.literal16+0x4d6>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  124,66                              // jl            2b45a <.literal16+0x4da>
+  .byte  124,66                              // jl            2b7ba <.literal16+0x4da>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  124,66                              // jl            2b45e <.literal16+0x4de>
+  .byte  124,66                              // jl            2b7be <.literal16+0x4de>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  124,66                              // jl            2b462 <.literal16+0x4e2>
+  .byte  124,66                              // jl            2b7c2 <.literal16+0x4e2>
   .byte  0,240                               // add           %dh,%al
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,240                               // add           %dh,%al
@@ -53529,25 +53678,25 @@
   .byte  136,136,61,137,136,136              // mov           %cl,-0x777776c3(%rax)
   .byte  61,137,136,136,61                   // cmp           $0x3d888889,%eax
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            2b4e5 <.literal16+0x565>
+  .byte  112,65                              // jo            2b845 <.literal16+0x565>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            2b4e9 <.literal16+0x569>
+  .byte  112,65                              // jo            2b849 <.literal16+0x569>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            2b4ed <.literal16+0x56d>
+  .byte  112,65                              // jo            2b84d <.literal16+0x56d>
   .byte  0,0                                 // add           %al,(%rax)
-  .byte  112,65                              // jo            2b4f1 <.literal16+0x571>
+  .byte  112,65                              // jo            2b851 <.literal16+0x571>
   .byte  0,128,0,0,0,128                     // add           %al,-0x80000000(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  0,128,0,0,0,128                     // add           %al,-0x80000000(%rax)
   .byte  0,0                                 // add           %al,(%rax)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b4c3 <.literal16+0x543>
+  .byte  127,0                               // jg            2b823 <.literal16+0x543>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            2b4c7 <.literal16+0x547>
+  .byte  127,0                               // jg            2b827 <.literal16+0x547>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            2b4cb <.literal16+0x54b>
+  .byte  127,0                               // jg            2b82b <.literal16+0x54b>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            2b4cf <.literal16+0x54f>
+  .byte  127,0                               // jg            2b82f <.literal16+0x54f>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  4,0                                 // add           $0x0,%al
   .byte  0,0                                 // add           %al,(%rax)
@@ -53573,13 +53722,13 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            2b508 <.literal16+0x588>
+  .byte  127,255                             // jg            2b868 <.literal16+0x588>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            2b50c <.literal16+0x58c>
+  .byte  127,255                             // jg            2b86c <.literal16+0x58c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b511 <.literal16+0x591>
+  .byte  127,0                               // jg            2b871 <.literal16+0x591>
   .byte  0,128,56,0,0,128                    // add           %al,-0x7fffffc8(%rax)
   .byte  56,0                                // cmp           %al,(%rax)
   .byte  0,128,56,0,0,128                    // add           %al,-0x7fffffc8(%rax)
@@ -53593,13 +53742,13 @@
   .byte  64,254                              // rex           (bad)
   .byte  255,0                               // incl          (%rax)
   .byte  255                                 // (bad)
-  .byte  127,71                              // jg            2b57b <.literal16+0x5fb>
+  .byte  127,71                              // jg            2b8db <.literal16+0x5fb>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            2b57f <.literal16+0x5ff>
+  .byte  127,71                              // jg            2b8df <.literal16+0x5ff>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            2b583 <.literal16+0x603>
+  .byte  127,71                              // jg            2b8e3 <.literal16+0x603>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            2b587 <.literal16+0x607>
+  .byte  127,71                              // jg            2b8e7 <.literal16+0x607>
   .byte  208                                 // (bad)
   .byte  179,89                              // mov           $0x59,%bl
   .byte  62,208                              // ds            (bad)
@@ -53629,10 +53778,10 @@
   .byte  61,152,221,147,61                   // cmp           $0x3d93dd98,%eax
   .byte  152                                 // cwtl
   .byte  221,147,61,45,16,17                 // fstl          0x11102d3d(%rbx)
-  .byte  192,45,16,17,192,45,16              // shrb          $0x10,0x2dc01110(%rip)        # 2dc2c68a <_sk_srcover_rgba_8888_sse2_lowp+0x2dc020ee>
+  .byte  192,45,16,17,192,45,16              // shrb          $0x10,0x2dc01110(%rip)        # 2dc2c9ea <_sk_srcover_rgba_8888_sse2_lowp+0x2dc020ee>
   .byte  17,192                              // adc           %eax,%eax
   .byte  45,16,17,192,18                     // sub           $0x12c01110,%eax
-  .byte  120,57                              // js            2b5bc <.literal16+0x63c>
+  .byte  120,57                              // js            2b91c <.literal16+0x63c>
   .byte  64,18,120,57                        // adc           0x39(%rax),%dil
   .byte  64,18,120,57                        // adc           0x39(%rax),%dil
   .byte  64,18,120,57                        // adc           0x39(%rax),%dil
@@ -53697,13 +53846,13 @@
   .byte  192,191,0,0,192,191,0               // sarb          $0x0,-0x40400000(%rdi)
   .byte  0,192                               // add           %al,%al
   .byte  191,0,0,192,191                     // mov           $0xbfc00000,%edi
-  .byte  114,28                              // jb            2b66e <.literal16+0x6ee>
+  .byte  114,28                              // jb            2b9ce <.literal16+0x6ee>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         2b672 <.literal16+0x6f2>
+  .byte  62,114,28                           // jb,pt         2b9d2 <.literal16+0x6f2>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         2b676 <.literal16+0x6f6>
+  .byte  62,114,28                           // jb,pt         2b9d6 <.literal16+0x6f6>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         2b67a <.literal16+0x6fa>
+  .byte  62,114,28                           // jb,pt         2b9da <.literal16+0x6fa>
   .byte  199                                 // (bad)
   .byte  62,85                               // ds            push %rbp
   .byte  85                                  // push          %rbp
@@ -53722,15 +53871,15 @@
   .byte  0,192                               // add           %al,%al
   .byte  63                                  // (bad)
   .byte  57,142,99,61,57,142                 // cmp           %ecx,-0x71c6c29d(%rsi)
-  .byte  99,61,57,142,99,61                  // movslq        0x3d638e39(%rip),%edi        # 3d6644c5 <_sk_srcover_rgba_8888_sse2_lowp+0x3d639f29>
+  .byte  99,61,57,142,99,61                  // movslq        0x3d638e39(%rip),%edi        # 3d664825 <_sk_srcover_rgba_8888_sse2_lowp+0x3d639f29>
   .byte  57,142,99,61,114,249                // cmp           %ecx,-0x68dc29d(%rsi)
-  .byte  127,63                              // jg            2b6d3 <.literal16+0x753>
-  .byte  114,249                             // jb            2b68f <.literal16+0x70f>
-  .byte  127,63                              // jg            2b6d7 <.literal16+0x757>
-  .byte  114,249                             // jb            2b693 <.literal16+0x713>
-  .byte  127,63                              // jg            2b6db <.literal16+0x75b>
-  .byte  114,249                             // jb            2b697 <.literal16+0x717>
-  .byte  127,63                              // jg            2b6df <.literal16+0x75f>
+  .byte  127,63                              // jg            2ba33 <.literal16+0x753>
+  .byte  114,249                             // jb            2b9ef <.literal16+0x70f>
+  .byte  127,63                              // jg            2ba37 <.literal16+0x757>
+  .byte  114,249                             // jb            2b9f3 <.literal16+0x713>
+  .byte  127,63                              // jg            2ba3b <.literal16+0x75b>
+  .byte  114,249                             // jb            2b9f7 <.literal16+0x717>
+  .byte  127,63                              // jg            2ba3f <.literal16+0x75f>
   .byte  3,0                                 // add           (%rax),%eax
   .byte  0,0                                 // add           %al,(%rax)
   .byte  3,0                                 // add           (%rax),%eax
@@ -53840,14 +53989,14 @@
   .byte  0,248                               // add           %bh,%al
   .byte  0,248                               // add           %bh,%al
   .byte  0,248                               // add           %bh,%al
-  .byte  224,255                             // loopne        2b771 <.literal16+0x7f1>
-  .byte  224,255                             // loopne        2b773 <.literal16+0x7f3>
-  .byte  224,255                             // loopne        2b775 <.literal16+0x7f5>
-  .byte  224,255                             // loopne        2b777 <.literal16+0x7f7>
-  .byte  224,255                             // loopne        2b779 <.literal16+0x7f9>
-  .byte  224,255                             // loopne        2b77b <.literal16+0x7fb>
-  .byte  224,255                             // loopne        2b77d <.literal16+0x7fd>
-  .byte  224,255                             // loopne        2b77f <.literal16+0x7ff>
+  .byte  224,255                             // loopne        2bad1 <.literal16+0x7f1>
+  .byte  224,255                             // loopne        2bad3 <.literal16+0x7f3>
+  .byte  224,255                             // loopne        2bad5 <.literal16+0x7f5>
+  .byte  224,255                             // loopne        2bad7 <.literal16+0x7f7>
+  .byte  224,255                             // loopne        2bad9 <.literal16+0x7f9>
+  .byte  224,255                             // loopne        2badb <.literal16+0x7fb>
+  .byte  224,255                             // loopne        2badd <.literal16+0x7fd>
+  .byte  224,255                             // loopne        2badf <.literal16+0x7ff>
   .byte  54,0,54                             // add           %dh,%ss:(%rsi)
   .byte  0,54                                // add           %dh,(%rsi)
   .byte  0,54                                // add           %dh,(%rsi)
@@ -53889,9 +54038,9 @@
   .byte  4,0                                 // add           $0x0,%al
   .byte  0,0                                 // add           %al,(%rax)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            2b7db <.literal8+0x1b>
+  .byte  127,0                               // jg            2bb3b <.literal8+0x1b>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            2b7df <.literal8+0x1f>
+  .byte  127,0                               // jg            2bb3f <.literal8+0x1f>
   .byte  0,0                                 // add           %al,(%rax)
   .byte  128,0,0                             // addb          $0x0,(%rax)
   .byte  0                                   // .byte         0x0
@@ -53983,11 +54132,11 @@
   .byte  102,15,110,2                        // movd          (%edx),%xmm0
   .byte  102,15,112,192,0                    // pshufd        $0x0,%xmm0,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,88,128,92,203,0,0                // addps         0xcb5c(%eax),%xmm0
+  .byte  15,88,128,236,203,0,0               // addps         0xcbec(%eax),%xmm0
   .byte  102,15,110,74,4                     // movd          0x4(%edx),%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,88,136,108,203,0,0               // addps         0xcb6c(%eax),%xmm1
+  .byte  15,88,136,252,203,0,0               // addps         0xcbfc(%eax),%xmm1
   .byte  141,113,4                           // lea           0x4(%ecx),%esi
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  15,41,82,64                         // movaps        %xmm2,0x40(%edx)
@@ -53995,7 +54144,7 @@
   .byte  15,41,82,32                         // movaps        %xmm2,0x20(%edx)
   .byte  15,41,82,16                         // movaps        %xmm2,0x10(%edx)
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,144,124,203,0,0               // movaps        0xcb7c(%eax),%xmm2
+  .byte  15,40,144,12,204,0,0                // movaps        0xcc0c(%eax),%xmm2
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  86                                  // push          %esi
   .byte  82                                  // push          %edx
@@ -54022,15 +54171,15 @@
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  102,15,110,32                       // movd          (%eax),%xmm4
   .byte  102,15,112,228,0                    // pshufd        $0x0,%xmm4,%xmm4
-  .byte  102,15,254,161,23,203,0,0           // paddd         0xcb17(%ecx),%xmm4
+  .byte  102,15,254,161,167,203,0,0          // paddd         0xcba7(%ecx),%xmm4
   .byte  102,15,110,104,4                    // movd          0x4(%eax),%xmm5
   .byte  102,15,112,253,0                    // pshufd        $0x0,%xmm5,%xmm7
   .byte  102,15,239,252                      // pxor          %xmm4,%xmm7
-  .byte  102,15,111,177,39,203,0,0           // movdqa        0xcb27(%ecx),%xmm6
+  .byte  102,15,111,177,183,203,0,0          // movdqa        0xcbb7(%ecx),%xmm6
   .byte  102,15,111,207                      // movdqa        %xmm7,%xmm1
   .byte  102,15,219,206                      // pand          %xmm6,%xmm1
   .byte  102,15,114,241,5                    // pslld         $0x5,%xmm1
-  .byte  102,15,111,129,71,203,0,0           // movdqa        0xcb47(%ecx),%xmm0
+  .byte  102,15,111,129,215,203,0,0          // movdqa        0xcbd7(%ecx),%xmm0
   .byte  102,15,111,239                      // movdqa        %xmm7,%xmm5
   .byte  102,15,219,232                      // pand          %xmm0,%xmm5
   .byte  102,15,114,245,2                    // pslld         $0x2,%xmm5
@@ -54040,7 +54189,7 @@
   .byte  102,15,219,196                      // pand          %xmm4,%xmm0
   .byte  102,15,254,192                      // paddd         %xmm0,%xmm0
   .byte  102,15,235,198                      // por           %xmm6,%xmm0
-  .byte  102,15,111,137,55,203,0,0           // movdqa        0xcb37(%ecx),%xmm1
+  .byte  102,15,111,137,199,203,0,0          // movdqa        0xcbc7(%ecx),%xmm1
   .byte  102,15,219,249                      // pand          %xmm1,%xmm7
   .byte  102,15,219,225                      // pand          %xmm1,%xmm4
   .byte  102,15,114,212,2                    // psrld         $0x2,%xmm4
@@ -54051,8 +54200,8 @@
   .byte  102,15,114,215,1                    // psrld         $0x1,%xmm7
   .byte  102,15,235,231                      // por           %xmm7,%xmm4
   .byte  15,91,196                           // cvtdq2ps      %xmm4,%xmm0
-  .byte  15,89,129,87,203,0,0                // mulps         0xcb57(%ecx),%xmm0
-  .byte  15,88,129,103,203,0,0               // addps         0xcb67(%ecx),%xmm0
+  .byte  15,89,129,231,203,0,0               // mulps         0xcbe7(%ecx),%xmm0
+  .byte  15,88,129,247,203,0,0               // addps         0xcbf7(%ecx),%xmm0
   .byte  243,15,16,14                        // movss         (%esi),%xmm1
   .byte  15,198,201,0                        // shufps        $0x0,%xmm1,%xmm1
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
@@ -54120,7 +54269,7 @@
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  141,81,4                            // lea           0x4(%ecx),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,152,203,201,0,0               // movaps        0xc9cb(%eax),%xmm3
+  .byte  15,40,152,91,202,0,0                // movaps        0xca5b(%eax),%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -54143,7 +54292,7 @@
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  141,81,4                            // lea           0x4(%ecx),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,128,155,201,0,0               // movaps        0xc99b(%eax),%xmm0
+  .byte  15,40,128,43,202,0,0                // movaps        0xca2b(%eax),%xmm0
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -54233,7 +54382,7 @@
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  15,40,97,64                         // movaps        0x40(%ecx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
-  .byte  15,40,170,236,200,0,0               // movaps        0xc8ec(%edx),%xmm5
+  .byte  15,40,170,124,201,0,0               // movaps        0xc97c(%edx),%xmm5
   .byte  15,92,235                           // subps         %xmm3,%xmm5
   .byte  15,40,113,16                        // movaps        0x10(%ecx),%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
@@ -54272,7 +54421,7 @@
   .byte  15,40,105,64                        // movaps        0x40(%ecx),%xmm5
   .byte  15,40,113,16                        // movaps        0x10(%ecx),%xmm6
   .byte  15,89,243                           // mulps         %xmm3,%xmm6
-  .byte  15,40,162,141,200,0,0               // movaps        0xc88d(%edx),%xmm4
+  .byte  15,40,162,29,201,0,0                // movaps        0xc91d(%edx),%xmm4
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  15,88,198                           // addps         %xmm6,%xmm0
@@ -54356,7 +54505,7 @@
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,85,8                            // mov           0x8(%ebp),%edx
-  .byte  15,40,160,204,199,0,0               // movaps        0xc7cc(%eax),%xmm4
+  .byte  15,40,160,92,200,0,0                // movaps        0xc85c(%eax),%xmm4
   .byte  15,92,98,64                         // subps         0x40(%edx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
@@ -54382,7 +54531,7 @@
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,85,8                            // mov           0x8(%ebp),%edx
-  .byte  15,40,160,148,199,0,0               // movaps        0xc794(%eax),%xmm4
+  .byte  15,40,160,36,200,0,0                // movaps        0xc824(%eax),%xmm4
   .byte  15,92,227                           // subps         %xmm3,%xmm4
   .byte  15,40,66,16                         // movaps        0x10(%edx),%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
@@ -54412,7 +54561,7 @@
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,85,8                            // mov           0x8(%ebp),%edx
-  .byte  15,40,160,77,199,0,0                // movaps        0xc74d(%eax),%xmm4
+  .byte  15,40,160,221,199,0,0               // movaps        0xc7dd(%eax),%xmm4
   .byte  15,92,227                           // subps         %xmm3,%xmm4
   .byte  15,40,106,16                        // movaps        0x10(%edx),%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
@@ -54446,7 +54595,7 @@
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,85,8                            // mov           0x8(%ebp),%edx
   .byte  15,40,106,64                        // movaps        0x40(%edx),%xmm5
-  .byte  15,40,160,253,198,0,0               // movaps        0xc6fd(%eax),%xmm4
+  .byte  15,40,160,141,199,0,0               // movaps        0xc78d(%eax),%xmm4
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  15,88,66,16                         // addps         0x10(%edx),%xmm0
@@ -54502,7 +54651,7 @@
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  15,40,80,64                         // movaps        0x40(%eax),%xmm2
   .byte  15,41,85,200                        // movaps        %xmm2,-0x38(%ebp)
-  .byte  15,40,129,126,198,0,0               // movaps        0xc67e(%ecx),%xmm0
+  .byte  15,40,129,14,199,0,0                // movaps        0xc70e(%ecx),%xmm0
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  15,92,242                           // subps         %xmm2,%xmm6
   .byte  15,40,254                           // movaps        %xmm6,%xmm7
@@ -54562,7 +54711,7 @@
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,85,8                            // mov           0x8(%ebp),%edx
   .byte  15,88,66,16                         // addps         0x10(%edx),%xmm0
-  .byte  15,40,160,216,197,0,0               // movaps        0xc5d8(%eax),%xmm4
+  .byte  15,40,160,104,198,0,0               // movaps        0xc668(%eax),%xmm4
   .byte  15,93,196                           // minps         %xmm4,%xmm0
   .byte  15,88,74,32                         // addps         0x20(%edx),%xmm1
   .byte  15,93,204                           // minps         %xmm4,%xmm1
@@ -54634,7 +54783,7 @@
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  15,40,105,64                        // movaps        0x40(%ecx),%xmm5
-  .byte  15,40,154,42,197,0,0                // movaps        0xc52a(%edx),%xmm3
+  .byte  15,40,154,186,197,0,0               // movaps        0xc5ba(%edx),%xmm3
   .byte  15,40,243                           // movaps        %xmm3,%xmm6
   .byte  15,92,245                           // subps         %xmm5,%xmm6
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
@@ -54696,7 +54845,7 @@
   .byte  15,89,203                           // mulps         %xmm3,%xmm1
   .byte  15,95,209                           // maxps         %xmm1,%xmm2
   .byte  15,92,234                           // subps         %xmm2,%xmm5
-  .byte  15,40,138,194,196,0,0               // movaps        0xc4c2(%edx),%xmm1
+  .byte  15,40,138,82,197,0,0                // movaps        0xc552(%edx),%xmm1
   .byte  15,92,203                           // subps         %xmm3,%xmm1
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
   .byte  15,88,217                           // addps         %xmm1,%xmm3
@@ -54745,7 +54894,7 @@
   .byte  15,89,203                           // mulps         %xmm3,%xmm1
   .byte  15,93,209                           // minps         %xmm1,%xmm2
   .byte  15,92,234                           // subps         %xmm2,%xmm5
-  .byte  15,40,138,66,196,0,0                // movaps        0xc442(%edx),%xmm1
+  .byte  15,40,138,210,196,0,0               // movaps        0xc4d2(%edx),%xmm1
   .byte  15,92,203                           // subps         %xmm3,%xmm1
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
   .byte  15,88,217                           // addps         %xmm1,%xmm3
@@ -54798,7 +54947,7 @@
   .byte  15,93,214                           // minps         %xmm6,%xmm2
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  15,92,226                           // subps         %xmm2,%xmm4
-  .byte  15,40,146,191,195,0,0               // movaps        0xc3bf(%edx),%xmm2
+  .byte  15,40,146,79,196,0,0                // movaps        0xc44f(%edx),%xmm2
   .byte  15,92,211                           // subps         %xmm3,%xmm2
   .byte  15,89,213                           // mulps         %xmm5,%xmm2
   .byte  15,88,218                           // addps         %xmm2,%xmm3
@@ -54842,7 +54991,7 @@
   .byte  15,89,202                           // mulps         %xmm2,%xmm1
   .byte  15,88,201                           // addps         %xmm1,%xmm1
   .byte  15,92,233                           // subps         %xmm1,%xmm5
-  .byte  15,40,138,57,195,0,0                // movaps        0xc339(%edx),%xmm1
+  .byte  15,40,138,201,195,0,0               // movaps        0xc3c9(%edx),%xmm1
   .byte  15,92,203                           // subps         %xmm3,%xmm1
   .byte  15,89,73,64                         // mulps         0x40(%ecx),%xmm1
   .byte  15,88,217                           // addps         %xmm1,%xmm3
@@ -54883,7 +55032,7 @@
   .byte  15,93,198                           // minps         %xmm6,%xmm0
   .byte  15,40,233                           // movaps        %xmm1,%xmm5
   .byte  15,92,232                           // subps         %xmm0,%xmm5
-  .byte  15,40,177,186,194,0,0               // movaps        0xc2ba(%ecx),%xmm6
+  .byte  15,40,177,74,195,0,0                // movaps        0xc34a(%ecx),%xmm6
   .byte  15,40,198                           // movaps        %xmm6,%xmm0
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,41,69,200                        // movaps        %xmm0,-0x38(%ebp)
@@ -55000,7 +55149,7 @@
   .byte  89                                  // pop           %ecx
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  15,40,72,16                         // movaps        0x10(%eax),%xmm1
-  .byte  15,40,145,49,193,0,0                // movaps        0xc131(%ecx),%xmm2
+  .byte  15,40,145,193,193,0,0               // movaps        0xc1c1(%ecx),%xmm2
   .byte  15,40,226                           // movaps        %xmm2,%xmm4
   .byte  15,92,214                           // subps         %xmm6,%xmm2
   .byte  15,40,250                           // movaps        %xmm2,%xmm7
@@ -55117,7 +55266,7 @@
   .byte  89                                  // pop           %ecx
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  15,40,72,64                         // movaps        0x40(%eax),%xmm1
-  .byte  15,40,145,208,191,0,0               // movaps        0xbfd0(%ecx),%xmm2
+  .byte  15,40,145,96,192,0,0                // movaps        0xc060(%ecx),%xmm2
   .byte  15,40,234                           // movaps        %xmm2,%xmm5
   .byte  15,92,233                           // subps         %xmm1,%xmm5
   .byte  15,40,225                           // movaps        %xmm1,%xmm4
@@ -55227,7 +55376,7 @@
   .byte  89                                  // pop           %ecx
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  15,40,80,64                         // movaps        0x40(%eax),%xmm2
-  .byte  15,40,161,133,190,0,0               // movaps        0xbe85(%ecx),%xmm4
+  .byte  15,40,161,21,191,0,0                // movaps        0xbf15(%ecx),%xmm4
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  15,92,242                           // subps         %xmm2,%xmm6
   .byte  15,40,206                           // movaps        %xmm6,%xmm1
@@ -55355,17 +55504,17 @@
   .byte  232,0,0,0,0                         // call          f1b <_sk_softlight_sse2+0x52>
   .byte  89                                  // pop           %ecx
   .byte  15,40,194                           // movaps        %xmm2,%xmm0
-  .byte  15,40,137,101,189,0,0               // movaps        0xbd65(%ecx),%xmm1
+  .byte  15,40,137,245,189,0,0               // movaps        0xbdf5(%ecx),%xmm1
   .byte  15,41,141,104,255,255,255           // movaps        %xmm1,-0x98(%ebp)
   .byte  15,88,193                           // addps         %xmm1,%xmm0
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
-  .byte  15,40,185,245,188,0,0               // movaps        0xbcf5(%ecx),%xmm7
+  .byte  15,40,185,133,189,0,0               // movaps        0xbd85(%ecx),%xmm7
   .byte  15,41,125,232                       // movaps        %xmm7,-0x18(%ebp)
   .byte  15,92,250                           // subps         %xmm2,%xmm7
   .byte  15,82,242                           // rsqrtps       %xmm2,%xmm6
   .byte  15,83,206                           // rcpps         %xmm6,%xmm1
   .byte  15,92,202                           // subps         %xmm2,%xmm1
-  .byte  15,40,161,117,189,0,0               // movaps        0xbd75(%ecx),%xmm4
+  .byte  15,40,161,5,190,0,0                 // movaps        0xbe05(%ecx),%xmm4
   .byte  15,41,101,152                       // movaps        %xmm4,-0x68(%ebp)
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  15,88,208                           // addps         %xmm0,%xmm2
@@ -55571,7 +55720,7 @@
   .byte  15,40,226                           // movaps        %xmm2,%xmm4
   .byte  15,40,72,64                         // movaps        0x40(%eax),%xmm1
   .byte  15,41,77,216                        // movaps        %xmm1,-0x28(%ebp)
-  .byte  15,40,169,52,186,0,0                // movaps        0xba34(%ecx),%xmm5
+  .byte  15,40,169,196,186,0,0               // movaps        0xbac4(%ecx),%xmm5
   .byte  15,92,233                           // subps         %xmm1,%xmm5
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
   .byte  15,41,133,72,255,255,255            // movaps        %xmm0,-0xb8(%ebp)
@@ -55604,17 +55753,17 @@
   .byte  15,89,233                           // mulps         %xmm1,%xmm5
   .byte  15,41,173,120,255,255,255           // movaps        %xmm5,-0x88(%ebp)
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
-  .byte  15,40,153,196,186,0,0               // movaps        0xbac4(%ecx),%xmm3
+  .byte  15,40,153,84,187,0,0                // movaps        0xbb54(%ecx),%xmm3
   .byte  15,41,93,232                        // movaps        %xmm3,-0x18(%ebp)
   .byte  15,40,117,152                       // movaps        -0x68(%ebp),%xmm6
   .byte  15,40,206                           // movaps        %xmm6,%xmm1
   .byte  15,89,203                           // mulps         %xmm3,%xmm1
-  .byte  15,40,153,212,186,0,0               // movaps        0xbad4(%ecx),%xmm3
+  .byte  15,40,153,100,187,0,0               // movaps        0xbb64(%ecx),%xmm3
   .byte  15,40,109,136                       // movaps        -0x78(%ebp),%xmm5
   .byte  15,40,253                           // movaps        %xmm5,%xmm7
   .byte  15,89,251                           // mulps         %xmm3,%xmm7
   .byte  15,88,249                           // addps         %xmm1,%xmm7
-  .byte  15,40,137,52,186,0,0                // movaps        0xba34(%ecx),%xmm1
+  .byte  15,40,137,196,186,0,0               // movaps        0xbac4(%ecx),%xmm1
   .byte  15,92,77,184                        // subps         -0x48(%ebp),%xmm1
   .byte  15,89,241                           // mulps         %xmm1,%xmm6
   .byte  15,41,117,152                       // movaps        %xmm6,-0x68(%ebp)
@@ -55624,7 +55773,7 @@
   .byte  15,40,77,200                        // movaps        -0x38(%ebp),%xmm1
   .byte  15,89,241                           // mulps         %xmm1,%xmm6
   .byte  15,41,117,168                       // movaps        %xmm6,-0x58(%ebp)
-  .byte  15,40,169,228,186,0,0               // movaps        0xbae4(%ecx),%xmm5
+  .byte  15,40,169,116,187,0,0               // movaps        0xbb74(%ecx),%xmm5
   .byte  15,89,205                           // mulps         %xmm5,%xmm1
   .byte  15,88,207                           // addps         %xmm7,%xmm1
   .byte  15,94,212                           // divps         %xmm4,%xmm2
@@ -55817,17 +55966,17 @@
   .byte  15,89,253                           // mulps         %xmm5,%xmm7
   .byte  232,0,0,0,0                         // call          1530 <_sk_saturation_sse2+0xb0>
   .byte  89                                  // pop           %ecx
-  .byte  15,40,153,112,183,0,0               // movaps        0xb770(%ecx),%xmm3
+  .byte  15,40,153,0,184,0,0                 // movaps        0xb800(%ecx),%xmm3
   .byte  15,41,157,88,255,255,255            // movaps        %xmm3,-0xa8(%ebp)
   .byte  15,40,77,184                        // movaps        -0x48(%ebp),%xmm1
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,40,153,128,183,0,0               // movaps        0xb780(%ecx),%xmm3
+  .byte  15,40,153,16,184,0,0                // movaps        0xb810(%ecx),%xmm3
   .byte  15,41,93,232                        // movaps        %xmm3,-0x18(%ebp)
   .byte  15,40,238                           // movaps        %xmm6,%xmm5
   .byte  15,89,235                           // mulps         %xmm3,%xmm5
   .byte  15,88,232                           // addps         %xmm0,%xmm5
-  .byte  15,40,129,224,182,0,0               // movaps        0xb6e0(%ecx),%xmm0
+  .byte  15,40,129,112,183,0,0               // movaps        0xb770(%ecx),%xmm0
   .byte  15,41,133,104,255,255,255           // movaps        %xmm0,-0x98(%ebp)
   .byte  15,92,69,216                        // subps         -0x28(%ebp),%xmm0
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
@@ -55839,7 +55988,7 @@
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
   .byte  15,41,141,120,255,255,255           // movaps        %xmm1,-0x88(%ebp)
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
-  .byte  15,40,129,144,183,0,0               // movaps        0xb790(%ecx),%xmm0
+  .byte  15,40,129,32,184,0,0                // movaps        0xb820(%ecx),%xmm0
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
   .byte  15,88,205                           // addps         %xmm5,%xmm1
   .byte  15,40,109,168                       // movaps        -0x58(%ebp),%xmm5
@@ -55998,16 +56147,16 @@
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  15,40,80,16                         // movaps        0x10(%eax),%xmm2
   .byte  15,40,72,32                         // movaps        0x20(%eax),%xmm1
-  .byte  15,40,177,21,181,0,0                // movaps        0xb515(%ecx),%xmm6
+  .byte  15,40,177,165,181,0,0               // movaps        0xb5a5(%ecx),%xmm6
   .byte  15,41,117,216                       // movaps        %xmm6,-0x28(%ebp)
   .byte  15,40,194                           // movaps        %xmm2,%xmm0
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
-  .byte  15,40,153,37,181,0,0                // movaps        0xb525(%ecx),%xmm3
+  .byte  15,40,153,181,181,0,0               // movaps        0xb5b5(%ecx),%xmm3
   .byte  15,41,93,184                        // movaps        %xmm3,-0x48(%ebp)
   .byte  15,40,241                           // movaps        %xmm1,%xmm6
   .byte  15,89,243                           // mulps         %xmm3,%xmm6
   .byte  15,88,240                           // addps         %xmm0,%xmm6
-  .byte  15,40,129,133,180,0,0               // movaps        0xb485(%ecx),%xmm0
+  .byte  15,40,129,21,181,0,0                // movaps        0xb515(%ecx),%xmm0
   .byte  15,41,69,168                        // movaps        %xmm0,-0x58(%ebp)
   .byte  15,92,69,200                        // subps         -0x38(%ebp),%xmm0
   .byte  15,89,208                           // mulps         %xmm0,%xmm2
@@ -56017,7 +56166,7 @@
   .byte  15,40,80,48                         // movaps        0x30(%eax),%xmm2
   .byte  15,89,194                           // mulps         %xmm2,%xmm0
   .byte  15,41,133,72,255,255,255            // movaps        %xmm0,-0xb8(%ebp)
-  .byte  15,40,137,53,181,0,0                // movaps        0xb535(%ecx),%xmm1
+  .byte  15,40,137,197,181,0,0               // movaps        0xb5c5(%ecx),%xmm1
   .byte  15,89,209                           // mulps         %xmm1,%xmm2
   .byte  15,88,214                           // addps         %xmm6,%xmm2
   .byte  15,40,88,64                         // movaps        0x40(%eax),%xmm3
@@ -56176,18 +56325,18 @@
   .byte  232,0,0,0,0                         // call          19ee <_sk_luminosity_sse2+0x11>
   .byte  89                                  // pop           %ecx
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
-  .byte  15,40,161,178,178,0,0               // movaps        0xb2b2(%ecx),%xmm4
+  .byte  15,40,161,66,179,0,0                // movaps        0xb342(%ecx),%xmm4
   .byte  15,41,101,232                       // movaps        %xmm4,-0x18(%ebp)
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
-  .byte  15,40,161,194,178,0,0               // movaps        0xb2c2(%ecx),%xmm4
+  .byte  15,40,161,82,179,0,0                // movaps        0xb352(%ecx),%xmm4
   .byte  15,41,101,216                       // movaps        %xmm4,-0x28(%ebp)
   .byte  15,40,233                           // movaps        %xmm1,%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
   .byte  15,88,234                           // addps         %xmm2,%xmm5
   .byte  15,40,80,64                         // movaps        0x40(%eax),%xmm2
   .byte  15,41,85,184                        // movaps        %xmm2,-0x48(%ebp)
-  .byte  15,40,161,34,178,0,0                // movaps        0xb222(%ecx),%xmm4
+  .byte  15,40,161,178,178,0,0               // movaps        0xb2b2(%ecx),%xmm4
   .byte  15,40,252                           // movaps        %xmm4,%xmm7
   .byte  15,92,250                           // subps         %xmm2,%xmm7
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
@@ -56197,7 +56346,7 @@
   .byte  15,89,254                           // mulps         %xmm6,%xmm7
   .byte  15,41,189,104,255,255,255           // movaps        %xmm7,-0x98(%ebp)
   .byte  15,40,214                           // movaps        %xmm6,%xmm2
-  .byte  15,40,137,210,178,0,0               // movaps        0xb2d2(%ecx),%xmm1
+  .byte  15,40,137,98,179,0,0                // movaps        0xb362(%ecx),%xmm1
   .byte  15,89,209                           // mulps         %xmm1,%xmm2
   .byte  15,88,213                           // addps         %xmm5,%xmm2
   .byte  15,40,104,16                        // movaps        0x10(%eax),%xmm5
@@ -56373,7 +56522,7 @@
   .byte  139,49                              // mov           (%ecx),%esi
   .byte  15,133,224,0,0,0                    // jne           1d5b <_sk_srcover_rgba_8888_sse2+0x119>
   .byte  243,15,111,20,178                   // movdqu        (%edx,%esi,4),%xmm2
-  .byte  102,15,111,167,119,176,0,0          // movdqa        0xb077(%edi),%xmm4
+  .byte  102,15,111,167,7,177,0,0            // movdqa        0xb107(%edi),%xmm4
   .byte  102,15,111,234                      // movdqa        %xmm2,%xmm5
   .byte  102,15,219,236                      // pand          %xmm4,%xmm5
   .byte  102,15,111,242                      // movdqa        %xmm2,%xmm6
@@ -56384,9 +56533,9 @@
   .byte  102,15,219,252                      // pand          %xmm4,%xmm7
   .byte  15,91,229                           // cvtdq2ps      %xmm5,%xmm4
   .byte  15,41,97,16                         // movaps        %xmm4,0x10(%ecx)
-  .byte  15,40,175,183,175,0,0               // movaps        0xafb7(%edi),%xmm5
+  .byte  15,40,175,71,176,0,0                // movaps        0xb047(%edi),%xmm5
   .byte  15,92,235                           // subps         %xmm3,%xmm5
-  .byte  15,40,143,135,176,0,0               // movaps        0xb087(%edi),%xmm1
+  .byte  15,40,143,23,177,0,0                // movaps        0xb117(%edi),%xmm1
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
   .byte  15,88,224                           // addps         %xmm0,%xmm4
@@ -56500,7 +56649,7 @@
   .byte  232,0,0,0,0                         // call          1e05 <_sk_clamp_1_sse2+0xb>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
-  .byte  15,40,160,11,174,0,0                // movaps        0xae0b(%eax),%xmm4
+  .byte  15,40,160,155,174,0,0               // movaps        0xae9b(%eax),%xmm4
   .byte  15,93,196                           // minps         %xmm4,%xmm0
   .byte  15,93,204                           // minps         %xmm4,%xmm1
   .byte  15,93,212                           // minps         %xmm4,%xmm2
@@ -56524,7 +56673,7 @@
   .byte  232,0,0,0,0                         // call          1e38 <_sk_clamp_a_sse2+0xb>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
-  .byte  15,93,152,216,173,0,0               // minps         0xadd8(%eax),%xmm3
+  .byte  15,93,152,104,174,0,0               // minps         0xae68(%eax),%xmm3
   .byte  15,93,195                           // minps         %xmm3,%xmm0
   .byte  15,93,203                           // minps         %xmm3,%xmm1
   .byte  15,93,211                           // minps         %xmm3,%xmm2
@@ -56549,7 +56698,7 @@
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,85,8                            // mov           0x8(%ebp),%edx
   .byte  15,40,98,64                         // movaps        0x40(%edx),%xmm4
-  .byte  15,93,160,168,173,0,0               // minps         0xada8(%eax),%xmm4
+  .byte  15,93,160,56,174,0,0                // minps         0xae38(%eax),%xmm4
   .byte  15,41,98,64                         // movaps        %xmm4,0x40(%edx)
   .byte  15,40,106,16                        // movaps        0x10(%edx),%xmm5
   .byte  15,40,114,32                        // movaps        0x20(%edx),%xmm6
@@ -56623,7 +56772,7 @@
   .byte  232,0,0,0,0                         // call          1f13 <_sk_invert_sse2+0xb>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
-  .byte  15,40,160,253,172,0,0               // movaps        0xacfd(%eax),%xmm4
+  .byte  15,40,160,141,173,0,0               // movaps        0xad8d(%eax),%xmm4
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,92,232                           // subps         %xmm0,%xmm5
   .byte  15,40,244                           // movaps        %xmm4,%xmm6
@@ -56746,7 +56895,7 @@
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  15,40,168,255,171,0,0               // movaps        0xabff(%eax),%xmm5
+  .byte  15,40,168,143,172,0,0               // movaps        0xac8f(%eax),%xmm5
   .byte  15,94,235                           // divps         %xmm3,%xmm5
   .byte  15,194,227,4                        // cmpneqps      %xmm3,%xmm4
   .byte  15,84,229                           // andps         %xmm5,%xmm4
@@ -56777,19 +56926,19 @@
   .byte  88                                  // pop           %eax
   .byte  15,40,202                           // movaps        %xmm2,%xmm1
   .byte  15,89,201                           // mulps         %xmm1,%xmm1
-  .byte  15,40,160,69,172,0,0                // movaps        0xac45(%eax),%xmm4
+  .byte  15,40,160,213,172,0,0               // movaps        0xacd5(%eax),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
-  .byte  15,40,176,165,172,0,0               // movaps        0xaca5(%eax),%xmm6
+  .byte  15,40,176,53,173,0,0                // movaps        0xad35(%eax),%xmm6
   .byte  15,41,117,216                       // movaps        %xmm6,-0x28(%ebp)
   .byte  15,88,198                           // addps         %xmm6,%xmm0
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
-  .byte  15,40,176,149,172,0,0               // movaps        0xac95(%eax),%xmm6
+  .byte  15,40,176,37,173,0,0                // movaps        0xad25(%eax),%xmm6
   .byte  15,40,202                           // movaps        %xmm2,%xmm1
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
-  .byte  15,40,184,181,172,0,0               // movaps        0xacb5(%eax),%xmm7
+  .byte  15,40,184,69,173,0,0                // movaps        0xad45(%eax),%xmm7
   .byte  15,41,125,232                       // movaps        %xmm7,-0x18(%ebp)
   .byte  15,88,199                           // addps         %xmm7,%xmm0
-  .byte  15,40,184,197,172,0,0               // movaps        0xacc5(%eax),%xmm7
+  .byte  15,40,184,85,173,0,0                // movaps        0xad55(%eax),%xmm7
   .byte  15,194,215,1                        // cmpltps       %xmm7,%xmm2
   .byte  15,84,202                           // andps         %xmm2,%xmm1
   .byte  15,85,208                           // andnps        %xmm0,%xmm2
@@ -56849,18 +56998,18 @@
   .byte  15,40,72,16                         // movaps        0x10(%eax),%xmm1
   .byte  15,40,233                           // movaps        %xmm1,%xmm5
   .byte  15,89,237                           // mulps         %xmm5,%xmm5
-  .byte  15,40,161,106,171,0,0               // movaps        0xab6a(%ecx),%xmm4
+  .byte  15,40,161,250,171,0,0               // movaps        0xabfa(%ecx),%xmm4
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
-  .byte  15,40,177,202,171,0,0               // movaps        0xabca(%ecx),%xmm6
+  .byte  15,40,177,90,172,0,0                // movaps        0xac5a(%ecx),%xmm6
   .byte  15,88,198                           // addps         %xmm6,%xmm0
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
-  .byte  15,40,169,186,171,0,0               // movaps        0xabba(%ecx),%xmm5
+  .byte  15,40,169,74,172,0,0                // movaps        0xac4a(%ecx),%xmm5
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  15,89,213                           // mulps         %xmm5,%xmm2
-  .byte  15,40,185,218,171,0,0               // movaps        0xabda(%ecx),%xmm7
+  .byte  15,40,185,106,172,0,0               // movaps        0xac6a(%ecx),%xmm7
   .byte  15,88,199                           // addps         %xmm7,%xmm0
-  .byte  15,40,153,234,171,0,0               // movaps        0xabea(%ecx),%xmm3
+  .byte  15,40,153,122,172,0,0               // movaps        0xac7a(%ecx),%xmm3
   .byte  15,194,203,1                        // cmpltps       %xmm3,%xmm1
   .byte  15,84,209                           // andps         %xmm1,%xmm2
   .byte  15,85,200                           // andnps        %xmm0,%xmm1
@@ -56922,25 +57071,25 @@
   .byte  232,0,0,0,0                         // call          2221 <_sk_to_srgb_sse2+0x18>
   .byte  88                                  // pop           %eax
   .byte  15,82,218                           // rsqrtps       %xmm2,%xmm3
-  .byte  15,40,160,31,171,0,0                // movaps        0xab1f(%eax),%xmm4
+  .byte  15,40,160,175,171,0,0               // movaps        0xabaf(%eax),%xmm4
   .byte  15,40,235                           // movaps        %xmm3,%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
-  .byte  15,40,128,47,171,0,0                // movaps        0xab2f(%eax),%xmm0
+  .byte  15,40,128,191,171,0,0               // movaps        0xabbf(%eax),%xmm0
   .byte  15,41,69,232                        // movaps        %xmm0,-0x18(%ebp)
   .byte  15,88,232                           // addps         %xmm0,%xmm5
   .byte  15,89,235                           // mulps         %xmm3,%xmm5
-  .byte  15,40,128,63,171,0,0                // movaps        0xab3f(%eax),%xmm0
+  .byte  15,40,128,207,171,0,0               // movaps        0xabcf(%eax),%xmm0
   .byte  15,41,69,200                        // movaps        %xmm0,-0x38(%ebp)
   .byte  15,88,232                           // addps         %xmm0,%xmm5
-  .byte  15,40,128,79,171,0,0                // movaps        0xab4f(%eax),%xmm0
+  .byte  15,40,128,223,171,0,0               // movaps        0xabdf(%eax),%xmm0
   .byte  15,41,69,216                        // movaps        %xmm0,-0x28(%ebp)
   .byte  15,88,216                           // addps         %xmm0,%xmm3
   .byte  15,83,195                           // rcpps         %xmm3,%xmm0
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
-  .byte  15,40,168,15,171,0,0                // movaps        0xab0f(%eax),%xmm5
+  .byte  15,40,168,159,171,0,0               // movaps        0xab9f(%eax),%xmm5
   .byte  15,40,202                           // movaps        %xmm2,%xmm1
   .byte  15,89,205                           // mulps         %xmm5,%xmm1
-  .byte  15,40,152,95,171,0,0                // movaps        0xab5f(%eax),%xmm3
+  .byte  15,40,152,239,171,0,0               // movaps        0xabef(%eax),%xmm3
   .byte  15,194,211,1                        // cmpltps       %xmm3,%xmm2
   .byte  15,84,202                           // andps         %xmm2,%xmm1
   .byte  15,85,208                           // andnps        %xmm0,%xmm2
@@ -57011,14 +57160,14 @@
   .byte  15,40,195                           // movaps        %xmm3,%xmm0
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,41,69,216                        // movaps        %xmm0,-0x28(%ebp)
-  .byte  15,40,136,248,168,0,0               // movaps        0xa8f8(%eax),%xmm1
+  .byte  15,40,136,136,169,0,0               // movaps        0xa988(%eax),%xmm1
   .byte  15,94,200                           // divps         %xmm0,%xmm1
   .byte  15,40,199                           // movaps        %xmm7,%xmm0
   .byte  15,92,194                           // subps         %xmm2,%xmm0
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
   .byte  15,40,239                           // movaps        %xmm7,%xmm5
   .byte  15,194,234,1                        // cmpltps       %xmm2,%xmm5
-  .byte  15,84,168,120,170,0,0               // andps         0xaa78(%eax),%xmm5
+  .byte  15,84,168,8,171,0,0                 // andps         0xab08(%eax),%xmm5
   .byte  15,88,232                           // addps         %xmm0,%xmm5
   .byte  15,40,195                           // movaps        %xmm3,%xmm0
   .byte  15,194,196,0                        // cmpeqps       %xmm4,%xmm0
@@ -57028,9 +57177,9 @@
   .byte  15,92,231                           // subps         %xmm7,%xmm4
   .byte  15,89,209                           // mulps         %xmm1,%xmm2
   .byte  15,89,225                           // mulps         %xmm1,%xmm4
-  .byte  15,40,136,136,170,0,0               // movaps        0xaa88(%eax),%xmm1
+  .byte  15,40,136,24,171,0,0                // movaps        0xab18(%eax),%xmm1
   .byte  15,88,209                           // addps         %xmm1,%xmm2
-  .byte  15,88,160,152,170,0,0               // addps         0xaa98(%eax),%xmm4
+  .byte  15,88,160,40,171,0,0                // addps         0xab28(%eax),%xmm4
   .byte  15,84,214                           // andps         %xmm6,%xmm2
   .byte  15,85,244                           // andnps        %xmm4,%xmm6
   .byte  15,86,242                           // orps          %xmm2,%xmm6
@@ -57042,7 +57191,7 @@
   .byte  15,194,226,4                        // cmpneqps      %xmm2,%xmm4
   .byte  15,92,203                           // subps         %xmm3,%xmm1
   .byte  15,88,218                           // addps         %xmm2,%xmm3
-  .byte  15,40,168,232,168,0,0               // movaps        0xa8e8(%eax),%xmm5
+  .byte  15,40,168,120,169,0,0               // movaps        0xa978(%eax),%xmm5
   .byte  15,92,202                           // subps         %xmm2,%xmm1
   .byte  15,40,211                           // movaps        %xmm3,%xmm2
   .byte  15,89,213                           // mulps         %xmm5,%xmm2
@@ -57052,7 +57201,7 @@
   .byte  15,86,233                           // orps          %xmm1,%xmm5
   .byte  15,40,77,216                        // movaps        -0x28(%ebp),%xmm1
   .byte  15,94,205                           // divps         %xmm5,%xmm1
-  .byte  15,89,128,168,170,0,0               // mulps         0xaaa8(%eax),%xmm0
+  .byte  15,89,128,56,171,0,0                // mulps         0xab38(%eax),%xmm0
   .byte  15,84,196                           // andps         %xmm4,%xmm0
   .byte  15,84,204                           // andps         %xmm4,%xmm1
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
@@ -57077,7 +57226,7 @@
   .byte  15,41,69,184                        // movaps        %xmm0,-0x48(%ebp)
   .byte  232,0,0,0,0                         // call          2413 <_sk_hsl_to_rgb_sse2+0x19>
   .byte  88                                  // pop           %eax
-  .byte  15,40,160,237,167,0,0               // movaps        0xa7ed(%eax),%xmm4
+  .byte  15,40,160,125,168,0,0               // movaps        0xa87d(%eax),%xmm4
   .byte  15,40,220                           // movaps        %xmm4,%xmm3
   .byte  15,41,165,104,255,255,255           // movaps        %xmm4,-0x98(%ebp)
   .byte  15,194,218,2                        // cmpleps       %xmm2,%xmm3
@@ -57090,13 +57239,13 @@
   .byte  15,84,243                           // andps         %xmm3,%xmm6
   .byte  15,85,217                           // andnps        %xmm1,%xmm3
   .byte  15,86,222                           // orps          %xmm6,%xmm3
-  .byte  15,40,168,189,169,0,0               // movaps        0xa9bd(%eax),%xmm5
+  .byte  15,40,168,77,170,0,0                // movaps        0xaa4d(%eax),%xmm5
   .byte  15,88,232                           // addps         %xmm0,%xmm5
   .byte  243,15,91,205                       // cvttps2dq     %xmm5,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,194,193,1                        // cmpltps       %xmm1,%xmm0
-  .byte  15,40,176,253,167,0,0               // movaps        0xa7fd(%eax),%xmm6
+  .byte  15,40,176,141,168,0,0               // movaps        0xa88d(%eax),%xmm6
   .byte  15,41,117,136                       // movaps        %xmm6,-0x78(%ebp)
   .byte  15,84,198                           // andps         %xmm6,%xmm0
   .byte  15,92,200                           // subps         %xmm0,%xmm1
@@ -57106,19 +57255,19 @@
   .byte  15,41,93,216                        // movaps        %xmm3,-0x28(%ebp)
   .byte  15,88,210                           // addps         %xmm2,%xmm2
   .byte  15,92,211                           // subps         %xmm3,%xmm2
-  .byte  15,40,184,205,169,0,0               // movaps        0xa9cd(%eax),%xmm7
+  .byte  15,40,184,93,170,0,0                // movaps        0xaa5d(%eax),%xmm7
   .byte  15,41,189,88,255,255,255            // movaps        %xmm7,-0xa8(%ebp)
   .byte  15,194,253,2                        // cmpleps       %xmm5,%xmm7
   .byte  15,92,218                           // subps         %xmm2,%xmm3
   .byte  15,41,93,200                        // movaps        %xmm3,-0x38(%ebp)
   .byte  15,40,204                           // movaps        %xmm4,%xmm1
   .byte  15,194,205,2                        // cmpleps       %xmm5,%xmm1
-  .byte  15,40,160,173,169,0,0               // movaps        0xa9ad(%eax),%xmm4
+  .byte  15,40,160,61,170,0,0                // movaps        0xaa3d(%eax),%xmm4
   .byte  15,41,165,120,255,255,255           // movaps        %xmm4,-0x88(%ebp)
   .byte  15,194,229,2                        // cmpleps       %xmm5,%xmm4
-  .byte  15,40,176,125,169,0,0               // movaps        0xa97d(%eax),%xmm6
+  .byte  15,40,176,13,170,0,0                // movaps        0xaa0d(%eax),%xmm6
   .byte  15,89,238                           // mulps         %xmm6,%xmm5
-  .byte  15,40,128,157,169,0,0               // movaps        0xa99d(%eax),%xmm0
+  .byte  15,40,128,45,170,0,0                // movaps        0xaa2d(%eax),%xmm0
   .byte  15,41,69,168                        // movaps        %xmm0,-0x58(%ebp)
   .byte  15,92,197                           // subps         %xmm5,%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
@@ -57144,18 +57293,18 @@
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
   .byte  15,194,200,1                        // cmpltps       %xmm0,%xmm1
-  .byte  15,84,136,253,167,0,0               // andps         0xa7fd(%eax),%xmm1
+  .byte  15,84,136,141,168,0,0               // andps         0xa88d(%eax),%xmm1
   .byte  15,92,193                           // subps         %xmm1,%xmm0
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
   .byte  15,92,200                           // subps         %xmm0,%xmm1
-  .byte  15,40,128,205,169,0,0               // movaps        0xa9cd(%eax),%xmm0
+  .byte  15,40,128,93,170,0,0                // movaps        0xaa5d(%eax),%xmm0
   .byte  15,194,193,2                        // cmpleps       %xmm1,%xmm0
-  .byte  15,40,152,237,167,0,0               // movaps        0xa7ed(%eax),%xmm3
+  .byte  15,40,152,125,168,0,0               // movaps        0xa87d(%eax),%xmm3
   .byte  15,194,217,2                        // cmpleps       %xmm1,%xmm3
-  .byte  15,40,160,173,169,0,0               // movaps        0xa9ad(%eax),%xmm4
+  .byte  15,40,160,61,170,0,0                // movaps        0xaa3d(%eax),%xmm4
   .byte  15,194,225,2                        // cmpleps       %xmm1,%xmm4
   .byte  15,89,206                           // mulps         %xmm6,%xmm1
-  .byte  15,40,168,157,169,0,0               // movaps        0xa99d(%eax),%xmm5
+  .byte  15,40,168,45,170,0,0                // movaps        0xaa2d(%eax),%xmm5
   .byte  15,92,233                           // subps         %xmm1,%xmm5
   .byte  15,89,239                           // mulps         %xmm7,%xmm5
   .byte  15,88,234                           // addps         %xmm2,%xmm5
@@ -57175,7 +57324,7 @@
   .byte  15,40,125,232                       // movaps        -0x18(%ebp),%xmm7
   .byte  15,85,252                           // andnps        %xmm4,%xmm7
   .byte  15,40,93,184                        // movaps        -0x48(%ebp),%xmm3
-  .byte  15,88,152,221,169,0,0               // addps         0xa9dd(%eax),%xmm3
+  .byte  15,88,152,109,170,0,0               // addps         0xaa6d(%eax),%xmm3
   .byte  243,15,91,195                       // cvttps2dq     %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
   .byte  15,40,203                           // movaps        %xmm3,%xmm1
@@ -57277,9 +57426,9 @@
   .byte  102,15,110,36,62                    // movd          (%esi,%edi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,162,67,166,0,0           // pand          0xa643(%edx),%xmm4
+  .byte  102,15,219,162,211,166,0,0          // pand          0xa6d3(%edx),%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,162,115,167,0,0               // mulps         0xa773(%edx),%xmm4
+  .byte  15,89,162,3,168,0,0                 // mulps         0xa803(%edx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
@@ -57345,17 +57494,17 @@
   .byte  15,133,157,0,0,0                    // jne           2805 <_sk_scale_565_sse2+0xd8>
   .byte  243,15,126,52,126                   // movq          (%esi,%edi,2),%xmm6
   .byte  102,15,97,240                       // punpcklwd     %xmm0,%xmm6
-  .byte  102,15,111,162,201,166,0,0          // movdqa        0xa6c9(%edx),%xmm4
+  .byte  102,15,111,162,89,167,0,0           // movdqa        0xa759(%edx),%xmm4
   .byte  102,15,219,230                      // pand          %xmm6,%xmm4
   .byte  15,91,212                           // cvtdq2ps      %xmm4,%xmm2
-  .byte  15,89,146,217,166,0,0               // mulps         0xa6d9(%edx),%xmm2
-  .byte  102,15,111,170,233,166,0,0          // movdqa        0xa6e9(%edx),%xmm5
+  .byte  15,89,146,105,167,0,0               // mulps         0xa769(%edx),%xmm2
+  .byte  102,15,111,170,121,167,0,0          // movdqa        0xa779(%edx),%xmm5
   .byte  102,15,219,238                      // pand          %xmm6,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,170,249,166,0,0               // mulps         0xa6f9(%edx),%xmm5
-  .byte  102,15,219,178,9,167,0,0            // pand          0xa709(%edx),%xmm6
+  .byte  15,89,170,137,167,0,0               // mulps         0xa789(%edx),%xmm5
+  .byte  102,15,219,178,153,167,0,0          // pand          0xa799(%edx),%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,178,25,167,0,0                // mulps         0xa719(%edx),%xmm6
+  .byte  15,89,178,169,167,0,0               // mulps         0xa7a9(%edx),%xmm6
   .byte  15,40,253                           // movaps        %xmm5,%xmm7
   .byte  15,93,254                           // minps         %xmm6,%xmm7
   .byte  15,40,226                           // movaps        %xmm2,%xmm4
@@ -57469,9 +57618,9 @@
   .byte  102,15,110,36,62                    // movd          (%esi,%edi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,162,27,164,0,0           // pand          0xa41b(%edx),%xmm4
+  .byte  102,15,219,162,171,164,0,0          // pand          0xa4ab(%edx),%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,162,75,165,0,0                // mulps         0xa54b(%edx),%xmm4
+  .byte  15,89,162,219,165,0,0               // mulps         0xa5db(%edx),%xmm4
   .byte  15,40,105,16                        // movaps        0x10(%ecx),%xmm5
   .byte  15,40,113,32                        // movaps        0x20(%ecx),%xmm6
   .byte  15,92,197                           // subps         %xmm5,%xmm0
@@ -57549,17 +57698,17 @@
   .byte  15,133,211,0,0,0                    // jne           2a93 <_sk_lerp_565_sse2+0x113>
   .byte  243,15,126,44,126                   // movq          (%esi,%edi,2),%xmm5
   .byte  102,15,97,232                       // punpcklwd     %xmm0,%xmm5
-  .byte  102,15,111,162,113,164,0,0          // movdqa        0xa471(%edx),%xmm4
+  .byte  102,15,111,162,1,165,0,0            // movdqa        0xa501(%edx),%xmm4
   .byte  102,15,219,229                      // pand          %xmm5,%xmm4
   .byte  15,91,204                           // cvtdq2ps      %xmm4,%xmm1
-  .byte  15,89,138,129,164,0,0               // mulps         0xa481(%edx),%xmm1
-  .byte  102,15,111,178,145,164,0,0          // movdqa        0xa491(%edx),%xmm6
+  .byte  15,89,138,17,165,0,0                // mulps         0xa511(%edx),%xmm1
+  .byte  102,15,111,178,33,165,0,0           // movdqa        0xa521(%edx),%xmm6
   .byte  102,15,219,245                      // pand          %xmm5,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,89,178,161,164,0,0               // mulps         0xa4a1(%edx),%xmm6
-  .byte  102,15,219,170,177,164,0,0          // pand          0xa4b1(%edx),%xmm5
+  .byte  15,89,178,49,165,0,0                // mulps         0xa531(%edx),%xmm6
+  .byte  102,15,219,170,65,165,0,0           // pand          0xa541(%edx),%xmm5
   .byte  15,91,213                           // cvtdq2ps      %xmm5,%xmm2
-  .byte  15,89,146,193,164,0,0               // mulps         0xa4c1(%edx),%xmm2
+  .byte  15,89,146,81,165,0,0                // mulps         0xa551(%edx),%xmm2
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,41,93,200                        // movaps        %xmm3,-0x38(%ebp)
   .byte  15,40,254                           // movaps        %xmm6,%xmm7
@@ -57647,7 +57796,7 @@
   .byte  139,30                              // mov           (%esi),%ebx
   .byte  15,133,22,1,0,0                     // jne           2c17 <_sk_load_tables_sse2+0x13c>
   .byte  243,15,111,28,187                   // movdqu        (%ebx,%edi,4),%xmm3
-  .byte  102,15,111,146,231,161,0,0          // movdqa        0xa1e7(%edx),%xmm2
+  .byte  102,15,111,146,119,162,0,0          // movdqa        0xa277(%edx),%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
@@ -57703,7 +57852,7 @@
   .byte  102,15,20,215                       // unpcklpd      %xmm7,%xmm2
   .byte  102,15,114,211,24                   // psrld         $0x18,%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,154,23,163,0,0                // mulps         0xa317(%edx),%xmm3
+  .byte  15,89,154,167,163,0,0               // mulps         0xa3a7(%edx),%xmm3
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  137,194                             // mov           %eax,%edx
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -57778,7 +57927,7 @@
   .byte  242,15,112,192,232                  // pshuflw       $0xe8,%xmm0,%xmm0
   .byte  243,15,112,192,232                  // pshufhw       $0xe8,%xmm0,%xmm0
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
-  .byte  102,15,111,146,22,162,0,0           // movdqa        0xa216(%edx),%xmm2
+  .byte  102,15,111,146,166,162,0,0          // movdqa        0xa2a6(%edx),%xmm2
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,97,196                       // punpcklwd     %xmm4,%xmm0
@@ -57850,7 +57999,7 @@
   .byte  243,15,126,93,232                   // movq          -0x18(%ebp),%xmm3
   .byte  102,15,97,220                       // punpcklwd     %xmm4,%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,154,38,162,0,0                // mulps         0xa226(%edx),%xmm3
+  .byte  15,89,154,182,162,0,0               // mulps         0xa2b6(%edx),%xmm3
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  137,194                             // mov           %eax,%edx
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -57923,7 +58072,7 @@
   .byte  242,15,112,194,232                  // pshuflw       $0xe8,%xmm2,%xmm0
   .byte  243,15,112,192,232                  // pshufhw       $0xe8,%xmm0,%xmm0
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
-  .byte  102,15,111,146,239,159,0,0          // movdqa        0x9fef(%edx),%xmm2
+  .byte  102,15,111,146,127,160,0,0          // movdqa        0xa07f(%edx),%xmm2
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
@@ -57988,7 +58137,7 @@
   .byte  137,198                             // mov           %eax,%esi
   .byte  141,70,8                            // lea           0x8(%esi),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,154,143,157,0,0               // movaps        0x9d8f(%edx),%xmm3
+  .byte  15,40,154,31,158,0,0                // movaps        0x9e1f(%edx),%xmm3
   .byte  80                                  // push          %eax
   .byte  81                                  // push          %ecx
   .byte  255,86,4                            // call          *0x4(%esi)
@@ -58031,7 +58180,7 @@
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
-  .byte  15,40,162,50,156,0,0                // movaps        0x9c32(%edx),%xmm4
+  .byte  15,40,162,194,156,0,0               // movaps        0x9cc2(%edx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  102,15,112,232,78                   // pshufd        $0x4e,%xmm0,%xmm5
@@ -58053,7 +58202,7 @@
   .byte  102,15,110,192                      // movd          %eax,%xmm0
   .byte  139,65,4                            // mov           0x4(%ecx),%eax
   .byte  102,15,196,195,1                    // pinsrw        $0x1,%ebx,%xmm0
-  .byte  15,40,170,82,157,0,0                // movaps        0x9d52(%edx),%xmm5
+  .byte  15,40,170,226,157,0,0               // movaps        0x9de2(%edx),%xmm5
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
   .byte  102,15,112,241,78                   // pshufd        $0x4e,%xmm1,%xmm6
@@ -58183,7 +58332,7 @@
   .byte  102,15,110,199                      // movd          %edi,%xmm0
   .byte  139,121,4                           // mov           0x4(%ecx),%edi
   .byte  102,15,196,198,1                    // pinsrw        $0x1,%esi,%xmm0
-  .byte  15,40,170,86,155,0,0                // movaps        0x9b56(%edx),%xmm5
+  .byte  15,40,170,230,155,0,0               // movaps        0x9be6(%edx),%xmm5
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
   .byte  102,15,91,201                       // cvtps2dq      %xmm1,%xmm1
   .byte  102,15,112,241,78                   // pshufd        $0x4e,%xmm1,%xmm6
@@ -58439,15 +58588,15 @@
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,88,245                           // addps         %xmm5,%xmm6
   .byte  15,91,238                           // cvtdq2ps      %xmm6,%xmm5
-  .byte  15,89,170,22,153,0,0                // mulps         0x9916(%edx),%xmm5
-  .byte  15,84,178,38,153,0,0                // andps         0x9926(%edx),%xmm6
-  .byte  15,86,178,134,150,0,0               // orps          0x9686(%edx),%xmm6
-  .byte  15,88,170,54,153,0,0                // addps         0x9936(%edx),%xmm5
-  .byte  15,40,186,70,153,0,0                // movaps        0x9946(%edx),%xmm7
+  .byte  15,89,170,166,153,0,0               // mulps         0x99a6(%edx),%xmm5
+  .byte  15,84,178,182,153,0,0               // andps         0x99b6(%edx),%xmm6
+  .byte  15,86,178,22,151,0,0                // orps          0x9716(%edx),%xmm6
+  .byte  15,88,170,198,153,0,0               // addps         0x99c6(%edx),%xmm5
+  .byte  15,40,186,214,153,0,0               // movaps        0x99d6(%edx),%xmm7
   .byte  15,89,254                           // mulps         %xmm6,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,88,178,86,153,0,0                // addps         0x9956(%edx),%xmm6
-  .byte  15,40,186,102,153,0,0               // movaps        0x9966(%edx),%xmm7
+  .byte  15,88,178,230,153,0,0               // addps         0x99e6(%edx),%xmm6
+  .byte  15,40,186,246,153,0,0               // movaps        0x99f6(%edx),%xmm7
   .byte  15,94,254                           // divps         %xmm6,%xmm7
   .byte  243,15,16,49                        // movss         (%ecx),%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
@@ -58457,21 +58606,21 @@
   .byte  15,91,254                           // cvtdq2ps      %xmm6,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
-  .byte  15,40,178,150,150,0,0               // movaps        0x9696(%edx),%xmm6
+  .byte  15,40,178,38,151,0,0                // movaps        0x9726(%edx),%xmm6
   .byte  15,84,198                           // andps         %xmm6,%xmm0
   .byte  15,92,248                           // subps         %xmm0,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,92,199                           // subps         %xmm7,%xmm0
-  .byte  15,88,170,118,153,0,0               // addps         0x9976(%edx),%xmm5
-  .byte  15,40,186,134,153,0,0               // movaps        0x9986(%edx),%xmm7
+  .byte  15,88,170,6,154,0,0                 // addps         0x9a06(%edx),%xmm5
+  .byte  15,40,186,22,154,0,0                // movaps        0x9a16(%edx),%xmm7
   .byte  15,89,248                           // mulps         %xmm0,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,40,186,150,153,0,0               // movaps        0x9996(%edx),%xmm7
+  .byte  15,40,186,38,154,0,0                // movaps        0x9a26(%edx),%xmm7
   .byte  15,92,248                           // subps         %xmm0,%xmm7
-  .byte  15,40,130,166,153,0,0               // movaps        0x99a6(%edx),%xmm0
+  .byte  15,40,130,54,154,0,0                // movaps        0x9a36(%edx),%xmm0
   .byte  15,94,199                           // divps         %xmm7,%xmm0
   .byte  15,88,197                           // addps         %xmm5,%xmm0
-  .byte  15,89,130,182,153,0,0               // mulps         0x99b6(%edx),%xmm0
+  .byte  15,89,130,70,154,0,0                // mulps         0x9a46(%edx),%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  243,15,16,105,20                    // movss         0x14(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
@@ -58525,15 +58674,15 @@
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,88,245                           // addps         %xmm5,%xmm6
   .byte  15,91,238                           // cvtdq2ps      %xmm6,%xmm5
-  .byte  15,89,170,223,151,0,0               // mulps         0x97df(%edx),%xmm5
-  .byte  15,84,178,239,151,0,0               // andps         0x97ef(%edx),%xmm6
-  .byte  15,86,178,79,149,0,0                // orps          0x954f(%edx),%xmm6
-  .byte  15,88,170,255,151,0,0               // addps         0x97ff(%edx),%xmm5
-  .byte  15,40,186,15,152,0,0                // movaps        0x980f(%edx),%xmm7
+  .byte  15,89,170,111,152,0,0               // mulps         0x986f(%edx),%xmm5
+  .byte  15,84,178,127,152,0,0               // andps         0x987f(%edx),%xmm6
+  .byte  15,86,178,223,149,0,0               // orps          0x95df(%edx),%xmm6
+  .byte  15,88,170,143,152,0,0               // addps         0x988f(%edx),%xmm5
+  .byte  15,40,186,159,152,0,0               // movaps        0x989f(%edx),%xmm7
   .byte  15,89,254                           // mulps         %xmm6,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,88,178,31,152,0,0                // addps         0x981f(%edx),%xmm6
-  .byte  15,40,186,47,152,0,0                // movaps        0x982f(%edx),%xmm7
+  .byte  15,88,178,175,152,0,0               // addps         0x98af(%edx),%xmm6
+  .byte  15,40,186,191,152,0,0               // movaps        0x98bf(%edx),%xmm7
   .byte  15,94,254                           // divps         %xmm6,%xmm7
   .byte  243,15,16,49                        // movss         (%ecx),%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
@@ -58543,21 +58692,21 @@
   .byte  15,91,254                           // cvtdq2ps      %xmm6,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
-  .byte  15,40,178,95,149,0,0                // movaps        0x955f(%edx),%xmm6
+  .byte  15,40,178,239,149,0,0               // movaps        0x95ef(%edx),%xmm6
   .byte  15,84,198                           // andps         %xmm6,%xmm0
   .byte  15,92,248                           // subps         %xmm0,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,92,199                           // subps         %xmm7,%xmm0
-  .byte  15,88,170,63,152,0,0                // addps         0x983f(%edx),%xmm5
-  .byte  15,40,186,79,152,0,0                // movaps        0x984f(%edx),%xmm7
+  .byte  15,88,170,207,152,0,0               // addps         0x98cf(%edx),%xmm5
+  .byte  15,40,186,223,152,0,0               // movaps        0x98df(%edx),%xmm7
   .byte  15,89,248                           // mulps         %xmm0,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,40,186,95,152,0,0                // movaps        0x985f(%edx),%xmm7
+  .byte  15,40,186,239,152,0,0               // movaps        0x98ef(%edx),%xmm7
   .byte  15,92,248                           // subps         %xmm0,%xmm7
-  .byte  15,40,130,111,152,0,0               // movaps        0x986f(%edx),%xmm0
+  .byte  15,40,130,255,152,0,0               // movaps        0x98ff(%edx),%xmm0
   .byte  15,94,199                           // divps         %xmm7,%xmm0
   .byte  15,88,197                           // addps         %xmm5,%xmm0
-  .byte  15,89,130,127,152,0,0               // mulps         0x987f(%edx),%xmm0
+  .byte  15,89,130,15,153,0,0                // mulps         0x990f(%edx),%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  243,15,16,105,20                    // movss         0x14(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
@@ -58610,15 +58759,15 @@
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,88,245                           // addps         %xmm5,%xmm6
   .byte  15,91,238                           // cvtdq2ps      %xmm6,%xmm5
-  .byte  15,89,170,171,150,0,0               // mulps         0x96ab(%edx),%xmm5
-  .byte  15,84,178,187,150,0,0               // andps         0x96bb(%edx),%xmm6
-  .byte  15,86,178,27,148,0,0                // orps          0x941b(%edx),%xmm6
-  .byte  15,88,170,203,150,0,0               // addps         0x96cb(%edx),%xmm5
-  .byte  15,40,186,219,150,0,0               // movaps        0x96db(%edx),%xmm7
+  .byte  15,89,170,59,151,0,0                // mulps         0x973b(%edx),%xmm5
+  .byte  15,84,178,75,151,0,0                // andps         0x974b(%edx),%xmm6
+  .byte  15,86,178,171,148,0,0               // orps          0x94ab(%edx),%xmm6
+  .byte  15,88,170,91,151,0,0                // addps         0x975b(%edx),%xmm5
+  .byte  15,40,186,107,151,0,0               // movaps        0x976b(%edx),%xmm7
   .byte  15,89,254                           // mulps         %xmm6,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,88,178,235,150,0,0               // addps         0x96eb(%edx),%xmm6
-  .byte  15,40,186,251,150,0,0               // movaps        0x96fb(%edx),%xmm7
+  .byte  15,88,178,123,151,0,0               // addps         0x977b(%edx),%xmm6
+  .byte  15,40,186,139,151,0,0               // movaps        0x978b(%edx),%xmm7
   .byte  15,94,254                           // divps         %xmm6,%xmm7
   .byte  243,15,16,49                        // movss         (%ecx),%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
@@ -58628,21 +58777,21 @@
   .byte  15,91,254                           // cvtdq2ps      %xmm6,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
-  .byte  15,40,178,43,148,0,0                // movaps        0x942b(%edx),%xmm6
+  .byte  15,40,178,187,148,0,0               // movaps        0x94bb(%edx),%xmm6
   .byte  15,84,198                           // andps         %xmm6,%xmm0
   .byte  15,92,248                           // subps         %xmm0,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,92,199                           // subps         %xmm7,%xmm0
-  .byte  15,88,170,11,151,0,0                // addps         0x970b(%edx),%xmm5
-  .byte  15,40,186,27,151,0,0                // movaps        0x971b(%edx),%xmm7
+  .byte  15,88,170,155,151,0,0               // addps         0x979b(%edx),%xmm5
+  .byte  15,40,186,171,151,0,0               // movaps        0x97ab(%edx),%xmm7
   .byte  15,89,248                           // mulps         %xmm0,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,40,186,43,151,0,0                // movaps        0x972b(%edx),%xmm7
+  .byte  15,40,186,187,151,0,0               // movaps        0x97bb(%edx),%xmm7
   .byte  15,92,248                           // subps         %xmm0,%xmm7
-  .byte  15,40,130,59,151,0,0                // movaps        0x973b(%edx),%xmm0
+  .byte  15,40,130,203,151,0,0               // movaps        0x97cb(%edx),%xmm0
   .byte  15,94,199                           // divps         %xmm7,%xmm0
   .byte  15,88,197                           // addps         %xmm5,%xmm0
-  .byte  15,89,130,75,151,0,0                // mulps         0x974b(%edx),%xmm0
+  .byte  15,89,130,219,151,0,0               // mulps         0x97db(%edx),%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  243,15,16,105,20                    // movss         0x14(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
@@ -58695,15 +58844,15 @@
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,88,245                           // addps         %xmm5,%xmm6
   .byte  15,91,238                           // cvtdq2ps      %xmm6,%xmm5
-  .byte  15,89,170,119,149,0,0               // mulps         0x9577(%edx),%xmm5
-  .byte  15,84,178,135,149,0,0               // andps         0x9587(%edx),%xmm6
-  .byte  15,86,178,231,146,0,0               // orps          0x92e7(%edx),%xmm6
-  .byte  15,88,170,151,149,0,0               // addps         0x9597(%edx),%xmm5
-  .byte  15,40,186,167,149,0,0               // movaps        0x95a7(%edx),%xmm7
+  .byte  15,89,170,7,150,0,0                 // mulps         0x9607(%edx),%xmm5
+  .byte  15,84,178,23,150,0,0                // andps         0x9617(%edx),%xmm6
+  .byte  15,86,178,119,147,0,0               // orps          0x9377(%edx),%xmm6
+  .byte  15,88,170,39,150,0,0                // addps         0x9627(%edx),%xmm5
+  .byte  15,40,186,55,150,0,0                // movaps        0x9637(%edx),%xmm7
   .byte  15,89,254                           // mulps         %xmm6,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,88,178,183,149,0,0               // addps         0x95b7(%edx),%xmm6
-  .byte  15,40,186,199,149,0,0               // movaps        0x95c7(%edx),%xmm7
+  .byte  15,88,178,71,150,0,0                // addps         0x9647(%edx),%xmm6
+  .byte  15,40,186,87,150,0,0                // movaps        0x9657(%edx),%xmm7
   .byte  15,94,254                           // divps         %xmm6,%xmm7
   .byte  243,15,16,49                        // movss         (%ecx),%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
@@ -58713,21 +58862,21 @@
   .byte  15,91,254                           // cvtdq2ps      %xmm6,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,194,199,1                        // cmpltps       %xmm7,%xmm0
-  .byte  15,40,178,247,146,0,0               // movaps        0x92f7(%edx),%xmm6
+  .byte  15,40,178,135,147,0,0               // movaps        0x9387(%edx),%xmm6
   .byte  15,84,198                           // andps         %xmm6,%xmm0
   .byte  15,92,248                           // subps         %xmm0,%xmm7
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,92,199                           // subps         %xmm7,%xmm0
-  .byte  15,88,170,215,149,0,0               // addps         0x95d7(%edx),%xmm5
-  .byte  15,40,186,231,149,0,0               // movaps        0x95e7(%edx),%xmm7
+  .byte  15,88,170,103,150,0,0               // addps         0x9667(%edx),%xmm5
+  .byte  15,40,186,119,150,0,0               // movaps        0x9677(%edx),%xmm7
   .byte  15,89,248                           // mulps         %xmm0,%xmm7
   .byte  15,92,239                           // subps         %xmm7,%xmm5
-  .byte  15,40,186,247,149,0,0               // movaps        0x95f7(%edx),%xmm7
+  .byte  15,40,186,135,150,0,0               // movaps        0x9687(%edx),%xmm7
   .byte  15,92,248                           // subps         %xmm0,%xmm7
-  .byte  15,40,130,7,150,0,0                 // movaps        0x9607(%edx),%xmm0
+  .byte  15,40,130,151,150,0,0               // movaps        0x9697(%edx),%xmm0
   .byte  15,94,199                           // divps         %xmm7,%xmm0
   .byte  15,88,197                           // addps         %xmm5,%xmm0
-  .byte  15,89,130,23,150,0,0                // mulps         0x9617(%edx),%xmm0
+  .byte  15,89,130,167,150,0,0               // mulps         0x96a7(%edx),%xmm0
   .byte  102,15,91,192                       // cvtps2dq      %xmm0,%xmm0
   .byte  243,15,16,105,20                    // movss         0x14(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
@@ -58762,15 +58911,15 @@
   .byte  232,0,0,0,0                         // call          3a4a <_sk_gamma_sse2+0x12>
   .byte  88                                  // pop           %eax
   .byte  15,91,195                           // cvtdq2ps      %xmm3,%xmm0
-  .byte  15,89,128,70,148,0,0                // mulps         0x9446(%eax),%xmm0
-  .byte  15,84,152,86,148,0,0                // andps         0x9456(%eax),%xmm3
-  .byte  15,86,152,182,145,0,0               // orps          0x91b6(%eax),%xmm3
-  .byte  15,88,128,102,148,0,0               // addps         0x9466(%eax),%xmm0
+  .byte  15,89,128,214,148,0,0               // mulps         0x94d6(%eax),%xmm0
+  .byte  15,84,152,230,148,0,0               // andps         0x94e6(%eax),%xmm3
+  .byte  15,86,152,70,146,0,0                // orps          0x9246(%eax),%xmm3
+  .byte  15,88,128,246,148,0,0               // addps         0x94f6(%eax),%xmm0
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
-  .byte  15,89,160,118,148,0,0               // mulps         0x9476(%eax),%xmm4
+  .byte  15,89,160,6,149,0,0                 // mulps         0x9506(%eax),%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  15,88,152,134,148,0,0               // addps         0x9486(%eax),%xmm3
-  .byte  15,40,160,150,148,0,0               // movaps        0x9496(%eax),%xmm4
+  .byte  15,88,152,22,149,0,0                // addps         0x9516(%eax),%xmm3
+  .byte  15,40,160,38,149,0,0                // movaps        0x9526(%eax),%xmm4
   .byte  15,94,227                           // divps         %xmm3,%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
@@ -58783,30 +58932,30 @@
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,194,227,1                        // cmpltps       %xmm3,%xmm4
-  .byte  15,84,160,198,145,0,0               // andps         0x91c6(%eax),%xmm4
+  .byte  15,84,160,86,146,0,0                // andps         0x9256(%eax),%xmm4
   .byte  15,92,220                           // subps         %xmm4,%xmm3
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
   .byte  15,92,227                           // subps         %xmm3,%xmm4
-  .byte  15,88,128,166,148,0,0               // addps         0x94a6(%eax),%xmm0
-  .byte  15,40,176,198,148,0,0               // movaps        0x94c6(%eax),%xmm6
+  .byte  15,88,128,54,149,0,0                // addps         0x9536(%eax),%xmm0
+  .byte  15,40,176,86,149,0,0                // movaps        0x9556(%eax),%xmm6
   .byte  15,92,244                           // subps         %xmm4,%xmm6
-  .byte  15,40,168,182,148,0,0               // movaps        0x94b6(%eax),%xmm5
+  .byte  15,40,168,70,149,0,0                // movaps        0x9546(%eax),%xmm5
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  15,40,152,214,148,0,0               // movaps        0x94d6(%eax),%xmm3
+  .byte  15,40,152,102,149,0,0               // movaps        0x9566(%eax),%xmm3
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
   .byte  15,94,230                           // divps         %xmm6,%xmm4
   .byte  15,88,224                           // addps         %xmm0,%xmm4
   .byte  15,91,193                           // cvtdq2ps      %xmm1,%xmm0
-  .byte  15,89,128,70,148,0,0                // mulps         0x9446(%eax),%xmm0
-  .byte  15,84,136,86,148,0,0                // andps         0x9456(%eax),%xmm1
-  .byte  15,86,136,182,145,0,0               // orps          0x91b6(%eax),%xmm1
-  .byte  15,88,128,102,148,0,0               // addps         0x9466(%eax),%xmm0
+  .byte  15,89,128,214,148,0,0               // mulps         0x94d6(%eax),%xmm0
+  .byte  15,84,136,230,148,0,0               // andps         0x94e6(%eax),%xmm1
+  .byte  15,86,136,70,146,0,0                // orps          0x9246(%eax),%xmm1
+  .byte  15,88,128,246,148,0,0               // addps         0x94f6(%eax),%xmm0
   .byte  15,40,241                           // movaps        %xmm1,%xmm6
-  .byte  15,89,176,118,148,0,0               // mulps         0x9476(%eax),%xmm6
+  .byte  15,89,176,6,149,0,0                 // mulps         0x9506(%eax),%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
-  .byte  15,88,136,134,148,0,0               // addps         0x9486(%eax),%xmm1
-  .byte  15,40,176,150,148,0,0               // movaps        0x9496(%eax),%xmm6
+  .byte  15,88,136,22,149,0,0                // addps         0x9516(%eax),%xmm1
+  .byte  15,40,176,38,149,0,0                // movaps        0x9526(%eax),%xmm6
   .byte  15,94,241                           // divps         %xmm1,%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
@@ -58814,12 +58963,12 @@
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  15,194,241,1                        // cmpltps       %xmm1,%xmm6
-  .byte  15,84,176,198,145,0,0               // andps         0x91c6(%eax),%xmm6
+  .byte  15,84,176,86,146,0,0                // andps         0x9256(%eax),%xmm6
   .byte  15,92,206                           // subps         %xmm6,%xmm1
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  15,92,241                           // subps         %xmm1,%xmm6
-  .byte  15,88,128,166,148,0,0               // addps         0x94a6(%eax),%xmm0
-  .byte  15,40,184,198,148,0,0               // movaps        0x94c6(%eax),%xmm7
+  .byte  15,88,128,54,149,0,0                // addps         0x9536(%eax),%xmm0
+  .byte  15,40,184,86,149,0,0                // movaps        0x9556(%eax),%xmm7
   .byte  15,92,254                           // subps         %xmm6,%xmm7
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
@@ -58827,15 +58976,15 @@
   .byte  15,94,207                           // divps         %xmm7,%xmm1
   .byte  15,88,200                           // addps         %xmm0,%xmm1
   .byte  15,91,194                           // cvtdq2ps      %xmm2,%xmm0
-  .byte  15,89,128,70,148,0,0                // mulps         0x9446(%eax),%xmm0
-  .byte  15,84,144,86,148,0,0                // andps         0x9456(%eax),%xmm2
-  .byte  15,86,144,182,145,0,0               // orps          0x91b6(%eax),%xmm2
-  .byte  15,88,128,102,148,0,0               // addps         0x9466(%eax),%xmm0
-  .byte  15,40,176,118,148,0,0               // movaps        0x9476(%eax),%xmm6
+  .byte  15,89,128,214,148,0,0               // mulps         0x94d6(%eax),%xmm0
+  .byte  15,84,144,230,148,0,0               // andps         0x94e6(%eax),%xmm2
+  .byte  15,86,144,70,146,0,0                // orps          0x9246(%eax),%xmm2
+  .byte  15,88,128,246,148,0,0               // addps         0x94f6(%eax),%xmm0
+  .byte  15,40,176,6,149,0,0                 // movaps        0x9506(%eax),%xmm6
   .byte  15,89,242                           // mulps         %xmm2,%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
-  .byte  15,88,144,134,148,0,0               // addps         0x9486(%eax),%xmm2
-  .byte  15,40,176,150,148,0,0               // movaps        0x9496(%eax),%xmm6
+  .byte  15,88,144,22,149,0,0                // addps         0x9516(%eax),%xmm2
+  .byte  15,40,176,38,149,0,0                // movaps        0x9526(%eax),%xmm6
   .byte  15,94,242                           // divps         %xmm2,%xmm6
   .byte  15,92,198                           // subps         %xmm6,%xmm0
   .byte  15,89,69,232                        // mulps         -0x18(%ebp),%xmm0
@@ -58843,18 +58992,18 @@
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  15,194,242,1                        // cmpltps       %xmm2,%xmm6
-  .byte  15,84,176,198,145,0,0               // andps         0x91c6(%eax),%xmm6
+  .byte  15,84,176,86,146,0,0                // andps         0x9256(%eax),%xmm6
   .byte  15,92,214                           // subps         %xmm6,%xmm2
   .byte  15,40,240                           // movaps        %xmm0,%xmm6
   .byte  15,92,242                           // subps         %xmm2,%xmm6
-  .byte  15,88,128,166,148,0,0               // addps         0x94a6(%eax),%xmm0
+  .byte  15,88,128,54,149,0,0                // addps         0x9536(%eax),%xmm0
   .byte  15,89,238                           // mulps         %xmm6,%xmm5
   .byte  15,92,197                           // subps         %xmm5,%xmm0
-  .byte  15,40,144,198,148,0,0               // movaps        0x94c6(%eax),%xmm2
+  .byte  15,40,144,86,149,0,0                // movaps        0x9556(%eax),%xmm2
   .byte  15,92,214                           // subps         %xmm6,%xmm2
   .byte  15,94,218                           // divps         %xmm2,%xmm3
   .byte  15,88,216                           // addps         %xmm0,%xmm3
-  .byte  15,40,128,230,148,0,0               // movaps        0x94e6(%eax),%xmm0
+  .byte  15,40,128,118,149,0,0               // movaps        0x9576(%eax),%xmm0
   .byte  15,89,224                           // mulps         %xmm0,%xmm4
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
   .byte  15,89,216                           // mulps         %xmm0,%xmm3
@@ -58883,29 +59032,29 @@
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  232,0,0,0,0                         // call          3c32 <_sk_lab_to_xyz_sse2+0x15>
   .byte  88                                  // pop           %eax
-  .byte  15,89,144,14,147,0,0                // mulps         0x930e(%eax),%xmm2
-  .byte  15,40,160,174,144,0,0               // movaps        0x90ae(%eax),%xmm4
+  .byte  15,89,144,158,147,0,0               // mulps         0x939e(%eax),%xmm2
+  .byte  15,40,160,62,145,0,0                // movaps        0x913e(%eax),%xmm4
   .byte  15,89,204                           // mulps         %xmm4,%xmm1
-  .byte  15,40,168,30,147,0,0                // movaps        0x931e(%eax),%xmm5
+  .byte  15,40,168,174,147,0,0               // movaps        0x93ae(%eax),%xmm5
   .byte  15,88,205                           // addps         %xmm5,%xmm1
   .byte  15,89,220                           // mulps         %xmm4,%xmm3
   .byte  15,88,221                           // addps         %xmm5,%xmm3
-  .byte  15,88,144,46,147,0,0                // addps         0x932e(%eax),%xmm2
-  .byte  15,89,144,62,147,0,0                // mulps         0x933e(%eax),%xmm2
-  .byte  15,89,136,78,147,0,0                // mulps         0x934e(%eax),%xmm1
+  .byte  15,88,144,190,147,0,0               // addps         0x93be(%eax),%xmm2
+  .byte  15,89,144,206,147,0,0               // mulps         0x93ce(%eax),%xmm2
+  .byte  15,89,136,222,147,0,0               // mulps         0x93de(%eax),%xmm1
   .byte  15,88,202                           // addps         %xmm2,%xmm1
-  .byte  15,89,152,94,147,0,0                // mulps         0x935e(%eax),%xmm3
+  .byte  15,89,152,238,147,0,0               // mulps         0x93ee(%eax),%xmm3
   .byte  15,40,234                           // movaps        %xmm2,%xmm5
   .byte  15,92,235                           // subps         %xmm3,%xmm5
   .byte  15,40,193                           // movaps        %xmm1,%xmm0
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  15,89,193                           // mulps         %xmm1,%xmm0
-  .byte  15,40,152,110,147,0,0               // movaps        0x936e(%eax),%xmm3
+  .byte  15,40,152,254,147,0,0               // movaps        0x93fe(%eax),%xmm3
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
   .byte  15,194,224,1                        // cmpltps       %xmm0,%xmm4
-  .byte  15,40,176,126,147,0,0               // movaps        0x937e(%eax),%xmm6
+  .byte  15,40,176,14,148,0,0                // movaps        0x940e(%eax),%xmm6
   .byte  15,88,206                           // addps         %xmm6,%xmm1
-  .byte  15,40,184,142,147,0,0               // movaps        0x938e(%eax),%xmm7
+  .byte  15,40,184,30,148,0,0                // movaps        0x941e(%eax),%xmm7
   .byte  15,89,207                           // mulps         %xmm7,%xmm1
   .byte  15,84,196                           // andps         %xmm4,%xmm0
   .byte  15,85,225                           // andnps        %xmm1,%xmm4
@@ -58930,8 +59079,8 @@
   .byte  15,85,221                           // andnps        %xmm5,%xmm3
   .byte  15,86,216                           // orps          %xmm0,%xmm3
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
-  .byte  15,89,160,158,147,0,0               // mulps         0x939e(%eax),%xmm4
-  .byte  15,89,152,174,147,0,0               // mulps         0x93ae(%eax),%xmm3
+  .byte  15,89,160,46,148,0,0                // mulps         0x942e(%eax),%xmm4
+  .byte  15,89,152,62,148,0,0                // mulps         0x943e(%eax),%xmm3
   .byte  141,65,4                            // lea           0x4(%ecx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  15,40,196                           // movaps        %xmm4,%xmm0
@@ -58969,9 +59118,9 @@
   .byte  102,15,110,4,62                     // movd          (%esi,%edi,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  102,15,97,192                       // punpcklwd     %xmm0,%xmm0
-  .byte  102,15,219,130,174,143,0,0          // pand          0x8fae(%edx),%xmm0
+  .byte  102,15,219,130,62,144,0,0           // pand          0x903e(%edx),%xmm0
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,154,222,144,0,0               // mulps         0x90de(%edx),%xmm3
+  .byte  15,89,154,110,145,0,0               // mulps         0x916e(%edx),%xmm3
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -59036,9 +59185,9 @@
   .byte  102,15,110,36,55                    // movd          (%edi,%esi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,162,218,142,0,0          // pand          0x8eda(%edx),%xmm4
+  .byte  102,15,219,162,106,143,0,0          // pand          0x8f6a(%edx),%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,162,10,144,0,0                // mulps         0x900a(%edx),%xmm4
+  .byte  15,89,162,154,144,0,0               // mulps         0x909a(%edx),%xmm4
   .byte  15,41,97,64                         // movaps        %xmm4,0x40(%ecx)
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -59081,42 +59230,55 @@
   .byte  86                                  // push          %esi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,95,224                           // maxps         %xmm0,%xmm4
+  .byte  15,93,226                           // minps         %xmm2,%xmm4
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,209                           // maxps         %xmm1,%xmm2
+  .byte  15,93,208                           // minps         %xmm0,%xmm2
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,194                       // cvttps2dq     %xmm2,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
-  .byte  102,15,112,208,78                   // pshufd        $0x4e,%xmm0,%xmm2
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,204                       // cvttps2dq     %xmm4,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,193,229                  // pshufd        $0xe5,%xmm1,%xmm0
+  .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,15,126,214                      // movd          %xmm2,%esi
-  .byte  102,15,112,192,231                  // pshufd        $0xe7,%xmm0,%xmm0
-  .byte  102,15,126,199                      // movd          %xmm0,%edi
+  .byte  102,15,112,201,231                  // pshufd        $0xe7,%xmm1,%xmm1
+  .byte  102,15,126,207                      // movd          %xmm1,%edi
   .byte  15,182,52,50                        // movzbl        (%edx,%esi,1),%esi
   .byte  15,182,60,58                        // movzbl        (%edx,%edi,1),%edi
   .byte  193,231,8                           // shl           $0x8,%edi
   .byte  9,247                               // or            %esi,%edi
-  .byte  102,15,126,206                      // movd          %xmm1,%esi
+  .byte  102,15,126,198                      // movd          %xmm0,%esi
   .byte  15,182,12,10                        // movzbl        (%edx,%ecx,1),%ecx
   .byte  15,182,20,50                        // movzbl        (%edx,%esi,1),%edx
   .byte  193,226,8                           // shl           $0x8,%edx
   .byte  9,202                               // or            %ecx,%edx
   .byte  102,15,110,194                      // movd          %edx,%xmm0
   .byte  102,15,196,199,1                    // pinsrw        $0x1,%edi,%xmm0
-  .byte  232,0,0,0,0                         // call          3ef3 <_sk_gather_a8_sse2+0x84>
+  .byte  232,0,0,0,0                         // call          3f23 <_sk_gather_a8_sse2+0xb4>
   .byte  89                                  // pop           %ecx
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  102,15,96,193                       // punpcklbw     %xmm1,%xmm0
   .byte  102,15,97,193                       // punpcklwd     %xmm1,%xmm0
   .byte  15,91,216                           // cvtdq2ps      %xmm0,%xmm3
-  .byte  15,89,153,13,143,0,0                // mulps         0x8f0d(%ecx),%xmm3
+  .byte  15,89,153,109,143,0,0               // mulps         0x8f6d(%ecx),%xmm3
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
@@ -59141,7 +59303,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          3f37 <_sk_store_a8_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          3f67 <_sk_store_a8_sse2+0xe>
   .byte  94                                  // pop           %esi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59150,7 +59312,7 @@
   .byte  15,175,81,4                         // imul          0x4(%ecx),%edx
   .byte  3,23                                // add           (%edi),%edx
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
-  .byte  15,40,166,169,141,0,0               // movaps        0x8da9(%esi),%xmm4
+  .byte  15,40,166,9,142,0,0                 // movaps        0x8e09(%esi),%xmm4
   .byte  15,89,227                           // mulps         %xmm3,%xmm4
   .byte  102,15,91,228                       // cvtps2dq      %xmm4,%xmm4
   .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
@@ -59159,7 +59321,7 @@
   .byte  102,15,103,224                      // packuswb      %xmm0,%xmm4
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,26                              // jne           3f8c <_sk_store_a8_sse2+0x63>
+  .byte  117,26                              // jne           3fbc <_sk_store_a8_sse2+0x63>
   .byte  102,15,126,230                      // movd          %xmm4,%esi
   .byte  137,52,58                           // mov           %esi,(%edx,%edi,1)
   .byte  141,80,8                            // lea           0x8(%eax),%edx
@@ -59177,24 +59339,24 @@
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,54                              // je            3fd2 <_sk_store_a8_sse2+0xa9>
+  .byte  116,54                              // je            4002 <_sk_store_a8_sse2+0xa9>
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,14                              // je            3faf <_sk_store_a8_sse2+0x86>
+  .byte  116,14                              // je            3fdf <_sk_store_a8_sse2+0x86>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,211                             // jne           3f79 <_sk_store_a8_sse2+0x50>
+  .byte  117,211                             // jne           3fa9 <_sk_store_a8_sse2+0x50>
   .byte  102,15,197,220,4                    // pextrw        $0x4,%xmm4,%ebx
   .byte  136,92,58,2                         // mov           %bl,0x2(%edx,%edi,1)
   .byte  102,15,112,228,212                  // pshufd        $0xd4,%xmm4,%xmm4
-  .byte  102,15,219,166,185,144,0,0          // pand          0x90b9(%esi),%xmm4
+  .byte  102,15,219,166,25,145,0,0           // pand          0x9119(%esi),%xmm4
   .byte  102,15,103,228                      // packuswb      %xmm4,%xmm4
   .byte  102,15,103,228                      // packuswb      %xmm4,%xmm4
   .byte  102,15,103,228                      // packuswb      %xmm4,%xmm4
   .byte  102,15,126,230                      // movd          %xmm4,%esi
   .byte  102,137,52,58                       // mov           %si,(%edx,%edi,1)
-  .byte  235,167                             // jmp           3f79 <_sk_store_a8_sse2+0x50>
+  .byte  235,167                             // jmp           3fa9 <_sk_store_a8_sse2+0x50>
   .byte  102,15,126,227                      // movd          %xmm4,%ebx
   .byte  136,28,58                           // mov           %bl,(%edx,%edi,1)
-  .byte  235,158                             // jmp           3f79 <_sk_store_a8_sse2+0x50>
+  .byte  235,158                             // jmp           3fa9 <_sk_store_a8_sse2+0x50>
 
 HIDDEN _sk_load_g8_sse2
 .globl _sk_load_g8_sse2
@@ -59206,7 +59368,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          3fe9 <_sk_load_g8_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4019 <_sk_load_g8_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59217,16 +59379,16 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,63                              // jne           4043 <_sk_load_g8_sse2+0x68>
+  .byte  117,63                              // jne           4073 <_sk_load_g8_sse2+0x68>
   .byte  102,15,110,4,62                     // movd          (%esi,%edi,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
   .byte  102,15,97,192                       // punpcklwd     %xmm0,%xmm0
-  .byte  102,15,219,130,231,140,0,0          // pand          0x8ce7(%edx),%xmm0
+  .byte  102,15,219,130,71,141,0,0           // pand          0x8d47(%edx),%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,130,23,142,0,0                // mulps         0x8e17(%edx),%xmm0
+  .byte  15,89,130,119,142,0,0               // mulps         0x8e77(%edx),%xmm0
   .byte  141,112,8                           // lea           0x8(%eax),%esi
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,154,39,140,0,0                // movaps        0x8c27(%edx),%xmm3
+  .byte  15,40,154,135,140,0,0               // movaps        0x8c87(%edx),%xmm3
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  86                                  // push          %esi
@@ -59240,12 +59402,12 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,50                              // je            407d <_sk_load_g8_sse2+0xa2>
+  .byte  116,50                              // je            40ad <_sk_load_g8_sse2+0xa2>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,19                              // je            4067 <_sk_load_g8_sse2+0x8c>
+  .byte  116,19                              // je            4097 <_sk_load_g8_sse2+0x8c>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,184                             // jne           4011 <_sk_load_g8_sse2+0x36>
+  .byte  117,184                             // jne           4041 <_sk_load_g8_sse2+0x36>
   .byte  15,182,92,62,2                      // movzbl        0x2(%esi,%edi,1),%ebx
   .byte  102,15,110,195                      // movd          %ebx,%xmm0
   .byte  102,15,112,192,69                   // pshufd        $0x45,%xmm0,%xmm0
@@ -59254,10 +59416,10 @@
   .byte  102,15,96,200                       // punpcklbw     %xmm0,%xmm1
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  242,15,16,193                       // movsd         %xmm1,%xmm0
-  .byte  235,148                             // jmp           4011 <_sk_load_g8_sse2+0x36>
+  .byte  235,148                             // jmp           4041 <_sk_load_g8_sse2+0x36>
   .byte  15,182,52,62                        // movzbl        (%esi,%edi,1),%esi
   .byte  102,15,110,198                      // movd          %esi,%xmm0
-  .byte  235,138                             // jmp           4011 <_sk_load_g8_sse2+0x36>
+  .byte  235,138                             // jmp           4041 <_sk_load_g8_sse2+0x36>
 
 HIDDEN _sk_load_g8_dst_sse2
 .globl _sk_load_g8_dst_sse2
@@ -59269,7 +59431,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4095 <_sk_load_g8_dst_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          40c5 <_sk_load_g8_dst_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59280,17 +59442,17 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,73                              // jne           40f9 <_sk_load_g8_dst_sse2+0x72>
+  .byte  117,73                              // jne           4129 <_sk_load_g8_dst_sse2+0x72>
   .byte  102,15,110,36,62                    // movd          (%esi,%edi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,219,162,59,140,0,0           // pand          0x8c3b(%edx),%xmm4
+  .byte  102,15,219,162,155,140,0,0          // pand          0x8c9b(%edx),%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,162,107,141,0,0               // mulps         0x8d6b(%edx),%xmm4
+  .byte  15,89,162,203,141,0,0               // mulps         0x8dcb(%edx),%xmm4
   .byte  15,41,97,48                         // movaps        %xmm4,0x30(%ecx)
   .byte  15,41,97,32                         // movaps        %xmm4,0x20(%ecx)
   .byte  15,41,97,16                         // movaps        %xmm4,0x10(%ecx)
-  .byte  15,40,162,123,139,0,0               // movaps        0x8b7b(%edx),%xmm4
+  .byte  15,40,162,219,139,0,0               // movaps        0x8bdb(%edx),%xmm4
   .byte  15,41,97,64                         // movaps        %xmm4,0x40(%ecx)
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -59305,12 +59467,12 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,50                              // je            4133 <_sk_load_g8_dst_sse2+0xac>
+  .byte  116,50                              // je            4163 <_sk_load_g8_dst_sse2+0xac>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,19                              // je            411d <_sk_load_g8_dst_sse2+0x96>
+  .byte  116,19                              // je            414d <_sk_load_g8_dst_sse2+0x96>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,174                             // jne           40bd <_sk_load_g8_dst_sse2+0x36>
+  .byte  117,174                             // jne           40ed <_sk_load_g8_dst_sse2+0x36>
   .byte  15,182,92,62,2                      // movzbl        0x2(%esi,%edi,1),%ebx
   .byte  102,15,110,227                      // movd          %ebx,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
@@ -59319,10 +59481,10 @@
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  102,15,97,232                       // punpcklwd     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  235,138                             // jmp           40bd <_sk_load_g8_dst_sse2+0x36>
+  .byte  235,138                             // jmp           40ed <_sk_load_g8_dst_sse2+0x36>
   .byte  15,182,52,62                        // movzbl        (%esi,%edi,1),%esi
   .byte  102,15,110,230                      // movd          %esi,%xmm4
-  .byte  235,128                             // jmp           40bd <_sk_load_g8_dst_sse2+0x36>
+  .byte  235,128                             // jmp           40ed <_sk_load_g8_dst_sse2+0x36>
 
 HIDDEN _sk_gather_g8_sse2
 .globl _sk_gather_g8_sse2
@@ -59334,45 +59496,58 @@
   .byte  86                                  // push          %esi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,95,224                           // maxps         %xmm0,%xmm4
+  .byte  15,93,226                           // minps         %xmm2,%xmm4
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,209                           // maxps         %xmm1,%xmm2
+  .byte  15,93,208                           // minps         %xmm0,%xmm2
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,194                       // cvttps2dq     %xmm2,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
-  .byte  102,15,112,208,78                   // pshufd        $0x4e,%xmm0,%xmm2
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,204                       // cvttps2dq     %xmm4,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,193,229                  // pshufd        $0xe5,%xmm1,%xmm0
+  .byte  102,15,112,209,78                   // pshufd        $0x4e,%xmm1,%xmm2
   .byte  102,15,126,214                      // movd          %xmm2,%esi
-  .byte  102,15,112,192,231                  // pshufd        $0xe7,%xmm0,%xmm0
-  .byte  102,15,126,199                      // movd          %xmm0,%edi
+  .byte  102,15,112,201,231                  // pshufd        $0xe7,%xmm1,%xmm1
+  .byte  102,15,126,207                      // movd          %xmm1,%edi
   .byte  15,182,52,50                        // movzbl        (%edx,%esi,1),%esi
   .byte  15,182,60,58                        // movzbl        (%edx,%edi,1),%edi
   .byte  193,231,8                           // shl           $0x8,%edi
   .byte  9,247                               // or            %esi,%edi
-  .byte  102,15,126,206                      // movd          %xmm1,%esi
+  .byte  102,15,126,198                      // movd          %xmm0,%esi
   .byte  15,182,12,10                        // movzbl        (%edx,%ecx,1),%ecx
   .byte  15,182,20,50                        // movzbl        (%edx,%esi,1),%edx
   .byte  193,226,8                           // shl           $0x8,%edx
   .byte  9,202                               // or            %ecx,%edx
   .byte  102,15,110,194                      // movd          %edx,%xmm0
-  .byte  232,0,0,0,0                         // call          41bc <_sk_gather_g8_sse2+0x7f>
+  .byte  232,0,0,0,0                         // call          421c <_sk_gather_g8_sse2+0xaf>
   .byte  89                                  // pop           %ecx
-  .byte  102,15,196,199,1                    // pinsrw        $0x1,%edi,%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
+  .byte  102,15,196,199,1                    // pinsrw        $0x1,%edi,%xmm0
   .byte  102,15,96,193                       // punpcklbw     %xmm1,%xmm0
   .byte  102,15,97,193                       // punpcklwd     %xmm1,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,129,68,140,0,0                // mulps         0x8c44(%ecx),%xmm0
+  .byte  15,89,129,116,140,0,0               // mulps         0x8c74(%ecx),%xmm0
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,153,84,138,0,0                // movaps        0x8a54(%ecx),%xmm3
+  .byte  15,40,153,132,138,0,0               // movaps        0x8a84(%ecx),%xmm3
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  82                                  // push          %edx
@@ -59394,7 +59569,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4207 <_sk_load_565_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4267 <_sk_load_565_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59406,23 +59581,23 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,97                              // jne           4285 <_sk_load_565_sse2+0x8c>
+  .byte  117,97                              // jne           42e5 <_sk_load_565_sse2+0x8c>
   .byte  243,15,126,20,126                   // movq          (%esi,%edi,2),%xmm2
   .byte  102,15,97,208                       // punpcklwd     %xmm0,%xmm2
-  .byte  102,15,111,130,9,140,0,0            // movdqa        0x8c09(%edx),%xmm0
+  .byte  102,15,111,130,57,140,0,0           // movdqa        0x8c39(%edx),%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,130,25,140,0,0                // mulps         0x8c19(%edx),%xmm0
-  .byte  102,15,111,138,41,140,0,0           // movdqa        0x8c29(%edx),%xmm1
+  .byte  15,89,130,73,140,0,0                // mulps         0x8c49(%edx),%xmm0
+  .byte  102,15,111,138,89,140,0,0           // movdqa        0x8c59(%edx),%xmm1
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,138,57,140,0,0                // mulps         0x8c39(%edx),%xmm1
-  .byte  102,15,219,146,73,140,0,0           // pand          0x8c49(%edx),%xmm2
+  .byte  15,89,138,105,140,0,0               // mulps         0x8c69(%edx),%xmm1
+  .byte  102,15,219,146,121,140,0,0          // pand          0x8c79(%edx),%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,146,89,140,0,0                // mulps         0x8c59(%edx),%xmm2
+  .byte  15,89,146,137,140,0,0               // mulps         0x8c89(%edx),%xmm2
   .byte  141,112,8                           // lea           0x8(%eax),%esi
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,154,9,138,0,0                 // movaps        0x8a09(%edx),%xmm3
+  .byte  15,40,154,57,138,0,0                // movaps        0x8a39(%edx),%xmm3
   .byte  86                                  // push          %esi
   .byte  81                                  // push          %ecx
   .byte  255,80,4                            // call          *0x4(%eax)
@@ -59434,22 +59609,22 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,47                              // je            42bc <_sk_load_565_sse2+0xc3>
+  .byte  116,47                              // je            431c <_sk_load_565_sse2+0xc3>
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,19                              // je            42a9 <_sk_load_565_sse2+0xb0>
+  .byte  116,19                              // je            4309 <_sk_load_565_sse2+0xb0>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,146                             // jne           422d <_sk_load_565_sse2+0x34>
+  .byte  117,146                             // jne           428d <_sk_load_565_sse2+0x34>
   .byte  15,183,92,126,4                     // movzwl        0x4(%esi,%edi,2),%ebx
   .byte  102,15,110,195                      // movd          %ebx,%xmm0
   .byte  102,15,112,208,69                   // pshufd        $0x45,%xmm0,%xmm2
   .byte  102,15,110,4,126                    // movd          (%esi,%edi,2),%xmm0
   .byte  242,15,112,192,212                  // pshuflw       $0xd4,%xmm0,%xmm0
   .byte  242,15,16,208                       // movsd         %xmm0,%xmm2
-  .byte  233,113,255,255,255                 // jmp           422d <_sk_load_565_sse2+0x34>
+  .byte  233,113,255,255,255                 // jmp           428d <_sk_load_565_sse2+0x34>
   .byte  15,183,52,126                       // movzwl        (%esi,%edi,2),%esi
   .byte  102,15,110,214                      // movd          %esi,%xmm2
-  .byte  233,100,255,255,255                 // jmp           422d <_sk_load_565_sse2+0x34>
+  .byte  233,100,255,255,255                 // jmp           428d <_sk_load_565_sse2+0x34>
 
 HIDDEN _sk_load_565_dst_sse2
 .globl _sk_load_565_dst_sse2
@@ -59461,7 +59636,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          42d7 <_sk_load_565_dst_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4337 <_sk_load_565_dst_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59473,24 +59648,24 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,113                             // jne           4365 <_sk_load_565_dst_sse2+0x9c>
+  .byte  117,113                             // jne           43c5 <_sk_load_565_dst_sse2+0x9c>
   .byte  243,15,126,36,126                   // movq          (%esi,%edi,2),%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
-  .byte  102,15,111,170,57,139,0,0           // movdqa        0x8b39(%edx),%xmm5
+  .byte  102,15,111,170,105,139,0,0          // movdqa        0x8b69(%edx),%xmm5
   .byte  102,15,219,236                      // pand          %xmm4,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,170,73,139,0,0                // mulps         0x8b49(%edx),%xmm5
+  .byte  15,89,170,121,139,0,0               // mulps         0x8b79(%edx),%xmm5
   .byte  15,41,105,16                        // movaps        %xmm5,0x10(%ecx)
-  .byte  102,15,111,170,89,139,0,0           // movdqa        0x8b59(%edx),%xmm5
+  .byte  102,15,111,170,137,139,0,0          // movdqa        0x8b89(%edx),%xmm5
   .byte  102,15,219,236                      // pand          %xmm4,%xmm5
   .byte  15,91,237                           // cvtdq2ps      %xmm5,%xmm5
-  .byte  15,89,170,105,139,0,0               // mulps         0x8b69(%edx),%xmm5
+  .byte  15,89,170,153,139,0,0               // mulps         0x8b99(%edx),%xmm5
   .byte  15,41,105,32                        // movaps        %xmm5,0x20(%ecx)
-  .byte  102,15,219,162,121,139,0,0          // pand          0x8b79(%edx),%xmm4
+  .byte  102,15,219,162,169,139,0,0          // pand          0x8ba9(%edx),%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
-  .byte  15,89,162,137,139,0,0               // mulps         0x8b89(%edx),%xmm4
+  .byte  15,89,162,185,139,0,0               // mulps         0x8bb9(%edx),%xmm4
   .byte  15,41,97,48                         // movaps        %xmm4,0x30(%ecx)
-  .byte  15,40,162,57,137,0,0                // movaps        0x8939(%edx),%xmm4
+  .byte  15,40,162,105,137,0,0               // movaps        0x8969(%edx),%xmm4
   .byte  15,41,97,64                         // movaps        %xmm4,0x40(%ecx)
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -59505,22 +59680,22 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,47                              // je            439c <_sk_load_565_dst_sse2+0xd3>
+  .byte  116,47                              // je            43fc <_sk_load_565_dst_sse2+0xd3>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,19                              // je            4389 <_sk_load_565_dst_sse2+0xc0>
+  .byte  116,19                              // je            43e9 <_sk_load_565_dst_sse2+0xc0>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,130                             // jne           42fd <_sk_load_565_dst_sse2+0x34>
+  .byte  117,130                             // jne           435d <_sk_load_565_dst_sse2+0x34>
   .byte  15,183,92,126,4                     // movzwl        0x4(%esi,%edi,2),%ebx
   .byte  102,15,110,227                      // movd          %ebx,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
   .byte  102,15,110,44,126                   // movd          (%esi,%edi,2),%xmm5
   .byte  242,15,112,237,212                  // pshuflw       $0xd4,%xmm5,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  233,97,255,255,255                  // jmp           42fd <_sk_load_565_dst_sse2+0x34>
+  .byte  233,97,255,255,255                  // jmp           435d <_sk_load_565_dst_sse2+0x34>
   .byte  15,183,52,126                       // movzwl        (%esi,%edi,2),%esi
   .byte  102,15,110,230                      // movd          %esi,%xmm4
-  .byte  233,84,255,255,255                  // jmp           42fd <_sk_load_565_dst_sse2+0x34>
+  .byte  233,84,255,255,255                  // jmp           435d <_sk_load_565_dst_sse2+0x34>
 
 HIDDEN _sk_gather_565_sse2
 .globl _sk_gather_565_sse2
@@ -59531,36 +59706,49 @@
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,95,224                           // maxps         %xmm0,%xmm4
+  .byte  15,93,226                           // minps         %xmm2,%xmm4
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,209                           // maxps         %xmm1,%xmm2
+  .byte  15,93,208                           // minps         %xmm0,%xmm2
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,194                       // cvttps2dq     %xmm2,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,204                       // cvttps2dq     %xmm4,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,193,229                  // pshufd        $0xe5,%xmm1,%xmm0
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,110,209                      // movd          %ecx,%xmm2
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
+  .byte  102,15,126,193                      // movd          %xmm0,%ecx
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,196,209,1                    // pinsrw        $0x1,%ecx,%xmm2
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  102,15,112,192,231                  // pshufd        $0xe7,%xmm0,%xmm0
+  .byte  102,15,126,193                      // movd          %xmm0,%ecx
+  .byte  102,15,112,193,231                  // pshufd        $0xe7,%xmm1,%xmm0
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,196,209,2                    // pinsrw        $0x2,%ecx,%xmm2
   .byte  102,15,126,193                      // movd          %xmm0,%ecx
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
-  .byte  232,0,0,0,0                         // call          4429 <_sk_gather_565_sse2+0x80>
+  .byte  232,0,0,0,0                         // call          44b9 <_sk_gather_565_sse2+0xb0>
   .byte  90                                  // pop           %edx
-  .byte  102,15,196,209,3                    // pinsrw        $0x3,%ecx,%xmm2
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
+  .byte  102,15,196,209,3                    // pinsrw        $0x3,%ecx,%xmm2
   .byte  102,15,97,208                       // punpcklwd     %xmm0,%xmm2
   .byte  102,15,111,130,231,137,0,0          // movdqa        0x89e7(%edx),%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
@@ -59593,7 +59781,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          449c <_sk_store_565_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          452c <_sk_store_565_sse2+0xe>
   .byte  95                                  // pop           %edi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59624,7 +59812,7 @@
   .byte  102,15,112,236,229                  // pshufd        $0xe5,%xmm4,%xmm5
   .byte  102,15,126,109,236                  // movd          %xmm5,-0x14(%ebp)
   .byte  133,219                             // test          %ebx,%ebx
-  .byte  117,34                              // jne           4530 <_sk_store_565_sse2+0xa2>
+  .byte  117,34                              // jne           45c0 <_sk_store_565_sse2+0xa2>
   .byte  102,15,126,231                      // movd          %xmm4,%edi
   .byte  102,15,126,235                      // movd          %xmm5,%ebx
   .byte  137,60,114                          // mov           %edi,(%edx,%esi,2)
@@ -59644,20 +59832,20 @@
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,37                              // je            4566 <_sk_store_565_sse2+0xd8>
+  .byte  116,37                              // je            45f6 <_sk_store_565_sse2+0xd8>
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,15                              // je            4555 <_sk_store_565_sse2+0xc7>
+  .byte  116,15                              // je            45e5 <_sk_store_565_sse2+0xc7>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,210                             // jne           451d <_sk_store_565_sse2+0x8f>
+  .byte  117,210                             // jne           45ad <_sk_store_565_sse2+0x8f>
   .byte  102,15,197,252,4                    // pextrw        $0x4,%xmm4,%edi
   .byte  102,137,124,114,4                   // mov           %di,0x4(%edx,%esi,2)
   .byte  102,15,112,228,212                  // pshufd        $0xd4,%xmm4,%xmm4
   .byte  242,15,112,228,232                  // pshuflw       $0xe8,%xmm4,%xmm4
   .byte  102,15,126,36,114                   // movd          %xmm4,(%edx,%esi,2)
-  .byte  235,183                             // jmp           451d <_sk_store_565_sse2+0x8f>
+  .byte  235,183                             // jmp           45ad <_sk_store_565_sse2+0x8f>
   .byte  102,15,126,231                      // movd          %xmm4,%edi
   .byte  102,137,60,114                      // mov           %di,(%edx,%esi,2)
-  .byte  235,173                             // jmp           451d <_sk_store_565_sse2+0x8f>
+  .byte  235,173                             // jmp           45ad <_sk_store_565_sse2+0x8f>
 
 HIDDEN _sk_load_4444_sse2
 .globl _sk_load_4444_sse2
@@ -59669,7 +59857,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          457e <_sk_load_4444_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          460e <_sk_load_4444_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59681,7 +59869,7 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,112                             // jne           460b <_sk_load_4444_sse2+0x9b>
+  .byte  117,112                             // jne           469b <_sk_load_4444_sse2+0x9b>
   .byte  243,15,126,28,126                   // movq          (%esi,%edi,2),%xmm3
   .byte  102,15,97,216                       // punpcklwd     %xmm0,%xmm3
   .byte  102,15,111,130,162,138,0,0          // movdqa        0x8aa2(%edx),%xmm0
@@ -59712,22 +59900,22 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,47                              // je            4642 <_sk_load_4444_sse2+0xd2>
+  .byte  116,47                              // je            46d2 <_sk_load_4444_sse2+0xd2>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,19                              // je            462f <_sk_load_4444_sse2+0xbf>
+  .byte  116,19                              // je            46bf <_sk_load_4444_sse2+0xbf>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,131                             // jne           45a4 <_sk_load_4444_sse2+0x34>
+  .byte  117,131                             // jne           4634 <_sk_load_4444_sse2+0x34>
   .byte  15,183,92,126,4                     // movzwl        0x4(%esi,%edi,2),%ebx
   .byte  102,15,110,195                      // movd          %ebx,%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,15,110,4,126                    // movd          (%esi,%edi,2),%xmm0
   .byte  242,15,112,192,212                  // pshuflw       $0xd4,%xmm0,%xmm0
   .byte  242,15,16,216                       // movsd         %xmm0,%xmm3
-  .byte  233,98,255,255,255                  // jmp           45a4 <_sk_load_4444_sse2+0x34>
+  .byte  233,98,255,255,255                  // jmp           4634 <_sk_load_4444_sse2+0x34>
   .byte  15,183,52,126                       // movzwl        (%esi,%edi,2),%esi
   .byte  102,15,110,222                      // movd          %esi,%xmm3
-  .byte  233,85,255,255,255                  // jmp           45a4 <_sk_load_4444_sse2+0x34>
+  .byte  233,85,255,255,255                  // jmp           4634 <_sk_load_4444_sse2+0x34>
 
 HIDDEN _sk_load_4444_dst_sse2
 .globl _sk_load_4444_dst_sse2
@@ -59739,7 +59927,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          465d <_sk_load_4444_dst_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          46ed <_sk_load_4444_dst_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59751,7 +59939,7 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  15,133,128,0,0,0                    // jne           46fe <_sk_load_4444_dst_sse2+0xaf>
+  .byte  15,133,128,0,0,0                    // jne           478e <_sk_load_4444_dst_sse2+0xaf>
   .byte  243,15,126,36,126                   // movq          (%esi,%edi,2),%xmm4
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
   .byte  102,15,111,170,195,137,0,0          // movdqa        0x89c3(%edx),%xmm5
@@ -59786,22 +59974,22 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,51                              // je            4739 <_sk_load_4444_dst_sse2+0xea>
+  .byte  116,51                              // je            47c9 <_sk_load_4444_dst_sse2+0xea>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,23                              // je            4726 <_sk_load_4444_dst_sse2+0xd7>
+  .byte  116,23                              // je            47b6 <_sk_load_4444_dst_sse2+0xd7>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  15,133,111,255,255,255              // jne           4687 <_sk_load_4444_dst_sse2+0x38>
+  .byte  15,133,111,255,255,255              // jne           4717 <_sk_load_4444_dst_sse2+0x38>
   .byte  15,183,92,126,4                     // movzwl        0x4(%esi,%edi,2),%ebx
   .byte  102,15,110,227                      // movd          %ebx,%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
   .byte  102,15,110,44,126                   // movd          (%esi,%edi,2),%xmm5
   .byte  242,15,112,237,212                  // pshuflw       $0xd4,%xmm5,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  233,78,255,255,255                  // jmp           4687 <_sk_load_4444_dst_sse2+0x38>
+  .byte  233,78,255,255,255                  // jmp           4717 <_sk_load_4444_dst_sse2+0x38>
   .byte  15,183,52,126                       // movzwl        (%esi,%edi,2),%esi
   .byte  102,15,110,230                      // movd          %esi,%xmm4
-  .byte  233,65,255,255,255                  // jmp           4687 <_sk_load_4444_dst_sse2+0x38>
+  .byte  233,65,255,255,255                  // jmp           4717 <_sk_load_4444_dst_sse2+0x38>
 
 HIDDEN _sk_gather_4444_sse2
 .globl _sk_gather_4444_sse2
@@ -59812,52 +60000,65 @@
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,95,224                           // maxps         %xmm0,%xmm4
+  .byte  15,93,226                           // minps         %xmm2,%xmm4
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,209                           // maxps         %xmm1,%xmm2
+  .byte  15,93,208                           // minps         %xmm0,%xmm2
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,194                       // cvttps2dq     %xmm2,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,204                       // cvttps2dq     %xmm4,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,193,229                  // pshufd        $0xe5,%xmm1,%xmm0
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,110,217                      // movd          %ecx,%xmm3
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
+  .byte  102,15,126,193                      // movd          %xmm0,%ecx
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,196,217,1                    // pinsrw        $0x1,%ecx,%xmm3
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  102,15,112,192,231                  // pshufd        $0xe7,%xmm0,%xmm0
+  .byte  102,15,126,193                      // movd          %xmm0,%ecx
+  .byte  102,15,112,193,231                  // pshufd        $0xe7,%xmm1,%xmm0
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,196,217,2                    // pinsrw        $0x2,%ecx,%xmm3
   .byte  102,15,126,193                      // movd          %xmm0,%ecx
   .byte  15,183,12,74                        // movzwl        (%edx,%ecx,2),%ecx
   .byte  102,15,196,217,3                    // pinsrw        $0x3,%ecx,%xmm3
-  .byte  232,0,0,0,0                         // call          47cb <_sk_gather_4444_sse2+0x85>
+  .byte  232,0,0,0,0                         // call          488b <_sk_gather_4444_sse2+0xb5>
   .byte  89                                  // pop           %ecx
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,97,216                       // punpcklwd     %xmm0,%xmm3
-  .byte  102,15,111,129,85,136,0,0           // movdqa        0x8855(%ecx),%xmm0
+  .byte  102,15,111,129,37,136,0,0           // movdqa        0x8825(%ecx),%xmm0
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,89,129,101,136,0,0               // mulps         0x8865(%ecx),%xmm0
-  .byte  102,15,111,137,117,136,0,0          // movdqa        0x8875(%ecx),%xmm1
+  .byte  15,89,129,53,136,0,0                // mulps         0x8835(%ecx),%xmm0
+  .byte  102,15,111,137,69,136,0,0           // movdqa        0x8845(%ecx),%xmm1
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
   .byte  15,91,201                           // cvtdq2ps      %xmm1,%xmm1
-  .byte  15,89,137,133,136,0,0               // mulps         0x8885(%ecx),%xmm1
-  .byte  102,15,111,145,149,136,0,0          // movdqa        0x8895(%ecx),%xmm2
+  .byte  15,89,137,85,136,0,0                // mulps         0x8855(%ecx),%xmm1
+  .byte  102,15,111,145,101,136,0,0          // movdqa        0x8865(%ecx),%xmm2
   .byte  102,15,219,211                      // pand          %xmm3,%xmm2
   .byte  15,91,210                           // cvtdq2ps      %xmm2,%xmm2
-  .byte  15,89,145,165,136,0,0               // mulps         0x88a5(%ecx),%xmm2
-  .byte  102,15,219,153,181,136,0,0          // pand          0x88b5(%ecx),%xmm3
+  .byte  15,89,145,117,136,0,0               // mulps         0x8875(%ecx),%xmm2
+  .byte  102,15,219,153,133,136,0,0          // pand          0x8885(%ecx),%xmm3
   .byte  15,91,219                           // cvtdq2ps      %xmm3,%xmm3
-  .byte  15,89,153,197,136,0,0               // mulps         0x88c5(%ecx),%xmm3
+  .byte  15,89,153,149,136,0,0               // mulps         0x8895(%ecx),%xmm3
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  81                                  // push          %ecx
@@ -59877,7 +60078,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4848 <_sk_store_4444_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4908 <_sk_store_4444_sse2+0xe>
   .byte  95                                  // pop           %edi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59887,7 +60088,7 @@
   .byte  1,210                               // add           %edx,%edx
   .byte  3,22                                // add           (%esi),%edx
   .byte  139,49                              // mov           (%ecx),%esi
-  .byte  15,40,167,88,136,0,0                // movaps        0x8858(%edi),%xmm4
+  .byte  15,40,167,40,136,0,0                // movaps        0x8828(%edi),%xmm4
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
@@ -59913,7 +60114,7 @@
   .byte  102,15,112,236,229                  // pshufd        $0xe5,%xmm4,%xmm5
   .byte  102,15,126,109,236                  // movd          %xmm5,-0x14(%ebp)
   .byte  133,219                             // test          %ebx,%ebx
-  .byte  117,34                              // jne           48eb <_sk_store_4444_sse2+0xb1>
+  .byte  117,34                              // jne           49ab <_sk_store_4444_sse2+0xb1>
   .byte  102,15,126,231                      // movd          %xmm4,%edi
   .byte  102,15,126,235                      // movd          %xmm5,%ebx
   .byte  137,60,114                          // mov           %edi,(%edx,%esi,2)
@@ -59933,20 +60134,20 @@
   .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,37                              // je            4921 <_sk_store_4444_sse2+0xe7>
+  .byte  116,37                              // je            49e1 <_sk_store_4444_sse2+0xe7>
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,15                              // je            4910 <_sk_store_4444_sse2+0xd6>
+  .byte  116,15                              // je            49d0 <_sk_store_4444_sse2+0xd6>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,210                             // jne           48d8 <_sk_store_4444_sse2+0x9e>
+  .byte  117,210                             // jne           4998 <_sk_store_4444_sse2+0x9e>
   .byte  102,15,197,252,4                    // pextrw        $0x4,%xmm4,%edi
   .byte  102,137,124,114,4                   // mov           %di,0x4(%edx,%esi,2)
   .byte  102,15,112,228,212                  // pshufd        $0xd4,%xmm4,%xmm4
   .byte  242,15,112,228,232                  // pshuflw       $0xe8,%xmm4,%xmm4
   .byte  102,15,126,36,114                   // movd          %xmm4,(%edx,%esi,2)
-  .byte  235,183                             // jmp           48d8 <_sk_store_4444_sse2+0x9e>
+  .byte  235,183                             // jmp           4998 <_sk_store_4444_sse2+0x9e>
   .byte  102,15,126,231                      // movd          %xmm4,%edi
   .byte  102,137,60,114                      // mov           %di,(%edx,%esi,2)
-  .byte  235,173                             // jmp           48d8 <_sk_store_4444_sse2+0x9e>
+  .byte  235,173                             // jmp           4998 <_sk_store_4444_sse2+0x9e>
 
 HIDDEN _sk_load_8888_sse2
 .globl _sk_load_8888_sse2
@@ -59958,7 +60159,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4939 <_sk_load_8888_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          49f9 <_sk_load_8888_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -59970,13 +60171,13 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,102                             // jne           49bd <_sk_load_8888_sse2+0x92>
+  .byte  117,102                             // jne           4a7d <_sk_load_8888_sse2+0x92>
   .byte  243,15,111,28,190                   // movdqu        (%esi,%edi,4),%xmm3
-  .byte  102,15,111,146,151,131,0,0          // movdqa        0x8397(%edx),%xmm2
+  .byte  102,15,111,146,103,131,0,0          // movdqa        0x8367(%edx),%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,40,162,199,132,0,0               // movaps        0x84c7(%edx),%xmm4
+  .byte  15,40,162,151,132,0,0               // movaps        0x8497(%edx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -60004,18 +60205,18 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,35                              // je            49e8 <_sk_load_8888_sse2+0xbd>
+  .byte  116,35                              // je            4aa8 <_sk_load_8888_sse2+0xbd>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,16                              // je            49de <_sk_load_8888_sse2+0xb3>
+  .byte  116,16                              // je            4a9e <_sk_load_8888_sse2+0xb3>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,137                             // jne           495c <_sk_load_8888_sse2+0x31>
+  .byte  117,137                             // jne           4a1c <_sk_load_8888_sse2+0x31>
   .byte  102,15,110,68,190,8                 // movd          0x8(%esi,%edi,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,15,18,28,190                    // movlpd        (%esi,%edi,4),%xmm3
-  .byte  233,116,255,255,255                 // jmp           495c <_sk_load_8888_sse2+0x31>
+  .byte  233,116,255,255,255                 // jmp           4a1c <_sk_load_8888_sse2+0x31>
   .byte  102,15,110,28,190                   // movd          (%esi,%edi,4),%xmm3
-  .byte  233,106,255,255,255                 // jmp           495c <_sk_load_8888_sse2+0x31>
+  .byte  233,106,255,255,255                 // jmp           4a1c <_sk_load_8888_sse2+0x31>
 
 HIDDEN _sk_load_8888_dst_sse2
 .globl _sk_load_8888_dst_sse2
@@ -60027,7 +60228,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4a00 <_sk_load_8888_dst_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4ac0 <_sk_load_8888_dst_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60039,13 +60240,13 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,118                             // jne           4a94 <_sk_load_8888_dst_sse2+0xa2>
+  .byte  117,118                             // jne           4b54 <_sk_load_8888_dst_sse2+0xa2>
   .byte  243,15,111,36,190                   // movdqu        (%esi,%edi,4),%xmm4
-  .byte  102,15,111,170,208,130,0,0          // movdqa        0x82d0(%edx),%xmm5
+  .byte  102,15,111,170,160,130,0,0          // movdqa        0x82a0(%edx),%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  102,15,219,245                      // pand          %xmm5,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,40,186,0,132,0,0                 // movaps        0x8400(%edx),%xmm7
+  .byte  15,40,186,208,131,0,0               // movaps        0x83d0(%edx),%xmm7
   .byte  15,89,247                           // mulps         %xmm7,%xmm6
   .byte  15,41,113,16                        // movaps        %xmm6,0x10(%ecx)
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
@@ -60077,18 +60278,18 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,39                              // je            4ac3 <_sk_load_8888_dst_sse2+0xd1>
+  .byte  116,39                              // je            4b83 <_sk_load_8888_dst_sse2+0xd1>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,20                              // je            4ab9 <_sk_load_8888_dst_sse2+0xc7>
+  .byte  116,20                              // je            4b79 <_sk_load_8888_dst_sse2+0xc7>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  15,133,117,255,255,255              // jne           4a23 <_sk_load_8888_dst_sse2+0x31>
+  .byte  15,133,117,255,255,255              // jne           4ae3 <_sk_load_8888_dst_sse2+0x31>
   .byte  102,15,110,100,190,8                // movd          0x8(%esi,%edi,4),%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
   .byte  102,15,18,36,190                    // movlpd        (%esi,%edi,4),%xmm4
-  .byte  233,96,255,255,255                  // jmp           4a23 <_sk_load_8888_dst_sse2+0x31>
+  .byte  233,96,255,255,255                  // jmp           4ae3 <_sk_load_8888_dst_sse2+0x31>
   .byte  102,15,110,36,190                   // movd          (%esi,%edi,4),%xmm4
-  .byte  233,86,255,255,255                  // jmp           4a23 <_sk_load_8888_dst_sse2+0x31>
+  .byte  233,86,255,255,255                  // jmp           4ae3 <_sk_load_8888_dst_sse2+0x31>
 
 HIDDEN _sk_gather_8888_sse2
 .globl _sk_gather_8888_sse2
@@ -60099,39 +60300,52 @@
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,87,237                           // xorps         %xmm5,%xmm5
+  .byte  15,95,232                           // maxps         %xmm0,%xmm5
+  .byte  15,93,234                           // minps         %xmm2,%xmm5
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,95,225                           // maxps         %xmm1,%xmm4
+  .byte  15,93,224                           // minps         %xmm0,%xmm4
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,196                       // cvttps2dq     %xmm4,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,15,112,208,231                  // pshufd        $0xe7,%xmm0,%xmm2
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,205                       // cvttps2dq     %xmm5,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,15,112,209,231                  // pshufd        $0xe7,%xmm1,%xmm2
   .byte  102,15,126,209                      // movd          %xmm2,%ecx
   .byte  102,15,110,20,138                   // movd          (%edx,%ecx,4),%xmm2
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  102,15,110,12,138                   // movd          (%edx,%ecx,4),%xmm1
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,192,229                  // pshufd        $0xe5,%xmm0,%xmm0
-  .byte  102,15,110,28,138                   // movd          (%edx,%ecx,4),%xmm3
   .byte  102,15,126,193                      // movd          %xmm0,%ecx
   .byte  102,15,110,4,138                    // movd          (%edx,%ecx,4),%xmm0
-  .byte  232,0,0,0,0                         // call          4b43 <_sk_gather_8888_sse2+0x76>
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,201,229                  // pshufd        $0xe5,%xmm1,%xmm1
+  .byte  102,15,110,28,138                   // movd          (%edx,%ecx,4),%xmm3
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,110,12,138                   // movd          (%edx,%ecx,4),%xmm1
+  .byte  232,0,0,0,0                         // call          4c33 <_sk_gather_8888_sse2+0xa6>
   .byte  89                                  // pop           %ecx
-  .byte  102,15,98,202                       // punpckldq     %xmm2,%xmm1
-  .byte  102,15,98,216                       // punpckldq     %xmm0,%xmm3
-  .byte  102,15,108,217                      // punpcklqdq    %xmm1,%xmm3
-  .byte  102,15,111,145,141,129,0,0          // movdqa        0x818d(%ecx),%xmm2
+  .byte  102,15,98,194                       // punpckldq     %xmm2,%xmm0
+  .byte  102,15,98,217                       // punpckldq     %xmm1,%xmm3
+  .byte  102,15,108,216                      // punpcklqdq    %xmm0,%xmm3
+  .byte  102,15,111,145,45,129,0,0           // movdqa        0x812d(%ecx),%xmm2
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,219,194                      // pand          %xmm2,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,40,161,189,130,0,0               // movaps        0x82bd(%ecx),%xmm4
+  .byte  15,40,161,93,130,0,0                // movaps        0x825d(%ecx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -60165,7 +60379,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4bbe <_sk_store_8888_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4cae <_sk_store_8888_sse2+0xe>
   .byte  95                                  // pop           %edi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60175,7 +60389,7 @@
   .byte  193,226,2                           // shl           $0x2,%edx
   .byte  3,22                                // add           (%esi),%edx
   .byte  139,49                              // mov           (%ecx),%esi
-  .byte  15,40,167,34,129,0,0                // movaps        0x8122(%edi),%xmm4
+  .byte  15,40,167,194,128,0,0               // movaps        0x80c2(%edi),%xmm4
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
@@ -60195,7 +60409,7 @@
   .byte  102,15,235,229                      // por           %xmm5,%xmm4
   .byte  102,15,235,230                      // por           %xmm6,%xmm4
   .byte  133,219                             // test          %ebx,%ebx
-  .byte  117,24                              // jne           4c3b <_sk_store_8888_sse2+0x8b>
+  .byte  117,24                              // jne           4d2b <_sk_store_8888_sse2+0x8b>
   .byte  243,15,127,36,178                   // movdqu        %xmm4,(%edx,%esi,4)
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -60210,17 +60424,17 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,28                              // je            4c5f <_sk_store_8888_sse2+0xaf>
+  .byte  116,28                              // je            4d4f <_sk_store_8888_sse2+0xaf>
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,16                              // je            4c58 <_sk_store_8888_sse2+0xa8>
+  .byte  116,16                              // je            4d48 <_sk_store_8888_sse2+0xa8>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,219                             // jne           4c28 <_sk_store_8888_sse2+0x78>
+  .byte  117,219                             // jne           4d18 <_sk_store_8888_sse2+0x78>
   .byte  102,15,112,236,78                   // pshufd        $0x4e,%xmm4,%xmm5
   .byte  102,15,126,108,178,8                // movd          %xmm5,0x8(%edx,%esi,4)
   .byte  102,15,214,36,178                   // movq          %xmm4,(%edx,%esi,4)
-  .byte  235,201                             // jmp           4c28 <_sk_store_8888_sse2+0x78>
+  .byte  235,201                             // jmp           4d18 <_sk_store_8888_sse2+0x78>
   .byte  102,15,126,36,178                   // movd          %xmm4,(%edx,%esi,4)
-  .byte  235,194                             // jmp           4c28 <_sk_store_8888_sse2+0x78>
+  .byte  235,194                             // jmp           4d18 <_sk_store_8888_sse2+0x78>
 
 HIDDEN _sk_load_bgra_sse2
 .globl _sk_load_bgra_sse2
@@ -60232,7 +60446,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4c74 <_sk_load_bgra_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4d64 <_sk_load_bgra_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60244,13 +60458,13 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,102                             // jne           4cf8 <_sk_load_bgra_sse2+0x92>
+  .byte  117,102                             // jne           4de8 <_sk_load_bgra_sse2+0x92>
   .byte  243,15,111,28,190                   // movdqu        (%esi,%edi,4),%xmm3
-  .byte  102,15,111,130,92,128,0,0           // movdqa        0x805c(%edx),%xmm0
+  .byte  102,15,111,130,252,127,0,0          // movdqa        0x7ffc(%edx),%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  15,91,209                           // cvtdq2ps      %xmm1,%xmm2
-  .byte  15,40,162,140,129,0,0               // movaps        0x818c(%edx),%xmm4
+  .byte  15,40,162,44,129,0,0                // movaps        0x812c(%edx),%xmm4
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -60278,18 +60492,18 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,35                              // je            4d23 <_sk_load_bgra_sse2+0xbd>
+  .byte  116,35                              // je            4e13 <_sk_load_bgra_sse2+0xbd>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,16                              // je            4d19 <_sk_load_bgra_sse2+0xb3>
+  .byte  116,16                              // je            4e09 <_sk_load_bgra_sse2+0xb3>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,137                             // jne           4c97 <_sk_load_bgra_sse2+0x31>
+  .byte  117,137                             // jne           4d87 <_sk_load_bgra_sse2+0x31>
   .byte  102,15,110,68,190,8                 // movd          0x8(%esi,%edi,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,15,18,28,190                    // movlpd        (%esi,%edi,4),%xmm3
-  .byte  233,116,255,255,255                 // jmp           4c97 <_sk_load_bgra_sse2+0x31>
+  .byte  233,116,255,255,255                 // jmp           4d87 <_sk_load_bgra_sse2+0x31>
   .byte  102,15,110,28,190                   // movd          (%esi,%edi,4),%xmm3
-  .byte  233,106,255,255,255                 // jmp           4c97 <_sk_load_bgra_sse2+0x31>
+  .byte  233,106,255,255,255                 // jmp           4d87 <_sk_load_bgra_sse2+0x31>
 
 HIDDEN _sk_load_bgra_dst_sse2
 .globl _sk_load_bgra_dst_sse2
@@ -60301,7 +60515,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4d3b <_sk_load_bgra_dst_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          4e2b <_sk_load_bgra_dst_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60313,13 +60527,13 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  117,118                             // jne           4dcf <_sk_load_bgra_dst_sse2+0xa2>
+  .byte  117,118                             // jne           4ebf <_sk_load_bgra_dst_sse2+0xa2>
   .byte  243,15,111,36,190                   // movdqu        (%esi,%edi,4),%xmm4
-  .byte  102,15,111,170,149,127,0,0          // movdqa        0x7f95(%edx),%xmm5
+  .byte  102,15,111,170,53,127,0,0           // movdqa        0x7f35(%edx),%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  102,15,219,245                      // pand          %xmm5,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
-  .byte  15,40,186,197,128,0,0               // movaps        0x80c5(%edx),%xmm7
+  .byte  15,40,186,101,128,0,0               // movaps        0x8065(%edx),%xmm7
   .byte  15,89,247                           // mulps         %xmm7,%xmm6
   .byte  15,41,113,48                        // movaps        %xmm6,0x30(%ecx)
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
@@ -60351,18 +60565,18 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,39                              // je            4dfe <_sk_load_bgra_dst_sse2+0xd1>
+  .byte  116,39                              // je            4eee <_sk_load_bgra_dst_sse2+0xd1>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,20                              // je            4df4 <_sk_load_bgra_dst_sse2+0xc7>
+  .byte  116,20                              // je            4ee4 <_sk_load_bgra_dst_sse2+0xc7>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  15,133,117,255,255,255              // jne           4d5e <_sk_load_bgra_dst_sse2+0x31>
+  .byte  15,133,117,255,255,255              // jne           4e4e <_sk_load_bgra_dst_sse2+0x31>
   .byte  102,15,110,100,190,8                // movd          0x8(%esi,%edi,4),%xmm4
   .byte  102,15,112,228,69                   // pshufd        $0x45,%xmm4,%xmm4
   .byte  102,15,18,36,190                    // movlpd        (%esi,%edi,4),%xmm4
-  .byte  233,96,255,255,255                  // jmp           4d5e <_sk_load_bgra_dst_sse2+0x31>
+  .byte  233,96,255,255,255                  // jmp           4e4e <_sk_load_bgra_dst_sse2+0x31>
   .byte  102,15,110,36,190                   // movd          (%esi,%edi,4),%xmm4
-  .byte  233,86,255,255,255                  // jmp           4d5e <_sk_load_bgra_dst_sse2+0x31>
+  .byte  233,86,255,255,255                  // jmp           4e4e <_sk_load_bgra_dst_sse2+0x31>
 
 HIDDEN _sk_gather_bgra_sse2
 .globl _sk_gather_bgra_sse2
@@ -60373,39 +60587,52 @@
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,87,237                           // xorps         %xmm5,%xmm5
+  .byte  15,95,232                           // maxps         %xmm0,%xmm5
+  .byte  15,93,234                           // minps         %xmm2,%xmm5
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,95,225                           // maxps         %xmm1,%xmm4
+  .byte  15,93,224                           // minps         %xmm0,%xmm4
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,196                       // cvttps2dq     %xmm4,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,15,112,208,231                  // pshufd        $0xe7,%xmm0,%xmm2
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,205                       // cvttps2dq     %xmm5,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,15,112,209,231                  // pshufd        $0xe7,%xmm1,%xmm2
   .byte  102,15,126,209                      // movd          %xmm2,%ecx
   .byte  102,15,110,20,138                   // movd          (%edx,%ecx,4),%xmm2
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  102,15,110,12,138                   // movd          (%edx,%ecx,4),%xmm1
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,192,229                  // pshufd        $0xe5,%xmm0,%xmm0
-  .byte  102,15,110,28,138                   // movd          (%edx,%ecx,4),%xmm3
   .byte  102,15,126,193                      // movd          %xmm0,%ecx
   .byte  102,15,110,4,138                    // movd          (%edx,%ecx,4),%xmm0
-  .byte  232,0,0,0,0                         // call          4e7e <_sk_gather_bgra_sse2+0x76>
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,201,229                  // pshufd        $0xe5,%xmm1,%xmm1
+  .byte  102,15,110,28,138                   // movd          (%edx,%ecx,4),%xmm3
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,110,12,138                   // movd          (%edx,%ecx,4),%xmm1
+  .byte  232,0,0,0,0                         // call          4f9e <_sk_gather_bgra_sse2+0xa6>
   .byte  89                                  // pop           %ecx
-  .byte  102,15,98,202                       // punpckldq     %xmm2,%xmm1
-  .byte  102,15,98,216                       // punpckldq     %xmm0,%xmm3
-  .byte  102,15,108,217                      // punpcklqdq    %xmm1,%xmm3
-  .byte  102,15,111,129,82,126,0,0           // movdqa        0x7e52(%ecx),%xmm0
+  .byte  102,15,98,194                       // punpckldq     %xmm2,%xmm0
+  .byte  102,15,98,217                       // punpckldq     %xmm1,%xmm3
+  .byte  102,15,108,216                      // punpcklqdq    %xmm0,%xmm3
+  .byte  102,15,111,129,194,125,0,0          // movdqa        0x7dc2(%ecx),%xmm0
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
   .byte  15,91,209                           // cvtdq2ps      %xmm1,%xmm2
-  .byte  15,40,161,130,127,0,0               // movaps        0x7f82(%ecx),%xmm4
+  .byte  15,40,161,242,126,0,0               // movaps        0x7ef2(%ecx),%xmm4
   .byte  15,89,212                           // mulps         %xmm4,%xmm2
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,114,209,8                    // psrld         $0x8,%xmm1
@@ -60439,7 +60666,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,12                          // sub           $0xc,%esp
-  .byte  232,0,0,0,0                         // call          4ef9 <_sk_store_bgra_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          5019 <_sk_store_bgra_sse2+0xe>
   .byte  95                                  // pop           %edi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60449,7 +60676,7 @@
   .byte  193,226,2                           // shl           $0x2,%edx
   .byte  3,22                                // add           (%esi),%edx
   .byte  139,49                              // mov           (%ecx),%esi
-  .byte  15,40,167,231,125,0,0               // movaps        0x7de7(%edi),%xmm4
+  .byte  15,40,167,87,125,0,0                // movaps        0x7d57(%edi),%xmm4
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  15,40,234                           // movaps        %xmm2,%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
@@ -60469,7 +60696,7 @@
   .byte  102,15,235,229                      // por           %xmm5,%xmm4
   .byte  102,15,235,230                      // por           %xmm6,%xmm4
   .byte  133,219                             // test          %ebx,%ebx
-  .byte  117,24                              // jne           4f76 <_sk_store_bgra_sse2+0x8b>
+  .byte  117,24                              // jne           5096 <_sk_store_bgra_sse2+0x8b>
   .byte  243,15,127,36,178                   // movdqu        %xmm4,(%edx,%esi,4)
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -60484,17 +60711,17 @@
   .byte  195                                 // ret
   .byte  128,227,3                           // and           $0x3,%bl
   .byte  128,251,1                           // cmp           $0x1,%bl
-  .byte  116,28                              // je            4f9a <_sk_store_bgra_sse2+0xaf>
+  .byte  116,28                              // je            50ba <_sk_store_bgra_sse2+0xaf>
   .byte  128,251,2                           // cmp           $0x2,%bl
-  .byte  116,16                              // je            4f93 <_sk_store_bgra_sse2+0xa8>
+  .byte  116,16                              // je            50b3 <_sk_store_bgra_sse2+0xa8>
   .byte  128,251,3                           // cmp           $0x3,%bl
-  .byte  117,219                             // jne           4f63 <_sk_store_bgra_sse2+0x78>
+  .byte  117,219                             // jne           5083 <_sk_store_bgra_sse2+0x78>
   .byte  102,15,112,236,78                   // pshufd        $0x4e,%xmm4,%xmm5
   .byte  102,15,126,108,178,8                // movd          %xmm5,0x8(%edx,%esi,4)
   .byte  102,15,214,36,178                   // movq          %xmm4,(%edx,%esi,4)
-  .byte  235,201                             // jmp           4f63 <_sk_store_bgra_sse2+0x78>
+  .byte  235,201                             // jmp           5083 <_sk_store_bgra_sse2+0x78>
   .byte  102,15,126,36,178                   // movd          %xmm4,(%edx,%esi,4)
-  .byte  235,194                             // jmp           4f63 <_sk_store_bgra_sse2+0x78>
+  .byte  235,194                             // jmp           5083 <_sk_store_bgra_sse2+0x78>
 
 HIDDEN _sk_load_f16_sse2
 .globl _sk_load_f16_sse2
@@ -60506,7 +60733,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,108                         // sub           $0x6c,%esp
-  .byte  232,0,0,0,0                         // call          4faf <_sk_load_f16_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          50cf <_sk_load_f16_sse2+0xe>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60518,7 +60745,7 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  15,133,173,1,0,0                    // jne           517e <_sk_load_f16_sse2+0x1dd>
+  .byte  15,133,173,1,0,0                    // jne           529e <_sk_load_f16_sse2+0x1dd>
   .byte  102,15,16,4,254                     // movupd        (%esi,%edi,8),%xmm0
   .byte  243,15,111,76,254,16                // movdqu        0x10(%esi,%edi,8),%xmm1
   .byte  102,15,40,216                       // movapd        %xmm0,%xmm3
@@ -60548,11 +60775,11 @@
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
-  .byte  102,15,111,170,1,129,0,0            // movdqa        0x8101(%edx),%xmm5
+  .byte  102,15,111,170,113,128,0,0          // movdqa        0x8071(%edx),%xmm5
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
   .byte  102,15,219,245                      // pand          %xmm5,%xmm6
-  .byte  102,15,219,138,17,129,0,0           // pand          0x8111(%edx),%xmm1
-  .byte  102,15,111,130,33,129,0,0           // movdqa        0x8121(%edx),%xmm0
+  .byte  102,15,219,138,129,128,0,0          // pand          0x8081(%edx),%xmm1
+  .byte  102,15,111,130,145,128,0,0          // movdqa        0x8091(%edx),%xmm0
   .byte  102,15,127,69,184                   // movdqa        %xmm0,-0x48(%ebp)
   .byte  102,15,114,246,16                   // pslld         $0x10,%xmm6
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
@@ -60564,7 +60791,7 @@
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
   .byte  102,15,219,213                      // pand          %xmm5,%xmm2
-  .byte  102,15,111,154,17,129,0,0           // movdqa        0x8111(%edx),%xmm3
+  .byte  102,15,111,154,129,128,0,0          // movdqa        0x8081(%edx),%xmm3
   .byte  102,15,219,227                      // pand          %xmm3,%xmm4
   .byte  102,15,114,242,16                   // pslld         $0x10,%xmm2
   .byte  102,15,102,196                      // pcmpgtd       %xmm4,%xmm0
@@ -60577,7 +60804,7 @@
   .byte  102,15,219,253                      // pand          %xmm5,%xmm7
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  102,15,114,247,16                   // pslld         $0x10,%xmm7
-  .byte  102,15,111,146,33,129,0,0           // movdqa        0x8121(%edx),%xmm2
+  .byte  102,15,111,146,145,128,0,0          // movdqa        0x8091(%edx),%xmm2
   .byte  102,15,102,208                      // pcmpgtd       %xmm0,%xmm2
   .byte  102,15,114,240,13                   // pslld         $0xd,%xmm0
   .byte  102,15,235,199                      // por           %xmm7,%xmm0
@@ -60592,7 +60819,7 @@
   .byte  102,15,127,93,184                   // movdqa        %xmm3,-0x48(%ebp)
   .byte  102,15,114,247,13                   // pslld         $0xd,%xmm7
   .byte  102,15,235,253                      // por           %xmm5,%xmm7
-  .byte  102,15,111,154,49,129,0,0           // movdqa        0x8131(%edx),%xmm3
+  .byte  102,15,111,154,161,128,0,0          // movdqa        0x80a1(%edx),%xmm3
   .byte  102,15,254,203                      // paddd         %xmm3,%xmm1
   .byte  102,15,254,227                      // paddd         %xmm3,%xmm4
   .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
@@ -60620,12 +60847,12 @@
   .byte  242,15,16,4,254                     // movsd         (%esi,%edi,8),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  131,251,1                           // cmp           $0x1,%ebx
-  .byte  15,132,76,254,255,255               // je            4fdc <_sk_load_f16_sse2+0x3b>
+  .byte  15,132,76,254,255,255               // je            50fc <_sk_load_f16_sse2+0x3b>
   .byte  102,15,22,68,254,8                  // movhpd        0x8(%esi,%edi,8),%xmm0
   .byte  131,251,3                           // cmp           $0x3,%ebx
-  .byte  15,130,61,254,255,255               // jb            4fdc <_sk_load_f16_sse2+0x3b>
+  .byte  15,130,61,254,255,255               // jb            50fc <_sk_load_f16_sse2+0x3b>
   .byte  243,15,126,76,254,16                // movq          0x10(%esi,%edi,8),%xmm1
-  .byte  233,50,254,255,255                  // jmp           4fdc <_sk_load_f16_sse2+0x3b>
+  .byte  233,50,254,255,255                  // jmp           50fc <_sk_load_f16_sse2+0x3b>
 
 HIDDEN _sk_load_f16_dst_sse2
 .globl _sk_load_f16_dst_sse2
@@ -60641,7 +60868,7 @@
   .byte  15,41,85,136                        // movaps        %xmm2,-0x78(%ebp)
   .byte  102,15,127,77,152                   // movdqa        %xmm1,-0x68(%ebp)
   .byte  15,41,69,168                        // movaps        %xmm0,-0x58(%ebp)
-  .byte  232,0,0,0,0                         // call          51cc <_sk_load_f16_dst_sse2+0x22>
+  .byte  232,0,0,0,0                         // call          52ec <_sk_load_f16_dst_sse2+0x22>
   .byte  90                                  // pop           %edx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -60653,7 +60880,7 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  133,219                             // test          %ebx,%ebx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  15,133,168,1,0,0                    // jne           5396 <_sk_load_f16_dst_sse2+0x1ec>
+  .byte  15,133,168,1,0,0                    // jne           54b6 <_sk_load_f16_dst_sse2+0x1ec>
   .byte  102,15,16,4,254                     // movupd        (%esi,%edi,8),%xmm0
   .byte  243,15,111,76,254,16                // movdqu        0x10(%esi,%edi,8),%xmm1
   .byte  102,15,40,208                       // movapd        %xmm0,%xmm2
@@ -60681,18 +60908,18 @@
   .byte  102,15,126,85,232                   // movd          %xmm2,-0x18(%ebp)
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
   .byte  102,15,97,202                       // punpcklwd     %xmm2,%xmm1
-  .byte  102,15,111,186,228,126,0,0          // movdqa        0x7ee4(%edx),%xmm7
+  .byte  102,15,111,186,84,126,0,0           // movdqa        0x7e54(%edx),%xmm7
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,15,219,215                      // pand          %xmm7,%xmm2
-  .byte  102,15,111,154,244,126,0,0          // movdqa        0x7ef4(%edx),%xmm3
+  .byte  102,15,111,154,100,126,0,0          // movdqa        0x7e64(%edx),%xmm3
   .byte  102,15,219,203                      // pand          %xmm3,%xmm1
-  .byte  102,15,111,162,4,127,0,0            // movdqa        0x7f04(%edx),%xmm4
+  .byte  102,15,111,162,116,126,0,0          // movdqa        0x7e74(%edx),%xmm4
   .byte  102,15,114,242,16                   // pslld         $0x10,%xmm2
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,102,233                      // pcmpgtd       %xmm1,%xmm5
   .byte  102,15,114,241,13                   // pslld         $0xd,%xmm1
   .byte  102,15,235,202                      // por           %xmm2,%xmm1
-  .byte  102,15,111,146,20,127,0,0           // movdqa        0x7f14(%edx),%xmm2
+  .byte  102,15,111,146,132,126,0,0          // movdqa        0x7e84(%edx),%xmm2
   .byte  102,15,127,85,184                   // movdqa        %xmm2,-0x48(%ebp)
   .byte  102,15,254,202                      // paddd         %xmm2,%xmm1
   .byte  102,15,223,233                      // pandn         %xmm1,%xmm5
@@ -60755,12 +60982,12 @@
   .byte  242,15,16,4,254                     // movsd         (%esi,%edi,8),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  131,251,1                           // cmp           $0x1,%ebx
-  .byte  15,132,81,254,255,255               // je            51f9 <_sk_load_f16_dst_sse2+0x4f>
+  .byte  15,132,81,254,255,255               // je            5319 <_sk_load_f16_dst_sse2+0x4f>
   .byte  102,15,22,68,254,8                  // movhpd        0x8(%esi,%edi,8),%xmm0
   .byte  131,251,3                           // cmp           $0x3,%ebx
-  .byte  15,130,66,254,255,255               // jb            51f9 <_sk_load_f16_dst_sse2+0x4f>
+  .byte  15,130,66,254,255,255               // jb            5319 <_sk_load_f16_dst_sse2+0x4f>
   .byte  243,15,126,76,254,16                // movq          0x10(%esi,%edi,8),%xmm1
-  .byte  233,55,254,255,255                  // jmp           51f9 <_sk_load_f16_dst_sse2+0x4f>
+  .byte  233,55,254,255,255                  // jmp           5319 <_sk_load_f16_dst_sse2+0x4f>
 
 HIDDEN _sk_gather_f16_sse2
 .globl _sk_gather_f16_sse2
@@ -60771,121 +60998,134 @@
   .byte  131,236,88                          // sub           $0x58,%esp
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,8                               // mov           (%eax),%ecx
+  .byte  243,15,16,81,8                      // movss         0x8(%ecx),%xmm2
+  .byte  15,198,210,0                        // shufps        $0x0,%xmm2,%xmm2
+  .byte  102,15,118,219                      // pcmpeqd       %xmm3,%xmm3
+  .byte  102,15,254,211                      // paddd         %xmm3,%xmm2
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,95,224                           // maxps         %xmm0,%xmm4
+  .byte  15,93,226                           // minps         %xmm2,%xmm4
+  .byte  243,15,16,65,12                     // movss         0xc(%ecx),%xmm0
+  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
+  .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
+  .byte  15,87,210                           // xorps         %xmm2,%xmm2
+  .byte  15,95,209                           // maxps         %xmm1,%xmm2
+  .byte  15,93,208                           // minps         %xmm0,%xmm2
   .byte  139,17                              // mov           (%ecx),%edx
-  .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
-  .byte  102,15,110,81,4                     // movd          0x4(%ecx),%xmm2
-  .byte  102,15,112,210,0                    // pshufd        $0x0,%xmm2,%xmm2
-  .byte  102,15,112,217,245                  // pshufd        $0xf5,%xmm1,%xmm3
-  .byte  102,15,244,218                      // pmuludq       %xmm2,%xmm3
-  .byte  102,15,112,219,232                  // pshufd        $0xe8,%xmm3,%xmm3
+  .byte  243,15,91,194                       // cvttps2dq     %xmm2,%xmm0
+  .byte  102,15,110,73,4                     // movd          0x4(%ecx),%xmm1
+  .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
+  .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
+  .byte  102,15,244,200                      // pmuludq       %xmm0,%xmm1
+  .byte  102,15,112,193,232                  // pshufd        $0xe8,%xmm1,%xmm0
   .byte  102,15,112,202,232                  // pshufd        $0xe8,%xmm2,%xmm1
-  .byte  102,15,98,203                       // punpckldq     %xmm3,%xmm1
-  .byte  243,15,91,192                       // cvttps2dq     %xmm0,%xmm0
-  .byte  102,15,254,193                      // paddd         %xmm1,%xmm0
-  .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
-  .byte  102,15,112,208,231                  // pshufd        $0xe7,%xmm0,%xmm2
+  .byte  102,15,98,193                       // punpckldq     %xmm1,%xmm0
+  .byte  243,15,91,204                       // cvttps2dq     %xmm4,%xmm1
+  .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
+  .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
+  .byte  102,15,112,209,231                  // pshufd        $0xe7,%xmm1,%xmm2
   .byte  102,15,126,209                      // movd          %xmm2,%ecx
   .byte  243,15,126,20,202                   // movq          (%edx,%ecx,8),%xmm2
-  .byte  102,15,126,201                      // movd          %xmm1,%ecx
-  .byte  243,15,126,12,202                   // movq          (%edx,%ecx,8),%xmm1
-  .byte  102,15,126,193                      // movd          %xmm0,%ecx
-  .byte  102,15,112,192,229                  // pshufd        $0xe5,%xmm0,%xmm0
-  .byte  243,15,126,28,202                   // movq          (%edx,%ecx,8),%xmm3
   .byte  102,15,126,193                      // movd          %xmm0,%ecx
   .byte  243,15,126,4,202                    // movq          (%edx,%ecx,8),%xmm0
-  .byte  232,0,0,0,0                         // call          5438 <_sk_gather_f16_sse2+0x76>
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  102,15,112,201,229                  // pshufd        $0xe5,%xmm1,%xmm1
+  .byte  243,15,126,28,202                   // movq          (%edx,%ecx,8),%xmm3
+  .byte  102,15,126,201                      // movd          %xmm1,%ecx
+  .byte  243,15,126,12,202                   // movq          (%edx,%ecx,8),%xmm1
+  .byte  232,0,0,0,0                         // call          5588 <_sk_gather_f16_sse2+0xa6>
   .byte  89                                  // pop           %ecx
-  .byte  102,15,108,202                      // punpcklqdq    %xmm2,%xmm1
-  .byte  102,15,108,216                      // punpcklqdq    %xmm0,%xmm3
-  .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  102,15,97,193                       // punpcklwd     %xmm1,%xmm0
-  .byte  102,15,105,217                      // punpckhwd     %xmm1,%xmm3
-  .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
-  .byte  102,15,97,211                       // punpcklwd     %xmm3,%xmm2
-  .byte  102,15,105,195                      // punpckhwd     %xmm3,%xmm0
-  .byte  102,15,126,85,224                   // movd          %xmm2,-0x20(%ebp)
-  .byte  102,15,112,202,229                  // pshufd        $0xe5,%xmm2,%xmm1
+  .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
+  .byte  102,15,108,194                      // punpcklqdq    %xmm2,%xmm0
+  .byte  102,15,108,217                      // punpcklqdq    %xmm1,%xmm3
+  .byte  102,15,111,227                      // movdqa        %xmm3,%xmm4
+  .byte  102,15,97,224                       // punpcklwd     %xmm0,%xmm4
+  .byte  102,15,105,216                      // punpckhwd     %xmm0,%xmm3
+  .byte  102,15,111,196                      // movdqa        %xmm4,%xmm0
+  .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
+  .byte  102,15,105,227                      // punpckhwd     %xmm3,%xmm4
+  .byte  102,15,126,69,224                   // movd          %xmm0,-0x20(%ebp)
+  .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
   .byte  102,15,126,77,228                   // movd          %xmm1,-0x1c(%ebp)
   .byte  243,15,126,77,224                   // movq          -0x20(%ebp),%xmm1
-  .byte  102,15,112,218,231                  // pshufd        $0xe7,%xmm2,%xmm3
-  .byte  102,15,126,93,236                   // movd          %xmm3,-0x14(%ebp)
-  .byte  102,15,112,210,78                   // pshufd        $0x4e,%xmm2,%xmm2
-  .byte  102,15,126,85,232                   // movd          %xmm2,-0x18(%ebp)
-  .byte  243,15,126,101,232                  // movq          -0x18(%ebp),%xmm4
-  .byte  102,15,126,69,240                   // movd          %xmm0,-0x10(%ebp)
-  .byte  102,15,112,216,229                  // pshufd        $0xe5,%xmm0,%xmm3
-  .byte  102,15,126,93,244                   // movd          %xmm3,-0xc(%ebp)
-  .byte  243,15,126,85,240                   // movq          -0x10(%ebp),%xmm2
-  .byte  102,15,127,85,184                   // movdqa        %xmm2,-0x48(%ebp)
-  .byte  102,15,112,216,231                  // pshufd        $0xe7,%xmm0,%xmm3
-  .byte  102,15,126,93,252                   // movd          %xmm3,-0x4(%ebp)
+  .byte  102,15,112,208,231                  // pshufd        $0xe7,%xmm0,%xmm2
+  .byte  102,15,126,85,236                   // movd          %xmm2,-0x14(%ebp)
   .byte  102,15,112,192,78                   // pshufd        $0x4e,%xmm0,%xmm0
+  .byte  102,15,126,69,232                   // movd          %xmm0,-0x18(%ebp)
+  .byte  243,15,126,109,232                  // movq          -0x18(%ebp),%xmm5
+  .byte  102,15,126,101,240                  // movd          %xmm4,-0x10(%ebp)
+  .byte  102,15,112,196,229                  // pshufd        $0xe5,%xmm4,%xmm0
+  .byte  102,15,126,69,244                   // movd          %xmm0,-0xc(%ebp)
+  .byte  242,15,16,69,240                    // movsd         -0x10(%ebp),%xmm0
+  .byte  15,41,69,184                        // movaps        %xmm0,-0x48(%ebp)
+  .byte  102,15,112,196,231                  // pshufd        $0xe7,%xmm4,%xmm0
+  .byte  102,15,126,69,252                   // movd          %xmm0,-0x4(%ebp)
+  .byte  102,15,112,196,78                   // pshufd        $0x4e,%xmm4,%xmm0
   .byte  102,15,126,69,248                   // movd          %xmm0,-0x8(%ebp)
-  .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  102,15,97,200                       // punpcklwd     %xmm0,%xmm1
+  .byte  102,15,97,206                       // punpcklwd     %xmm6,%xmm1
   .byte  102,15,239,210                      // pxor          %xmm2,%xmm2
-  .byte  102,15,111,169,120,124,0,0          // movdqa        0x7c78(%ecx),%xmm5
-  .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
-  .byte  102,15,219,245                      // pand          %xmm5,%xmm6
-  .byte  102,15,219,137,136,124,0,0          // pand          0x7c88(%ecx),%xmm1
-  .byte  102,15,111,129,152,124,0,0          // movdqa        0x7c98(%ecx),%xmm0
-  .byte  102,15,114,246,16                   // pslld         $0x10,%xmm6
+  .byte  102,15,111,177,184,123,0,0          // movdqa        0x7bb8(%ecx),%xmm6
+  .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
+  .byte  102,15,219,230                      // pand          %xmm6,%xmm4
+  .byte  102,15,219,137,200,123,0,0          // pand          0x7bc8(%ecx),%xmm1
+  .byte  102,15,111,129,216,123,0,0          // movdqa        0x7bd8(%ecx),%xmm0
+  .byte  102,15,114,244,16                   // pslld         $0x10,%xmm4
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,102,217                      // pcmpgtd       %xmm1,%xmm3
   .byte  102,15,127,93,168                   // movdqa        %xmm3,-0x58(%ebp)
   .byte  102,15,114,241,13                   // pslld         $0xd,%xmm1
-  .byte  102,15,235,206                      // por           %xmm6,%xmm1
-  .byte  102,15,97,226                       // punpcklwd     %xmm2,%xmm4
+  .byte  102,15,235,204                      // por           %xmm4,%xmm1
+  .byte  102,15,97,234                       // punpcklwd     %xmm2,%xmm5
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
-  .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
-  .byte  102,15,219,213                      // pand          %xmm5,%xmm2
-  .byte  102,15,111,153,136,124,0,0          // movdqa        0x7c88(%ecx),%xmm3
-  .byte  102,15,219,227                      // pand          %xmm3,%xmm4
+  .byte  102,15,111,213                      // movdqa        %xmm5,%xmm2
+  .byte  102,15,219,214                      // pand          %xmm6,%xmm2
+  .byte  102,15,111,153,200,123,0,0          // movdqa        0x7bc8(%ecx),%xmm3
+  .byte  102,15,219,235                      // pand          %xmm3,%xmm5
   .byte  102,15,114,242,16                   // pslld         $0x10,%xmm2
-  .byte  102,15,111,240                      // movdqa        %xmm0,%xmm6
-  .byte  102,15,102,244                      // pcmpgtd       %xmm4,%xmm6
-  .byte  102,15,127,117,200                  // movdqa        %xmm6,-0x38(%ebp)
-  .byte  102,15,114,244,13                   // pslld         $0xd,%xmm4
-  .byte  102,15,235,226                      // por           %xmm2,%xmm4
+  .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
+  .byte  102,15,102,229                      // pcmpgtd       %xmm5,%xmm4
+  .byte  102,15,127,101,200                  // movdqa        %xmm4,-0x38(%ebp)
+  .byte  102,15,114,245,13                   // pslld         $0xd,%xmm5
+  .byte  102,15,235,234                      // por           %xmm2,%xmm5
   .byte  102,15,111,69,184                   // movdqa        -0x48(%ebp),%xmm0
   .byte  102,15,97,199                       // punpcklwd     %xmm7,%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
-  .byte  102,15,219,253                      // pand          %xmm5,%xmm7
+  .byte  102,15,219,254                      // pand          %xmm6,%xmm7
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  102,15,114,247,16                   // pslld         $0x10,%xmm7
-  .byte  102,15,111,145,152,124,0,0          // movdqa        0x7c98(%ecx),%xmm2
+  .byte  102,15,111,145,216,123,0,0          // movdqa        0x7bd8(%ecx),%xmm2
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
   .byte  102,15,102,216                      // pcmpgtd       %xmm0,%xmm3
   .byte  102,15,114,240,13                   // pslld         $0xd,%xmm0
   .byte  102,15,235,199                      // por           %xmm7,%xmm0
   .byte  243,15,126,125,248                  // movq          -0x8(%ebp),%xmm7
-  .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
-  .byte  102,15,97,254                       // punpcklwd     %xmm6,%xmm7
-  .byte  102,15,219,239                      // pand          %xmm7,%xmm5
-  .byte  102,15,219,185,136,124,0,0          // pand          0x7c88(%ecx),%xmm7
-  .byte  102,15,114,245,16                   // pslld         $0x10,%xmm5
+  .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
+  .byte  102,15,97,252                       // punpcklwd     %xmm4,%xmm7
+  .byte  102,15,219,247                      // pand          %xmm7,%xmm6
+  .byte  102,15,219,185,200,123,0,0          // pand          0x7bc8(%ecx),%xmm7
+  .byte  102,15,114,246,16                   // pslld         $0x10,%xmm6
   .byte  102,15,102,215                      // pcmpgtd       %xmm7,%xmm2
   .byte  102,15,114,247,13                   // pslld         $0xd,%xmm7
-  .byte  102,15,235,253                      // por           %xmm5,%xmm7
-  .byte  102,15,111,169,168,124,0,0          // movdqa        0x7ca8(%ecx),%xmm5
-  .byte  102,15,254,205                      // paddd         %xmm5,%xmm1
-  .byte  102,15,254,229                      // paddd         %xmm5,%xmm4
-  .byte  102,15,254,197                      // paddd         %xmm5,%xmm0
-  .byte  102,15,254,253                      // paddd         %xmm5,%xmm7
-  .byte  102,15,111,109,168                  // movdqa        -0x58(%ebp),%xmm5
-  .byte  102,15,223,233                      // pandn         %xmm1,%xmm5
+  .byte  102,15,235,254                      // por           %xmm6,%xmm7
+  .byte  102,15,111,161,232,123,0,0          // movdqa        0x7be8(%ecx),%xmm4
+  .byte  102,15,254,204                      // paddd         %xmm4,%xmm1
+  .byte  102,15,254,236                      // paddd         %xmm4,%xmm5
+  .byte  102,15,254,196                      // paddd         %xmm4,%xmm0
+  .byte  102,15,254,252                      // paddd         %xmm4,%xmm7
+  .byte  102,15,111,117,168                  // movdqa        -0x58(%ebp),%xmm6
+  .byte  102,15,223,241                      // pandn         %xmm1,%xmm6
   .byte  102,15,111,77,200                   // movdqa        -0x38(%ebp),%xmm1
-  .byte  102,15,223,204                      // pandn         %xmm4,%xmm1
+  .byte  102,15,223,205                      // pandn         %xmm5,%xmm1
   .byte  102,15,223,216                      // pandn         %xmm0,%xmm3
-  .byte  102,15,111,226                      // movdqa        %xmm2,%xmm4
-  .byte  102,15,223,231                      // pandn         %xmm7,%xmm4
+  .byte  102,15,111,234                      // movdqa        %xmm2,%xmm5
+  .byte  102,15,223,239                      // pandn         %xmm7,%xmm5
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  141,80,8                            // lea           0x8(%eax),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  102,15,111,197                      // movdqa        %xmm5,%xmm0
+  .byte  102,15,111,198                      // movdqa        %xmm6,%xmm0
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
-  .byte  102,15,111,220                      // movdqa        %xmm4,%xmm3
+  .byte  102,15,111,221                      // movdqa        %xmm5,%xmm3
   .byte  82                                  // push          %edx
   .byte  81                                  // push          %ecx
   .byte  255,80,4                            // call          *0x4(%eax)
@@ -60905,24 +61145,24 @@
   .byte  15,41,93,184                        // movaps        %xmm3,-0x48(%ebp)
   .byte  15,41,85,200                        // movaps        %xmm2,-0x38(%ebp)
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
-  .byte  232,0,0,0,0                         // call          55fd <_sk_store_f16_sse2+0x19>
+  .byte  232,0,0,0,0                         // call          574c <_sk_store_f16_sse2+0x19>
   .byte  88                                  // pop           %eax
-  .byte  102,15,111,152,243,122,0,0          // movdqa        0x7af3(%eax),%xmm3
+  .byte  102,15,111,152,52,122,0,0           // movdqa        0x7a34(%eax),%xmm3
   .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
   .byte  102,15,219,227                      // pand          %xmm3,%xmm4
-  .byte  102,15,111,136,35,123,0,0           // movdqa        0x7b23(%eax),%xmm1
+  .byte  102,15,111,136,100,122,0,0          // movdqa        0x7a64(%eax),%xmm1
   .byte  102,15,127,77,232                   // movdqa        %xmm1,-0x18(%ebp)
   .byte  102,15,111,240                      // movdqa        %xmm0,%xmm6
   .byte  102,15,114,246,3                    // pslld         $0x3,%xmm6
   .byte  102,15,219,241                      // pand          %xmm1,%xmm6
   .byte  102,15,254,244                      // paddd         %xmm4,%xmm6
-  .byte  102,15,111,184,3,123,0,0            // movdqa        0x7b03(%eax),%xmm7
+  .byte  102,15,111,184,68,122,0,0           // movdqa        0x7a44(%eax),%xmm7
   .byte  102,15,127,69,168                   // movdqa        %xmm0,-0x58(%ebp)
   .byte  102,15,219,199                      // pand          %xmm7,%xmm0
-  .byte  102,15,111,168,19,123,0,0           // movdqa        0x7b13(%eax),%xmm5
+  .byte  102,15,111,168,84,122,0,0           // movdqa        0x7a54(%eax),%xmm5
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
   .byte  102,15,102,200                      // pcmpgtd       %xmm0,%xmm1
-  .byte  102,15,111,128,163,119,0,0          // movdqa        0x77a3(%eax),%xmm0
+  .byte  102,15,111,128,228,118,0,0          // movdqa        0x76e4(%eax),%xmm0
   .byte  102,15,127,69,216                   // movdqa        %xmm0,-0x28(%ebp)
   .byte  102,15,254,240                      // paddd         %xmm0,%xmm6
   .byte  102,15,114,230,16                   // psrad         $0x10,%xmm6
@@ -60984,7 +61224,7 @@
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,98,198                       // punpckldq     %xmm6,%xmm0
   .byte  133,255                             // test          %edi,%edi
-  .byte  117,48                              // jne           577e <_sk_store_f16_sse2+0x19a>
+  .byte  117,48                              // jne           58cd <_sk_store_f16_sse2+0x19a>
   .byte  15,17,4,214                         // movups        %xmm0,(%esi,%edx,8)
   .byte  102,15,106,206                      // punpckhdq     %xmm6,%xmm1
   .byte  243,15,127,76,214,16                // movdqu        %xmm1,0x10(%esi,%edx,8)
@@ -61004,13 +61244,13 @@
   .byte  195                                 // ret
   .byte  102,15,214,4,214                    // movq          %xmm0,(%esi,%edx,8)
   .byte  131,255,1                           // cmp           $0x1,%edi
-  .byte  116,212                             // je            575c <_sk_store_f16_sse2+0x178>
+  .byte  116,212                             // je            58ab <_sk_store_f16_sse2+0x178>
   .byte  102,15,23,68,214,8                  // movhpd        %xmm0,0x8(%esi,%edx,8)
   .byte  131,255,3                           // cmp           $0x3,%edi
-  .byte  114,201                             // jb            575c <_sk_store_f16_sse2+0x178>
+  .byte  114,201                             // jb            58ab <_sk_store_f16_sse2+0x178>
   .byte  102,15,106,206                      // punpckhdq     %xmm6,%xmm1
   .byte  102,15,214,76,214,16                // movq          %xmm1,0x10(%esi,%edx,8)
-  .byte  235,189                             // jmp           575c <_sk_store_f16_sse2+0x178>
+  .byte  235,189                             // jmp           58ab <_sk_store_f16_sse2+0x178>
 
 HIDDEN _sk_load_u16_be_sse2
 .globl _sk_load_u16_be_sse2
@@ -61033,9 +61273,9 @@
   .byte  139,89,8                            // mov           0x8(%ecx),%ebx
   .byte  193,230,2                           // shl           $0x2,%esi
   .byte  133,219                             // test          %ebx,%ebx
-  .byte  232,0,0,0,0                         // call          57ca <_sk_load_u16_be_sse2+0x2b>
+  .byte  232,0,0,0,0                         // call          5919 <_sk_load_u16_be_sse2+0x2b>
   .byte  90                                  // pop           %edx
-  .byte  15,133,11,1,0,0                     // jne           58dc <_sk_load_u16_be_sse2+0x13d>
+  .byte  15,133,11,1,0,0                     // jne           5a2b <_sk_load_u16_be_sse2+0x13d>
   .byte  102,15,16,4,119                     // movupd        (%edi,%esi,2),%xmm0
   .byte  243,15,111,76,119,16                // movdqu        0x10(%edi,%esi,2),%xmm1
   .byte  102,15,40,208                       // movapd        %xmm0,%xmm2
@@ -61056,7 +61296,7 @@
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,40,162,182,118,0,0               // movaps        0x76b6(%edx),%xmm4
+  .byte  15,40,162,247,117,0,0               // movaps        0x75f7(%edx),%xmm4
   .byte  15,89,196                           // mulps         %xmm4,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -61106,12 +61346,12 @@
   .byte  242,15,16,4,119                     // movsd         (%edi,%esi,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  131,251,1                           // cmp           $0x1,%ebx
-  .byte  15,132,238,254,255,255              // je            57dc <_sk_load_u16_be_sse2+0x3d>
+  .byte  15,132,238,254,255,255              // je            592b <_sk_load_u16_be_sse2+0x3d>
   .byte  102,15,22,68,119,8                  // movhpd        0x8(%edi,%esi,2),%xmm0
   .byte  131,251,3                           // cmp           $0x3,%ebx
-  .byte  15,130,223,254,255,255              // jb            57dc <_sk_load_u16_be_sse2+0x3d>
+  .byte  15,130,223,254,255,255              // jb            592b <_sk_load_u16_be_sse2+0x3d>
   .byte  243,15,126,76,119,16                // movq          0x10(%edi,%esi,2),%xmm1
-  .byte  233,212,254,255,255                 // jmp           57dc <_sk_load_u16_be_sse2+0x3d>
+  .byte  233,212,254,255,255                 // jmp           592b <_sk_load_u16_be_sse2+0x3d>
 
 HIDDEN _sk_load_rgb_u16_be_sse2
 .globl _sk_load_rgb_u16_be_sse2
@@ -61133,9 +61373,9 @@
   .byte  3,50                                // add           (%edx),%esi
   .byte  107,25,3                            // imul          $0x3,(%ecx),%ebx
   .byte  133,255                             // test          %edi,%edi
-  .byte  232,0,0,0,0                         // call          5931 <_sk_load_rgb_u16_be_sse2+0x29>
+  .byte  232,0,0,0,0                         // call          5a80 <_sk_load_rgb_u16_be_sse2+0x29>
   .byte  90                                  // pop           %edx
-  .byte  15,133,240,0,0,0                    // jne           5a28 <_sk_load_rgb_u16_be_sse2+0x120>
+  .byte  15,133,240,0,0,0                    // jne           5b77 <_sk_load_rgb_u16_be_sse2+0x120>
   .byte  243,15,111,20,94                    // movdqu        (%esi,%ebx,2),%xmm2
   .byte  243,15,111,92,94,8                  // movdqu        0x8(%esi,%ebx,2),%xmm3
   .byte  102,15,115,219,4                    // psrldq        $0x4,%xmm3
@@ -61160,7 +61400,7 @@
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,97,195                       // punpcklwd     %xmm3,%xmm0
   .byte  15,91,192                           // cvtdq2ps      %xmm0,%xmm0
-  .byte  15,40,170,79,117,0,0                // movaps        0x754f(%edx),%xmm5
+  .byte  15,40,170,144,116,0,0               // movaps        0x7490(%edx),%xmm5
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
   .byte  102,15,111,204                      // movdqa        %xmm4,%xmm1
   .byte  102,15,113,241,8                    // psllw         $0x8,%xmm1
@@ -61186,7 +61426,7 @@
   .byte  15,89,213                           // mulps         %xmm5,%xmm2
   .byte  141,112,8                           // lea           0x8(%eax),%esi
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,154,223,114,0,0               // movaps        0x72df(%edx),%xmm3
+  .byte  15,40,154,32,114,0,0                // movaps        0x7220(%edx),%xmm3
   .byte  86                                  // push          %esi
   .byte  81                                  // push          %ecx
   .byte  255,80,4                            // call          *0x4(%eax)
@@ -61200,20 +61440,20 @@
   .byte  102,15,196,84,94,4,2                // pinsrw        $0x2,0x4(%esi,%ebx,2),%xmm2
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  131,255,1                           // cmp           $0x1,%edi
-  .byte  117,13                              // jne           5a4a <_sk_load_rgb_u16_be_sse2+0x142>
+  .byte  117,13                              // jne           5b99 <_sk_load_rgb_u16_be_sse2+0x142>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
-  .byte  233,16,255,255,255                  // jmp           595a <_sk_load_rgb_u16_be_sse2+0x52>
+  .byte  233,16,255,255,255                  // jmp           5aa9 <_sk_load_rgb_u16_be_sse2+0x52>
   .byte  102,15,110,68,94,6                  // movd          0x6(%esi,%ebx,2),%xmm0
   .byte  102,15,196,68,94,10,2               // pinsrw        $0x2,0xa(%esi,%ebx,2),%xmm0
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  131,255,3                           // cmp           $0x3,%edi
-  .byte  114,18                              // jb            5a72 <_sk_load_rgb_u16_be_sse2+0x16a>
+  .byte  114,18                              // jb            5bc1 <_sk_load_rgb_u16_be_sse2+0x16a>
   .byte  102,15,110,92,94,12                 // movd          0xc(%esi,%ebx,2),%xmm3
   .byte  102,15,196,92,94,16,2               // pinsrw        $0x2,0x10(%esi,%ebx,2),%xmm3
-  .byte  233,232,254,255,255                 // jmp           595a <_sk_load_rgb_u16_be_sse2+0x52>
+  .byte  233,232,254,255,255                 // jmp           5aa9 <_sk_load_rgb_u16_be_sse2+0x52>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
-  .byte  233,223,254,255,255                 // jmp           595a <_sk_load_rgb_u16_be_sse2+0x52>
+  .byte  233,223,254,255,255                 // jmp           5aa9 <_sk_load_rgb_u16_be_sse2+0x52>
 
 HIDDEN _sk_store_u16_be_sse2
 .globl _sk_store_u16_be_sse2
@@ -61223,7 +61463,7 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
-  .byte  232,0,0,0,0                         // call          5a85 <_sk_store_u16_be_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          5bd4 <_sk_store_u16_be_sse2+0xa>
   .byte  95                                  // pop           %edi
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
@@ -61233,7 +61473,7 @@
   .byte  1,210                               // add           %edx,%edx
   .byte  3,22                                // add           (%esi),%edx
   .byte  139,49                              // mov           (%ecx),%esi
-  .byte  15,40,183,171,118,0,0               // movaps        0x76ab(%edi),%xmm6
+  .byte  15,40,183,236,117,0,0               // movaps        0x75ec(%edi),%xmm6
   .byte  139,121,8                           // mov           0x8(%ecx),%edi
   .byte  193,230,2                           // shl           $0x2,%esi
   .byte  15,40,224                           // movaps        %xmm0,%xmm4
@@ -61280,7 +61520,7 @@
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  102,15,98,245                       // punpckldq     %xmm5,%xmm6
   .byte  133,255                             // test          %edi,%edi
-  .byte  117,32                              // jne           5b81 <_sk_store_u16_be_sse2+0x106>
+  .byte  117,32                              // jne           5cd0 <_sk_store_u16_be_sse2+0x106>
   .byte  15,17,52,114                        // movups        %xmm6,(%edx,%esi,2)
   .byte  102,15,106,229                      // punpckhdq     %xmm5,%xmm4
   .byte  243,15,127,100,114,16               // movdqu        %xmm4,0x10(%edx,%esi,2)
@@ -61296,13 +61536,13 @@
   .byte  195                                 // ret
   .byte  102,15,214,52,114                   // movq          %xmm6,(%edx,%esi,2)
   .byte  131,255,1                           // cmp           $0x1,%edi
-  .byte  116,228                             // je            5b6f <_sk_store_u16_be_sse2+0xf4>
+  .byte  116,228                             // je            5cbe <_sk_store_u16_be_sse2+0xf4>
   .byte  102,15,23,116,114,8                 // movhpd        %xmm6,0x8(%edx,%esi,2)
   .byte  131,255,3                           // cmp           $0x3,%edi
-  .byte  114,217                             // jb            5b6f <_sk_store_u16_be_sse2+0xf4>
+  .byte  114,217                             // jb            5cbe <_sk_store_u16_be_sse2+0xf4>
   .byte  102,15,106,229                      // punpckhdq     %xmm5,%xmm4
   .byte  102,15,214,100,114,16               // movq          %xmm4,0x10(%edx,%esi,2)
-  .byte  235,205                             // jmp           5b6f <_sk_store_u16_be_sse2+0xf4>
+  .byte  235,205                             // jmp           5cbe <_sk_store_u16_be_sse2+0xf4>
 
 HIDDEN _sk_load_f32_sse2
 .globl _sk_load_f32_sse2
@@ -61325,7 +61565,7 @@
   .byte  15,16,36,23                         // movups        (%edi,%edx,1),%xmm4
   .byte  139,121,8                           // mov           0x8(%ecx),%edi
   .byte  133,255                             // test          %edi,%edi
-  .byte  117,71                              // jne           5c19 <_sk_load_f32_sse2+0x77>
+  .byte  117,71                              // jne           5d68 <_sk_load_f32_sse2+0x77>
   .byte  15,16,84,178,16                     // movups        0x10(%edx,%esi,4),%xmm2
   .byte  15,16,92,178,32                     // movups        0x20(%edx,%esi,4),%xmm3
   .byte  15,16,68,178,48                     // movups        0x30(%edx,%esi,4),%xmm0
@@ -61353,17 +61593,17 @@
   .byte  195                                 // ret
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  131,255,1                           // cmp           $0x1,%edi
-  .byte  117,8                               // jne           5c29 <_sk_load_f32_sse2+0x87>
+  .byte  117,8                               // jne           5d78 <_sk_load_f32_sse2+0x87>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
-  .byte  235,184                             // jmp           5be1 <_sk_load_f32_sse2+0x3f>
+  .byte  235,184                             // jmp           5d30 <_sk_load_f32_sse2+0x3f>
   .byte  15,16,84,178,16                     // movups        0x10(%edx,%esi,4),%xmm2
   .byte  131,255,3                           // cmp           $0x3,%edi
-  .byte  114,7                               // jb            5c3a <_sk_load_f32_sse2+0x98>
+  .byte  114,7                               // jb            5d89 <_sk_load_f32_sse2+0x98>
   .byte  15,16,92,178,32                     // movups        0x20(%edx,%esi,4),%xmm3
-  .byte  235,167                             // jmp           5be1 <_sk_load_f32_sse2+0x3f>
+  .byte  235,167                             // jmp           5d30 <_sk_load_f32_sse2+0x3f>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,162                             // jmp           5be1 <_sk_load_f32_sse2+0x3f>
+  .byte  235,162                             // jmp           5d30 <_sk_load_f32_sse2+0x3f>
 
 HIDDEN _sk_load_f32_dst_sse2
 .globl _sk_load_f32_dst_sse2
@@ -61389,7 +61629,7 @@
   .byte  15,16,52,23                         // movups        (%edi,%edx,1),%xmm6
   .byte  139,121,8                           // mov           0x8(%ecx),%edi
   .byte  133,255                             // test          %edi,%edi
-  .byte  117,97                              // jne           5cdb <_sk_load_f32_dst_sse2+0x9c>
+  .byte  117,97                              // jne           5e2a <_sk_load_f32_dst_sse2+0x9c>
   .byte  15,16,124,178,16                    // movups        0x10(%edx,%esi,4),%xmm7
   .byte  15,16,92,178,32                     // movups        0x20(%edx,%esi,4),%xmm3
   .byte  15,16,84,178,48                     // movups        0x30(%edx,%esi,4),%xmm2
@@ -61423,17 +61663,17 @@
   .byte  195                                 // ret
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
   .byte  131,255,1                           // cmp           $0x1,%edi
-  .byte  117,8                               // jne           5ceb <_sk_load_f32_dst_sse2+0xac>
+  .byte  117,8                               // jne           5e3a <_sk_load_f32_dst_sse2+0xac>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
-  .byte  235,158                             // jmp           5c89 <_sk_load_f32_dst_sse2+0x4a>
+  .byte  235,158                             // jmp           5dd8 <_sk_load_f32_dst_sse2+0x4a>
   .byte  15,16,124,178,16                    // movups        0x10(%edx,%esi,4),%xmm7
   .byte  131,255,3                           // cmp           $0x3,%edi
-  .byte  114,7                               // jb            5cfc <_sk_load_f32_dst_sse2+0xbd>
+  .byte  114,7                               // jb            5e4b <_sk_load_f32_dst_sse2+0xbd>
   .byte  15,16,92,178,32                     // movups        0x20(%edx,%esi,4),%xmm3
-  .byte  235,141                             // jmp           5c89 <_sk_load_f32_dst_sse2+0x4a>
+  .byte  235,141                             // jmp           5dd8 <_sk_load_f32_dst_sse2+0x4a>
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,136                             // jmp           5c89 <_sk_load_f32_dst_sse2+0x4a>
+  .byte  235,136                             // jmp           5dd8 <_sk_load_f32_dst_sse2+0x4a>
 
 HIDDEN _sk_store_f32_sse2
 .globl _sk_store_f32_sse2
@@ -61471,7 +61711,7 @@
   .byte  15,40,238                           // movaps        %xmm6,%xmm5
   .byte  102,15,20,239                       // unpcklpd      %xmm7,%xmm5
   .byte  133,255                             // test          %edi,%edi
-  .byte  117,40                              // jne           5d87 <_sk_store_f32_sse2+0x86>
+  .byte  117,40                              // jne           5ed6 <_sk_store_f32_sse2+0x86>
   .byte  102,15,21,247                       // unpckhpd      %xmm7,%xmm6
   .byte  15,17,100,178,16                    // movups        %xmm4,0x10(%edx,%esi,4)
   .byte  102,15,17,108,178,32                // movupd        %xmm5,0x20(%edx,%esi,4)
@@ -61488,64 +61728,12 @@
   .byte  93                                  // pop           %ebp
   .byte  195                                 // ret
   .byte  131,255,1                           // cmp           $0x1,%edi
-  .byte  116,232                             // je            5d74 <_sk_store_f32_sse2+0x73>
+  .byte  116,232                             // je            5ec3 <_sk_store_f32_sse2+0x73>
   .byte  15,17,100,178,16                    // movups        %xmm4,0x10(%edx,%esi,4)
   .byte  131,255,3                           // cmp           $0x3,%edi
-  .byte  114,222                             // jb            5d74 <_sk_store_f32_sse2+0x73>
+  .byte  114,222                             // jb            5ec3 <_sk_store_f32_sse2+0x73>
   .byte  102,15,17,108,178,32                // movupd        %xmm5,0x20(%edx,%esi,4)
-  .byte  235,214                             // jmp           5d74 <_sk_store_f32_sse2+0x73>
-
-HIDDEN _sk_clamp_x_sse2
-.globl _sk_clamp_x_sse2
-FUNCTION(_sk_clamp_x_sse2)
-_sk_clamp_x_sse2:
-  .byte  85                                  // push          %ebp
-  .byte  137,229                             // mov           %esp,%ebp
-  .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  139,69,12                           // mov           0xc(%ebp),%eax
-  .byte  139,8                               // mov           (%eax),%ecx
-  .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  15,95,224                           // maxps         %xmm0,%xmm4
-  .byte  243,15,16,1                         // movss         (%ecx),%xmm0
-  .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
-  .byte  102,15,118,237                      // pcmpeqd       %xmm5,%xmm5
-  .byte  102,15,254,232                      // paddd         %xmm0,%xmm5
-  .byte  15,93,229                           // minps         %xmm5,%xmm4
-  .byte  141,72,8                            // lea           0x8(%eax),%ecx
-  .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,196                           // movaps        %xmm4,%xmm0
-  .byte  81                                  // push          %ecx
-  .byte  255,117,8                           // pushl         0x8(%ebp)
-  .byte  255,80,4                            // call          *0x4(%eax)
-  .byte  131,196,24                          // add           $0x18,%esp
-  .byte  93                                  // pop           %ebp
-  .byte  195                                 // ret
-
-HIDDEN _sk_clamp_y_sse2
-.globl _sk_clamp_y_sse2
-FUNCTION(_sk_clamp_y_sse2)
-_sk_clamp_y_sse2:
-  .byte  85                                  // push          %ebp
-  .byte  137,229                             // mov           %esp,%ebp
-  .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  139,69,12                           // mov           0xc(%ebp),%eax
-  .byte  139,8                               // mov           (%eax),%ecx
-  .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  15,95,225                           // maxps         %xmm1,%xmm4
-  .byte  243,15,16,9                         // movss         (%ecx),%xmm1
-  .byte  15,198,201,0                        // shufps        $0x0,%xmm1,%xmm1
-  .byte  102,15,118,237                      // pcmpeqd       %xmm5,%xmm5
-  .byte  102,15,254,233                      // paddd         %xmm1,%xmm5
-  .byte  15,93,229                           // minps         %xmm5,%xmm4
-  .byte  141,72,8                            // lea           0x8(%eax),%ecx
-  .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,204                           // movaps        %xmm4,%xmm1
-  .byte  81                                  // push          %ecx
-  .byte  255,117,8                           // pushl         0x8(%ebp)
-  .byte  255,80,4                            // call          *0x4(%eax)
-  .byte  131,196,24                          // add           $0x18,%esp
-  .byte  93                                  // pop           %ebp
-  .byte  195                                 // ret
+  .byte  235,214                             // jmp           5ec3 <_sk_store_f32_sse2+0x73>
 
 HIDDEN _sk_repeat_x_sse2
 .globl _sk_repeat_x_sse2
@@ -61554,33 +61742,27 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          5e1b <_sk_repeat_x_sse2+0xb>
-  .byte  89                                  // pop           %ecx
-  .byte  139,69,12                           // mov           0xc(%ebp),%eax
-  .byte  139,16                              // mov           (%eax),%edx
-  .byte  243,15,16,42                        // movss         (%edx),%xmm5
-  .byte  243,15,16,114,4                     // movss         0x4(%edx),%xmm6
-  .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
-  .byte  15,89,240                           // mulps         %xmm0,%xmm6
-  .byte  243,15,91,230                       // cvttps2dq     %xmm6,%xmm4
-  .byte  15,91,252                           // cvtdq2ps      %xmm4,%xmm7
-  .byte  15,194,247,1                        // cmpltps       %xmm7,%xmm6
-  .byte  15,84,177,245,109,0,0               // andps         0x6df5(%ecx),%xmm6
-  .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  15,92,254                           // subps         %xmm6,%xmm7
+  .byte  232,0,0,0,0                         // call          5ef8 <_sk_repeat_x_sse2+0xb>
+  .byte  88                                  // pop           %eax
+  .byte  139,77,12                           // mov           0xc(%ebp),%ecx
+  .byte  139,17                              // mov           (%ecx),%edx
+  .byte  243,15,16,34                        // movss         (%edx),%xmm4
+  .byte  243,15,16,106,4                     // movss         0x4(%edx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
-  .byte  15,89,253                           // mulps         %xmm5,%xmm7
-  .byte  15,92,199                           // subps         %xmm7,%xmm0
-  .byte  15,95,224                           // maxps         %xmm0,%xmm4
-  .byte  102,15,118,192                      // pcmpeqd       %xmm0,%xmm0
-  .byte  102,15,254,197                      // paddd         %xmm5,%xmm0
-  .byte  15,93,224                           // minps         %xmm0,%xmm4
-  .byte  141,72,8                            // lea           0x8(%eax),%ecx
+  .byte  15,89,232                           // mulps         %xmm0,%xmm5
+  .byte  243,15,91,245                       // cvttps2dq     %xmm5,%xmm6
+  .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
+  .byte  15,194,238,1                        // cmpltps       %xmm6,%xmm5
+  .byte  15,84,168,168,109,0,0               // andps         0x6da8(%eax),%xmm5
+  .byte  15,92,245                           // subps         %xmm5,%xmm6
+  .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
+  .byte  15,89,230                           // mulps         %xmm6,%xmm4
+  .byte  15,92,196                           // subps         %xmm4,%xmm0
+  .byte  141,65,8                            // lea           0x8(%ecx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,196                           // movaps        %xmm4,%xmm0
-  .byte  81                                  // push          %ecx
+  .byte  80                                  // push          %eax
   .byte  255,117,8                           // pushl         0x8(%ebp)
-  .byte  255,80,4                            // call          *0x4(%eax)
+  .byte  255,81,4                            // call          *0x4(%ecx)
   .byte  131,196,24                          // add           $0x18,%esp
   .byte  93                                  // pop           %ebp
   .byte  195                                 // ret
@@ -61592,33 +61774,27 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          5e81 <_sk_repeat_y_sse2+0xb>
-  .byte  89                                  // pop           %ecx
-  .byte  139,69,12                           // mov           0xc(%ebp),%eax
-  .byte  139,16                              // mov           (%eax),%edx
-  .byte  243,15,16,42                        // movss         (%edx),%xmm5
-  .byte  243,15,16,114,4                     // movss         0x4(%edx),%xmm6
-  .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
-  .byte  15,89,241                           // mulps         %xmm1,%xmm6
-  .byte  243,15,91,230                       // cvttps2dq     %xmm6,%xmm4
-  .byte  15,91,252                           // cvtdq2ps      %xmm4,%xmm7
-  .byte  15,194,247,1                        // cmpltps       %xmm7,%xmm6
-  .byte  15,84,177,143,109,0,0               // andps         0x6d8f(%ecx),%xmm6
-  .byte  15,87,228                           // xorps         %xmm4,%xmm4
-  .byte  15,92,254                           // subps         %xmm6,%xmm7
+  .byte  232,0,0,0,0                         // call          5f4a <_sk_repeat_y_sse2+0xb>
+  .byte  88                                  // pop           %eax
+  .byte  139,77,12                           // mov           0xc(%ebp),%ecx
+  .byte  139,17                              // mov           (%ecx),%edx
+  .byte  243,15,16,34                        // movss         (%edx),%xmm4
+  .byte  243,15,16,106,4                     // movss         0x4(%edx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
-  .byte  15,89,253                           // mulps         %xmm5,%xmm7
-  .byte  15,92,207                           // subps         %xmm7,%xmm1
-  .byte  15,95,225                           // maxps         %xmm1,%xmm4
-  .byte  102,15,118,201                      // pcmpeqd       %xmm1,%xmm1
-  .byte  102,15,254,205                      // paddd         %xmm5,%xmm1
-  .byte  15,93,225                           // minps         %xmm1,%xmm4
-  .byte  141,72,8                            // lea           0x8(%eax),%ecx
+  .byte  15,89,233                           // mulps         %xmm1,%xmm5
+  .byte  243,15,91,245                       // cvttps2dq     %xmm5,%xmm6
+  .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
+  .byte  15,194,238,1                        // cmpltps       %xmm6,%xmm5
+  .byte  15,84,168,86,109,0,0                // andps         0x6d56(%eax),%xmm5
+  .byte  15,92,245                           // subps         %xmm5,%xmm6
+  .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
+  .byte  15,89,230                           // mulps         %xmm6,%xmm4
+  .byte  15,92,204                           // subps         %xmm4,%xmm1
+  .byte  141,65,8                            // lea           0x8(%ecx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,204                           // movaps        %xmm4,%xmm1
-  .byte  81                                  // push          %ecx
+  .byte  80                                  // push          %eax
   .byte  255,117,8                           // pushl         0x8(%ebp)
-  .byte  255,80,4                            // call          *0x4(%eax)
+  .byte  255,81,4                            // call          *0x4(%ecx)
   .byte  131,196,24                          // add           $0x18,%esp
   .byte  93                                  // pop           %ebp
   .byte  195                                 // ret
@@ -61630,36 +61806,31 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          5ee7 <_sk_mirror_x_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          5f9c <_sk_mirror_x_sse2+0xb>
   .byte  89                                  // pop           %ecx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,16                              // mov           (%eax),%edx
-  .byte  243,15,16,42                        // movss         (%edx),%xmm5
-  .byte  243,15,16,114,4                     // movss         0x4(%edx),%xmm6
-  .byte  15,40,229                           // movaps        %xmm5,%xmm4
-  .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
-  .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  243,15,89,177,185,116,0,0           // mulss         0x74b9(%ecx),%xmm6
+  .byte  243,15,16,34                        // movss         (%edx),%xmm4
+  .byte  243,15,16,106,4                     // movss         0x4(%edx),%xmm5
+  .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
-  .byte  15,89,240                           // mulps         %xmm0,%xmm6
-  .byte  243,15,91,254                       // cvttps2dq     %xmm6,%xmm7
-  .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  15,194,247,1                        // cmpltps       %xmm7,%xmm6
-  .byte  15,84,177,41,109,0,0                // andps         0x6d29(%ecx),%xmm6
-  .byte  15,92,254                           // subps         %xmm6,%xmm7
-  .byte  243,15,88,237                       // addss         %xmm5,%xmm5
+  .byte  15,92,198                           // subps         %xmm6,%xmm0
+  .byte  243,15,89,169,148,116,0,0           // mulss         0x7494(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
-  .byte  15,89,253                           // mulps         %xmm5,%xmm7
+  .byte  15,89,232                           // mulps         %xmm0,%xmm5
+  .byte  243,15,91,253                       // cvttps2dq     %xmm5,%xmm7
+  .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
+  .byte  15,194,239,1                        // cmpltps       %xmm7,%xmm5
+  .byte  15,84,169,4,109,0,0                 // andps         0x6d04(%ecx),%xmm5
+  .byte  15,92,253                           // subps         %xmm5,%xmm7
+  .byte  243,15,88,228                       // addss         %xmm4,%xmm4
+  .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
+  .byte  15,89,252                           // mulps         %xmm4,%xmm7
   .byte  15,92,199                           // subps         %xmm7,%xmm0
-  .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  15,87,237                           // xorps         %xmm5,%xmm5
-  .byte  15,92,232                           // subps         %xmm0,%xmm5
-  .byte  15,84,232                           // andps         %xmm0,%xmm5
-  .byte  15,87,192                           // xorps         %xmm0,%xmm0
-  .byte  15,95,197                           // maxps         %xmm5,%xmm0
-  .byte  102,15,118,237                      // pcmpeqd       %xmm5,%xmm5
-  .byte  102,15,254,236                      // paddd         %xmm4,%xmm5
-  .byte  15,93,197                           // minps         %xmm5,%xmm0
+  .byte  15,92,198                           // subps         %xmm6,%xmm0
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,92,224                           // subps         %xmm0,%xmm4
+  .byte  15,84,196                           // andps         %xmm4,%xmm0
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  81                                  // push          %ecx
@@ -61676,36 +61847,31 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          5f6c <_sk_mirror_y_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          6010 <_sk_mirror_y_sse2+0xb>
   .byte  89                                  // pop           %ecx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,16                              // mov           (%eax),%edx
-  .byte  243,15,16,42                        // movss         (%edx),%xmm5
-  .byte  243,15,16,114,4                     // movss         0x4(%edx),%xmm6
-  .byte  15,40,229                           // movaps        %xmm5,%xmm4
-  .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
-  .byte  15,92,204                           // subps         %xmm4,%xmm1
-  .byte  243,15,89,177,52,116,0,0            // mulss         0x7434(%ecx),%xmm6
+  .byte  243,15,16,34                        // movss         (%edx),%xmm4
+  .byte  243,15,16,106,4                     // movss         0x4(%edx),%xmm5
+  .byte  15,40,244                           // movaps        %xmm4,%xmm6
   .byte  15,198,246,0                        // shufps        $0x0,%xmm6,%xmm6
-  .byte  15,89,241                           // mulps         %xmm1,%xmm6
-  .byte  243,15,91,254                       // cvttps2dq     %xmm6,%xmm7
-  .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
-  .byte  15,194,247,1                        // cmpltps       %xmm7,%xmm6
-  .byte  15,84,177,164,108,0,0               // andps         0x6ca4(%ecx),%xmm6
-  .byte  15,92,254                           // subps         %xmm6,%xmm7
-  .byte  243,15,88,237                       // addss         %xmm5,%xmm5
+  .byte  15,92,206                           // subps         %xmm6,%xmm1
+  .byte  243,15,89,169,32,116,0,0            // mulss         0x7420(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
-  .byte  15,89,253                           // mulps         %xmm5,%xmm7
+  .byte  15,89,233                           // mulps         %xmm1,%xmm5
+  .byte  243,15,91,253                       // cvttps2dq     %xmm5,%xmm7
+  .byte  15,91,255                           // cvtdq2ps      %xmm7,%xmm7
+  .byte  15,194,239,1                        // cmpltps       %xmm7,%xmm5
+  .byte  15,84,169,144,108,0,0               // andps         0x6c90(%ecx),%xmm5
+  .byte  15,92,253                           // subps         %xmm5,%xmm7
+  .byte  243,15,88,228                       // addss         %xmm4,%xmm4
+  .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
+  .byte  15,89,252                           // mulps         %xmm4,%xmm7
   .byte  15,92,207                           // subps         %xmm7,%xmm1
-  .byte  15,92,204                           // subps         %xmm4,%xmm1
-  .byte  15,87,237                           // xorps         %xmm5,%xmm5
-  .byte  15,92,233                           // subps         %xmm1,%xmm5
-  .byte  15,84,233                           // andps         %xmm1,%xmm5
-  .byte  15,87,201                           // xorps         %xmm1,%xmm1
-  .byte  15,95,205                           // maxps         %xmm5,%xmm1
-  .byte  102,15,118,237                      // pcmpeqd       %xmm5,%xmm5
-  .byte  102,15,254,236                      // paddd         %xmm4,%xmm5
-  .byte  15,93,205                           // minps         %xmm5,%xmm1
+  .byte  15,92,206                           // subps         %xmm6,%xmm1
+  .byte  15,87,228                           // xorps         %xmm4,%xmm4
+  .byte  15,92,225                           // subps         %xmm1,%xmm4
+  .byte  15,84,204                           // andps         %xmm4,%xmm1
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  81                                  // push          %ecx
@@ -61722,12 +61888,12 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          5ff1 <_sk_clamp_x_1_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          6084 <_sk_clamp_x_1_sse2+0xb>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,95,224                           // maxps         %xmm0,%xmm4
-  .byte  15,93,160,31,108,0,0                // minps         0x6c1f(%eax),%xmm4
+  .byte  15,93,160,28,108,0,0                // minps         0x6c1c(%eax),%xmm4
   .byte  141,65,4                            // lea           0x4(%ecx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  15,40,196                           // movaps        %xmm4,%xmm0
@@ -61745,14 +61911,14 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          6021 <_sk_repeat_x_1_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          60b4 <_sk_repeat_x_1_sse2+0xb>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  243,15,91,224                       // cvttps2dq     %xmm0,%xmm4
   .byte  15,91,228                           // cvtdq2ps      %xmm4,%xmm4
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
   .byte  15,194,236,1                        // cmpltps       %xmm4,%xmm5
-  .byte  15,84,168,239,107,0,0               // andps         0x6bef(%eax),%xmm5
+  .byte  15,84,168,236,107,0,0               // andps         0x6bec(%eax),%xmm5
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
   .byte  141,65,4                            // lea           0x4(%ecx),%eax
@@ -61771,17 +61937,17 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          605c <_sk_mirror_x_1_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          60ef <_sk_mirror_x_1_sse2+0xb>
   .byte  89                                  // pop           %ecx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
-  .byte  15,40,161,36,108,0,0                // movaps        0x6c24(%ecx),%xmm4
+  .byte  15,40,161,33,108,0,0                // movaps        0x6c21(%ecx),%xmm4
   .byte  15,88,196                           // addps         %xmm4,%xmm0
-  .byte  15,40,169,164,107,0,0               // movaps        0x6ba4(%ecx),%xmm5
+  .byte  15,40,169,161,107,0,0               // movaps        0x6ba1(%ecx),%xmm5
   .byte  15,89,232                           // mulps         %xmm0,%xmm5
   .byte  243,15,91,245                       // cvttps2dq     %xmm5,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  15,194,238,1                        // cmpltps       %xmm6,%xmm5
-  .byte  15,84,169,180,107,0,0               // andps         0x6bb4(%ecx),%xmm5
+  .byte  15,84,169,177,107,0,0               // andps         0x6bb1(%ecx),%xmm5
   .byte  15,87,255                           // xorps         %xmm7,%xmm7
   .byte  15,92,245                           // subps         %xmm5,%xmm6
   .byte  15,88,246                           // addps         %xmm6,%xmm6
@@ -61806,13 +61972,13 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
-  .byte  232,0,0,0,0                         // call          60ba <_sk_luminance_to_alpha_sse2+0xe>
+  .byte  232,0,0,0,0                         // call          614d <_sk_luminance_to_alpha_sse2+0xe>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
-  .byte  15,89,128,134,112,0,0               // mulps         0x7086(%eax),%xmm0
-  .byte  15,89,136,150,112,0,0               // mulps         0x7096(%eax),%xmm1
+  .byte  15,89,128,131,112,0,0               // mulps         0x7083(%eax),%xmm0
+  .byte  15,89,136,147,112,0,0               // mulps         0x7093(%eax),%xmm1
   .byte  15,88,200                           // addps         %xmm0,%xmm1
-  .byte  15,89,152,166,112,0,0               // mulps         0x70a6(%eax),%xmm3
+  .byte  15,89,152,163,112,0,0               // mulps         0x70a3(%eax),%xmm3
   .byte  15,88,217                           // addps         %xmm1,%xmm3
   .byte  141,65,4                            // lea           0x4(%ecx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -62202,7 +62368,7 @@
   .byte  86                                  // push          %esi
   .byte  131,236,60                          // sub           $0x3c,%esp
   .byte  15,41,69,184                        // movaps        %xmm0,-0x48(%ebp)
-  .byte  232,0,0,0,0                         // call          6557 <_sk_evenly_spaced_gradient_sse2+0x12>
+  .byte  232,0,0,0,0                         // call          65ea <_sk_evenly_spaced_gradient_sse2+0x12>
   .byte  90                                  // pop           %edx
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  141,65,4                            // lea           0x4(%ecx),%eax
@@ -62213,12 +62379,12 @@
   .byte  78                                  // dec           %esi
   .byte  102,15,110,206                      // movd          %esi,%xmm1
   .byte  102,15,112,201,0                    // pshufd        $0x0,%xmm1,%xmm1
-  .byte  102,15,111,146,25,108,0,0           // movdqa        0x6c19(%edx),%xmm2
+  .byte  102,15,111,146,22,108,0,0           // movdqa        0x6c16(%edx),%xmm2
   .byte  102,15,219,209                      // pand          %xmm1,%xmm2
-  .byte  102,15,235,146,217,105,0,0          // por           0x69d9(%edx),%xmm2
+  .byte  102,15,235,146,214,105,0,0          // por           0x69d6(%edx),%xmm2
   .byte  102,15,114,209,16                   // psrld         $0x10,%xmm1
-  .byte  102,15,235,138,41,108,0,0           // por           0x6c29(%edx),%xmm1
-  .byte  15,88,138,57,108,0,0                // addps         0x6c39(%edx),%xmm1
+  .byte  102,15,235,138,38,108,0,0           // por           0x6c26(%edx),%xmm1
+  .byte  15,88,138,54,108,0,0                // addps         0x6c36(%edx),%xmm1
   .byte  15,88,202                           // addps         %xmm2,%xmm1
   .byte  15,89,200                           // mulps         %xmm0,%xmm1
   .byte  243,15,91,201                       // cvttps2dq     %xmm1,%xmm1
@@ -62325,18 +62491,18 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          6717 <_sk_gauss_a_to_rgba_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          67aa <_sk_gauss_a_to_rgba_sse2+0xb>
   .byte  88                                  // pop           %eax
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
-  .byte  15,40,128,137,106,0,0               // movaps        0x6a89(%eax),%xmm0
+  .byte  15,40,128,134,106,0,0               // movaps        0x6a86(%eax),%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,128,153,106,0,0               // addps         0x6a99(%eax),%xmm0
+  .byte  15,88,128,150,106,0,0               // addps         0x6a96(%eax),%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,128,169,106,0,0               // addps         0x6aa9(%eax),%xmm0
+  .byte  15,88,128,166,106,0,0               // addps         0x6aa6(%eax),%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,128,185,106,0,0               // addps         0x6ab9(%eax),%xmm0
+  .byte  15,88,128,182,106,0,0               // addps         0x6ab6(%eax),%xmm0
   .byte  15,89,195                           // mulps         %xmm3,%xmm0
-  .byte  15,88,128,201,106,0,0               // addps         0x6ac9(%eax),%xmm0
+  .byte  15,88,128,198,106,0,0               // addps         0x6ac6(%eax),%xmm0
   .byte  141,65,4                            // lea           0x4(%ecx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
@@ -62366,7 +62532,7 @@
   .byte  139,17                              // mov           (%ecx),%edx
   .byte  102,15,239,201                      // pxor          %xmm1,%xmm1
   .byte  131,250,2                           // cmp           $0x2,%edx
-  .byte  114,33                              // jb            67a4 <_sk_gradient_sse2+0x40>
+  .byte  114,33                              // jb            6837 <_sk_gradient_sse2+0x40>
   .byte  139,113,36                          // mov           0x24(%ecx),%esi
   .byte  74                                  // dec           %edx
   .byte  131,198,4                           // add           $0x4,%esi
@@ -62377,7 +62543,7 @@
   .byte  102,15,250,202                      // psubd         %xmm2,%xmm1
   .byte  131,198,4                           // add           $0x4,%esi
   .byte  74                                  // dec           %edx
-  .byte  117,234                             // jne           678e <_sk_gradient_sse2+0x2a>
+  .byte  117,234                             // jne           6821 <_sk_gradient_sse2+0x2a>
   .byte  102,15,126,202                      // movd          %xmm1,%edx
   .byte  102,15,112,209,229                  // pshufd        $0xe5,%xmm1,%xmm2
   .byte  102,15,112,217,78                   // pshufd        $0x4e,%xmm1,%xmm3
@@ -62529,7 +62695,7 @@
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
   .byte  15,40,209                           // movaps        %xmm1,%xmm2
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          69a9 <_sk_xy_to_unit_angle_sse2+0x18>
+  .byte  232,0,0,0,0                         // call          6a3c <_sk_xy_to_unit_angle_sse2+0x18>
   .byte  88                                  // pop           %eax
   .byte  15,87,237                           // xorps         %xmm5,%xmm5
   .byte  15,92,233                           // subps         %xmm1,%xmm5
@@ -62544,30 +62710,30 @@
   .byte  15,94,247                           // divps         %xmm7,%xmm6
   .byte  15,40,254                           // movaps        %xmm6,%xmm7
   .byte  15,89,255                           // mulps         %xmm7,%xmm7
-  .byte  15,40,128,71,104,0,0                // movaps        0x6847(%eax),%xmm0
+  .byte  15,40,128,68,104,0,0                // movaps        0x6844(%eax),%xmm0
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  15,88,128,87,104,0,0                // addps         0x6857(%eax),%xmm0
+  .byte  15,88,128,84,104,0,0                // addps         0x6854(%eax),%xmm0
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  15,88,128,103,104,0,0               // addps         0x6867(%eax),%xmm0
+  .byte  15,88,128,100,104,0,0               // addps         0x6864(%eax),%xmm0
   .byte  15,89,199                           // mulps         %xmm7,%xmm0
-  .byte  15,88,128,119,104,0,0               // addps         0x6877(%eax),%xmm0
+  .byte  15,88,128,116,104,0,0               // addps         0x6874(%eax),%xmm0
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
   .byte  15,194,236,1                        // cmpltps       %xmm4,%xmm5
-  .byte  15,40,176,135,104,0,0               // movaps        0x6887(%eax),%xmm6
+  .byte  15,40,176,132,104,0,0               // movaps        0x6884(%eax),%xmm6
   .byte  15,92,240                           // subps         %xmm0,%xmm6
   .byte  15,84,245                           // andps         %xmm5,%xmm6
   .byte  15,85,232                           // andnps        %xmm0,%xmm5
   .byte  15,87,228                           // xorps         %xmm4,%xmm4
   .byte  15,86,238                           // orps          %xmm6,%xmm5
   .byte  15,194,204,1                        // cmpltps       %xmm4,%xmm1
-  .byte  15,40,128,87,98,0,0                 // movaps        0x6257(%eax),%xmm0
+  .byte  15,40,128,84,98,0,0                 // movaps        0x6254(%eax),%xmm0
   .byte  15,92,197                           // subps         %xmm5,%xmm0
   .byte  15,84,193                           // andps         %xmm1,%xmm0
   .byte  15,85,205                           // andnps        %xmm5,%xmm1
   .byte  15,86,200                           // orps          %xmm0,%xmm1
   .byte  15,40,194                           // movaps        %xmm2,%xmm0
   .byte  15,194,196,1                        // cmpltps       %xmm4,%xmm0
-  .byte  15,40,168,103,98,0,0                // movaps        0x6267(%eax),%xmm5
+  .byte  15,40,168,100,98,0,0                // movaps        0x6264(%eax),%xmm5
   .byte  15,92,233                           // subps         %xmm1,%xmm5
   .byte  15,84,232                           // andps         %xmm0,%xmm5
   .byte  15,85,193                           // andnps        %xmm1,%xmm0
@@ -62628,15 +62794,15 @@
   .byte  15,40,241                           // movaps        %xmm1,%xmm6
   .byte  15,89,246                           // mulps         %xmm6,%xmm6
   .byte  15,88,240                           // addps         %xmm0,%xmm6
-  .byte  232,0,0,0,0                         // call          6ac6 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+  .byte  232,0,0,0,0                         // call          6b59 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
   .byte  90                                  // pop           %edx
   .byte  243,15,89,237                       // mulss         %xmm5,%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,92,245                           // subps         %xmm5,%xmm6
   .byte  243,15,16,65,32                     // movss         0x20(%ecx),%xmm0
   .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
-  .byte  15,89,162,122,103,0,0               // mulps         0x677a(%edx),%xmm4
-  .byte  15,89,130,138,103,0,0               // mulps         0x678a(%edx),%xmm0
+  .byte  15,89,162,119,103,0,0               // mulps         0x6777(%edx),%xmm4
+  .byte  15,89,130,135,103,0,0               // mulps         0x6787(%edx),%xmm0
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,89,237                           // mulps         %xmm5,%xmm5
@@ -62644,11 +62810,11 @@
   .byte  15,81,237                           // sqrtps        %xmm5,%xmm5
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  15,87,162,42,102,0,0                // xorps         0x662a(%edx),%xmm4
+  .byte  15,87,162,39,102,0,0                // xorps         0x6627(%edx),%xmm4
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  243,15,16,105,36                    // movss         0x24(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
-  .byte  15,89,170,58,97,0,0                 // mulps         0x613a(%edx),%xmm5
+  .byte  15,89,170,55,97,0,0                 // mulps         0x6137(%edx),%xmm5
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
   .byte  15,95,196                           // maxps         %xmm4,%xmm0
@@ -62679,15 +62845,15 @@
   .byte  15,40,241                           // movaps        %xmm1,%xmm6
   .byte  15,89,246                           // mulps         %xmm6,%xmm6
   .byte  15,88,240                           // addps         %xmm0,%xmm6
-  .byte  232,0,0,0,0                         // call          6b64 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+  .byte  232,0,0,0,0                         // call          6bf7 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
   .byte  90                                  // pop           %edx
   .byte  243,15,89,237                       // mulss         %xmm5,%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,92,245                           // subps         %xmm5,%xmm6
   .byte  243,15,16,65,32                     // movss         0x20(%ecx),%xmm0
   .byte  15,198,192,0                        // shufps        $0x0,%xmm0,%xmm0
-  .byte  15,89,162,220,102,0,0               // mulps         0x66dc(%edx),%xmm4
-  .byte  15,89,130,236,102,0,0               // mulps         0x66ec(%edx),%xmm0
+  .byte  15,89,162,217,102,0,0               // mulps         0x66d9(%edx),%xmm4
+  .byte  15,89,130,233,102,0,0               // mulps         0x66e9(%edx),%xmm0
   .byte  15,89,198                           // mulps         %xmm6,%xmm0
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,89,237                           // mulps         %xmm5,%xmm5
@@ -62695,11 +62861,11 @@
   .byte  15,81,237                           // sqrtps        %xmm5,%xmm5
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  15,87,162,140,101,0,0               // xorps         0x658c(%edx),%xmm4
+  .byte  15,87,162,137,101,0,0               // xorps         0x6589(%edx),%xmm4
   .byte  15,92,229                           // subps         %xmm5,%xmm4
   .byte  243,15,16,105,36                    // movss         0x24(%ecx),%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
-  .byte  15,89,170,156,96,0,0                // mulps         0x609c(%edx),%xmm5
+  .byte  15,89,170,153,96,0,0                // mulps         0x6099(%edx),%xmm5
   .byte  15,89,197                           // mulps         %xmm5,%xmm0
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
   .byte  15,93,196                           // minps         %xmm4,%xmm0
@@ -62719,7 +62885,7 @@
   .byte  85                                  // push          %ebp
   .byte  137,229                             // mov           %esp,%ebp
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  232,0,0,0,0                         // call          6bdc <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+  .byte  232,0,0,0,0                         // call          6c6f <_sk_xy_to_2pt_conical_linear_sse2+0xb>
   .byte  89                                  // pop           %ecx
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,16                              // mov           (%eax),%edx
@@ -62728,7 +62894,7 @@
   .byte  243,15,89,236                       // mulss         %xmm4,%xmm5
   .byte  15,198,237,0                        // shufps        $0x0,%xmm5,%xmm5
   .byte  15,88,232                           // addps         %xmm0,%xmm5
-  .byte  15,89,169,100,102,0,0               // mulps         0x6664(%ecx),%xmm5
+  .byte  15,89,169,97,102,0,0                // mulps         0x6661(%ecx),%xmm5
   .byte  15,89,192                           // mulps         %xmm0,%xmm0
   .byte  15,40,241                           // movaps        %xmm1,%xmm6
   .byte  15,89,246                           // mulps         %xmm6,%xmm6
@@ -62736,7 +62902,7 @@
   .byte  243,15,89,228                       // mulss         %xmm4,%xmm4
   .byte  15,198,228,0                        // shufps        $0x0,%xmm4,%xmm4
   .byte  15,92,196                           // subps         %xmm4,%xmm0
-  .byte  15,87,129,20,101,0,0                // xorps         0x6514(%ecx),%xmm0
+  .byte  15,87,129,17,101,0,0                // xorps         0x6511(%ecx),%xmm0
   .byte  15,94,197                           // divps         %xmm5,%xmm0
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -62810,16 +62976,16 @@
   .byte  131,236,24                          // sub           $0x18,%esp
   .byte  15,41,93,232                        // movaps        %xmm3,-0x18(%ebp)
   .byte  15,40,218                           // movaps        %xmm2,%xmm3
-  .byte  232,0,0,0,0                         // call          6cb9 <_sk_save_xy_sse2+0x12>
+  .byte  232,0,0,0,0                         // call          6d4c <_sk_save_xy_sse2+0x12>
   .byte  88                                  // pop           %eax
-  .byte  15,40,160,71,95,0,0                 // movaps        0x5f47(%eax),%xmm4
+  .byte  15,40,160,68,95,0,0                 // movaps        0x5f44(%eax),%xmm4
   .byte  15,40,232                           // movaps        %xmm0,%xmm5
   .byte  15,88,236                           // addps         %xmm4,%xmm5
   .byte  243,15,91,245                       // cvttps2dq     %xmm5,%xmm6
   .byte  15,91,246                           // cvtdq2ps      %xmm6,%xmm6
   .byte  15,40,253                           // movaps        %xmm5,%xmm7
   .byte  15,194,254,1                        // cmpltps       %xmm6,%xmm7
-  .byte  15,40,144,87,95,0,0                 // movaps        0x5f57(%eax),%xmm2
+  .byte  15,40,144,84,95,0,0                 // movaps        0x5f54(%eax),%xmm2
   .byte  15,84,250                           // andps         %xmm2,%xmm7
   .byte  15,92,247                           // subps         %xmm7,%xmm6
   .byte  15,92,238                           // subps         %xmm6,%xmm5
@@ -62894,15 +63060,15 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6d9b <_sk_bilinear_nx_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6e2e <_sk_bilinear_nx_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,6                             // movups        (%esi),%xmm0
   .byte  15,16,102,64                        // movups        0x40(%esi),%xmm4
-  .byte  15,88,128,197,100,0,0               // addps         0x64c5(%eax),%xmm0
-  .byte  15,40,168,117,94,0,0                // movaps        0x5e75(%eax),%xmm5
+  .byte  15,88,128,194,100,0,0               // addps         0x64c2(%eax),%xmm0
+  .byte  15,40,168,114,94,0,0                // movaps        0x5e72(%eax),%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
   .byte  15,17,174,128,0,0,0                 // movups        %xmm5,0x80(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -62923,14 +63089,14 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6dde <_sk_bilinear_px_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6e71 <_sk_bilinear_px_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,6                             // movups        (%esi),%xmm0
   .byte  15,16,102,64                        // movups        0x40(%esi),%xmm4
-  .byte  15,88,128,34,94,0,0                 // addps         0x5e22(%eax),%xmm0
+  .byte  15,88,128,31,94,0,0                 // addps         0x5e1f(%eax),%xmm0
   .byte  15,17,166,128,0,0,0                 // movups        %xmm4,0x80(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -62950,15 +63116,15 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6e17 <_sk_bilinear_ny_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6eaa <_sk_bilinear_ny_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,78,32                         // movups        0x20(%esi),%xmm1
   .byte  15,16,102,96                        // movups        0x60(%esi),%xmm4
-  .byte  15,88,136,73,100,0,0                // addps         0x6449(%eax),%xmm1
-  .byte  15,40,168,249,93,0,0                // movaps        0x5df9(%eax),%xmm5
+  .byte  15,88,136,70,100,0,0                // addps         0x6446(%eax),%xmm1
+  .byte  15,40,168,246,93,0,0                // movaps        0x5df6(%eax),%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
   .byte  15,17,174,160,0,0,0                 // movups        %xmm5,0xa0(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -62979,14 +63145,14 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6e5b <_sk_bilinear_py_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6eee <_sk_bilinear_py_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,78,32                         // movups        0x20(%esi),%xmm1
   .byte  15,16,102,96                        // movups        0x60(%esi),%xmm4
-  .byte  15,88,136,165,93,0,0                // addps         0x5da5(%eax),%xmm1
+  .byte  15,88,136,162,93,0,0                // addps         0x5da2(%eax),%xmm1
   .byte  15,17,166,160,0,0,0                 // movups        %xmm4,0xa0(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -63006,20 +63172,20 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6e95 <_sk_bicubic_n3x_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6f28 <_sk_bicubic_n3x_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,6                             // movups        (%esi),%xmm0
   .byte  15,16,102,64                        // movups        0x40(%esi),%xmm4
-  .byte  15,88,128,219,99,0,0                // addps         0x63db(%eax),%xmm0
-  .byte  15,40,168,123,93,0,0                // movaps        0x5d7b(%eax),%xmm5
+  .byte  15,88,128,216,99,0,0                // addps         0x63d8(%eax),%xmm0
+  .byte  15,40,168,120,93,0,0                // movaps        0x5d78(%eax),%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
   .byte  15,40,229                           // movaps        %xmm5,%xmm4
   .byte  15,89,228                           // mulps         %xmm4,%xmm4
-  .byte  15,89,168,235,99,0,0                // mulps         0x63eb(%eax),%xmm5
-  .byte  15,88,168,91,95,0,0                 // addps         0x5f5b(%eax),%xmm5
+  .byte  15,89,168,232,99,0,0                // mulps         0x63e8(%eax),%xmm5
+  .byte  15,88,168,88,95,0,0                 // addps         0x5f58(%eax),%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
   .byte  15,17,174,128,0,0,0                 // movups        %xmm5,0x80(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -63040,23 +63206,23 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6eef <_sk_bicubic_n1x_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6f82 <_sk_bicubic_n1x_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,6                             // movups        (%esi),%xmm0
   .byte  15,16,102,64                        // movups        0x40(%esi),%xmm4
-  .byte  15,88,128,113,99,0,0                // addps         0x6371(%eax),%xmm0
-  .byte  15,40,168,33,93,0,0                 // movaps        0x5d21(%eax),%xmm5
+  .byte  15,88,128,110,99,0,0                // addps         0x636e(%eax),%xmm0
+  .byte  15,40,168,30,93,0,0                 // movaps        0x5d1e(%eax),%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
-  .byte  15,40,160,161,99,0,0                // movaps        0x63a1(%eax),%xmm4
+  .byte  15,40,160,158,99,0,0                // movaps        0x639e(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
-  .byte  15,88,160,177,99,0,0                // addps         0x63b1(%eax),%xmm4
+  .byte  15,88,160,174,99,0,0                // addps         0x63ae(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
-  .byte  15,88,160,17,93,0,0                 // addps         0x5d11(%eax),%xmm4
+  .byte  15,88,160,14,93,0,0                 // addps         0x5d0e(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
-  .byte  15,88,160,193,99,0,0                // addps         0x63c1(%eax),%xmm4
+  .byte  15,88,160,190,99,0,0                // addps         0x63be(%eax),%xmm4
   .byte  15,17,166,128,0,0,0                 // movups        %xmm4,0x80(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -63076,22 +63242,22 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6f57 <_sk_bicubic_p1x_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          6fea <_sk_bicubic_p1x_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
-  .byte  15,40,160,169,92,0,0                // movaps        0x5ca9(%eax),%xmm4
+  .byte  15,40,160,166,92,0,0                // movaps        0x5ca6(%eax),%xmm4
   .byte  15,16,6                             // movups        (%esi),%xmm0
   .byte  15,16,110,64                        // movups        0x40(%esi),%xmm5
   .byte  15,88,196                           // addps         %xmm4,%xmm0
-  .byte  15,40,176,57,99,0,0                 // movaps        0x6339(%eax),%xmm6
+  .byte  15,40,176,54,99,0,0                 // movaps        0x6336(%eax),%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
-  .byte  15,88,176,73,99,0,0                 // addps         0x6349(%eax),%xmm6
+  .byte  15,88,176,70,99,0,0                 // addps         0x6346(%eax),%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
   .byte  15,88,244                           // addps         %xmm4,%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
-  .byte  15,88,176,89,99,0,0                 // addps         0x6359(%eax),%xmm6
+  .byte  15,88,176,86,99,0,0                 // addps         0x6356(%eax),%xmm6
   .byte  15,17,182,128,0,0,0                 // movups        %xmm6,0x80(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -63111,18 +63277,18 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          6fb4 <_sk_bicubic_p3x_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          7047 <_sk_bicubic_p3x_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,6                             // movups        (%esi),%xmm0
   .byte  15,16,102,64                        // movups        0x40(%esi),%xmm4
-  .byte  15,88,128,236,98,0,0                // addps         0x62ec(%eax),%xmm0
+  .byte  15,88,128,233,98,0,0                // addps         0x62e9(%eax),%xmm0
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,89,237                           // mulps         %xmm5,%xmm5
-  .byte  15,89,160,204,98,0,0                // mulps         0x62cc(%eax),%xmm4
-  .byte  15,88,160,60,94,0,0                 // addps         0x5e3c(%eax),%xmm4
+  .byte  15,89,160,201,98,0,0                // mulps         0x62c9(%eax),%xmm4
+  .byte  15,88,160,57,94,0,0                 // addps         0x5e39(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
   .byte  15,17,166,128,0,0,0                 // movups        %xmm4,0x80(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -63143,20 +63309,20 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          7004 <_sk_bicubic_n3y_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          7097 <_sk_bicubic_n3y_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,78,32                         // movups        0x20(%esi),%xmm1
   .byte  15,16,102,96                        // movups        0x60(%esi),%xmm4
-  .byte  15,88,136,108,98,0,0                // addps         0x626c(%eax),%xmm1
-  .byte  15,40,168,12,92,0,0                 // movaps        0x5c0c(%eax),%xmm5
+  .byte  15,88,136,105,98,0,0                // addps         0x6269(%eax),%xmm1
+  .byte  15,40,168,9,92,0,0                  // movaps        0x5c09(%eax),%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
   .byte  15,40,229                           // movaps        %xmm5,%xmm4
   .byte  15,89,228                           // mulps         %xmm4,%xmm4
-  .byte  15,89,168,124,98,0,0                // mulps         0x627c(%eax),%xmm5
-  .byte  15,88,168,236,93,0,0                // addps         0x5dec(%eax),%xmm5
+  .byte  15,89,168,121,98,0,0                // mulps         0x6279(%eax),%xmm5
+  .byte  15,88,168,233,93,0,0                // addps         0x5de9(%eax),%xmm5
   .byte  15,89,236                           // mulps         %xmm4,%xmm5
   .byte  15,17,174,160,0,0,0                 // movups        %xmm5,0xa0(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -63177,23 +63343,23 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          705f <_sk_bicubic_n1y_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          70f2 <_sk_bicubic_n1y_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,78,32                         // movups        0x20(%esi),%xmm1
   .byte  15,16,102,96                        // movups        0x60(%esi),%xmm4
-  .byte  15,88,136,1,98,0,0                  // addps         0x6201(%eax),%xmm1
-  .byte  15,40,168,177,91,0,0                // movaps        0x5bb1(%eax),%xmm5
+  .byte  15,88,136,254,97,0,0                // addps         0x61fe(%eax),%xmm1
+  .byte  15,40,168,174,91,0,0                // movaps        0x5bae(%eax),%xmm5
   .byte  15,92,236                           // subps         %xmm4,%xmm5
-  .byte  15,40,160,49,98,0,0                 // movaps        0x6231(%eax),%xmm4
+  .byte  15,40,160,46,98,0,0                 // movaps        0x622e(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
-  .byte  15,88,160,65,98,0,0                 // addps         0x6241(%eax),%xmm4
+  .byte  15,88,160,62,98,0,0                 // addps         0x623e(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
-  .byte  15,88,160,161,91,0,0                // addps         0x5ba1(%eax),%xmm4
+  .byte  15,88,160,158,91,0,0                // addps         0x5b9e(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
-  .byte  15,88,160,81,98,0,0                 // addps         0x6251(%eax),%xmm4
+  .byte  15,88,160,78,98,0,0                 // addps         0x624e(%eax),%xmm4
   .byte  15,17,166,160,0,0,0                 // movups        %xmm4,0xa0(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -63213,22 +63379,22 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          70c8 <_sk_bicubic_p1y_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          715b <_sk_bicubic_p1y_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
-  .byte  15,40,160,56,91,0,0                 // movaps        0x5b38(%eax),%xmm4
+  .byte  15,40,160,53,91,0,0                 // movaps        0x5b35(%eax),%xmm4
   .byte  15,16,78,32                         // movups        0x20(%esi),%xmm1
   .byte  15,16,110,96                        // movups        0x60(%esi),%xmm5
   .byte  15,88,204                           // addps         %xmm4,%xmm1
-  .byte  15,40,176,200,97,0,0                // movaps        0x61c8(%eax),%xmm6
+  .byte  15,40,176,197,97,0,0                // movaps        0x61c5(%eax),%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
-  .byte  15,88,176,216,97,0,0                // addps         0x61d8(%eax),%xmm6
+  .byte  15,88,176,213,97,0,0                // addps         0x61d5(%eax),%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
   .byte  15,88,244                           // addps         %xmm4,%xmm6
   .byte  15,89,245                           // mulps         %xmm5,%xmm6
-  .byte  15,88,176,232,97,0,0                // addps         0x61e8(%eax),%xmm6
+  .byte  15,88,176,229,97,0,0                // addps         0x61e5(%eax),%xmm6
   .byte  15,17,182,160,0,0,0                 // movups        %xmm6,0xa0(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
   .byte  131,236,8                           // sub           $0x8,%esp
@@ -63248,18 +63414,18 @@
   .byte  137,229                             // mov           %esp,%ebp
   .byte  86                                  // push          %esi
   .byte  80                                  // push          %eax
-  .byte  232,0,0,0,0                         // call          7126 <_sk_bicubic_p3y_sse2+0xa>
+  .byte  232,0,0,0,0                         // call          71b9 <_sk_bicubic_p3y_sse2+0xa>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,12                           // mov           0xc(%ebp),%edx
   .byte  139,50                              // mov           (%edx),%esi
   .byte  15,16,78,32                         // movups        0x20(%esi),%xmm1
   .byte  15,16,102,96                        // movups        0x60(%esi),%xmm4
-  .byte  15,88,136,122,97,0,0                // addps         0x617a(%eax),%xmm1
+  .byte  15,88,136,119,97,0,0                // addps         0x6177(%eax),%xmm1
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
   .byte  15,89,237                           // mulps         %xmm5,%xmm5
-  .byte  15,89,160,90,97,0,0                 // mulps         0x615a(%eax),%xmm4
-  .byte  15,88,160,202,92,0,0                // addps         0x5cca(%eax),%xmm4
+  .byte  15,89,160,87,97,0,0                 // mulps         0x6157(%eax),%xmm4
+  .byte  15,88,160,199,92,0,0                // addps         0x5cc7(%eax),%xmm4
   .byte  15,89,229                           // mulps         %xmm5,%xmm4
   .byte  15,17,166,160,0,0,0                 // movups        %xmm4,0xa0(%esi)
   .byte  141,66,8                            // lea           0x8(%edx),%eax
@@ -63404,7 +63570,7 @@
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
   .byte  102,15,98,200                       // punpckldq     %xmm0,%xmm1
   .byte  102,15,127,77,136                   // movdqa        %xmm1,-0x78(%ebp)
-  .byte  232,0,0,0,0                         // call          7312 <_sk_clut_3D_sse2+0xf7>
+  .byte  232,0,0,0,0                         // call          73a5 <_sk_clut_3D_sse2+0xf7>
   .byte  90                                  // pop           %edx
   .byte  243,15,91,196                       // cvttps2dq     %xmm4,%xmm0
   .byte  102,15,127,133,248,254,255,255      // movdqa        %xmm0,-0x108(%ebp)
@@ -63412,7 +63578,7 @@
   .byte  102,15,254,216                      // paddd         %xmm0,%xmm3
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,254,195                      // paddd         %xmm3,%xmm0
-  .byte  102,15,111,162,190,95,0,0           // movdqa        0x5fbe(%edx),%xmm4
+  .byte  102,15,111,162,187,95,0,0           // movdqa        0x5fbb(%edx),%xmm4
   .byte  102,15,127,165,120,255,255,255      // movdqa        %xmm4,-0x88(%ebp)
   .byte  102,15,112,200,245                  // pshufd        $0xf5,%xmm0,%xmm1
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
@@ -63452,7 +63618,7 @@
   .byte  243,15,16,4,129                     // movss         (%ecx,%eax,4),%xmm0
   .byte  15,20,248                           // unpcklps      %xmm0,%xmm7
   .byte  102,15,20,252                       // unpcklpd      %xmm4,%xmm7
-  .byte  102,15,111,130,62,89,0,0            // movdqa        0x593e(%edx),%xmm0
+  .byte  102,15,111,130,59,89,0,0            // movdqa        0x593b(%edx),%xmm0
   .byte  102,15,127,133,104,255,255,255      // movdqa        %xmm0,-0x98(%ebp)
   .byte  102,15,254,200                      // paddd         %xmm0,%xmm1
   .byte  102,15,112,193,229                  // pshufd        $0xe5,%xmm1,%xmm0
@@ -63469,7 +63635,7 @@
   .byte  243,15,16,4,129                     // movss         (%ecx,%eax,4),%xmm0
   .byte  15,20,240                           // unpcklps      %xmm0,%xmm6
   .byte  102,15,20,241                       // unpcklpd      %xmm1,%xmm6
-  .byte  15,40,130,174,95,0,0                // movaps        0x5fae(%edx),%xmm0
+  .byte  15,40,130,171,95,0,0                // movaps        0x5fab(%edx),%xmm0
   .byte  15,40,141,232,254,255,255           // movaps        -0x118(%ebp),%xmm1
   .byte  15,88,200                           // addps         %xmm0,%xmm1
   .byte  15,41,77,200                        // movaps        %xmm1,-0x38(%ebp)
@@ -64092,7 +64258,7 @@
   .byte  102,15,112,201,232                  // pshufd        $0xe8,%xmm1,%xmm1
   .byte  102,15,98,217                       // punpckldq     %xmm1,%xmm3
   .byte  102,15,127,93,152                   // movdqa        %xmm3,-0x68(%ebp)
-  .byte  232,0,0,0,0                         // call          7ea8 <_sk_clut_4D_sse2+0x16e>
+  .byte  232,0,0,0,0                         // call          7f3b <_sk_clut_4D_sse2+0x16e>
   .byte  89                                  // pop           %ecx
   .byte  15,40,197                           // movaps        %xmm5,%xmm0
   .byte  15,41,133,152,254,255,255           // movaps        %xmm0,-0x168(%ebp)
@@ -64103,7 +64269,7 @@
   .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
   .byte  102,15,254,214                      // paddd         %xmm6,%xmm2
   .byte  102,15,254,218                      // paddd         %xmm2,%xmm3
-  .byte  102,15,111,161,40,84,0,0            // movdqa        0x5428(%ecx),%xmm4
+  .byte  102,15,111,161,37,84,0,0            // movdqa        0x5425(%ecx),%xmm4
   .byte  102,15,112,203,245                  // pshufd        $0xf5,%xmm3,%xmm1
   .byte  102,15,244,220                      // pmuludq       %xmm4,%xmm3
   .byte  102,15,244,204                      // pmuludq       %xmm4,%xmm1
@@ -64145,7 +64311,7 @@
   .byte  15,20,223                           // unpcklps      %xmm7,%xmm3
   .byte  102,15,20,222                       // unpcklpd      %xmm6,%xmm3
   .byte  102,15,41,157,232,254,255,255       // movapd        %xmm3,-0x118(%ebp)
-  .byte  102,15,254,137,168,77,0,0           // paddd         0x4da8(%ecx),%xmm1
+  .byte  102,15,254,137,165,77,0,0           // paddd         0x4da5(%ecx),%xmm1
   .byte  102,15,112,241,229                  // pshufd        $0xe5,%xmm1,%xmm6
   .byte  102,15,126,240                      // movd          %xmm6,%eax
   .byte  102,15,112,241,78                   // pshufd        $0x4e,%xmm1,%xmm6
@@ -64160,7 +64326,7 @@
   .byte  243,15,16,60,130                    // movss         (%edx,%eax,4),%xmm7
   .byte  15,20,223                           // unpcklps      %xmm7,%xmm3
   .byte  102,15,20,222                       // unpcklpd      %xmm6,%xmm3
-  .byte  15,40,185,24,84,0,0                 // movaps        0x5418(%ecx),%xmm7
+  .byte  15,40,185,21,84,0,0                 // movaps        0x5415(%ecx),%xmm7
   .byte  15,88,199                           // addps         %xmm7,%xmm0
   .byte  15,41,133,120,255,255,255           // movaps        %xmm0,-0x88(%ebp)
   .byte  15,40,133,248,254,255,255           // movaps        -0x108(%ebp),%xmm0
@@ -64181,7 +64347,7 @@
   .byte  102,15,127,101,168                  // movdqa        %xmm4,-0x58(%ebp)
   .byte  102,15,254,212                      // paddd         %xmm4,%xmm2
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,161,40,84,0,0            // movdqa        0x5428(%ecx),%xmm4
+  .byte  102,15,111,161,37,84,0,0            // movdqa        0x5425(%ecx),%xmm4
   .byte  102,15,244,212                      // pmuludq       %xmm4,%xmm2
   .byte  102,15,244,196                      // pmuludq       %xmm4,%xmm0
   .byte  102,15,112,240,232                  // pshufd        $0xe8,%xmm0,%xmm6
@@ -64217,7 +64383,7 @@
   .byte  243,15,16,44,130                    // movss         (%edx,%eax,4),%xmm5
   .byte  15,20,213                           // unpcklps      %xmm5,%xmm2
   .byte  102,15,20,214                       // unpcklpd      %xmm6,%xmm2
-  .byte  102,15,254,129,168,77,0,0           // paddd         0x4da8(%ecx),%xmm0
+  .byte  102,15,254,129,165,77,0,0           // paddd         0x4da5(%ecx),%xmm0
   .byte  102,15,112,232,229                  // pshufd        $0xe5,%xmm0,%xmm5
   .byte  102,15,126,232                      // movd          %xmm5,%eax
   .byte  102,15,112,232,78                   // pshufd        $0x4e,%xmm0,%xmm5
@@ -64301,7 +64467,7 @@
   .byte  243,15,16,44,130                    // movss         (%edx,%eax,4),%xmm5
   .byte  15,20,245                           // unpcklps      %xmm5,%xmm6
   .byte  102,15,20,240                       // unpcklpd      %xmm0,%xmm6
-  .byte  102,15,254,137,168,77,0,0           // paddd         0x4da8(%ecx),%xmm1
+  .byte  102,15,254,137,165,77,0,0           // paddd         0x4da5(%ecx),%xmm1
   .byte  102,15,112,193,229                  // pshufd        $0xe5,%xmm1,%xmm0
   .byte  102,15,126,192                      // movd          %xmm0,%eax
   .byte  102,15,112,193,78                   // pshufd        $0x4e,%xmm1,%xmm0
@@ -64319,7 +64485,7 @@
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,15,254,77,168                   // paddd         -0x58(%ebp),%xmm1
   .byte  102,15,112,193,245                  // pshufd        $0xf5,%xmm1,%xmm0
-  .byte  102,15,111,145,40,84,0,0            // movdqa        0x5428(%ecx),%xmm2
+  .byte  102,15,111,145,37,84,0,0            // movdqa        0x5425(%ecx),%xmm2
   .byte  102,15,244,202                      // pmuludq       %xmm2,%xmm1
   .byte  102,15,244,194                      // pmuludq       %xmm2,%xmm0
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
@@ -64355,7 +64521,7 @@
   .byte  243,15,16,4,130                     // movss         (%edx,%eax,4),%xmm0
   .byte  15,20,216                           // unpcklps      %xmm0,%xmm3
   .byte  102,15,20,217                       // unpcklpd      %xmm1,%xmm3
-  .byte  102,15,254,169,168,77,0,0           // paddd         0x4da8(%ecx),%xmm5
+  .byte  102,15,254,169,165,77,0,0           // paddd         0x4da5(%ecx),%xmm5
   .byte  102,15,112,197,229                  // pshufd        $0xe5,%xmm5,%xmm0
   .byte  102,15,126,192                      // movd          %xmm0,%eax
   .byte  102,15,112,197,78                   // pshufd        $0x4e,%xmm5,%xmm0
@@ -64415,7 +64581,7 @@
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,15,254,85,152                   // paddd         -0x68(%ebp),%xmm2
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,153,40,84,0,0            // movdqa        0x5428(%ecx),%xmm3
+  .byte  102,15,111,153,37,84,0,0            // movdqa        0x5425(%ecx),%xmm3
   .byte  102,15,244,211                      // pmuludq       %xmm3,%xmm2
   .byte  102,15,244,195                      // pmuludq       %xmm3,%xmm0
   .byte  102,15,111,251                      // movdqa        %xmm3,%xmm7
@@ -64454,7 +64620,7 @@
   .byte  243,15,16,44,130                    // movss         (%edx,%eax,4),%xmm5
   .byte  15,20,229                           // unpcklps      %xmm5,%xmm4
   .byte  102,15,20,227                       // unpcklpd      %xmm3,%xmm4
-  .byte  102,15,254,129,168,77,0,0           // paddd         0x4da8(%ecx),%xmm0
+  .byte  102,15,254,129,165,77,0,0           // paddd         0x4da5(%ecx),%xmm0
   .byte  102,15,112,216,229                  // pshufd        $0xe5,%xmm0,%xmm3
   .byte  102,15,126,216                      // movd          %xmm3,%eax
   .byte  102,15,112,216,78                   // pshufd        $0x4e,%xmm0,%xmm3
@@ -64506,7 +64672,7 @@
   .byte  243,15,16,52,130                    // movss         (%edx,%eax,4),%xmm6
   .byte  15,20,238                           // unpcklps      %xmm6,%xmm5
   .byte  102,15,20,235                       // unpcklpd      %xmm3,%xmm5
-  .byte  102,15,111,137,168,77,0,0           // movdqa        0x4da8(%ecx),%xmm1
+  .byte  102,15,111,137,165,77,0,0           // movdqa        0x4da5(%ecx),%xmm1
   .byte  102,15,254,249                      // paddd         %xmm1,%xmm7
   .byte  102,15,112,223,229                  // pshufd        $0xe5,%xmm7,%xmm3
   .byte  102,15,126,216                      // movd          %xmm3,%eax
@@ -64540,7 +64706,7 @@
   .byte  102,15,111,226                      // movdqa        %xmm2,%xmm4
   .byte  102,15,254,69,152                   // paddd         -0x68(%ebp),%xmm0
   .byte  102,15,112,208,245                  // pshufd        $0xf5,%xmm0,%xmm2
-  .byte  102,15,111,153,40,84,0,0            // movdqa        0x5428(%ecx),%xmm3
+  .byte  102,15,111,153,37,84,0,0            // movdqa        0x5425(%ecx),%xmm3
   .byte  102,15,244,195                      // pmuludq       %xmm3,%xmm0
   .byte  102,15,244,211                      // pmuludq       %xmm3,%xmm2
   .byte  102,15,112,218,232                  // pshufd        $0xe8,%xmm2,%xmm3
@@ -64597,7 +64763,7 @@
   .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
   .byte  102,15,254,85,168                   // paddd         -0x58(%ebp),%xmm2
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,137,40,84,0,0            // movdqa        0x5428(%ecx),%xmm1
+  .byte  102,15,111,137,37,84,0,0            // movdqa        0x5425(%ecx),%xmm1
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
   .byte  102,15,244,193                      // pmuludq       %xmm1,%xmm0
   .byte  102,15,112,240,232                  // pshufd        $0xe8,%xmm0,%xmm6
@@ -64634,7 +64800,7 @@
   .byte  243,15,16,36,130                    // movss         (%edx,%eax,4),%xmm4
   .byte  15,20,212                           // unpcklps      %xmm4,%xmm2
   .byte  102,15,20,214                       // unpcklpd      %xmm6,%xmm2
-  .byte  102,15,254,129,168,77,0,0           // paddd         0x4da8(%ecx),%xmm0
+  .byte  102,15,254,129,165,77,0,0           // paddd         0x4da5(%ecx),%xmm0
   .byte  102,15,112,224,229                  // pshufd        $0xe5,%xmm0,%xmm4
   .byte  102,15,126,224                      // movd          %xmm4,%eax
   .byte  102,15,112,224,78                   // pshufd        $0x4e,%xmm0,%xmm4
@@ -64702,7 +64868,7 @@
   .byte  102,15,111,93,152                   // movdqa        -0x68(%ebp),%xmm3
   .byte  102,15,254,217                      // paddd         %xmm1,%xmm3
   .byte  102,15,112,211,245                  // pshufd        $0xf5,%xmm3,%xmm2
-  .byte  102,15,111,129,40,84,0,0            // movdqa        0x5428(%ecx),%xmm0
+  .byte  102,15,111,129,37,84,0,0            // movdqa        0x5425(%ecx),%xmm0
   .byte  102,15,244,216                      // pmuludq       %xmm0,%xmm3
   .byte  102,15,244,208                      // pmuludq       %xmm0,%xmm2
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
@@ -64741,7 +64907,7 @@
   .byte  243,15,16,28,130                    // movss         (%edx,%eax,4),%xmm3
   .byte  15,20,235                           // unpcklps      %xmm3,%xmm5
   .byte  102,15,20,238                       // unpcklpd      %xmm6,%xmm5
-  .byte  102,15,254,145,168,77,0,0           // paddd         0x4da8(%ecx),%xmm2
+  .byte  102,15,254,145,165,77,0,0           // paddd         0x4da5(%ecx),%xmm2
   .byte  102,15,112,218,229                  // pshufd        $0xe5,%xmm2,%xmm3
   .byte  102,15,126,216                      // movd          %xmm3,%eax
   .byte  102,15,112,218,78                   // pshufd        $0x4e,%xmm2,%xmm3
@@ -64793,7 +64959,7 @@
   .byte  243,15,16,4,130                     // movss         (%edx,%eax,4),%xmm0
   .byte  15,20,208                           // unpcklps      %xmm0,%xmm2
   .byte  102,15,20,215                       // unpcklpd      %xmm7,%xmm2
-  .byte  102,15,111,137,168,77,0,0           // movdqa        0x4da8(%ecx),%xmm1
+  .byte  102,15,111,137,165,77,0,0           // movdqa        0x4da5(%ecx),%xmm1
   .byte  102,15,254,217                      // paddd         %xmm1,%xmm3
   .byte  102,15,112,195,229                  // pshufd        $0xe5,%xmm3,%xmm0
   .byte  102,15,126,192                      // movd          %xmm0,%eax
@@ -64828,7 +64994,7 @@
   .byte  102,15,111,194                      // movdqa        %xmm2,%xmm0
   .byte  102,15,254,69,152                   // paddd         -0x68(%ebp),%xmm0
   .byte  102,15,112,224,245                  // pshufd        $0xf5,%xmm0,%xmm4
-  .byte  102,15,111,169,40,84,0,0            // movdqa        0x5428(%ecx),%xmm5
+  .byte  102,15,111,169,37,84,0,0            // movdqa        0x5425(%ecx),%xmm5
   .byte  102,15,111,221                      // movdqa        %xmm5,%xmm3
   .byte  102,15,244,195                      // pmuludq       %xmm3,%xmm0
   .byte  102,15,244,227                      // pmuludq       %xmm3,%xmm4
@@ -64884,7 +65050,7 @@
   .byte  102,15,111,202                      // movdqa        %xmm2,%xmm1
   .byte  102,15,254,77,168                   // paddd         -0x58(%ebp),%xmm1
   .byte  102,15,112,193,245                  // pshufd        $0xf5,%xmm1,%xmm0
-  .byte  102,15,111,145,40,84,0,0            // movdqa        0x5428(%ecx),%xmm2
+  .byte  102,15,111,145,37,84,0,0            // movdqa        0x5425(%ecx),%xmm2
   .byte  102,15,244,202                      // pmuludq       %xmm2,%xmm1
   .byte  102,15,244,194                      // pmuludq       %xmm2,%xmm0
   .byte  102,15,112,192,232                  // pshufd        $0xe8,%xmm0,%xmm0
@@ -64920,7 +65086,7 @@
   .byte  243,15,16,4,130                     // movss         (%edx,%eax,4),%xmm0
   .byte  15,20,216                           // unpcklps      %xmm0,%xmm3
   .byte  102,15,20,217                       // unpcklpd      %xmm1,%xmm3
-  .byte  102,15,254,185,168,77,0,0           // paddd         0x4da8(%ecx),%xmm7
+  .byte  102,15,254,185,165,77,0,0           // paddd         0x4da5(%ecx),%xmm7
   .byte  102,15,112,199,229                  // pshufd        $0xe5,%xmm7,%xmm0
   .byte  102,15,126,192                      // movd          %xmm0,%eax
   .byte  102,15,112,199,78                   // pshufd        $0x4e,%xmm7,%xmm0
@@ -64970,7 +65136,7 @@
   .byte  102,15,111,233                      // movdqa        %xmm1,%xmm5
   .byte  102,15,254,69,152                   // paddd         -0x68(%ebp),%xmm0
   .byte  102,15,112,200,245                  // pshufd        $0xf5,%xmm0,%xmm1
-  .byte  102,15,111,145,40,84,0,0            // movdqa        0x5428(%ecx),%xmm2
+  .byte  102,15,111,145,37,84,0,0            // movdqa        0x5425(%ecx),%xmm2
   .byte  102,15,244,194                      // pmuludq       %xmm2,%xmm0
   .byte  102,15,244,202                      // pmuludq       %xmm2,%xmm1
   .byte  102,15,111,250                      // movdqa        %xmm2,%xmm7
@@ -65009,7 +65175,7 @@
   .byte  243,15,16,36,130                    // movss         (%edx,%eax,4),%xmm4
   .byte  15,20,204                           // unpcklps      %xmm4,%xmm1
   .byte  102,15,20,203                       // unpcklpd      %xmm3,%xmm1
-  .byte  102,15,254,145,168,77,0,0           // paddd         0x4da8(%ecx),%xmm2
+  .byte  102,15,254,145,165,77,0,0           // paddd         0x4da5(%ecx),%xmm2
   .byte  102,15,112,218,229                  // pshufd        $0xe5,%xmm2,%xmm3
   .byte  102,15,126,216                      // movd          %xmm3,%eax
   .byte  102,15,112,218,78                   // pshufd        $0x4e,%xmm2,%xmm3
@@ -65063,7 +65229,7 @@
   .byte  243,15,16,36,130                    // movss         (%edx,%eax,4),%xmm4
   .byte  15,20,252                           // unpcklps      %xmm4,%xmm7
   .byte  102,15,20,254                       // unpcklpd      %xmm6,%xmm7
-  .byte  102,15,254,153,168,77,0,0           // paddd         0x4da8(%ecx),%xmm3
+  .byte  102,15,254,153,165,77,0,0           // paddd         0x4da5(%ecx),%xmm3
   .byte  102,15,112,227,229                  // pshufd        $0xe5,%xmm3,%xmm4
   .byte  102,15,126,224                      // movd          %xmm4,%eax
   .byte  102,15,112,227,78                   // pshufd        $0x4e,%xmm3,%xmm4
@@ -65096,7 +65262,7 @@
   .byte  102,15,254,208                      // paddd         %xmm0,%xmm2
   .byte  102,15,111,216                      // movdqa        %xmm0,%xmm3
   .byte  102,15,112,194,245                  // pshufd        $0xf5,%xmm2,%xmm0
-  .byte  102,15,111,137,40,84,0,0            // movdqa        0x5428(%ecx),%xmm1
+  .byte  102,15,111,137,37,84,0,0            // movdqa        0x5425(%ecx),%xmm1
   .byte  102,15,244,209                      // pmuludq       %xmm1,%xmm2
   .byte  102,15,244,193                      // pmuludq       %xmm1,%xmm0
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
@@ -65136,7 +65302,7 @@
   .byte  15,20,225                           // unpcklps      %xmm1,%xmm4
   .byte  102,15,20,226                       // unpcklpd      %xmm2,%xmm4
   .byte  102,15,41,165,88,255,255,255        // movapd        %xmm4,-0xa8(%ebp)
-  .byte  102,15,254,129,168,77,0,0           // paddd         0x4da8(%ecx),%xmm0
+  .byte  102,15,254,129,165,77,0,0           // paddd         0x4da5(%ecx),%xmm0
   .byte  102,15,112,200,229                  // pshufd        $0xe5,%xmm0,%xmm1
   .byte  102,15,126,200                      // movd          %xmm1,%eax
   .byte  102,15,112,200,78                   // pshufd        $0x4e,%xmm0,%xmm1
@@ -65190,7 +65356,7 @@
   .byte  243,15,16,52,130                    // movss         (%edx,%eax,4),%xmm6
   .byte  15,20,206                           // unpcklps      %xmm6,%xmm1
   .byte  102,15,20,203                       // unpcklpd      %xmm3,%xmm1
-  .byte  102,15,254,145,168,77,0,0           // paddd         0x4da8(%ecx),%xmm2
+  .byte  102,15,254,145,165,77,0,0           // paddd         0x4da5(%ecx),%xmm2
   .byte  102,15,112,218,229                  // pshufd        $0xe5,%xmm2,%xmm3
   .byte  102,15,126,216                      // movd          %xmm3,%eax
   .byte  102,15,112,218,78                   // pshufd        $0x4e,%xmm2,%xmm3
@@ -65260,7 +65426,7 @@
   .byte  139,117,12                          // mov           0xc(%ebp),%esi
   .byte  141,86,8                            // lea           0x8(%esi),%edx
   .byte  131,236,8                           // sub           $0x8,%esp
-  .byte  15,40,153,104,77,0,0                // movaps        0x4d68(%ecx),%xmm3
+  .byte  15,40,153,101,77,0,0                // movaps        0x4d65(%ecx),%xmm3
   .byte  82                                  // push          %edx
   .byte  80                                  // push          %eax
   .byte  255,86,4                            // call          *0x4(%esi)
@@ -65271,6 +65437,7 @@
   .byte  93                                  // pop           %ebp
   .byte  195                                 // ret
   .byte  144                                 // nop
+  .byte  144                                 // nop
 
 HIDDEN _sk_start_pipeline_sse2_lowp
 .globl _sk_start_pipeline_sse2_lowp
@@ -65284,7 +65451,7 @@
   .byte  131,236,92                          // sub           $0x5c,%esp
   .byte  139,125,12                          // mov           0xc(%ebp),%edi
   .byte  59,125,20                           // cmp           0x14(%ebp),%edi
-  .byte  15,131,193,0,0,0                    // jae           93ca <_sk_start_pipeline_sse2_lowp+0xd6>
+  .byte  15,131,193,0,0,0                    // jae           945e <_sk_start_pipeline_sse2_lowp+0xd6>
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  139,117,24                          // mov           0x18(%ebp),%esi
@@ -65298,7 +65465,7 @@
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  137,223                             // mov           %ebx,%edi
   .byte  137,243                             // mov           %esi,%ebx
-  .byte  119,77                              // ja            937c <_sk_start_pipeline_sse2_lowp+0x88>
+  .byte  119,77                              // ja            9410 <_sk_start_pipeline_sse2_lowp+0x88>
   .byte  139,117,8                           // mov           0x8(%ebp),%esi
   .byte  15,41,68,36,64                      // movaps        %xmm0,0x40(%esp)
   .byte  15,41,68,36,48                      // movaps        %xmm0,0x30(%esp)
@@ -65320,13 +65487,13 @@
   .byte  131,198,16                          // add           $0x10,%esi
   .byte  57,214                              // cmp           %edx,%esi
   .byte  137,198                             // mov           %eax,%esi
-  .byte  118,182                             // jbe           9332 <_sk_start_pipeline_sse2_lowp+0x3e>
+  .byte  118,182                             // jbe           93c6 <_sk_start_pipeline_sse2_lowp+0x3e>
   .byte  137,209                             // mov           %edx,%ecx
   .byte  41,193                              // sub           %eax,%ecx
   .byte  137,222                             // mov           %ebx,%esi
   .byte  137,251                             // mov           %edi,%ebx
   .byte  139,125,240                         // mov           -0x10(%ebp),%edi
-  .byte  116,55                              // je            93c0 <_sk_start_pipeline_sse2_lowp+0xcc>
+  .byte  116,55                              // je            9454 <_sk_start_pipeline_sse2_lowp+0xcc>
   .byte  15,41,68,36,64                      // movaps        %xmm0,0x40(%esp)
   .byte  15,41,68,36,48                      // movaps        %xmm0,0x30(%esp)
   .byte  15,41,68,36,32                      // movaps        %xmm0,0x20(%esp)
@@ -65344,7 +65511,7 @@
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
   .byte  71                                  // inc           %edi
   .byte  59,125,20                           // cmp           0x14(%ebp),%edi
-  .byte  15,133,86,255,255,255               // jne           9320 <_sk_start_pipeline_sse2_lowp+0x2c>
+  .byte  15,133,86,255,255,255               // jne           93b4 <_sk_start_pipeline_sse2_lowp+0x2c>
   .byte  131,196,92                          // add           $0x5c,%esp
   .byte  94                                  // pop           %esi
   .byte  95                                  // pop           %edi
@@ -65416,7 +65583,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,92                          // sub           $0x5c,%esp
-  .byte  232,0,0,0,0                         // call          9479 <_sk_black_color_sse2_lowp+0xe>
+  .byte  232,0,0,0,0                         // call          950d <_sk_black_color_sse2_lowp+0xe>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
@@ -65435,7 +65602,7 @@
   .byte  137,84,36,8                         // mov           %edx,0x8(%esp)
   .byte  137,92,36,4                         // mov           %ebx,0x4(%esp)
   .byte  137,12,36                           // mov           %ecx,(%esp)
-  .byte  15,40,152,103,62,0,0                // movaps        0x3e67(%eax),%xmm3
+  .byte  15,40,152,99,62,0,0                 // movaps        0x3e63(%eax),%xmm3
   .byte  15,87,192                           // xorps         %xmm0,%xmm0
   .byte  15,87,201                           // xorps         %xmm1,%xmm1
   .byte  15,87,210                           // xorps         %xmm2,%xmm2
@@ -65457,7 +65624,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,92                          // sub           $0x5c,%esp
-  .byte  232,0,0,0,0                         // call          94e4 <_sk_white_color_sse2_lowp+0xe>
+  .byte  232,0,0,0,0                         // call          9578 <_sk_white_color_sse2_lowp+0xe>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
@@ -65476,7 +65643,7 @@
   .byte  137,84,36,8                         // mov           %edx,0x8(%esp)
   .byte  137,92,36,4                         // mov           %ebx,0x4(%esp)
   .byte  137,12,36                           // mov           %ecx,(%esp)
-  .byte  15,40,128,252,61,0,0                // movaps        0x3dfc(%eax),%xmm0
+  .byte  15,40,128,248,61,0,0                // movaps        0x3df8(%eax),%xmm0
   .byte  15,40,200                           // movaps        %xmm0,%xmm1
   .byte  15,40,208                           // movaps        %xmm0,%xmm2
   .byte  15,40,216                           // movaps        %xmm0,%xmm3
@@ -65497,16 +65664,16 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          954e <_sk_set_rgb_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          95e2 <_sk_set_rgb_sse2_lowp+0xd>
   .byte  94                                  // pop           %esi
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,57                              // mov           (%ecx),%edi
-  .byte  243,15,16,150,86,62,0,0             // movss         0x3e56(%esi),%xmm2
+  .byte  243,15,16,150,82,62,0,0             // movss         0x3e52(%esi),%xmm2
   .byte  243,15,16,7                         // movss         (%edi),%xmm0
   .byte  243,15,89,194                       // mulss         %xmm2,%xmm0
-  .byte  243,15,16,142,82,62,0,0             // movss         0x3e52(%esi),%xmm1
+  .byte  243,15,16,142,78,62,0,0             // movss         0x3e4e(%esi),%xmm1
   .byte  243,15,88,193                       // addss         %xmm1,%xmm0
   .byte  243,15,44,240                       // cvttss2si     %xmm0,%esi
   .byte  102,15,110,198                      // movd          %esi,%xmm0
@@ -65555,7 +65722,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9612 <_sk_premul_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          96a6 <_sk_premul_sse2_lowp+0xd>
   .byte  90                                  // pop           %edx
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  139,77,16                           // mov           0x10(%ebp),%ecx
@@ -65564,7 +65731,7 @@
   .byte  15,40,109,40                        // movaps        0x28(%ebp),%xmm5
   .byte  15,40,117,56                        // movaps        0x38(%ebp),%xmm6
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,15,111,186,206,60,0,0           // movdqa        0x3cce(%edx),%xmm7
+  .byte  102,15,111,186,202,60,0,0           // movdqa        0x3cca(%edx),%xmm7
   .byte  102,15,253,199                      // paddw         %xmm7,%xmm0
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
   .byte  102,15,253,207                      // paddw         %xmm7,%xmm1
@@ -65698,12 +65865,12 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          978c <_sk_invert_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9820 <_sk_invert_sse2_lowp+0xd>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
   .byte  139,117,20                          // mov           0x14(%ebp),%esi
-  .byte  102,15,111,160,84,59,0,0            // movdqa        0x3b54(%eax),%xmm4
+  .byte  102,15,111,160,80,59,0,0            // movdqa        0x3b50(%eax),%xmm4
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,249,232                      // psubw         %xmm0,%xmm5
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
@@ -65785,11 +65952,11 @@
   .byte  102,15,111,234                      // movdqa        %xmm2,%xmm5
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          9884 <_sk_srcatop_sse2_lowp+0x19>
+  .byte  232,0,0,0,0                         // call          9918 <_sk_srcatop_sse2_lowp+0x19>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,117,72                   // movdqa        0x48(%ebp),%xmm6
   .byte  102,15,213,206                      // pmullw        %xmm6,%xmm1
-  .byte  102,15,111,128,92,58,0,0            // movdqa        0x3a5c(%eax),%xmm0
+  .byte  102,15,111,128,88,58,0,0            // movdqa        0x3a58(%eax),%xmm0
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
   .byte  102,15,213,214                      // pmullw        %xmm6,%xmm2
   .byte  102,15,253,208                      // paddw         %xmm0,%xmm2
@@ -65847,12 +66014,12 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9958 <_sk_dstatop_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          99ec <_sk_dstatop_sse2_lowp+0xd>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,101,40                   // movdqa        0x28(%ebp),%xmm4
   .byte  102,15,111,117,24                   // movdqa        0x18(%ebp),%xmm6
   .byte  102,15,213,243                      // pmullw        %xmm3,%xmm6
-  .byte  102,15,111,184,136,57,0,0           // movdqa        0x3988(%eax),%xmm7
+  .byte  102,15,111,184,132,57,0,0           // movdqa        0x3984(%eax),%xmm7
   .byte  102,15,253,247                      // paddw         %xmm7,%xmm6
   .byte  102,15,213,227                      // pmullw        %xmm3,%xmm4
   .byte  102,15,253,231                      // paddw         %xmm7,%xmm4
@@ -65905,7 +66072,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9a19 <_sk_srcin_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9aad <_sk_srcin_sse2_lowp+0xd>
   .byte  94                                  // pop           %esi
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  139,77,16                           // mov           0x10(%ebp),%ecx
@@ -65914,7 +66081,7 @@
   .byte  15,40,109,40                        // movaps        0x28(%ebp),%xmm5
   .byte  102,15,111,117,72                   // movdqa        0x48(%ebp),%xmm6
   .byte  102,15,213,198                      // pmullw        %xmm6,%xmm0
-  .byte  102,15,111,190,199,56,0,0           // movdqa        0x38c7(%esi),%xmm7
+  .byte  102,15,111,190,195,56,0,0           // movdqa        0x38c3(%esi),%xmm7
   .byte  102,15,253,199                      // paddw         %xmm7,%xmm0
   .byte  102,15,213,206                      // pmullw        %xmm6,%xmm1
   .byte  102,15,253,207                      // paddw         %xmm7,%xmm1
@@ -65953,14 +66120,14 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9ab0 <_sk_dstin_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9b44 <_sk_dstin_sse2_lowp+0xd>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,85,56                    // movdqa        0x38(%ebp),%xmm2
   .byte  102,15,111,109,40                   // movdqa        0x28(%ebp),%xmm5
   .byte  102,15,111,117,24                   // movdqa        0x18(%ebp),%xmm6
   .byte  102,15,111,198                      // movdqa        %xmm6,%xmm0
   .byte  102,15,213,195                      // pmullw        %xmm3,%xmm0
-  .byte  102,15,111,184,48,56,0,0            // movdqa        0x3830(%eax),%xmm7
+  .byte  102,15,111,184,44,56,0,0            // movdqa        0x382c(%eax),%xmm7
   .byte  102,15,253,199                      // paddw         %xmm7,%xmm0
   .byte  102,15,111,205                      // movdqa        %xmm5,%xmm1
   .byte  102,15,213,203                      // pmullw        %xmm3,%xmm1
@@ -66004,14 +66171,14 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9b58 <_sk_srcout_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9bec <_sk_srcout_sse2_lowp+0xd>
   .byte  94                                  // pop           %esi
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  139,77,16                           // mov           0x10(%ebp),%ecx
   .byte  139,85,20                           // mov           0x14(%ebp),%edx
   .byte  15,40,101,24                        // movaps        0x18(%ebp),%xmm4
   .byte  102,15,111,109,72                   // movdqa        0x48(%ebp),%xmm5
-  .byte  102,15,111,182,136,55,0,0           // movdqa        0x3788(%esi),%xmm6
+  .byte  102,15,111,182,132,55,0,0           // movdqa        0x3784(%esi),%xmm6
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,15,249,253                      // psubw         %xmm5,%xmm7
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
@@ -66055,11 +66222,11 @@
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
-  .byte  232,0,0,0,0                         // call          9bfb <_sk_dstout_sse2_lowp+0x11>
+  .byte  232,0,0,0,0                         // call          9c8f <_sk_dstout_sse2_lowp+0x11>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,109,56                   // movdqa        0x38(%ebp),%xmm5
   .byte  102,15,111,117,24                   // movdqa        0x18(%ebp),%xmm6
-  .byte  102,15,111,184,229,54,0,0           // movdqa        0x36e5(%eax),%xmm7
+  .byte  102,15,111,184,225,54,0,0           // movdqa        0x36e1(%eax),%xmm7
   .byte  102,15,111,223                      // movdqa        %xmm7,%xmm3
   .byte  102,15,249,216                      // psubw         %xmm0,%xmm3
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
@@ -66111,9 +66278,9 @@
   .byte  15,41,85,232                        // movaps        %xmm2,-0x18(%ebp)
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
-  .byte  232,0,0,0,0                         // call          9cb7 <_sk_srcover_sse2_lowp+0x19>
+  .byte  232,0,0,0,0                         // call          9d4b <_sk_srcover_sse2_lowp+0x19>
   .byte  88                                  // pop           %eax
-  .byte  102,15,111,136,41,54,0,0            // movdqa        0x3629(%eax),%xmm1
+  .byte  102,15,111,136,37,54,0,0            // movdqa        0x3625(%eax),%xmm1
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,249,195                      // psubw         %xmm3,%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
@@ -66172,7 +66339,7 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9d87 <_sk_dstover_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9e1b <_sk_dstover_sse2_lowp+0xd>
   .byte  95                                  // pop           %edi
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
@@ -66180,7 +66347,7 @@
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  102,15,111,101,56                   // movdqa        0x38(%ebp),%xmm4
   .byte  102,15,111,109,72                   // movdqa        0x48(%ebp),%xmm5
-  .byte  102,15,111,183,89,53,0,0            // movdqa        0x3559(%edi),%xmm6
+  .byte  102,15,111,183,85,53,0,0            // movdqa        0x3555(%edi),%xmm6
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,15,249,253                      // psubw         %xmm5,%xmm7
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
@@ -66226,12 +66393,12 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9e3c <_sk_modulate_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9ed0 <_sk_modulate_sse2_lowp+0xd>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,109,40                   // movdqa        0x28(%ebp),%xmm5
   .byte  102,15,111,117,24                   // movdqa        0x18(%ebp),%xmm6
   .byte  102,15,213,198                      // pmullw        %xmm6,%xmm0
-  .byte  102,15,111,184,164,52,0,0           // movdqa        0x34a4(%eax),%xmm7
+  .byte  102,15,111,184,160,52,0,0           // movdqa        0x34a0(%eax),%xmm7
   .byte  102,15,253,199                      // paddw         %xmm7,%xmm0
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
   .byte  102,15,253,207                      // paddw         %xmm7,%xmm1
@@ -66274,10 +66441,10 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          9ed8 <_sk_multiply_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          9f6c <_sk_multiply_sse2_lowp+0xd>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,109,24                   // movdqa        0x18(%ebp),%xmm5
-  .byte  102,15,111,160,8,52,0,0             // movdqa        0x3408(%eax),%xmm4
+  .byte  102,15,111,160,4,52,0,0             // movdqa        0x3404(%eax),%xmm4
   .byte  102,15,111,245                      // movdqa        %xmm5,%xmm6
   .byte  102,15,253,244                      // paddw         %xmm4,%xmm6
   .byte  102,15,249,117,72                   // psubw         0x48(%ebp),%xmm6
@@ -66347,17 +66514,17 @@
   .byte  131,236,96                          // sub           $0x60,%esp
   .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          9fd9 <_sk_plus__sse2_lowp+0x15>
+  .byte  232,0,0,0,0                         // call          a06d <_sk_plus__sse2_lowp+0x15>
   .byte  88                                  // pop           %eax
   .byte  102,15,253,77,24                    // paddw         0x18(%ebp),%xmm1
-  .byte  102,15,111,168,23,51,0,0            // movdqa        0x3317(%eax),%xmm5
+  .byte  102,15,111,168,19,51,0,0            // movdqa        0x3313(%eax),%xmm5
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,217,197                      // psubusw       %xmm5,%xmm0
   .byte  102,15,127,109,232                  // movdqa        %xmm5,-0x18(%ebp)
   .byte  102,15,239,255                      // pxor          %xmm7,%xmm7
   .byte  102,15,117,199                      // pcmpeqw       %xmm7,%xmm0
   .byte  102,15,219,200                      // pand          %xmm0,%xmm1
-  .byte  102,15,111,176,7,51,0,0             // movdqa        0x3307(%eax),%xmm6
+  .byte  102,15,111,176,3,51,0,0             // movdqa        0x3303(%eax),%xmm6
   .byte  102,15,223,198                      // pandn         %xmm6,%xmm0
   .byte  102,15,235,193                      // por           %xmm1,%xmm0
   .byte  102,15,253,101,40                   // paddw         0x28(%ebp),%xmm4
@@ -66418,14 +66585,14 @@
   .byte  131,236,80                          // sub           $0x50,%esp
   .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          a0d1 <_sk_screen_sse2_lowp+0x15>
+  .byte  232,0,0,0,0                         // call          a165 <_sk_screen_sse2_lowp+0x15>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,109,40                   // movdqa        0x28(%ebp),%xmm5
   .byte  102,15,111,117,24                   // movdqa        0x18(%ebp),%xmm6
   .byte  102,15,111,198                      // movdqa        %xmm6,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,206                      // pmullw        %xmm6,%xmm1
-  .byte  102,15,111,176,15,50,0,0            // movdqa        0x320f(%eax),%xmm6
+  .byte  102,15,111,176,11,50,0,0            // movdqa        0x320b(%eax),%xmm6
   .byte  102,15,253,206                      // paddw         %xmm6,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
@@ -66483,9 +66650,9 @@
   .byte  86                                  // push          %esi
   .byte  131,236,96                          // sub           $0x60,%esp
   .byte  102,15,127,93,232                   // movdqa        %xmm3,-0x18(%ebp)
-  .byte  232,0,0,0,0                         // call          a1b1 <_sk_xor__sse2_lowp+0x12>
+  .byte  232,0,0,0,0                         // call          a245 <_sk_xor__sse2_lowp+0x12>
   .byte  88                                  // pop           %eax
-  .byte  102,15,111,176,47,49,0,0            // movdqa        0x312f(%eax),%xmm6
+  .byte  102,15,111,176,43,49,0,0            // movdqa        0x312b(%eax),%xmm6
   .byte  102,15,111,254                      // movdqa        %xmm6,%xmm7
   .byte  102,15,249,125,72                   // psubw         0x48(%ebp),%xmm7
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
@@ -66552,7 +66719,7 @@
   .byte  15,41,85,200                        // movaps        %xmm2,-0x38(%ebp)
   .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          a2a6 <_sk_darken_sse2_lowp+0x25>
+  .byte  232,0,0,0,0                         // call          a33a <_sk_darken_sse2_lowp+0x25>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,117,72                   // movdqa        0x48(%ebp),%xmm6
   .byte  102,15,111,109,24                   // movdqa        0x18(%ebp),%xmm5
@@ -66563,7 +66730,7 @@
   .byte  102,15,111,222                      // movdqa        %xmm6,%xmm3
   .byte  102,15,111,197                      // movdqa        %xmm5,%xmm0
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,15,111,184,90,48,0,0            // movdqa        0x305a(%eax),%xmm7
+  .byte  102,15,111,184,86,48,0,0            // movdqa        0x3056(%eax),%xmm7
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
   .byte  102,15,239,247                      // pxor          %xmm7,%xmm6
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
@@ -66572,7 +66739,7 @@
   .byte  102,15,219,197                      // pand          %xmm5,%xmm0
   .byte  102,15,223,233                      // pandn         %xmm1,%xmm5
   .byte  102,15,235,232                      // por           %xmm0,%xmm5
-  .byte  102,15,111,128,58,48,0,0            // movdqa        0x303a(%eax),%xmm0
+  .byte  102,15,111,128,54,48,0,0            // movdqa        0x3036(%eax),%xmm0
   .byte  102,15,127,69,232                   // movdqa        %xmm0,-0x18(%ebp)
   .byte  102,15,253,232                      // paddw         %xmm0,%xmm5
   .byte  102,15,113,213,8                    // psrlw         $0x8,%xmm5
@@ -66663,7 +66830,7 @@
   .byte  15,41,85,200                        // movaps        %xmm2,-0x38(%ebp)
   .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          a44f <_sk_lighten_sse2_lowp+0x25>
+  .byte  232,0,0,0,0                         // call          a4e3 <_sk_lighten_sse2_lowp+0x25>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,109,24                   // movdqa        0x18(%ebp),%xmm5
   .byte  102,15,111,197                      // movdqa        %xmm5,%xmm0
@@ -66672,7 +66839,7 @@
   .byte  102,15,213,77,72                    // pmullw        0x48(%ebp),%xmm1
   .byte  102,15,111,197                      // movdqa        %xmm5,%xmm0
   .byte  102,15,213,198                      // pmullw        %xmm6,%xmm0
-  .byte  102,15,111,184,177,46,0,0           // movdqa        0x2eb1(%eax),%xmm7
+  .byte  102,15,111,184,173,46,0,0           // movdqa        0x2ead(%eax),%xmm7
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
   .byte  102,15,239,247                      // pxor          %xmm7,%xmm6
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
@@ -66681,7 +66848,7 @@
   .byte  102,15,219,205                      // pand          %xmm5,%xmm1
   .byte  102,15,223,232                      // pandn         %xmm0,%xmm5
   .byte  102,15,235,233                      // por           %xmm1,%xmm5
-  .byte  102,15,111,128,145,46,0,0           // movdqa        0x2e91(%eax),%xmm0
+  .byte  102,15,111,128,141,46,0,0           // movdqa        0x2e8d(%eax),%xmm0
   .byte  102,15,253,232                      // paddw         %xmm0,%xmm5
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  102,15,127,85,232                   // movdqa        %xmm2,-0x18(%ebp)
@@ -66771,7 +66938,7 @@
   .byte  15,41,85,184                        // movaps        %xmm2,-0x48(%ebp)
   .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          a5ed <_sk_difference_sse2_lowp+0x25>
+  .byte  232,0,0,0,0                         // call          a681 <_sk_difference_sse2_lowp+0x25>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,117,72                   // movdqa        0x48(%ebp),%xmm6
   .byte  102,15,111,109,24                   // movdqa        0x18(%ebp),%xmm5
@@ -66782,7 +66949,7 @@
   .byte  102,15,111,222                      // movdqa        %xmm6,%xmm3
   .byte  102,15,111,197                      // movdqa        %xmm5,%xmm0
   .byte  102,15,213,199                      // pmullw        %xmm7,%xmm0
-  .byte  102,15,111,184,19,45,0,0            // movdqa        0x2d13(%eax),%xmm7
+  .byte  102,15,111,184,15,45,0,0            // movdqa        0x2d0f(%eax),%xmm7
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
   .byte  102,15,239,247                      // pxor          %xmm7,%xmm6
   .byte  102,15,111,232                      // movdqa        %xmm0,%xmm5
@@ -66791,11 +66958,11 @@
   .byte  102,15,219,205                      // pand          %xmm5,%xmm1
   .byte  102,15,223,232                      // pandn         %xmm0,%xmm5
   .byte  102,15,235,233                      // por           %xmm1,%xmm5
-  .byte  102,15,111,128,243,44,0,0           // movdqa        0x2cf3(%eax),%xmm0
+  .byte  102,15,111,128,239,44,0,0           // movdqa        0x2cef(%eax),%xmm0
   .byte  102,15,127,69,216                   // movdqa        %xmm0,-0x28(%ebp)
   .byte  102,15,253,232                      // paddw         %xmm0,%xmm5
   .byte  102,15,113,213,7                    // psrlw         $0x7,%xmm5
-  .byte  102,15,111,128,35,45,0,0            // movdqa        0x2d23(%eax),%xmm0
+  .byte  102,15,111,128,31,45,0,0            // movdqa        0x2d1f(%eax),%xmm0
   .byte  102,15,127,69,232                   // movdqa        %xmm0,-0x18(%ebp)
   .byte  102,15,219,232                      // pand          %xmm0,%xmm5
   .byte  102,15,249,213                      // psubw         %xmm5,%xmm2
@@ -66884,16 +67051,16 @@
   .byte  131,236,80                          // sub           $0x50,%esp
   .byte  102,15,111,225                      // movdqa        %xmm1,%xmm4
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          a7a1 <_sk_exclusion_sse2_lowp+0x15>
+  .byte  232,0,0,0,0                         // call          a835 <_sk_exclusion_sse2_lowp+0x15>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,109,24                   // movdqa        0x18(%ebp),%xmm5
   .byte  102,15,111,197                      // movdqa        %xmm5,%xmm0
   .byte  102,15,253,193                      // paddw         %xmm1,%xmm0
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
-  .byte  102,15,111,184,63,43,0,0            // movdqa        0x2b3f(%eax),%xmm7
+  .byte  102,15,111,184,59,43,0,0            // movdqa        0x2b3b(%eax),%xmm7
   .byte  102,15,253,207                      // paddw         %xmm7,%xmm1
   .byte  102,15,113,209,7                    // psrlw         $0x7,%xmm1
-  .byte  102,15,111,176,111,43,0,0           // movdqa        0x2b6f(%eax),%xmm6
+  .byte  102,15,111,176,107,43,0,0           // movdqa        0x2b6b(%eax),%xmm6
   .byte  102,15,219,206                      // pand          %xmm6,%xmm1
   .byte  102,15,249,193                      // psubw         %xmm1,%xmm0
   .byte  102,15,111,109,40                   // movdqa        0x28(%ebp),%xmm5
@@ -66954,9 +67121,9 @@
   .byte  15,41,85,152                        // movaps        %xmm2,-0x68(%ebp)
   .byte  102,15,111,233                      // movdqa        %xmm1,%xmm5
   .byte  102,15,111,224                      // movdqa        %xmm0,%xmm4
-  .byte  232,0,0,0,0                         // call          a89b <_sk_hardlight_sse2_lowp+0x1c>
+  .byte  232,0,0,0,0                         // call          a92f <_sk_hardlight_sse2_lowp+0x1c>
   .byte  88                                  // pop           %eax
-  .byte  102,15,111,184,69,42,0,0            // movdqa        0x2a45(%eax),%xmm7
+  .byte  102,15,111,184,65,42,0,0            // movdqa        0x2a41(%eax),%xmm7
   .byte  102,15,127,125,200                  // movdqa        %xmm7,-0x38(%ebp)
   .byte  102,15,111,215                      // movdqa        %xmm7,%xmm2
   .byte  102,15,249,85,72                    // psubw         0x48(%ebp),%xmm2
@@ -66983,7 +67150,7 @@
   .byte  102,15,111,214                      // movdqa        %xmm6,%xmm2
   .byte  102,15,249,209                      // psubw         %xmm1,%xmm2
   .byte  102,15,253,228                      // paddw         %xmm4,%xmm4
-  .byte  102,15,111,128,101,42,0,0           // movdqa        0x2a65(%eax),%xmm0
+  .byte  102,15,111,128,97,42,0,0            // movdqa        0x2a61(%eax),%xmm0
   .byte  102,15,239,216                      // pxor          %xmm0,%xmm3
   .byte  102,15,127,93,184                   // movdqa        %xmm3,-0x48(%ebp)
   .byte  102,15,111,204                      // movdqa        %xmm4,%xmm1
@@ -67090,10 +67257,10 @@
   .byte  15,41,85,152                        // movaps        %xmm2,-0x68(%ebp)
   .byte  15,41,141,120,255,255,255           // movaps        %xmm1,-0x88(%ebp)
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          aabd <_sk_overlay_sse2_lowp+0x1f>
+  .byte  232,0,0,0,0                         // call          ab51 <_sk_overlay_sse2_lowp+0x1f>
   .byte  88                                  // pop           %eax
   .byte  102,15,111,69,72                    // movdqa        0x48(%ebp),%xmm0
-  .byte  102,15,111,184,35,40,0,0            // movdqa        0x2823(%eax),%xmm7
+  .byte  102,15,111,184,31,40,0,0            // movdqa        0x281f(%eax),%xmm7
   .byte  102,15,127,125,232                  // movdqa        %xmm7,-0x18(%ebp)
   .byte  102,15,111,215                      // movdqa        %xmm7,%xmm2
   .byte  102,15,249,208                      // psubw         %xmm0,%xmm2
@@ -67120,7 +67287,7 @@
   .byte  102,15,249,234                      // psubw         %xmm2,%xmm5
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,253,192                      // paddw         %xmm0,%xmm0
-  .byte  102,15,111,144,67,40,0,0            // movdqa        0x2843(%eax),%xmm2
+  .byte  102,15,111,144,63,40,0,0            // movdqa        0x283f(%eax),%xmm2
   .byte  102,15,127,85,184                   // movdqa        %xmm2,-0x48(%ebp)
   .byte  102,15,239,226                      // pxor          %xmm2,%xmm4
   .byte  102,15,239,194                      // pxor          %xmm2,%xmm0
@@ -67250,10 +67417,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          ad2c <_sk_load_8888_sse2_lowp+0x30>
+  .byte  232,0,0,0,0                         // call          adc0 <_sk_load_8888_sse2_lowp+0x30>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,32                              // ja            ad52 <_sk_load_8888_sse2_lowp+0x56>
+  .byte  119,32                              // ja            ade6 <_sk_load_8888_sse2_lowp+0x56>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,52,1,0,0                // mov           0x134(%edi,%ecx,4),%ecx
@@ -67262,14 +67429,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  243,15,16,28,179                    // movss         (%ebx,%esi,4),%xmm3
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
-  .byte  235,73                              // jmp           ad9b <_sk_load_8888_sse2_lowp+0x9f>
+  .byte  235,73                              // jmp           ae2f <_sk_load_8888_sse2_lowp+0x9f>
   .byte  102,15,16,28,179                    // movupd        (%ebx,%esi,4),%xmm3
   .byte  15,16,116,179,16                    // movups        0x10(%ebx,%esi,4),%xmm6
-  .byte  235,61                              // jmp           ad9b <_sk_load_8888_sse2_lowp+0x9f>
+  .byte  235,61                              // jmp           ae2f <_sk_load_8888_sse2_lowp+0x9f>
   .byte  102,15,110,68,179,8                 // movd          0x8(%ebx,%esi,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,15,18,28,179                    // movlpd        (%ebx,%esi,4),%xmm3
-  .byte  235,43                              // jmp           ad9b <_sk_load_8888_sse2_lowp+0x9f>
+  .byte  235,43                              // jmp           ae2f <_sk_load_8888_sse2_lowp+0x9f>
   .byte  102,15,110,68,179,24                // movd          0x18(%ebx,%esi,4),%xmm0
   .byte  102,15,112,240,69                   // pshufd        $0x45,%xmm0,%xmm6
   .byte  243,15,16,68,179,20                 // movss         0x14(%ebx,%esi,4),%xmm0
@@ -67286,7 +67453,7 @@
   .byte  102,15,114,240,16                   // pslld         $0x10,%xmm0
   .byte  102,15,114,224,16                   // psrad         $0x10,%xmm0
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,15,111,175,180,37,0,0           // movdqa        0x25b4(%edi),%xmm5
+  .byte  102,15,111,175,176,37,0,0           // movdqa        0x25b0(%edi),%xmm5
   .byte  102,15,111,193                      // movdqa        %xmm1,%xmm0
   .byte  102,15,219,197                      // pand          %xmm5,%xmm0
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -67366,10 +67533,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          aeb9 <_sk_load_8888_dst_sse2_lowp+0x3d>
+  .byte  232,0,0,0,0                         // call          af4d <_sk_load_8888_dst_sse2_lowp+0x3d>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,32                              // ja            aedf <_sk_load_8888_dst_sse2_lowp+0x63>
+  .byte  119,32                              // ja            af73 <_sk_load_8888_dst_sse2_lowp+0x63>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,59,1,0,0                // mov           0x13b(%edi,%ecx,4),%ecx
@@ -67378,14 +67545,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  243,15,16,60,179                    // movss         (%ebx,%esi,4),%xmm7
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,73                              // jmp           af28 <_sk_load_8888_dst_sse2_lowp+0xac>
+  .byte  235,73                              // jmp           afbc <_sk_load_8888_dst_sse2_lowp+0xac>
   .byte  102,15,16,60,179                    // movupd        (%ebx,%esi,4),%xmm7
   .byte  15,16,92,179,16                     // movups        0x10(%ebx,%esi,4),%xmm3
-  .byte  235,61                              // jmp           af28 <_sk_load_8888_dst_sse2_lowp+0xac>
+  .byte  235,61                              // jmp           afbc <_sk_load_8888_dst_sse2_lowp+0xac>
   .byte  102,15,110,84,179,8                 // movd          0x8(%ebx,%esi,4),%xmm2
   .byte  102,15,112,250,69                   // pshufd        $0x45,%xmm2,%xmm7
   .byte  102,15,18,60,179                    // movlpd        (%ebx,%esi,4),%xmm7
-  .byte  235,43                              // jmp           af28 <_sk_load_8888_dst_sse2_lowp+0xac>
+  .byte  235,43                              // jmp           afbc <_sk_load_8888_dst_sse2_lowp+0xac>
   .byte  102,15,110,84,179,24                // movd          0x18(%ebx,%esi,4),%xmm2
   .byte  102,15,112,218,69                   // pshufd        $0x45,%xmm2,%xmm3
   .byte  243,15,16,84,179,20                 // movss         0x14(%ebx,%esi,4),%xmm2
@@ -67402,7 +67569,7 @@
   .byte  102,15,114,242,16                   // pslld         $0x10,%xmm2
   .byte  102,15,114,226,16                   // psrad         $0x10,%xmm2
   .byte  102,15,107,242                      // packssdw      %xmm2,%xmm6
-  .byte  102,15,111,151,39,36,0,0            // movdqa        0x2427(%edi),%xmm2
+  .byte  102,15,111,151,35,36,0,0            // movdqa        0x2423(%edi),%xmm2
   .byte  102,15,111,206                      // movdqa        %xmm6,%xmm1
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  102,15,113,214,8                    // psrlw         $0x8,%xmm6
@@ -67496,19 +67663,19 @@
   .byte  128,227,7                           // and           $0x7,%bl
   .byte  254,203                             // dec           %bl
   .byte  128,251,6                           // cmp           $0x6,%bl
-  .byte  232,0,0,0,0                         // call          b084 <_sk_store_8888_sse2_lowp+0x74>
+  .byte  232,0,0,0,0                         // call          b118 <_sk_store_8888_sse2_lowp+0x74>
   .byte  89                                  // pop           %ecx
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
   .byte  15,40,109,40                        // movaps        0x28(%ebp),%xmm5
-  .byte  119,19                              // ja            b0a1 <_sk_store_8888_sse2_lowp+0x91>
+  .byte  119,19                              // ja            b135 <_sk_store_8888_sse2_lowp+0x91>
   .byte  15,182,219                          // movzbl        %bl,%ebx
   .byte  3,140,153,184,0,0,0                 // add           0xb8(%ecx,%ebx,4),%ecx
   .byte  255,225                             // jmp           *%ecx
   .byte  102,15,126,60,183                   // movd          %xmm7,(%edi,%esi,4)
-  .byte  235,93                              // jmp           b0fe <_sk_store_8888_sse2_lowp+0xee>
+  .byte  235,93                              // jmp           b192 <_sk_store_8888_sse2_lowp+0xee>
   .byte  243,15,127,60,183                   // movdqu        %xmm7,(%edi,%esi,4)
   .byte  243,15,127,116,183,16               // movdqu        %xmm6,0x10(%edi,%esi,4)
-  .byte  235,80                              // jmp           b0fe <_sk_store_8888_sse2_lowp+0xee>
+  .byte  235,80                              // jmp           b192 <_sk_store_8888_sse2_lowp+0xee>
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
   .byte  102,15,112,223,78                   // pshufd        $0x4e,%xmm7,%xmm3
@@ -67516,7 +67683,7 @@
   .byte  15,40,220                           // movaps        %xmm4,%xmm3
   .byte  102,15,111,230                      // movdqa        %xmm6,%xmm4
   .byte  102,15,214,60,183                   // movq          %xmm7,(%edi,%esi,4)
-  .byte  235,48                              // jmp           b0fe <_sk_store_8888_sse2_lowp+0xee>
+  .byte  235,48                              // jmp           b192 <_sk_store_8888_sse2_lowp+0xee>
   .byte  102,15,112,222,78                   // pshufd        $0x4e,%xmm6,%xmm3
   .byte  102,15,126,92,183,24                // movd          %xmm3,0x18(%edi,%esi,4)
   .byte  15,40,93,72                         // movaps        0x48(%ebp),%xmm3
@@ -67553,7 +67720,7 @@
   .byte  0,0                                 // add           %al,(%eax)
   .byte  42,0                                // sub           (%eax),%al
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  117,0                               // jne           b14a <_sk_store_8888_sse2_lowp+0x13a>
+  .byte  117,0                               // jne           b1de <_sk_store_8888_sse2_lowp+0x13a>
   .byte  0,0                                 // add           %al,(%eax)
   .byte  111                                 // outsl         %ds:(%esi),(%dx)
   .byte  0,0                                 // add           %al,(%eax)
@@ -67585,10 +67752,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          b188 <_sk_load_bgra_sse2_lowp+0x30>
+  .byte  232,0,0,0,0                         // call          b21c <_sk_load_bgra_sse2_lowp+0x30>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,32                              // ja            b1ae <_sk_load_bgra_sse2_lowp+0x56>
+  .byte  119,32                              // ja            b242 <_sk_load_bgra_sse2_lowp+0x56>
   .byte  102,15,239,246                      // pxor          %xmm6,%xmm6
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,52,1,0,0                // mov           0x134(%edi,%ecx,4),%ecx
@@ -67597,14 +67764,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  243,15,16,28,179                    // movss         (%ebx,%esi,4),%xmm3
   .byte  15,87,246                           // xorps         %xmm6,%xmm6
-  .byte  235,73                              // jmp           b1f7 <_sk_load_bgra_sse2_lowp+0x9f>
+  .byte  235,73                              // jmp           b28b <_sk_load_bgra_sse2_lowp+0x9f>
   .byte  102,15,16,28,179                    // movupd        (%ebx,%esi,4),%xmm3
   .byte  15,16,116,179,16                    // movups        0x10(%ebx,%esi,4),%xmm6
-  .byte  235,61                              // jmp           b1f7 <_sk_load_bgra_sse2_lowp+0x9f>
+  .byte  235,61                              // jmp           b28b <_sk_load_bgra_sse2_lowp+0x9f>
   .byte  102,15,110,68,179,8                 // movd          0x8(%ebx,%esi,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  102,15,18,28,179                    // movlpd        (%ebx,%esi,4),%xmm3
-  .byte  235,43                              // jmp           b1f7 <_sk_load_bgra_sse2_lowp+0x9f>
+  .byte  235,43                              // jmp           b28b <_sk_load_bgra_sse2_lowp+0x9f>
   .byte  102,15,110,68,179,24                // movd          0x18(%ebx,%esi,4),%xmm0
   .byte  102,15,112,240,69                   // pshufd        $0x45,%xmm0,%xmm6
   .byte  243,15,16,68,179,20                 // movss         0x14(%ebx,%esi,4),%xmm0
@@ -67621,7 +67788,7 @@
   .byte  102,15,114,240,16                   // pslld         $0x10,%xmm0
   .byte  102,15,114,224,16                   // psrad         $0x10,%xmm0
   .byte  102,15,107,200                      // packssdw      %xmm0,%xmm1
-  .byte  102,15,111,175,88,33,0,0            // movdqa        0x2158(%edi),%xmm5
+  .byte  102,15,111,175,84,33,0,0            // movdqa        0x2154(%edi),%xmm5
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,15,219,213                      // pand          %xmm5,%xmm2
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
@@ -67701,10 +67868,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          b315 <_sk_load_bgra_dst_sse2_lowp+0x3d>
+  .byte  232,0,0,0,0                         // call          b3a9 <_sk_load_bgra_dst_sse2_lowp+0x3d>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,32                              // ja            b33b <_sk_load_bgra_dst_sse2_lowp+0x63>
+  .byte  119,32                              // ja            b3cf <_sk_load_bgra_dst_sse2_lowp+0x63>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,59,1,0,0                // mov           0x13b(%edi,%ecx,4),%ecx
@@ -67713,14 +67880,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  243,15,16,60,179                    // movss         (%ebx,%esi,4),%xmm7
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,73                              // jmp           b384 <_sk_load_bgra_dst_sse2_lowp+0xac>
+  .byte  235,73                              // jmp           b418 <_sk_load_bgra_dst_sse2_lowp+0xac>
   .byte  102,15,16,60,179                    // movupd        (%ebx,%esi,4),%xmm7
   .byte  15,16,92,179,16                     // movups        0x10(%ebx,%esi,4),%xmm3
-  .byte  235,61                              // jmp           b384 <_sk_load_bgra_dst_sse2_lowp+0xac>
+  .byte  235,61                              // jmp           b418 <_sk_load_bgra_dst_sse2_lowp+0xac>
   .byte  102,15,110,84,179,8                 // movd          0x8(%ebx,%esi,4),%xmm2
   .byte  102,15,112,250,69                   // pshufd        $0x45,%xmm2,%xmm7
   .byte  102,15,18,60,179                    // movlpd        (%ebx,%esi,4),%xmm7
-  .byte  235,43                              // jmp           b384 <_sk_load_bgra_dst_sse2_lowp+0xac>
+  .byte  235,43                              // jmp           b418 <_sk_load_bgra_dst_sse2_lowp+0xac>
   .byte  102,15,110,84,179,24                // movd          0x18(%ebx,%esi,4),%xmm2
   .byte  102,15,112,218,69                   // pshufd        $0x45,%xmm2,%xmm3
   .byte  243,15,16,84,179,20                 // movss         0x14(%ebx,%esi,4),%xmm2
@@ -67737,7 +67904,7 @@
   .byte  102,15,114,242,16                   // pslld         $0x10,%xmm2
   .byte  102,15,114,226,16                   // psrad         $0x10,%xmm2
   .byte  102,15,107,242                      // packssdw      %xmm2,%xmm6
-  .byte  102,15,111,151,203,31,0,0           // movdqa        0x1fcb(%edi),%xmm2
+  .byte  102,15,111,151,199,31,0,0           // movdqa        0x1fc7(%edi),%xmm2
   .byte  102,15,111,206                      // movdqa        %xmm6,%xmm1
   .byte  102,15,219,202                      // pand          %xmm2,%xmm1
   .byte  102,15,113,214,8                    // psrlw         $0x8,%xmm6
@@ -67831,19 +67998,19 @@
   .byte  128,227,7                           // and           $0x7,%bl
   .byte  254,203                             // dec           %bl
   .byte  128,251,6                           // cmp           $0x6,%bl
-  .byte  232,0,0,0,0                         // call          b4e0 <_sk_store_bgra_sse2_lowp+0x74>
+  .byte  232,0,0,0,0                         // call          b574 <_sk_store_bgra_sse2_lowp+0x74>
   .byte  89                                  // pop           %ecx
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
   .byte  15,40,109,40                        // movaps        0x28(%ebp),%xmm5
-  .byte  119,19                              // ja            b4fd <_sk_store_bgra_sse2_lowp+0x91>
+  .byte  119,19                              // ja            b591 <_sk_store_bgra_sse2_lowp+0x91>
   .byte  15,182,219                          // movzbl        %bl,%ebx
   .byte  3,140,153,184,0,0,0                 // add           0xb8(%ecx,%ebx,4),%ecx
   .byte  255,225                             // jmp           *%ecx
   .byte  102,15,126,60,183                   // movd          %xmm7,(%edi,%esi,4)
-  .byte  235,93                              // jmp           b55a <_sk_store_bgra_sse2_lowp+0xee>
+  .byte  235,93                              // jmp           b5ee <_sk_store_bgra_sse2_lowp+0xee>
   .byte  243,15,127,60,183                   // movdqu        %xmm7,(%edi,%esi,4)
   .byte  243,15,127,116,183,16               // movdqu        %xmm6,0x10(%edi,%esi,4)
-  .byte  235,80                              // jmp           b55a <_sk_store_bgra_sse2_lowp+0xee>
+  .byte  235,80                              // jmp           b5ee <_sk_store_bgra_sse2_lowp+0xee>
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  15,40,227                           // movaps        %xmm3,%xmm4
   .byte  102,15,112,223,78                   // pshufd        $0x4e,%xmm7,%xmm3
@@ -67851,7 +68018,7 @@
   .byte  15,40,220                           // movaps        %xmm4,%xmm3
   .byte  102,15,111,230                      // movdqa        %xmm6,%xmm4
   .byte  102,15,214,60,183                   // movq          %xmm7,(%edi,%esi,4)
-  .byte  235,48                              // jmp           b55a <_sk_store_bgra_sse2_lowp+0xee>
+  .byte  235,48                              // jmp           b5ee <_sk_store_bgra_sse2_lowp+0xee>
   .byte  102,15,112,222,78                   // pshufd        $0x4e,%xmm6,%xmm3
   .byte  102,15,126,92,183,24                // movd          %xmm3,0x18(%edi,%esi,4)
   .byte  15,40,93,72                         // movaps        0x48(%ebp),%xmm3
@@ -67888,7 +68055,7 @@
   .byte  0,0                                 // add           %al,(%eax)
   .byte  42,0                                // sub           (%eax),%al
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  117,0                               // jne           b5a6 <_sk_store_bgra_sse2_lowp+0x13a>
+  .byte  117,0                               // jne           b63a <_sk_store_bgra_sse2_lowp+0x13a>
   .byte  0,0                                 // add           %al,(%eax)
   .byte  111                                 // outsl         %ds:(%esi),(%dx)
   .byte  0,0                                 // add           %al,(%eax)
@@ -67923,10 +68090,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          b5ef <_sk_load_565_sse2_lowp+0x3b>
+  .byte  232,0,0,0,0                         // call          b683 <_sk_load_565_sse2_lowp+0x3b>
   .byte  94                                  // pop           %esi
   .byte  139,125,16                          // mov           0x10(%ebp),%edi
-  .byte  119,28                              // ja            b611 <_sk_load_565_sse2_lowp+0x5d>
+  .byte  119,28                              // ja            b6a5 <_sk_load_565_sse2_lowp+0x5d>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,142,245,0,0,0               // mov           0xf5(%esi,%ecx,4),%ecx
@@ -67934,14 +68101,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,183,12,123                       // movzwl        (%ebx,%edi,2),%ecx
   .byte  102,15,110,193                      // movd          %ecx,%xmm0
-  .byte  235,59                              // jmp           b64c <_sk_load_565_sse2_lowp+0x98>
+  .byte  235,59                              // jmp           b6e0 <_sk_load_565_sse2_lowp+0x98>
   .byte  243,15,111,4,123                    // movdqu        (%ebx,%edi,2),%xmm0
-  .byte  235,52                              // jmp           b64c <_sk_load_565_sse2_lowp+0x98>
+  .byte  235,52                              // jmp           b6e0 <_sk_load_565_sse2_lowp+0x98>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,68,123,4,2               // pinsrw        $0x2,0x4(%ebx,%edi,2),%xmm0
   .byte  243,15,16,12,123                    // movss         (%ebx,%edi,2),%xmm1
   .byte  243,15,16,193                       // movss         %xmm1,%xmm0
-  .byte  235,30                              // jmp           b64c <_sk_load_565_sse2_lowp+0x98>
+  .byte  235,30                              // jmp           b6e0 <_sk_load_565_sse2_lowp+0x98>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,68,123,12,6              // pinsrw        $0x6,0xc(%ebx,%edi,2),%xmm0
   .byte  102,15,196,68,123,10,5              // pinsrw        $0x5,0xa(%ebx,%edi,2),%xmm0
@@ -67949,11 +68116,11 @@
   .byte  102,15,18,4,123                     // movlpd        (%ebx,%edi,2),%xmm0
   .byte  102,15,111,248                      // movdqa        %xmm0,%xmm7
   .byte  102,15,113,215,8                    // psrlw         $0x8,%xmm7
-  .byte  102,15,219,190,49,29,0,0            // pand          0x1d31(%esi),%xmm7
+  .byte  102,15,219,190,45,29,0,0            // pand          0x1d2d(%esi),%xmm7
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,113,209,5                    // psrlw         $0x5,%xmm1
-  .byte  102,15,219,142,65,29,0,0            // pand          0x1d41(%esi),%xmm1
-  .byte  102,15,111,150,81,29,0,0            // movdqa        0x1d51(%esi),%xmm2
+  .byte  102,15,219,142,61,29,0,0            // pand          0x1d3d(%esi),%xmm1
+  .byte  102,15,111,150,77,29,0,0            // movdqa        0x1d4d(%esi),%xmm2
   .byte  102,15,219,208                      // pand          %xmm0,%xmm2
   .byte  102,15,113,208,13                   // psrlw         $0xd,%xmm0
   .byte  102,15,235,199                      // por           %xmm7,%xmm0
@@ -67975,7 +68142,7 @@
   .byte  137,124,36,8                        // mov           %edi,0x8(%esp)
   .byte  137,76,36,4                         // mov           %ecx,0x4(%esp)
   .byte  137,20,36                           // mov           %edx,(%esp)
-  .byte  15,40,158,241,28,0,0                // movaps        0x1cf1(%esi),%xmm3
+  .byte  15,40,158,237,28,0,0                // movaps        0x1ced(%esi),%xmm3
   .byte  255,80,4                            // call          *0x4(%eax)
   .byte  131,196,92                          // add           $0x5c,%esp
   .byte  94                                  // pop           %esi
@@ -68021,10 +68188,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          b72b <_sk_load_565_dst_sse2_lowp+0x2b>
+  .byte  232,0,0,0,0                         // call          b7bf <_sk_load_565_dst_sse2_lowp+0x2b>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            b74d <_sk_load_565_dst_sse2_lowp+0x4d>
+  .byte  119,28                              // ja            b7e1 <_sk_load_565_dst_sse2_lowp+0x4d>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,249,0,0,0               // mov           0xf9(%edi,%ecx,4),%ecx
@@ -68032,14 +68199,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,183,12,115                       // movzwl        (%ebx,%esi,2),%ecx
   .byte  102,15,110,225                      // movd          %ecx,%xmm4
-  .byte  235,59                              // jmp           b788 <_sk_load_565_dst_sse2_lowp+0x88>
+  .byte  235,59                              // jmp           b81c <_sk_load_565_dst_sse2_lowp+0x88>
   .byte  243,15,111,36,115                   // movdqu        (%ebx,%esi,2),%xmm4
-  .byte  235,52                              // jmp           b788 <_sk_load_565_dst_sse2_lowp+0x88>
+  .byte  235,52                              // jmp           b81c <_sk_load_565_dst_sse2_lowp+0x88>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,100,115,4,2              // pinsrw        $0x2,0x4(%ebx,%esi,2),%xmm4
   .byte  243,15,16,44,115                    // movss         (%ebx,%esi,2),%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,30                              // jmp           b788 <_sk_load_565_dst_sse2_lowp+0x88>
+  .byte  235,30                              // jmp           b81c <_sk_load_565_dst_sse2_lowp+0x88>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,100,115,12,6             // pinsrw        $0x6,0xc(%ebx,%esi,2),%xmm4
   .byte  102,15,196,100,115,10,5             // pinsrw        $0x5,0xa(%ebx,%esi,2),%xmm4
@@ -68047,11 +68214,11 @@
   .byte  102,15,18,36,115                    // movlpd        (%ebx,%esi,2),%xmm4
   .byte  102,15,111,244                      // movdqa        %xmm4,%xmm6
   .byte  102,15,113,214,8                    // psrlw         $0x8,%xmm6
-  .byte  102,15,219,183,245,27,0,0           // pand          0x1bf5(%edi),%xmm6
+  .byte  102,15,219,183,241,27,0,0           // pand          0x1bf1(%edi),%xmm6
   .byte  102,15,111,236                      // movdqa        %xmm4,%xmm5
   .byte  102,15,113,213,5                    // psrlw         $0x5,%xmm5
-  .byte  102,15,219,175,5,28,0,0             // pand          0x1c05(%edi),%xmm5
-  .byte  102,15,111,191,21,28,0,0            // movdqa        0x1c15(%edi),%xmm7
+  .byte  102,15,219,175,1,28,0,0             // pand          0x1c01(%edi),%xmm5
+  .byte  102,15,111,191,17,28,0,0            // movdqa        0x1c11(%edi),%xmm7
   .byte  102,15,219,252                      // pand          %xmm4,%xmm7
   .byte  102,15,113,212,13                   // psrlw         $0xd,%xmm4
   .byte  102,15,235,230                      // por           %xmm6,%xmm4
@@ -68064,7 +68231,7 @@
   .byte  102,15,113,215,2                    // psrlw         $0x2,%xmm7
   .byte  102,15,235,254                      // por           %xmm6,%xmm7
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
-  .byte  15,40,183,181,27,0,0                // movaps        0x1bb5(%edi),%xmm6
+  .byte  15,40,183,177,27,0,0                // movaps        0x1bb1(%edi),%xmm6
   .byte  15,41,116,36,64                     // movaps        %xmm6,0x40(%esp)
   .byte  139,125,20                          // mov           0x14(%ebp),%edi
   .byte  137,124,36,12                       // mov           %edi,0xc(%esp)
@@ -68109,15 +68276,15 @@
   .byte  86                                  // push          %esi
   .byte  131,236,92                          // sub           $0x5c,%esp
   .byte  102,15,111,226                      // movdqa        %xmm2,%xmm4
-  .byte  232,0,0,0,0                         // call          b852 <_sk_store_565_sse2_lowp+0x12>
+  .byte  232,0,0,0,0                         // call          b8e6 <_sk_store_565_sse2_lowp+0x12>
   .byte  95                                  // pop           %edi
   .byte  15,40,109,72                        // movaps        0x48(%ebp),%xmm5
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  102,15,113,242,8                    // psllw         $0x8,%xmm2
-  .byte  102,15,219,151,254,26,0,0           // pand          0x1afe(%edi),%xmm2
+  .byte  102,15,219,151,250,26,0,0           // pand          0x1afa(%edi),%xmm2
   .byte  102,15,111,241                      // movdqa        %xmm1,%xmm6
   .byte  102,15,113,246,3                    // psllw         $0x3,%xmm6
-  .byte  102,15,219,183,14,27,0,0            // pand          0x1b0e(%edi),%xmm6
+  .byte  102,15,219,183,10,27,0,0            // pand          0x1b0a(%edi),%xmm6
   .byte  102,15,235,242                      // por           %xmm2,%xmm6
   .byte  102,15,111,212                      // movdqa        %xmm4,%xmm2
   .byte  102,15,113,210,3                    // psrlw         $0x3,%xmm2
@@ -68136,19 +68303,19 @@
   .byte  128,249,6                           // cmp           $0x6,%cl
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
   .byte  15,40,125,24                        // movaps        0x18(%ebp),%xmm7
-  .byte  119,22                              // ja            b8ca <_sk_store_565_sse2_lowp+0x8a>
+  .byte  119,22                              // ja            b95e <_sk_store_565_sse2_lowp+0x8a>
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  3,188,143,242,0,0,0                 // add           0xf2(%edi,%ecx,4),%edi
   .byte  255,231                             // jmp           *%edi
   .byte  102,15,126,209                      // movd          %xmm2,%ecx
   .byte  102,137,12,115                      // mov           %cx,(%ebx,%esi,2)
-  .byte  235,59                              // jmp           b905 <_sk_store_565_sse2_lowp+0xc5>
+  .byte  235,59                              // jmp           b999 <_sk_store_565_sse2_lowp+0xc5>
   .byte  243,15,127,20,115                   // movdqu        %xmm2,(%ebx,%esi,2)
-  .byte  235,52                              // jmp           b905 <_sk_store_565_sse2_lowp+0xc5>
+  .byte  235,52                              // jmp           b999 <_sk_store_565_sse2_lowp+0xc5>
   .byte  102,15,197,202,2                    // pextrw        $0x2,%xmm2,%ecx
   .byte  102,137,76,115,4                    // mov           %cx,0x4(%ebx,%esi,2)
   .byte  102,15,126,20,115                   // movd          %xmm2,(%ebx,%esi,2)
-  .byte  235,35                              // jmp           b905 <_sk_store_565_sse2_lowp+0xc5>
+  .byte  235,35                              // jmp           b999 <_sk_store_565_sse2_lowp+0xc5>
   .byte  102,15,197,202,6                    // pextrw        $0x6,%xmm2,%ecx
   .byte  102,137,76,115,12                   // mov           %cx,0xc(%ebx,%esi,2)
   .byte  102,15,197,202,5                    // pextrw        $0x5,%xmm2,%ecx
@@ -68210,10 +68377,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          b99a <_sk_load_a8_sse2_lowp+0x3a>
+  .byte  232,0,0,0,0                         // call          ba2e <_sk_load_a8_sse2_lowp+0x3a>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            b9bc <_sk_load_a8_sse2_lowp+0x5c>
+  .byte  119,28                              // ja            ba50 <_sk_load_a8_sse2_lowp+0x5c>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,198,0,0,0               // mov           0xc6(%edi,%ecx,4),%ecx
@@ -68221,10 +68388,10 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,182,12,51                        // movzbl        (%ebx,%esi,1),%ecx
   .byte  102,15,110,217                      // movd          %ecx,%xmm3
-  .byte  235,90                              // jmp           ba16 <_sk_load_a8_sse2_lowp+0xb6>
+  .byte  235,90                              // jmp           baaa <_sk_load_a8_sse2_lowp+0xb6>
   .byte  243,15,126,28,51                    // movq          (%ebx,%esi,1),%xmm3
   .byte  102,15,96,216                       // punpcklbw     %xmm0,%xmm3
-  .byte  235,79                              // jmp           ba16 <_sk_load_a8_sse2_lowp+0xb6>
+  .byte  235,79                              // jmp           baaa <_sk_load_a8_sse2_lowp+0xb6>
   .byte  15,182,76,51,2                      // movzbl        0x2(%ebx,%esi,1),%ecx
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,217,2                    // pinsrw        $0x2,%ecx,%xmm3
@@ -68232,7 +68399,7 @@
   .byte  102,15,110,233                      // movd          %ecx,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,221                       // movss         %xmm5,%xmm3
-  .byte  235,47                              // jmp           ba16 <_sk_load_a8_sse2_lowp+0xb6>
+  .byte  235,47                              // jmp           baaa <_sk_load_a8_sse2_lowp+0xb6>
   .byte  15,182,76,51,6                      // movzbl        0x6(%ebx,%esi,1),%ecx
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,217,6                    // pinsrw        $0x6,%ecx,%xmm3
@@ -68243,7 +68410,7 @@
   .byte  102,15,110,44,51                    // movd          (%ebx,%esi,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,221                       // movsd         %xmm5,%xmm3
-  .byte  102,15,219,159,70,25,0,0            // pand          0x1946(%edi),%xmm3
+  .byte  102,15,219,159,66,25,0,0            // pand          0x1942(%edi),%xmm3
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  15,41,100,36,64                     // movaps        %xmm4,0x40(%esp)
   .byte  15,41,84,36,48                      // movaps        %xmm2,0x30(%esp)
@@ -68298,10 +68465,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          baa5 <_sk_load_a8_dst_sse2_lowp+0x29>
+  .byte  232,0,0,0,0                         // call          bb39 <_sk_load_a8_dst_sse2_lowp+0x29>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            bac7 <_sk_load_a8_dst_sse2_lowp+0x4b>
+  .byte  119,28                              // ja            bb5b <_sk_load_a8_dst_sse2_lowp+0x4b>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,195,0,0,0               // mov           0xc3(%edi,%ecx,4),%ecx
@@ -68309,10 +68476,10 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,182,12,51                        // movzbl        (%ebx,%esi,1),%ecx
   .byte  102,15,110,225                      // movd          %ecx,%xmm4
-  .byte  235,90                              // jmp           bb21 <_sk_load_a8_dst_sse2_lowp+0xa5>
+  .byte  235,90                              // jmp           bbb5 <_sk_load_a8_dst_sse2_lowp+0xa5>
   .byte  243,15,126,36,51                    // movq          (%ebx,%esi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
-  .byte  235,79                              // jmp           bb21 <_sk_load_a8_dst_sse2_lowp+0xa5>
+  .byte  235,79                              // jmp           bbb5 <_sk_load_a8_dst_sse2_lowp+0xa5>
   .byte  15,182,76,51,2                      // movzbl        0x2(%ebx,%esi,1),%ecx
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,225,2                    // pinsrw        $0x2,%ecx,%xmm4
@@ -68320,7 +68487,7 @@
   .byte  102,15,110,233                      // movd          %ecx,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,47                              // jmp           bb21 <_sk_load_a8_dst_sse2_lowp+0xa5>
+  .byte  235,47                              // jmp           bbb5 <_sk_load_a8_dst_sse2_lowp+0xa5>
   .byte  15,182,76,51,6                      // movzbl        0x6(%ebx,%esi,1),%ecx
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,225,6                    // pinsrw        $0x6,%ecx,%xmm4
@@ -68331,7 +68498,7 @@
   .byte  102,15,110,44,51                    // movd          (%ebx,%esi,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  102,15,219,167,59,24,0,0            // pand          0x183b(%edi),%xmm4
+  .byte  102,15,219,167,55,24,0,0            // pand          0x1837(%edi),%xmm4
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  102,15,127,100,36,64                // movdqa        %xmm4,0x40(%esp)
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
@@ -68388,32 +68555,32 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          bbbd <_sk_store_a8_sse2_lowp+0x39>
+  .byte  232,0,0,0,0                         // call          bc51 <_sk_store_a8_sse2_lowp+0x39>
   .byte  91                                  // pop           %ebx
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,26                              // ja            bbdd <_sk_store_a8_sse2_lowp+0x59>
+  .byte  119,26                              // ja            bc71 <_sk_store_a8_sse2_lowp+0x59>
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,139,223,0,0,0               // mov           0xdf(%ebx,%ecx,4),%ecx
   .byte  1,217                               // add           %ebx,%ecx
   .byte  255,225                             // jmp           *%ecx
   .byte  102,15,126,217                      // movd          %xmm3,%ecx
   .byte  136,12,55                           // mov           %cl,(%edi,%esi,1)
-  .byte  233,136,0,0,0                       // jmp           bc65 <_sk_store_a8_sse2_lowp+0xe1>
-  .byte  102,15,111,163,35,23,0,0            // movdqa        0x1723(%ebx),%xmm4
+  .byte  233,136,0,0,0                       // jmp           bcf9 <_sk_store_a8_sse2_lowp+0xe1>
+  .byte  102,15,111,163,31,23,0,0            // movdqa        0x171f(%ebx),%xmm4
   .byte  102,15,219,227                      // pand          %xmm3,%xmm4
   .byte  102,15,103,228                      // packuswb      %xmm4,%xmm4
   .byte  102,15,214,36,55                    // movq          %xmm4,(%edi,%esi,1)
   .byte  15,40,101,24                        // movaps        0x18(%ebp),%xmm4
-  .byte  235,109                             // jmp           bc65 <_sk_store_a8_sse2_lowp+0xe1>
+  .byte  235,109                             // jmp           bcf9 <_sk_store_a8_sse2_lowp+0xe1>
   .byte  102,15,197,203,2                    // pextrw        $0x2,%xmm3,%ecx
   .byte  136,76,55,2                         // mov           %cl,0x2(%edi,%esi,1)
-  .byte  102,15,111,163,35,23,0,0            // movdqa        0x1723(%ebx),%xmm4
+  .byte  102,15,111,163,31,23,0,0            // movdqa        0x171f(%ebx),%xmm4
   .byte  102,15,219,227                      // pand          %xmm3,%xmm4
   .byte  102,15,103,228                      // packuswb      %xmm4,%xmm4
   .byte  102,15,126,225                      // movd          %xmm4,%ecx
   .byte  15,40,101,24                        // movaps        0x18(%ebp),%xmm4
   .byte  102,137,12,55                       // mov           %cx,(%edi,%esi,1)
-  .byte  235,70                              // jmp           bc65 <_sk_store_a8_sse2_lowp+0xe1>
+  .byte  235,70                              // jmp           bcf9 <_sk_store_a8_sse2_lowp+0xe1>
   .byte  102,15,197,203,6                    // pextrw        $0x6,%xmm3,%ecx
   .byte  136,76,55,6                         // mov           %cl,0x6(%edi,%esi,1)
   .byte  102,15,197,203,5                    // pextrw        $0x5,%xmm3,%ecx
@@ -68423,7 +68590,7 @@
   .byte  15,40,254                           // movaps        %xmm6,%xmm7
   .byte  15,40,245                           // movaps        %xmm5,%xmm6
   .byte  15,40,236                           // movaps        %xmm4,%xmm5
-  .byte  102,15,111,163,35,23,0,0            // movdqa        0x1723(%ebx),%xmm4
+  .byte  102,15,111,163,31,23,0,0            // movdqa        0x171f(%ebx),%xmm4
   .byte  102,15,219,227                      // pand          %xmm3,%xmm4
   .byte  102,15,103,228                      // packuswb      %xmm4,%xmm4
   .byte  102,15,126,36,55                    // movd          %xmm4,(%edi,%esi,1)
@@ -68457,7 +68624,7 @@
   .byte  0,0                                 // add           %al,(%eax)
   .byte  0,125,0                             // add           %bh,0x0(%ebp)
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  116,0                               // je            bcae <_sk_store_a8_sse2_lowp+0x12a>
+  .byte  116,0                               // je            bd42 <_sk_store_a8_sse2_lowp+0x12a>
   .byte  0,0                                 // add           %al,(%eax)
   .byte  107,0,0                             // imul          $0x0,(%eax),%eax
   .byte  0,98,0                              // add           %ah,0x0(%edx)
@@ -68487,10 +68654,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          bcf1 <_sk_load_g8_sse2_lowp+0x39>
+  .byte  232,0,0,0,0                         // call          bd85 <_sk_load_g8_sse2_lowp+0x39>
   .byte  94                                  // pop           %esi
   .byte  139,125,16                          // mov           0x10(%ebp),%edi
-  .byte  119,28                              // ja            bd13 <_sk_load_g8_sse2_lowp+0x5b>
+  .byte  119,28                              // ja            bda7 <_sk_load_g8_sse2_lowp+0x5b>
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,142,199,0,0,0               // mov           0xc7(%esi,%ecx,4),%ecx
@@ -68498,10 +68665,10 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,182,12,59                        // movzbl        (%ebx,%edi,1),%ecx
   .byte  102,15,110,193                      // movd          %ecx,%xmm0
-  .byte  235,90                              // jmp           bd6d <_sk_load_g8_sse2_lowp+0xb5>
+  .byte  235,90                              // jmp           be01 <_sk_load_g8_sse2_lowp+0xb5>
   .byte  243,15,126,4,59                     // movq          (%ebx,%edi,1),%xmm0
   .byte  102,15,96,192                       // punpcklbw     %xmm0,%xmm0
-  .byte  235,79                              // jmp           bd6d <_sk_load_g8_sse2_lowp+0xb5>
+  .byte  235,79                              // jmp           be01 <_sk_load_g8_sse2_lowp+0xb5>
   .byte  15,182,76,59,2                      // movzbl        0x2(%ebx,%edi,1),%ecx
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,193,2                    // pinsrw        $0x2,%ecx,%xmm0
@@ -68509,7 +68676,7 @@
   .byte  102,15,110,233                      // movd          %ecx,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,197                       // movss         %xmm5,%xmm0
-  .byte  235,47                              // jmp           bd6d <_sk_load_g8_sse2_lowp+0xb5>
+  .byte  235,47                              // jmp           be01 <_sk_load_g8_sse2_lowp+0xb5>
   .byte  15,182,76,59,6                      // movzbl        0x6(%ebx,%edi,1),%ecx
   .byte  102,15,239,192                      // pxor          %xmm0,%xmm0
   .byte  102,15,196,193,6                    // pinsrw        $0x6,%ecx,%xmm0
@@ -68520,7 +68687,7 @@
   .byte  102,15,110,44,59                    // movd          (%ebx,%edi,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,197                       // movsd         %xmm5,%xmm0
-  .byte  102,15,219,134,239,21,0,0           // pand          0x15ef(%esi),%xmm0
+  .byte  102,15,219,134,235,21,0,0           // pand          0x15eb(%esi),%xmm0
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
   .byte  15,41,100,36,64                     // movaps        %xmm4,0x40(%esp)
   .byte  15,41,92,36,48                      // movaps        %xmm3,0x30(%esp)
@@ -68531,7 +68698,7 @@
   .byte  137,124,36,8                        // mov           %edi,0x8(%esp)
   .byte  137,76,36,4                         // mov           %ecx,0x4(%esp)
   .byte  137,20,36                           // mov           %edx,(%esp)
-  .byte  15,40,158,239,21,0,0                // movaps        0x15ef(%esi),%xmm3
+  .byte  15,40,158,235,21,0,0                // movaps        0x15eb(%esi),%xmm3
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,111,208                      // movdqa        %xmm0,%xmm2
   .byte  255,80,4                            // call          *0x4(%eax)
@@ -68574,10 +68741,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          bdfd <_sk_load_g8_dst_sse2_lowp+0x29>
+  .byte  232,0,0,0,0                         // call          be91 <_sk_load_g8_dst_sse2_lowp+0x29>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            be1f <_sk_load_g8_dst_sse2_lowp+0x4b>
+  .byte  119,28                              // ja            beb3 <_sk_load_g8_dst_sse2_lowp+0x4b>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,195,0,0,0               // mov           0xc3(%edi,%ecx,4),%ecx
@@ -68585,10 +68752,10 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,182,12,51                        // movzbl        (%ebx,%esi,1),%ecx
   .byte  102,15,110,225                      // movd          %ecx,%xmm4
-  .byte  235,90                              // jmp           be79 <_sk_load_g8_dst_sse2_lowp+0xa5>
+  .byte  235,90                              // jmp           bf0d <_sk_load_g8_dst_sse2_lowp+0xa5>
   .byte  243,15,126,36,51                    // movq          (%ebx,%esi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
-  .byte  235,79                              // jmp           be79 <_sk_load_g8_dst_sse2_lowp+0xa5>
+  .byte  235,79                              // jmp           bf0d <_sk_load_g8_dst_sse2_lowp+0xa5>
   .byte  15,182,76,51,2                      // movzbl        0x2(%ebx,%esi,1),%ecx
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,225,2                    // pinsrw        $0x2,%ecx,%xmm4
@@ -68596,7 +68763,7 @@
   .byte  102,15,110,233                      // movd          %ecx,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,47                              // jmp           be79 <_sk_load_g8_dst_sse2_lowp+0xa5>
+  .byte  235,47                              // jmp           bf0d <_sk_load_g8_dst_sse2_lowp+0xa5>
   .byte  15,182,76,51,6                      // movzbl        0x6(%ebx,%esi,1),%ecx
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,225,6                    // pinsrw        $0x6,%ecx,%xmm4
@@ -68607,9 +68774,9 @@
   .byte  102,15,110,44,51                    // movd          (%ebx,%esi,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  102,15,219,167,227,20,0,0           // pand          0x14e3(%edi),%xmm4
+  .byte  102,15,219,167,223,20,0,0           // pand          0x14df(%edi),%xmm4
   .byte  141,72,8                            // lea           0x8(%eax),%ecx
-  .byte  15,40,175,227,20,0,0                // movaps        0x14e3(%edi),%xmm5
+  .byte  15,40,175,223,20,0,0                // movaps        0x14df(%edi),%xmm5
   .byte  15,41,108,36,64                     // movaps        %xmm5,0x40(%esp)
   .byte  102,15,127,100,36,48                // movdqa        %xmm4,0x30(%esp)
   .byte  102,15,127,100,36,32                // movdqa        %xmm4,0x20(%esp)
@@ -68650,7 +68817,7 @@
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
-  .byte  232,0,0,0,0                         // call          beed <_sk_luminance_to_alpha_sse2_lowp+0x11>
+  .byte  232,0,0,0,0                         // call          bf81 <_sk_luminance_to_alpha_sse2_lowp+0x11>
   .byte  88                                  // pop           %eax
   .byte  139,77,8                            // mov           0x8(%ebp),%ecx
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
@@ -68660,10 +68827,10 @@
   .byte  15,40,109,56                        // movaps        0x38(%ebp),%xmm5
   .byte  15,40,117,72                        // movaps        0x48(%ebp),%xmm6
   .byte  139,125,12                          // mov           0xc(%ebp),%edi
-  .byte  102,15,213,128,131,20,0,0           // pmullw        0x1483(%eax),%xmm0
-  .byte  102,15,213,136,147,20,0,0           // pmullw        0x1493(%eax),%xmm1
+  .byte  102,15,213,128,127,20,0,0           // pmullw        0x147f(%eax),%xmm0
+  .byte  102,15,213,136,143,20,0,0           // pmullw        0x148f(%eax),%xmm1
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
-  .byte  102,15,213,152,163,20,0,0           // pmullw        0x14a3(%eax),%xmm3
+  .byte  102,15,213,152,159,20,0,0           // pmullw        0x149f(%eax),%xmm3
   .byte  102,15,253,217                      // paddw         %xmm1,%xmm3
   .byte  102,15,113,211,8                    // psrlw         $0x8,%xmm3
   .byte  141,71,4                            // lea           0x4(%edi),%eax
@@ -68694,15 +68861,15 @@
   .byte  87                                  // push          %edi
   .byte  86                                  // push          %esi
   .byte  131,236,80                          // sub           $0x50,%esp
-  .byte  232,0,0,0,0                         // call          bf76 <_sk_scale_1_float_sse2_lowp+0xd>
+  .byte  232,0,0,0,0                         // call          c00a <_sk_scale_1_float_sse2_lowp+0xd>
   .byte  94                                  // pop           %esi
   .byte  139,69,8                            // mov           0x8(%ebp),%eax
   .byte  139,85,16                           // mov           0x10(%ebp),%edx
   .byte  139,77,12                           // mov           0xc(%ebp),%ecx
   .byte  139,57                              // mov           (%ecx),%edi
   .byte  243,15,16,39                        // movss         (%edi),%xmm4
-  .byte  243,15,89,166,46,20,0,0             // mulss         0x142e(%esi),%xmm4
-  .byte  243,15,88,166,42,20,0,0             // addss         0x142a(%esi),%xmm4
+  .byte  243,15,89,166,42,20,0,0             // mulss         0x142a(%esi),%xmm4
+  .byte  243,15,88,166,38,20,0,0             // addss         0x1426(%esi),%xmm4
   .byte  243,15,44,252                       // cvttss2si     %xmm4,%edi
   .byte  102,15,110,239                      // movd          %edi,%xmm5
   .byte  139,125,20                          // mov           0x14(%ebp),%edi
@@ -68715,7 +68882,7 @@
   .byte  102,15,213,205                      // pmullw        %xmm5,%xmm1
   .byte  102,15,213,213                      // pmullw        %xmm5,%xmm2
   .byte  102,15,213,221                      // pmullw        %xmm5,%xmm3
-  .byte  102,15,111,174,106,19,0,0           // movdqa        0x136a(%esi),%xmm5
+  .byte  102,15,111,174,102,19,0,0           // movdqa        0x1366(%esi),%xmm5
   .byte  102,15,253,197                      // paddw         %xmm5,%xmm0
   .byte  102,15,253,205                      // paddw         %xmm5,%xmm1
   .byte  102,15,253,213                      // paddw         %xmm5,%xmm2
@@ -68754,19 +68921,19 @@
   .byte  102,15,111,218                      // movdqa        %xmm2,%xmm3
   .byte  102,15,111,209                      // movdqa        %xmm1,%xmm2
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
-  .byte  232,0,0,0,0                         // call          c044 <_sk_lerp_1_float_sse2_lowp+0x1d>
+  .byte  232,0,0,0,0                         // call          c0d8 <_sk_lerp_1_float_sse2_lowp+0x1d>
   .byte  89                                  // pop           %ecx
   .byte  102,15,111,109,24                   // movdqa        0x18(%ebp),%xmm5
   .byte  139,69,12                           // mov           0xc(%ebp),%eax
   .byte  139,16                              // mov           (%eax),%edx
   .byte  243,15,16,50                        // movss         (%edx),%xmm6
-  .byte  243,15,89,177,96,19,0,0             // mulss         0x1360(%ecx),%xmm6
-  .byte  243,15,88,177,92,19,0,0             // addss         0x135c(%ecx),%xmm6
+  .byte  243,15,89,177,92,19,0,0             // mulss         0x135c(%ecx),%xmm6
+  .byte  243,15,88,177,88,19,0,0             // addss         0x1358(%ecx),%xmm6
   .byte  243,15,44,214                       // cvttss2si     %xmm6,%edx
   .byte  102,15,110,242                      // movd          %edx,%xmm6
   .byte  242,15,112,246,0                    // pshuflw       $0x0,%xmm6,%xmm6
   .byte  102,15,112,246,80                   // pshufd        $0x50,%xmm6,%xmm6
-  .byte  102,15,111,129,156,18,0,0           // movdqa        0x129c(%ecx),%xmm0
+  .byte  102,15,111,129,152,18,0,0           // movdqa        0x1298(%ecx),%xmm0
   .byte  102,15,213,206                      // pmullw        %xmm6,%xmm1
   .byte  102,15,253,200                      // paddw         %xmm0,%xmm1
   .byte  102,15,213,214                      // pmullw        %xmm6,%xmm2
@@ -68839,10 +69006,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          c16d <_sk_scale_u8_sse2_lowp+0x31>
+  .byte  232,0,0,0,0                         // call          c201 <_sk_scale_u8_sse2_lowp+0x31>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            c18f <_sk_scale_u8_sse2_lowp+0x53>
+  .byte  119,28                              // ja            c223 <_sk_scale_u8_sse2_lowp+0x53>
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,3,1,0,0                 // mov           0x103(%edi,%ecx,4),%ecx
@@ -68850,10 +69017,10 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,182,12,51                        // movzbl        (%ebx,%esi,1),%ecx
   .byte  102,15,110,225                      // movd          %ecx,%xmm4
-  .byte  235,90                              // jmp           c1e9 <_sk_scale_u8_sse2_lowp+0xad>
+  .byte  235,90                              // jmp           c27d <_sk_scale_u8_sse2_lowp+0xad>
   .byte  243,15,126,36,51                    // movq          (%ebx,%esi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
-  .byte  235,79                              // jmp           c1e9 <_sk_scale_u8_sse2_lowp+0xad>
+  .byte  235,79                              // jmp           c27d <_sk_scale_u8_sse2_lowp+0xad>
   .byte  15,182,76,51,2                      // movzbl        0x2(%ebx,%esi,1),%ecx
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,225,2                    // pinsrw        $0x2,%ecx,%xmm4
@@ -68861,7 +69028,7 @@
   .byte  102,15,110,233                      // movd          %ecx,%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  243,15,16,229                       // movss         %xmm5,%xmm4
-  .byte  235,47                              // jmp           c1e9 <_sk_scale_u8_sse2_lowp+0xad>
+  .byte  235,47                              // jmp           c27d <_sk_scale_u8_sse2_lowp+0xad>
   .byte  15,182,76,51,6                      // movzbl        0x6(%ebx,%esi,1),%ecx
   .byte  102,15,239,228                      // pxor          %xmm4,%xmm4
   .byte  102,15,196,225,6                    // pinsrw        $0x6,%ecx,%xmm4
@@ -68872,9 +69039,9 @@
   .byte  102,15,110,44,51                    // movd          (%ebx,%esi,1),%xmm5
   .byte  102,15,96,232                       // punpcklbw     %xmm0,%xmm5
   .byte  242,15,16,229                       // movsd         %xmm5,%xmm4
-  .byte  102,15,219,167,115,17,0,0           // pand          0x1173(%edi),%xmm4
+  .byte  102,15,219,167,111,17,0,0           // pand          0x116f(%edi),%xmm4
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
-  .byte  102,15,111,175,115,17,0,0           // movdqa        0x1173(%edi),%xmm5
+  .byte  102,15,111,175,111,17,0,0           // movdqa        0x116f(%edi),%xmm5
   .byte  102,15,253,197                      // paddw         %xmm5,%xmm0
   .byte  102,15,113,208,8                    // psrlw         $0x8,%xmm0
   .byte  102,15,213,204                      // pmullw        %xmm4,%xmm1
@@ -68941,10 +69108,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          c2ba <_sk_lerp_u8_sse2_lowp+0x2e>
+  .byte  232,0,0,0,0                         // call          c34e <_sk_lerp_u8_sse2_lowp+0x2e>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            c2dc <_sk_lerp_u8_sse2_lowp+0x50>
+  .byte  119,28                              // ja            c370 <_sk_lerp_u8_sse2_lowp+0x50>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,74,1,0,0                // mov           0x14a(%edi,%ecx,4),%ecx
@@ -68952,10 +69119,10 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,182,12,51                        // movzbl        (%ebx,%esi,1),%ecx
   .byte  102,15,110,217                      // movd          %ecx,%xmm3
-  .byte  235,90                              // jmp           c336 <_sk_lerp_u8_sse2_lowp+0xaa>
+  .byte  235,90                              // jmp           c3ca <_sk_lerp_u8_sse2_lowp+0xaa>
   .byte  243,15,126,28,51                    // movq          (%ebx,%esi,1),%xmm3
   .byte  102,15,96,216                       // punpcklbw     %xmm0,%xmm3
-  .byte  235,79                              // jmp           c336 <_sk_lerp_u8_sse2_lowp+0xaa>
+  .byte  235,79                              // jmp           c3ca <_sk_lerp_u8_sse2_lowp+0xaa>
   .byte  15,182,76,51,2                      // movzbl        0x2(%ebx,%esi,1),%ecx
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,217,2                    // pinsrw        $0x2,%ecx,%xmm3
@@ -68963,7 +69130,7 @@
   .byte  102,15,110,225                      // movd          %ecx,%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  243,15,16,220                       // movss         %xmm4,%xmm3
-  .byte  235,47                              // jmp           c336 <_sk_lerp_u8_sse2_lowp+0xaa>
+  .byte  235,47                              // jmp           c3ca <_sk_lerp_u8_sse2_lowp+0xaa>
   .byte  15,182,76,51,6                      // movzbl        0x6(%ebx,%esi,1),%ecx
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,217,6                    // pinsrw        $0x6,%ecx,%xmm3
@@ -68974,8 +69141,8 @@
   .byte  102,15,110,36,51                    // movd          (%ebx,%esi,1),%xmm4
   .byte  102,15,96,224                       // punpcklbw     %xmm0,%xmm4
   .byte  242,15,16,220                       // movsd         %xmm4,%xmm3
-  .byte  102,15,219,159,38,16,0,0            // pand          0x1026(%edi),%xmm3
-  .byte  102,15,111,183,38,16,0,0            // movdqa        0x1026(%edi),%xmm6
+  .byte  102,15,219,159,34,16,0,0            // pand          0x1022(%edi),%xmm3
+  .byte  102,15,111,183,34,16,0,0            // movdqa        0x1022(%edi),%xmm6
   .byte  102,15,111,227                      // movdqa        %xmm3,%xmm4
   .byte  102,15,239,230                      // pxor          %xmm6,%xmm4
   .byte  102,15,111,252                      // movdqa        %xmm4,%xmm7
@@ -69064,10 +69231,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          c463 <_sk_scale_565_sse2_lowp+0x43>
+  .byte  232,0,0,0,0                         // call          c4f7 <_sk_scale_565_sse2_lowp+0x43>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            c485 <_sk_scale_565_sse2_lowp+0x65>
+  .byte  119,28                              // ja            c519 <_sk_scale_565_sse2_lowp+0x65>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,249,1,0,0               // mov           0x1f9(%edi,%ecx,4),%ecx
@@ -69075,14 +69242,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,183,12,115                       // movzwl        (%ebx,%esi,2),%ecx
   .byte  102,15,110,217                      // movd          %ecx,%xmm3
-  .byte  235,59                              // jmp           c4c0 <_sk_scale_565_sse2_lowp+0xa0>
+  .byte  235,59                              // jmp           c554 <_sk_scale_565_sse2_lowp+0xa0>
   .byte  243,15,111,28,115                   // movdqu        (%ebx,%esi,2),%xmm3
-  .byte  235,52                              // jmp           c4c0 <_sk_scale_565_sse2_lowp+0xa0>
+  .byte  235,52                              // jmp           c554 <_sk_scale_565_sse2_lowp+0xa0>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,92,115,4,2               // pinsrw        $0x2,0x4(%ebx,%esi,2),%xmm3
   .byte  243,15,16,12,115                    // movss         (%ebx,%esi,2),%xmm1
   .byte  243,15,16,217                       // movss         %xmm1,%xmm3
-  .byte  235,30                              // jmp           c4c0 <_sk_scale_565_sse2_lowp+0xa0>
+  .byte  235,30                              // jmp           c554 <_sk_scale_565_sse2_lowp+0xa0>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,92,115,12,6              // pinsrw        $0x6,0xc(%ebx,%esi,2),%xmm3
   .byte  102,15,196,92,115,10,5              // pinsrw        $0x5,0xa(%ebx,%esi,2),%xmm3
@@ -69090,11 +69257,11 @@
   .byte  102,15,18,28,115                    // movlpd        (%ebx,%esi,2),%xmm3
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,15,219,143,189,14,0,0           // pand          0xebd(%edi),%xmm1
+  .byte  102,15,219,143,185,14,0,0           // pand          0xeb9(%edi),%xmm1
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
   .byte  102,15,113,210,5                    // psrlw         $0x5,%xmm2
-  .byte  102,15,219,151,205,14,0,0           // pand          0xecd(%edi),%xmm2
-  .byte  102,15,111,135,221,14,0,0           // movdqa        0xedd(%edi),%xmm0
+  .byte  102,15,219,151,201,14,0,0           // pand          0xec9(%edi),%xmm2
+  .byte  102,15,111,135,217,14,0,0           // movdqa        0xed9(%edi),%xmm0
   .byte  102,15,219,195                      // pand          %xmm3,%xmm0
   .byte  102,15,113,211,13                   // psrlw         $0xd,%xmm3
   .byte  102,15,235,217                      // por           %xmm1,%xmm3
@@ -69107,7 +69274,7 @@
   .byte  102,15,113,208,2                    // psrlw         $0x2,%xmm0
   .byte  102,15,235,193                      // por           %xmm1,%xmm0
   .byte  102,15,127,69,200                   // movdqa        %xmm0,-0x38(%ebp)
-  .byte  102,15,111,167,157,14,0,0           // movdqa        0xe9d(%edi),%xmm4
+  .byte  102,15,111,167,153,14,0,0           // movdqa        0xe99(%edi),%xmm4
   .byte  15,41,117,184                       // movaps        %xmm6,-0x48(%ebp)
   .byte  102,15,239,244                      // pxor          %xmm4,%xmm6
   .byte  102,15,239,252                      // pxor          %xmm4,%xmm7
@@ -69150,7 +69317,7 @@
   .byte  102,15,111,229                      // movdqa        %xmm5,%xmm4
   .byte  102,15,213,101,136                  // pmullw        -0x78(%ebp),%xmm4
   .byte  102,15,213,125,184                  // pmullw        -0x48(%ebp),%xmm7
-  .byte  102,15,111,135,125,14,0,0           // movdqa        0xe7d(%edi),%xmm0
+  .byte  102,15,111,135,121,14,0,0           // movdqa        0xe79(%edi),%xmm0
   .byte  102,15,253,216                      // paddw         %xmm0,%xmm3
   .byte  102,15,253,208                      // paddw         %xmm0,%xmm2
   .byte  102,15,253,224                      // paddw         %xmm0,%xmm4
@@ -69227,10 +69394,10 @@
   .byte  128,225,7                           // and           $0x7,%cl
   .byte  254,201                             // dec           %cl
   .byte  128,249,6                           // cmp           $0x6,%cl
-  .byte  232,0,0,0,0                         // call          c6bb <_sk_lerp_565_sse2_lowp+0x43>
+  .byte  232,0,0,0,0                         // call          c74f <_sk_lerp_565_sse2_lowp+0x43>
   .byte  95                                  // pop           %edi
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
-  .byte  119,28                              // ja            c6dd <_sk_lerp_565_sse2_lowp+0x65>
+  .byte  119,28                              // ja            c771 <_sk_lerp_565_sse2_lowp+0x65>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  15,182,201                          // movzbl        %cl,%ecx
   .byte  139,140,143,73,2,0,0                // mov           0x249(%edi,%ecx,4),%ecx
@@ -69238,14 +69405,14 @@
   .byte  255,225                             // jmp           *%ecx
   .byte  15,183,12,115                       // movzwl        (%ebx,%esi,2),%ecx
   .byte  102,15,110,217                      // movd          %ecx,%xmm3
-  .byte  235,59                              // jmp           c718 <_sk_lerp_565_sse2_lowp+0xa0>
+  .byte  235,59                              // jmp           c7ac <_sk_lerp_565_sse2_lowp+0xa0>
   .byte  243,15,111,28,115                   // movdqu        (%ebx,%esi,2),%xmm3
-  .byte  235,52                              // jmp           c718 <_sk_lerp_565_sse2_lowp+0xa0>
+  .byte  235,52                              // jmp           c7ac <_sk_lerp_565_sse2_lowp+0xa0>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,92,115,4,2               // pinsrw        $0x2,0x4(%ebx,%esi,2),%xmm3
   .byte  243,15,16,12,115                    // movss         (%ebx,%esi,2),%xmm1
   .byte  243,15,16,217                       // movss         %xmm1,%xmm3
-  .byte  235,30                              // jmp           c718 <_sk_lerp_565_sse2_lowp+0xa0>
+  .byte  235,30                              // jmp           c7ac <_sk_lerp_565_sse2_lowp+0xa0>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  102,15,196,92,115,12,6              // pinsrw        $0x6,0xc(%ebx,%esi,2),%xmm3
   .byte  102,15,196,92,115,10,5              // pinsrw        $0x5,0xa(%ebx,%esi,2),%xmm3
@@ -69253,11 +69420,11 @@
   .byte  102,15,18,28,115                    // movlpd        (%ebx,%esi,2),%xmm3
   .byte  102,15,111,203                      // movdqa        %xmm3,%xmm1
   .byte  102,15,113,209,8                    // psrlw         $0x8,%xmm1
-  .byte  102,15,219,143,101,12,0,0           // pand          0xc65(%edi),%xmm1
+  .byte  102,15,219,143,97,12,0,0            // pand          0xc61(%edi),%xmm1
   .byte  102,15,111,211                      // movdqa        %xmm3,%xmm2
   .byte  102,15,113,210,5                    // psrlw         $0x5,%xmm2
-  .byte  102,15,219,151,117,12,0,0           // pand          0xc75(%edi),%xmm2
-  .byte  102,15,111,175,133,12,0,0           // movdqa        0xc85(%edi),%xmm5
+  .byte  102,15,219,151,113,12,0,0           // pand          0xc71(%edi),%xmm2
+  .byte  102,15,111,175,129,12,0,0           // movdqa        0xc81(%edi),%xmm5
   .byte  102,15,219,235                      // pand          %xmm3,%xmm5
   .byte  102,15,113,211,13                   // psrlw         $0xd,%xmm3
   .byte  102,15,235,217                      // por           %xmm1,%xmm3
@@ -69270,7 +69437,7 @@
   .byte  102,15,113,213,2                    // psrlw         $0x2,%xmm5
   .byte  102,15,235,233                      // por           %xmm1,%xmm5
   .byte  102,15,127,109,216                  // movdqa        %xmm5,-0x28(%ebp)
-  .byte  102,15,111,167,69,12,0,0            // movdqa        0xc45(%edi),%xmm4
+  .byte  102,15,111,167,65,12,0,0            // movdqa        0xc41(%edi),%xmm4
   .byte  102,15,111,198                      // movdqa        %xmm6,%xmm0
   .byte  102,15,111,200                      // movdqa        %xmm0,%xmm1
   .byte  102,15,239,204                      // pxor          %xmm4,%xmm1
@@ -69311,7 +69478,7 @@
   .byte  102,15,235,249                      // por           %xmm1,%xmm7
   .byte  102,15,111,195                      // movdqa        %xmm3,%xmm0
   .byte  102,15,213,93,168                   // pmullw        -0x58(%ebp),%xmm3
-  .byte  102,15,111,143,37,12,0,0            // movdqa        0xc25(%edi),%xmm1
+  .byte  102,15,111,143,33,12,0,0            // movdqa        0xc21(%edi),%xmm1
   .byte  102,15,239,193                      // pxor          %xmm1,%xmm0
   .byte  102,15,111,101,24                   // movdqa        0x18(%ebp),%xmm4
   .byte  102,15,213,196                      // pmullw        %xmm4,%xmm0
@@ -69407,11 +69574,11 @@
   .byte  128,227,7                           // and           $0x7,%bl
   .byte  254,203                             // dec           %bl
   .byte  128,251,6                           // cmp           $0x6,%bl
-  .byte  232,0,0,0,0                         // call          c95f <_sk_srcover_rgba_8888_sse2_lowp+0x3f>
+  .byte  232,0,0,0,0                         // call          c9f3 <_sk_srcover_rgba_8888_sse2_lowp+0x3f>
   .byte  89                                  // pop           %ecx
   .byte  139,117,16                          // mov           0x10(%ebp),%esi
   .byte  15,182,211                          // movzbl        %bl,%edx
-  .byte  119,29                              // ja            c985 <_sk_srcover_rgba_8888_sse2_lowp+0x65>
+  .byte  119,29                              // ja            ca19 <_sk_srcover_rgba_8888_sse2_lowp+0x65>
   .byte  102,15,239,219                      // pxor          %xmm3,%xmm3
   .byte  139,132,145,77,2,0,0                // mov           0x24d(%ecx,%edx,4),%eax
   .byte  1,200                               // add           %ecx,%eax
@@ -69419,14 +69586,14 @@
   .byte  255,224                             // jmp           *%eax
   .byte  243,15,16,52,183                    // movss         (%edi,%esi,4),%xmm6
   .byte  15,87,219                           // xorps         %xmm3,%xmm3
-  .byte  235,73                              // jmp           c9ce <_sk_srcover_rgba_8888_sse2_lowp+0xae>
+  .byte  235,73                              // jmp           ca62 <_sk_srcover_rgba_8888_sse2_lowp+0xae>
   .byte  102,15,16,52,183                    // movupd        (%edi,%esi,4),%xmm6
   .byte  15,16,92,183,16                     // movups        0x10(%edi,%esi,4),%xmm3
-  .byte  235,61                              // jmp           c9ce <_sk_srcover_rgba_8888_sse2_lowp+0xae>
+  .byte  235,61                              // jmp           ca62 <_sk_srcover_rgba_8888_sse2_lowp+0xae>
   .byte  102,15,110,68,183,8                 // movd          0x8(%edi,%esi,4),%xmm0
   .byte  102,15,112,240,69                   // pshufd        $0x45,%xmm0,%xmm6
   .byte  102,15,18,52,183                    // movlpd        (%edi,%esi,4),%xmm6
-  .byte  235,43                              // jmp           c9ce <_sk_srcover_rgba_8888_sse2_lowp+0xae>
+  .byte  235,43                              // jmp           ca62 <_sk_srcover_rgba_8888_sse2_lowp+0xae>
   .byte  102,15,110,68,183,24                // movd          0x18(%edi,%esi,4),%xmm0
   .byte  102,15,112,216,69                   // pshufd        $0x45,%xmm0,%xmm3
   .byte  243,15,16,68,183,20                 // movss         0x14(%edi,%esi,4),%xmm0
@@ -69452,7 +69619,7 @@
   .byte  102,15,114,243,16                   // pslld         $0x10,%xmm3
   .byte  102,15,114,227,16                   // psrad         $0x10,%xmm3
   .byte  102,15,107,243                      // packssdw      %xmm3,%xmm6
-  .byte  102,15,111,153,129,9,0,0            // movdqa        0x981(%ecx),%xmm3
+  .byte  102,15,111,153,125,9,0,0            // movdqa        0x97d(%ecx),%xmm3
   .byte  102,15,114,208,16                   // psrld         $0x10,%xmm0
   .byte  102,15,114,210,16                   // psrld         $0x10,%xmm2
   .byte  102,15,114,242,16                   // pslld         $0x10,%xmm2
@@ -69504,18 +69671,18 @@
   .byte  102,15,105,220                      // punpckhwd     %xmm4,%xmm3
   .byte  102,15,235,222                      // por           %xmm6,%xmm3
   .byte  128,251,6                           // cmp           $0x6,%bl
-  .byte  119,16                              // ja            cb0f <_sk_srcover_rgba_8888_sse2_lowp+0x1ef>
+  .byte  119,16                              // ja            cba3 <_sk_srcover_rgba_8888_sse2_lowp+0x1ef>
   .byte  3,140,145,105,2,0,0                 // add           0x269(%ecx,%edx,4),%ecx
   .byte  255,225                             // jmp           *%ecx
   .byte  102,15,126,4,183                    // movd          %xmm0,(%edi,%esi,4)
-  .byte  235,64                              // jmp           cb4f <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
+  .byte  235,64                              // jmp           cbe3 <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
   .byte  243,15,127,4,183                    // movdqu        %xmm0,(%edi,%esi,4)
   .byte  243,15,127,92,183,16                // movdqu        %xmm3,0x10(%edi,%esi,4)
-  .byte  235,51                              // jmp           cb4f <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
+  .byte  235,51                              // jmp           cbe3 <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
   .byte  102,15,112,208,78                   // pshufd        $0x4e,%xmm0,%xmm2
   .byte  102,15,126,84,183,8                 // movd          %xmm2,0x8(%edi,%esi,4)
   .byte  102,15,214,4,183                    // movq          %xmm0,(%edi,%esi,4)
-  .byte  235,33                              // jmp           cb4f <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
+  .byte  235,33                              // jmp           cbe3 <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
   .byte  102,15,112,211,78                   // pshufd        $0x4e,%xmm3,%xmm2
   .byte  102,15,126,84,183,24                // movd          %xmm2,0x18(%edi,%esi,4)
   .byte  102,15,112,211,229                  // pshufd        $0xe5,%xmm3,%xmm2
@@ -69644,11 +69811,11 @@
   .byte  0,128,191,0,0,128                   // add           %al,-0x7fffff41(%eax)
   .byte  191,0,0,224,64                      // mov           $0x40e00000,%edi
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  224,64                              // loopne        ccd8 <.literal16+0xe8>
+  .byte  224,64                              // loopne        cd68 <.literal16+0xe8>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  224,64                              // loopne        ccdc <.literal16+0xec>
+  .byte  224,64                              // loopne        cd6c <.literal16+0xec>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  224,64                              // loopne        cce0 <.literal16+0xf0>
+  .byte  224,64                              // loopne        cd70 <.literal16+0xf0>
   .byte  154,153,153,62,154,153,153          // lcall         $0x9999,$0x9a3e9999
   .byte  62,154,153,153,62,154,153,153       // ds            lcall $0x9999,$0x9a3e9999
   .byte  62,61,10,23,63,61                   // ds            cmp $0x3d3f170a,%eax
@@ -69659,16 +69826,16 @@
   .byte  63                                  // aas
   .byte  174                                 // scas          %es:(%edi),%al
   .byte  71                                  // inc           %edi
-  .byte  225,61                              // loope         cd01 <.literal16+0x111>
+  .byte  225,61                              // loope         cd91 <.literal16+0x111>
   .byte  174                                 // scas          %es:(%edi),%al
   .byte  71                                  // inc           %edi
-  .byte  225,61                              // loope         cd05 <.literal16+0x115>
+  .byte  225,61                              // loope         cd95 <.literal16+0x115>
   .byte  174                                 // scas          %es:(%edi),%al
   .byte  71                                  // inc           %edi
-  .byte  225,61                              // loope         cd09 <.literal16+0x119>
+  .byte  225,61                              // loope         cd99 <.literal16+0x119>
   .byte  174                                 // scas          %es:(%edi),%al
   .byte  71                                  // inc           %edi
-  .byte  225,61                              // loope         cd0d <.literal16+0x11d>
+  .byte  225,61                              // loope         cd9d <.literal16+0x11d>
   .byte  255,0                               // incl          (%eax)
   .byte  0,0                                 // add           %al,(%eax)
   .byte  255,0                               // incl          (%eax)
@@ -69678,13 +69845,13 @@
   .byte  255,0                               // incl          (%eax)
   .byte  0,0                                 // add           %al,(%eax)
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  127,67                              // jg            cd27 <.literal16+0x137>
+  .byte  127,67                              // jg            cdb7 <.literal16+0x137>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  127,67                              // jg            cd2b <.literal16+0x13b>
+  .byte  127,67                              // jg            cdbb <.literal16+0x13b>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  127,67                              // jg            cd2f <.literal16+0x13f>
+  .byte  127,67                              // jg            cdbf <.literal16+0x13f>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  127,67                              // jg            cd33 <.literal16+0x143>
+  .byte  127,67                              // jg            cdc3 <.literal16+0x143>
   .byte  145                                 // xchg          %eax,%ecx
   .byte  131,158,61,145,131,158,61           // sbbl          $0x3d,-0x617c6ec3(%esi)
   .byte  145                                 // xchg          %eax,%ecx
@@ -69835,13 +70002,13 @@
   .byte  132,55                              // test          %dh,(%edi)
   .byte  8,33                                // or            %ah,(%ecx)
   .byte  132,55                              // test          %dh,(%edi)
-  .byte  224,7                               // loopne        ce39 <.literal16+0x249>
+  .byte  224,7                               // loopne        cec9 <.literal16+0x249>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  224,7                               // loopne        ce3d <.literal16+0x24d>
+  .byte  224,7                               // loopne        cecd <.literal16+0x24d>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  224,7                               // loopne        ce41 <.literal16+0x251>
+  .byte  224,7                               // loopne        ced1 <.literal16+0x251>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  224,7                               // loopne        ce45 <.literal16+0x255>
+  .byte  224,7                               // loopne        ced5 <.literal16+0x255>
   .byte  0,0                                 // add           %al,(%eax)
   .byte  33,8                                // and           %ecx,(%eax)
   .byte  2,58                                // add           (%edx),%bh
@@ -69890,17 +70057,17 @@
   .byte  0,0                                 // add           %al,(%eax)
   .byte  52,255                              // xor           $0xff,%al
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            cea4 <.literal16+0x2b4>
+  .byte  127,0                               // jg            cf34 <.literal16+0x2b4>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            cea8 <.literal16+0x2b8>
+  .byte  127,0                               // jg            cf38 <.literal16+0x2b8>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            ceac <.literal16+0x2bc>
+  .byte  127,0                               // jg            cf3c <.literal16+0x2bc>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            ceb0 <.literal16+0x2c0>
-  .byte  119,115                             // ja            cf25 <.literal16+0x335>
+  .byte  127,0                               // jg            cf40 <.literal16+0x2c0>
+  .byte  119,115                             // ja            cfb5 <.literal16+0x335>
   .byte  248                                 // clc
   .byte  194,119,115                         // ret           $0x7377
   .byte  248                                 // clc
@@ -69911,7 +70078,7 @@
   .byte  194,117,191                         // ret           $0xbf75
   .byte  191,63,117,191,191                  // mov           $0xbfbf753f,%edi
   .byte  63                                  // aas
-  .byte  117,191                             // jne           ce89 <.literal16+0x299>
+  .byte  117,191                             // jne           cf19 <.literal16+0x299>
   .byte  191,63,117,191,191                  // mov           $0xbfbf753f,%edi
   .byte  63                                  // aas
   .byte  249                                 // stc
@@ -69927,7 +70094,7 @@
   .byte  68                                  // inc           %esp
   .byte  180,62                              // mov           $0x3e,%ah
   .byte  163,233,220,63,163                  // mov           %eax,0xa33fdce9
-  .byte  233,220,63,163,233                  // jmp           e9a40ec6 <_sk_srcover_rgba_8888_sse2_lowp+0xe9a345a6>
+  .byte  233,220,63,163,233                  // jmp           e9a40f56 <_sk_srcover_rgba_8888_sse2_lowp+0xe9a345a2>
   .byte  220,63                              // fdivrl        (%edi)
   .byte  163,233,220,63,81                   // mov           %eax,0x513fdce9
   .byte  140,242                             // mov           %?,%edx
@@ -70023,16 +70190,16 @@
   .byte  128,3,62                            // addb          $0x3e,(%ebx)
   .byte  31                                  // pop           %ds
   .byte  215                                 // xlat          %ds:(%ebx)
-  .byte  118,63                              // jbe           d013 <.literal16+0x423>
+  .byte  118,63                              // jbe           d0a3 <.literal16+0x423>
   .byte  31                                  // pop           %ds
   .byte  215                                 // xlat          %ds:(%ebx)
-  .byte  118,63                              // jbe           d017 <.literal16+0x427>
+  .byte  118,63                              // jbe           d0a7 <.literal16+0x427>
   .byte  31                                  // pop           %ds
   .byte  215                                 // xlat          %ds:(%ebx)
-  .byte  118,63                              // jbe           d01b <.literal16+0x42b>
+  .byte  118,63                              // jbe           d0ab <.literal16+0x42b>
   .byte  31                                  // pop           %ds
   .byte  215                                 // xlat          %ds:(%ebx)
-  .byte  118,63                              // jbe           d01f <.literal16+0x42f>
+  .byte  118,63                              // jbe           d0af <.literal16+0x42f>
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%eax)
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%eax)
   .byte  246,64,83,63                        // testb         $0x3f,0x53(%eax)
@@ -70058,13 +70225,13 @@
   .byte  248                                 // clc
   .byte  65                                  // inc           %ecx
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  124,66                              // jl            d056 <.literal16+0x466>
+  .byte  124,66                              // jl            d0e6 <.literal16+0x466>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  124,66                              // jl            d05a <.literal16+0x46a>
+  .byte  124,66                              // jl            d0ea <.literal16+0x46a>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  124,66                              // jl            d05e <.literal16+0x46e>
+  .byte  124,66                              // jl            d0ee <.literal16+0x46e>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  124,66                              // jl            d062 <.literal16+0x472>
+  .byte  124,66                              // jl            d0f2 <.literal16+0x472>
   .byte  0,240                               // add           %dh,%al
   .byte  0,0                                 // add           %al,(%eax)
   .byte  0,240                               // add           %dh,%al
@@ -70110,25 +70277,25 @@
   .byte  136,136,61,137,136,136              // mov           %cl,-0x777776c3(%eax)
   .byte  61,137,136,136,61                   // cmp           $0x3d888889,%eax
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  112,65                              // jo            d0e5 <.literal16+0x4f5>
+  .byte  112,65                              // jo            d175 <.literal16+0x4f5>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  112,65                              // jo            d0e9 <.literal16+0x4f9>
+  .byte  112,65                              // jo            d179 <.literal16+0x4f9>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  112,65                              // jo            d0ed <.literal16+0x4fd>
+  .byte  112,65                              // jo            d17d <.literal16+0x4fd>
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  112,65                              // jo            d0f1 <.literal16+0x501>
+  .byte  112,65                              // jo            d181 <.literal16+0x501>
   .byte  0,128,0,0,0,128                     // add           %al,-0x80000000(%eax)
   .byte  0,0                                 // add           %al,(%eax)
   .byte  0,128,0,0,0,128                     // add           %al,-0x80000000(%eax)
   .byte  0,0                                 // add           %al,(%eax)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            d0c3 <.literal16+0x4d3>
+  .byte  127,0                               // jg            d153 <.literal16+0x4d3>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            d0c7 <.literal16+0x4d7>
+  .byte  127,0                               // jg            d157 <.literal16+0x4d7>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            d0cb <.literal16+0x4db>
+  .byte  127,0                               // jg            d15b <.literal16+0x4db>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,0                               // jg            d0cf <.literal16+0x4df>
+  .byte  127,0                               // jg            d15f <.literal16+0x4df>
   .byte  0,0                                 // add           %al,(%eax)
   .byte  4,0                                 // add           $0x0,%al
   .byte  0,0                                 // add           %al,(%eax)
@@ -70154,13 +70321,13 @@
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            d108 <.literal16+0x518>
+  .byte  127,255                             // jg            d198 <.literal16+0x518>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,255                             // jg            d10c <.literal16+0x51c>
+  .byte  127,255                             // jg            d19c <.literal16+0x51c>
   .byte  255                                 // (bad)
   .byte  255                                 // (bad)
-  .byte  127,0                               // jg            d111 <.literal16+0x521>
+  .byte  127,0                               // jg            d1a1 <.literal16+0x521>
   .byte  0,128,56,0,0,128                    // add           %al,-0x7fffffc8(%eax)
   .byte  56,0                                // cmp           %al,(%eax)
   .byte  0,128,56,0,0,128                    // add           %al,-0x7fffffc8(%eax)
@@ -70174,13 +70341,13 @@
   .byte  0,255                               // add           %bh,%bh
   .byte  255,0                               // incl          (%eax)
   .byte  255                                 // (bad)
-  .byte  127,71                              // jg            d17b <.literal16+0x58b>
+  .byte  127,71                              // jg            d20b <.literal16+0x58b>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            d17f <.literal16+0x58f>
+  .byte  127,71                              // jg            d20f <.literal16+0x58f>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            d183 <.literal16+0x593>
+  .byte  127,71                              // jg            d213 <.literal16+0x593>
   .byte  0,255                               // add           %bh,%bh
-  .byte  127,71                              // jg            d187 <.literal16+0x597>
+  .byte  127,71                              // jg            d217 <.literal16+0x597>
   .byte  208                                 // (bad)
   .byte  179,89                              // mov           $0x59,%bl
   .byte  62,208                              // ds            (bad)
@@ -70233,7 +70400,7 @@
   .byte  192,45,16,17,192,45,16              // shrb          $0x10,0x2dc01110
   .byte  17,192                              // adc           %eax,%eax
   .byte  45,16,17,192,18                     // sub           $0x12c01110,%eax
-  .byte  120,57                              // js            d1ec <.literal16+0x5fc>
+  .byte  120,57                              // js            d27c <.literal16+0x5fc>
   .byte  64                                  // inc           %eax
   .byte  18,120,57                           // adc           0x39(%eax),%bh
   .byte  64                                  // inc           %eax
@@ -70304,13 +70471,13 @@
   .byte  192,191,0,0,192,191,0               // sarb          $0x0,-0x40400000(%edi)
   .byte  0,192                               // add           %al,%al
   .byte  191,0,0,192,191                     // mov           $0xbfc00000,%edi
-  .byte  114,28                              // jb            d29e <.literal16+0x6ae>
+  .byte  114,28                              // jb            d32e <.literal16+0x6ae>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         d2a2 <.literal16+0x6b2>
+  .byte  62,114,28                           // jb,pt         d332 <.literal16+0x6b2>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         d2a6 <.literal16+0x6b6>
+  .byte  62,114,28                           // jb,pt         d336 <.literal16+0x6b6>
   .byte  199                                 // (bad)
-  .byte  62,114,28                           // jb,pt         d2aa <.literal16+0x6ba>
+  .byte  62,114,28                           // jb,pt         d33a <.literal16+0x6ba>
   .byte  199                                 // (bad)
   .byte  62,85                               // ds            push %ebp
   .byte  85                                  // push          %ebp
@@ -70331,13 +70498,13 @@
   .byte  57,142,99,61,57,142                 // cmp           %ecx,-0x71c6c29d(%esi)
   .byte  99,61,57,142,99,61                  // arpl          %di,0x3d638e39
   .byte  57,142,99,61,114,249                // cmp           %ecx,-0x68dc29d(%esi)
-  .byte  127,63                              // jg            d303 <.literal16+0x713>
-  .byte  114,249                             // jb            d2bf <.literal16+0x6cf>
-  .byte  127,63                              // jg            d307 <.literal16+0x717>
-  .byte  114,249                             // jb            d2c3 <.literal16+0x6d3>
-  .byte  127,63                              // jg            d30b <.literal16+0x71b>
-  .byte  114,249                             // jb            d2c7 <.literal16+0x6d7>
-  .byte  127,63                              // jg            d30f <.literal16+0x71f>
+  .byte  127,63                              // jg            d393 <.literal16+0x713>
+  .byte  114,249                             // jb            d34f <.literal16+0x6cf>
+  .byte  127,63                              // jg            d397 <.literal16+0x717>
+  .byte  114,249                             // jb            d353 <.literal16+0x6d3>
+  .byte  127,63                              // jg            d39b <.literal16+0x71b>
+  .byte  114,249                             // jb            d357 <.literal16+0x6d7>
+  .byte  127,63                              // jg            d39f <.literal16+0x71f>
   .byte  3,0                                 // add           (%eax),%eax
   .byte  0,0                                 // add           %al,(%eax)
   .byte  3,0                                 // add           (%eax),%eax
@@ -70405,14 +70572,14 @@
   .byte  0,248                               // add           %bh,%al
   .byte  0,248                               // add           %bh,%al
   .byte  0,248                               // add           %bh,%al
-  .byte  224,255                             // loopne        d361 <.literal16+0x771>
-  .byte  224,255                             // loopne        d363 <.literal16+0x773>
-  .byte  224,255                             // loopne        d365 <.literal16+0x775>
-  .byte  224,255                             // loopne        d367 <.literal16+0x777>
-  .byte  224,255                             // loopne        d369 <.literal16+0x779>
-  .byte  224,255                             // loopne        d36b <.literal16+0x77b>
-  .byte  224,255                             // loopne        d36d <.literal16+0x77d>
-  .byte  224,255                             // loopne        d36f <.literal16+0x77f>
+  .byte  224,255                             // loopne        d3f1 <.literal16+0x771>
+  .byte  224,255                             // loopne        d3f3 <.literal16+0x773>
+  .byte  224,255                             // loopne        d3f5 <.literal16+0x775>
+  .byte  224,255                             // loopne        d3f7 <.literal16+0x777>
+  .byte  224,255                             // loopne        d3f9 <.literal16+0x779>
+  .byte  224,255                             // loopne        d3fb <.literal16+0x77b>
+  .byte  224,255                             // loopne        d3fd <.literal16+0x77d>
+  .byte  224,255                             // loopne        d3ff <.literal16+0x77f>
   .byte  54,0,54                             // add           %dh,%ss:(%esi)
   .byte  0,54                                // add           %dh,(%esi)
   .byte  0,54                                // add           %dh,(%esi)
@@ -70436,5 +70603,5 @@
   .byte  0,0                                 // add           %al,(%eax)
   .byte  0,63                                // add           %bh,(%edi)
   .byte  0,0                                 // add           %al,(%eax)
-  .byte  127,67                              // jg            d3eb <_sk_srcover_rgba_8888_sse2_lowp+0xacb>
+  .byte  127,67                              // jg            d47b <_sk_srcover_rgba_8888_sse2_lowp+0xac7>
 #endif
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index 351ccd0..3f29279 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -99,14 +99,14 @@
   DB  197,249,110,194                     ; vmovd         %edx,%xmm0
   DB  196,226,125,88,192                  ; vpbroadcastd  %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  197,252,88,5,11,174,2,0             ; vaddps        0x2ae0b(%rip),%ymm0,%ymm0        # 2af60 <_sk_srcover_rgba_8888_sse2_lowp+0x2b8>
+  DB  197,252,88,5,107,177,2,0            ; vaddps        0x2b16b(%rip),%ymm0,%ymm0        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0x2bc>
   DB  197,249,110,201                     ; vmovd         %ecx,%xmm1
   DB  196,226,125,88,201                  ; vpbroadcastd  %xmm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,121,179,2,0       ; vbroadcastss  0x2b379(%rip),%ymm2        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,21,217,182,2,0       ; vbroadcastss  0x2b6d9(%rip),%ymm2        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,244,88,202                      ; vaddps        %ymm2,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,21,110,179,2,0       ; vbroadcastss  0x2b36e(%rip),%ymm2        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,21,206,182,2,0       ; vbroadcastss  0x2b6ce(%rip),%ymm2        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
@@ -119,17 +119,17 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,121,110,194                     ; vmovd         %edx,%xmm8
   DB  196,66,125,88,192                   ; vpbroadcastd  %xmm8,%ymm8
-  DB  197,61,254,5,221,173,2,0            ; vpaddd        0x2addd(%rip),%ymm8,%ymm8        # 2af80 <_sk_srcover_rgba_8888_sse2_lowp+0x2d8>
+  DB  197,61,254,5,61,177,2,0             ; vpaddd        0x2b13d(%rip),%ymm8,%ymm8        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x2dc>
   DB  197,121,110,201                     ; vmovd         %ecx,%xmm9
   DB  196,66,125,88,201                   ; vpbroadcastd  %xmm9,%ymm9
   DB  196,65,53,239,200                   ; vpxor         %ymm8,%ymm9,%ymm9
-  DB  196,98,125,88,21,50,179,2,0         ; vpbroadcastd  0x2b332(%rip),%ymm10        # 2b4ec <_sk_srcover_rgba_8888_sse2_lowp+0x844>
+  DB  196,98,125,88,21,146,182,2,0        ; vpbroadcastd  0x2b692(%rip),%ymm10        # 2b84c <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   DB  196,65,53,219,218                   ; vpand         %ymm10,%ymm9,%ymm11
   DB  196,193,37,114,243,5                ; vpslld        $0x5,%ymm11,%ymm11
   DB  196,65,61,219,210                   ; vpand         %ymm10,%ymm8,%ymm10
   DB  196,193,45,114,242,4                ; vpslld        $0x4,%ymm10,%ymm10
-  DB  196,98,125,88,37,23,179,2,0         ; vpbroadcastd  0x2b317(%rip),%ymm12        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
-  DB  196,98,125,88,45,18,179,2,0         ; vpbroadcastd  0x2b312(%rip),%ymm13        # 2b4f4 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,98,125,88,37,119,182,2,0        ; vpbroadcastd  0x2b677(%rip),%ymm12        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,98,125,88,45,114,182,2,0        ; vpbroadcastd  0x2b672(%rip),%ymm13        # 2b854 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   DB  196,65,53,219,245                   ; vpand         %ymm13,%ymm9,%ymm14
   DB  196,193,13,114,246,2                ; vpslld        $0x2,%ymm14,%ymm14
   DB  196,65,37,235,222                   ; vpor          %ymm14,%ymm11,%ymm11
@@ -144,8 +144,8 @@
   DB  196,65,61,235,195                   ; vpor          %ymm11,%ymm8,%ymm8
   DB  196,65,61,235,193                   ; vpor          %ymm9,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,196,178,2,0        ; vbroadcastss  0x2b2c4(%rip),%ymm9        # 2b4f8 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
-  DB  196,98,125,24,21,191,178,2,0        ; vbroadcastss  0x2b2bf(%rip),%ymm10        # 2b4fc <_sk_srcover_rgba_8888_sse2_lowp+0x854>
+  DB  196,98,125,24,13,36,182,2,0         ; vbroadcastss  0x2b624(%rip),%ymm9        # 2b858 <_sk_srcover_rgba_8888_sse2_lowp+0x854>
+  DB  196,98,125,24,21,31,182,2,0         ; vbroadcastss  0x2b61f(%rip),%ymm10        # 2b85c <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   DB  196,66,61,184,209                   ; vfmadd231ps   %ymm9,%ymm8,%ymm10
   DB  196,98,125,24,0                     ; vbroadcastss  (%rax),%ymm8
   DB  196,65,44,89,192                    ; vmulps        %ymm8,%ymm10,%ymm8
@@ -175,7 +175,7 @@
 PUBLIC _sk_black_color_hsw
 _sk_black_color_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,71,178,2,0        ; vbroadcastss  0x2b247(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,167,181,2,0       ; vbroadcastss  0x2b5a7(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -184,7 +184,7 @@
 PUBLIC _sk_white_color_hsw
 _sk_white_color_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,46,178,2,0         ; vbroadcastss  0x2b22e(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,142,181,2,0        ; vbroadcastss  0x2b58e(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,252,40,216                      ; vmovaps       %ymm0,%ymm3
@@ -222,7 +222,7 @@
 PUBLIC _sk_srcatop_hsw
 _sk_srcatop_hsw LABEL PROC
   DB  197,252,89,199                      ; vmulps        %ymm7,%ymm0,%ymm0
-  DB  196,98,125,24,5,205,177,2,0         ; vbroadcastss  0x2b1cd(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,45,181,2,0          ; vbroadcastss  0x2b52d(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,226,61,184,196                  ; vfmadd231ps   %ymm4,%ymm8,%ymm0
   DB  197,244,89,207                      ; vmulps        %ymm7,%ymm1,%ymm1
@@ -236,7 +236,7 @@
 
 PUBLIC _sk_dstatop_hsw
 _sk_dstatop_hsw LABEL PROC
-  DB  196,98,125,24,5,156,177,2,0         ; vbroadcastss  0x2b19c(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,252,180,2,0         ; vbroadcastss  0x2b4fc(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  196,226,101,184,196                 ; vfmadd231ps   %ymm4,%ymm3,%ymm0
@@ -269,7 +269,7 @@
 
 PUBLIC _sk_srcout_hsw
 _sk_srcout_hsw LABEL PROC
-  DB  196,98,125,24,5,63,177,2,0          ; vbroadcastss  0x2b13f(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,159,180,2,0         ; vbroadcastss  0x2b49f(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -280,7 +280,7 @@
 
 PUBLIC _sk_dstout_hsw
 _sk_dstout_hsw LABEL PROC
-  DB  196,226,125,24,5,30,177,2,0         ; vbroadcastss  0x2b11e(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,126,180,2,0        ; vbroadcastss  0x2b47e(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,92,219                      ; vsubps        %ymm3,%ymm0,%ymm3
   DB  197,228,89,196                      ; vmulps        %ymm4,%ymm3,%ymm0
   DB  197,228,89,205                      ; vmulps        %ymm5,%ymm3,%ymm1
@@ -291,7 +291,7 @@
 
 PUBLIC _sk_srcover_hsw
 _sk_srcover_hsw LABEL PROC
-  DB  196,98,125,24,5,253,176,2,0         ; vbroadcastss  0x2b0fd(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,93,180,2,0          ; vbroadcastss  0x2b45d(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,93,184,192                  ; vfmadd231ps   %ymm8,%ymm4,%ymm0
   DB  196,194,85,184,200                  ; vfmadd231ps   %ymm8,%ymm5,%ymm1
@@ -302,7 +302,7 @@
 
 PUBLIC _sk_dstover_hsw
 _sk_dstover_hsw LABEL PROC
-  DB  196,98,125,24,5,216,176,2,0         ; vbroadcastss  0x2b0d8(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,56,180,2,0          ; vbroadcastss  0x2b438(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  196,226,61,168,196                  ; vfmadd213ps   %ymm4,%ymm8,%ymm0
   DB  196,226,61,168,205                  ; vfmadd213ps   %ymm5,%ymm8,%ymm1
@@ -322,7 +322,7 @@
 
 PUBLIC _sk_multiply_hsw
 _sk_multiply_hsw LABEL PROC
-  DB  196,98,125,24,5,159,176,2,0         ; vbroadcastss  0x2b09f(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,255,179,2,0         ; vbroadcastss  0x2b3ff(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,208                       ; vmulps        %ymm0,%ymm9,%ymm10
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -343,7 +343,7 @@
 PUBLIC _sk_plus__hsw
 _sk_plus__hsw LABEL PROC
   DB  197,252,88,196                      ; vaddps        %ymm4,%ymm0,%ymm0
-  DB  196,98,125,24,5,78,176,2,0          ; vbroadcastss  0x2b04e(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,174,179,2,0         ; vbroadcastss  0x2b3ae(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  197,244,88,205                      ; vaddps        %ymm5,%ymm1,%ymm1
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
@@ -369,7 +369,7 @@
 
 PUBLIC _sk_xor__hsw
 _sk_xor__hsw LABEL PROC
-  DB  196,98,125,24,5,249,175,2,0         ; vbroadcastss  0x2aff9(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,89,179,2,0          ; vbroadcastss  0x2b359(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -401,7 +401,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,95,209                  ; vmaxps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,125,175,2,0         ; vbroadcastss  0x2af7d(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,221,178,2,0         ; vbroadcastss  0x2b2dd(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -424,7 +424,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,40,175,2,0          ; vbroadcastss  0x2af28(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,136,178,2,0         ; vbroadcastss  0x2b288(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -450,7 +450,7 @@
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,199,174,2,0         ; vbroadcastss  0x2aec7(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,39,178,2,0          ; vbroadcastss  0x2b227(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -470,7 +470,7 @@
   DB  197,236,89,214                      ; vmulps        %ymm6,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,129,174,2,0         ; vbroadcastss  0x2ae81(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,225,177,2,0         ; vbroadcastss  0x2b1e1(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  196,194,69,184,216                  ; vfmadd231ps   %ymm8,%ymm7,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -478,7 +478,7 @@
 
 PUBLIC _sk_colorburn_hsw
 _sk_colorburn_hsw LABEL PROC
-  DB  196,98,125,24,5,107,174,2,0         ; vbroadcastss  0x2ae6b(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,203,177,2,0         ; vbroadcastss  0x2b1cb(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,216                       ; vmulps        %ymm0,%ymm9,%ymm11
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
@@ -534,7 +534,7 @@
 PUBLIC _sk_colordodge_hsw
 _sk_colordodge_hsw LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  196,98,125,24,13,123,173,2,0        ; vbroadcastss  0x2ad7b(%rip),%ymm9        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,13,219,176,2,0        ; vbroadcastss  0x2b0db(%rip),%ymm9        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,52,92,215                       ; vsubps        %ymm7,%ymm9,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,52,92,203                       ; vsubps        %ymm3,%ymm9,%ymm9
@@ -585,7 +585,7 @@
 
 PUBLIC _sk_hardlight_hsw
 _sk_hardlight_hsw LABEL PROC
-  DB  196,98,125,24,5,149,172,2,0         ; vbroadcastss  0x2ac95(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,245,175,2,0         ; vbroadcastss  0x2aff5(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -634,7 +634,7 @@
 
 PUBLIC _sk_overlay_hsw
 _sk_overlay_hsw LABEL PROC
-  DB  196,98,125,24,5,201,171,2,0         ; vbroadcastss  0x2abc9(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,41,175,2,0          ; vbroadcastss  0x2af29(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -694,10 +694,10 @@
   DB  196,65,20,88,197                    ; vaddps        %ymm13,%ymm13,%ymm8
   DB  196,65,60,88,192                    ; vaddps        %ymm8,%ymm8,%ymm8
   DB  196,66,61,168,192                   ; vfmadd213ps   %ymm8,%ymm8,%ymm8
-  DB  196,98,125,24,29,224,170,2,0        ; vbroadcastss  0x2aae0(%rip),%ymm11        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  DB  196,98,125,24,29,64,174,2,0         ; vbroadcastss  0x2ae40(%rip),%ymm11        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
   DB  196,65,20,88,227                    ; vaddps        %ymm11,%ymm13,%ymm12
   DB  196,65,28,89,192                    ; vmulps        %ymm8,%ymm12,%ymm8
-  DB  196,98,125,24,37,209,170,2,0        ; vbroadcastss  0x2aad1(%rip),%ymm12        # 2b504 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
+  DB  196,98,125,24,37,49,174,2,0         ; vbroadcastss  0x2ae31(%rip),%ymm12        # 2b864 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
   DB  196,66,21,184,196                   ; vfmadd231ps   %ymm12,%ymm13,%ymm8
   DB  196,65,124,82,245                   ; vrsqrtps      %ymm13,%ymm14
   DB  196,65,124,83,246                   ; vrcpps        %ymm14,%ymm14
@@ -707,7 +707,7 @@
   DB  197,4,194,255,2                     ; vcmpleps      %ymm7,%ymm15,%ymm15
   DB  196,67,13,74,240,240                ; vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   DB  197,116,88,249                      ; vaddps        %ymm1,%ymm1,%ymm15
-  DB  196,98,125,24,5,128,170,2,0         ; vbroadcastss  0x2aa80(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,224,173,2,0         ; vbroadcastss  0x2ade0(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,65,60,92,237                    ; vsubps        %ymm13,%ymm8,%ymm13
   DB  197,132,92,195                      ; vsubps        %ymm3,%ymm15,%ymm0
   DB  196,98,125,168,235                  ; vfmadd213ps   %ymm3,%ymm0,%ymm13
@@ -820,11 +820,11 @@
   DB  196,65,28,89,210                    ; vmulps        %ymm10,%ymm12,%ymm10
   DB  196,65,44,94,214                    ; vdivps        %ymm14,%ymm10,%ymm10
   DB  196,67,45,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  DB  196,98,125,24,53,147,168,2,0        ; vbroadcastss  0x2a893(%rip),%ymm14        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
-  DB  196,98,125,24,61,142,168,2,0        ; vbroadcastss  0x2a88e(%rip),%ymm15        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,53,243,171,2,0        ; vbroadcastss  0x2abf3(%rip),%ymm14        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,61,238,171,2,0        ; vbroadcastss  0x2abee(%rip),%ymm15        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,66,93,184,238                   ; vfmadd231ps   %ymm14,%ymm4,%ymm13
-  DB  196,226,125,24,5,127,168,2,0        ; vbroadcastss  0x2a87f(%rip),%ymm0        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,226,125,24,5,223,171,2,0        ; vbroadcastss  0x2abdf(%rip),%ymm0        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  196,98,77,184,232                   ; vfmadd231ps   %ymm0,%ymm6,%ymm13
   DB  196,65,116,89,215                   ; vmulps        %ymm15,%ymm1,%ymm10
   DB  196,66,53,184,214                   ; vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -879,7 +879,7 @@
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
   DB  196,65,36,95,200                    ; vmaxps        %ymm8,%ymm11,%ymm9
   DB  196,65,116,95,192                   ; vmaxps        %ymm8,%ymm1,%ymm8
-  DB  196,226,125,24,13,64,167,2,0        ; vbroadcastss  0x2a740(%rip),%ymm1        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,13,160,170,2,0       ; vbroadcastss  0x2aaa0(%rip),%ymm1        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,116,92,215                      ; vsubps        %ymm7,%ymm1,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,116,92,219                      ; vsubps        %ymm3,%ymm1,%ymm11
@@ -933,11 +933,11 @@
   DB  196,65,28,89,210                    ; vmulps        %ymm10,%ymm12,%ymm10
   DB  196,65,44,94,214                    ; vdivps        %ymm14,%ymm10,%ymm10
   DB  196,67,45,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm10,%ymm12
-  DB  196,98,125,24,53,109,166,2,0        ; vbroadcastss  0x2a66d(%rip),%ymm14        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
-  DB  196,98,125,24,61,104,166,2,0        ; vbroadcastss  0x2a668(%rip),%ymm15        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,53,205,169,2,0        ; vbroadcastss  0x2a9cd(%rip),%ymm14        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,61,200,169,2,0        ; vbroadcastss  0x2a9c8(%rip),%ymm15        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,66,93,184,238                   ; vfmadd231ps   %ymm14,%ymm4,%ymm13
-  DB  196,226,125,24,5,89,166,2,0         ; vbroadcastss  0x2a659(%rip),%ymm0        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,226,125,24,5,185,169,2,0        ; vbroadcastss  0x2a9b9(%rip),%ymm0        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  196,98,77,184,232                   ; vfmadd231ps   %ymm0,%ymm6,%ymm13
   DB  196,65,116,89,215                   ; vmulps        %ymm15,%ymm1,%ymm10
   DB  196,66,53,184,214                   ; vfmadd231ps   %ymm14,%ymm9,%ymm10
@@ -992,7 +992,7 @@
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
   DB  196,65,36,95,200                    ; vmaxps        %ymm8,%ymm11,%ymm9
   DB  196,65,116,95,192                   ; vmaxps        %ymm8,%ymm1,%ymm8
-  DB  196,226,125,24,13,26,165,2,0        ; vbroadcastss  0x2a51a(%rip),%ymm1        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,13,122,168,2,0       ; vbroadcastss  0x2a87a(%rip),%ymm1        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,116,92,215                      ; vsubps        %ymm7,%ymm1,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,116,92,219                      ; vsubps        %ymm3,%ymm1,%ymm11
@@ -1020,11 +1020,11 @@
   DB  197,108,89,199                      ; vmulps        %ymm7,%ymm2,%ymm8
   DB  197,116,89,215                      ; vmulps        %ymm7,%ymm1,%ymm10
   DB  197,52,89,223                       ; vmulps        %ymm7,%ymm9,%ymm11
-  DB  196,98,125,24,45,201,164,2,0        ; vbroadcastss  0x2a4c9(%rip),%ymm13        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
-  DB  196,98,125,24,53,196,164,2,0        ; vbroadcastss  0x2a4c4(%rip),%ymm14        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,45,41,168,2,0         ; vbroadcastss  0x2a829(%rip),%ymm13        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,53,36,168,2,0         ; vbroadcastss  0x2a824(%rip),%ymm14        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,84,89,230                    ; vmulps        %ymm14,%ymm5,%ymm12
   DB  196,66,93,184,229                   ; vfmadd231ps   %ymm13,%ymm4,%ymm12
-  DB  196,98,125,24,61,181,164,2,0        ; vbroadcastss  0x2a4b5(%rip),%ymm15        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,98,125,24,61,21,168,2,0         ; vbroadcastss  0x2a815(%rip),%ymm15        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  196,66,77,184,231                   ; vfmadd231ps   %ymm15,%ymm6,%ymm12
   DB  196,65,44,89,206                    ; vmulps        %ymm14,%ymm10,%ymm9
   DB  196,66,61,184,205                   ; vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -1080,7 +1080,7 @@
   DB  196,193,116,95,206                  ; vmaxps        %ymm14,%ymm1,%ymm1
   DB  196,65,44,95,198                    ; vmaxps        %ymm14,%ymm10,%ymm8
   DB  196,65,124,95,206                   ; vmaxps        %ymm14,%ymm0,%ymm9
-  DB  196,226,125,24,5,107,163,2,0        ; vbroadcastss  0x2a36b(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,203,166,2,0        ; vbroadcastss  0x2a6cb(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -1108,11 +1108,11 @@
   DB  197,100,89,196                      ; vmulps        %ymm4,%ymm3,%ymm8
   DB  197,100,89,213                      ; vmulps        %ymm5,%ymm3,%ymm10
   DB  197,100,89,222                      ; vmulps        %ymm6,%ymm3,%ymm11
-  DB  196,98,125,24,45,26,163,2,0         ; vbroadcastss  0x2a31a(%rip),%ymm13        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
-  DB  196,98,125,24,53,21,163,2,0         ; vbroadcastss  0x2a315(%rip),%ymm14        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,45,122,166,2,0        ; vbroadcastss  0x2a67a(%rip),%ymm13        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,53,117,166,2,0        ; vbroadcastss  0x2a675(%rip),%ymm14        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,116,89,230                   ; vmulps        %ymm14,%ymm1,%ymm12
   DB  196,66,109,184,229                  ; vfmadd231ps   %ymm13,%ymm2,%ymm12
-  DB  196,98,125,24,61,6,163,2,0          ; vbroadcastss  0x2a306(%rip),%ymm15        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,98,125,24,61,102,166,2,0        ; vbroadcastss  0x2a666(%rip),%ymm15        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  196,66,53,184,231                   ; vfmadd231ps   %ymm15,%ymm9,%ymm12
   DB  196,65,44,89,206                    ; vmulps        %ymm14,%ymm10,%ymm9
   DB  196,66,61,184,205                   ; vfmadd231ps   %ymm13,%ymm8,%ymm9
@@ -1168,7 +1168,7 @@
   DB  196,193,116,95,206                  ; vmaxps        %ymm14,%ymm1,%ymm1
   DB  196,65,44,95,198                    ; vmaxps        %ymm14,%ymm10,%ymm8
   DB  196,65,124,95,206                   ; vmaxps        %ymm14,%ymm0,%ymm9
-  DB  196,226,125,24,5,188,161,2,0        ; vbroadcastss  0x2a1bc(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,28,165,2,0         ; vbroadcastss  0x2a51c(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -1198,17 +1198,17 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  15,133,179,0,0,0                    ; jne           1444 <_sk_srcover_rgba_8888_hsw+0xd3>
   DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,1,156,2,0            ; vpand         0x29c01(%rip),%ymm7,%ymm4        # 2afa0 <_sk_srcover_rgba_8888_sse2_lowp+0x2f8>
+  DB  197,197,219,37,97,159,2,0           ; vpand         0x29f61(%rip),%ymm7,%ymm4        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0x2fc>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,69,0,45,20,156,2,0          ; vpshufb       0x29c14(%rip),%ymm7,%ymm5        # 2afc0 <_sk_srcover_rgba_8888_sse2_lowp+0x318>
+  DB  196,226,69,0,45,116,159,2,0         ; vpshufb       0x29f74(%rip),%ymm7,%ymm5        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0x31c>
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,69,0,53,39,156,2,0          ; vpshufb       0x29c27(%rip),%ymm7,%ymm6        # 2afe0 <_sk_srcover_rgba_8888_sse2_lowp+0x338>
+  DB  196,226,69,0,53,135,159,2,0         ; vpshufb       0x29f87(%rip),%ymm7,%ymm6        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0x33c>
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,5,25,161,2,0          ; vbroadcastss  0x2a119(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,121,164,2,0         ; vbroadcastss  0x2a479(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
-  DB  196,98,125,24,13,56,161,2,0         ; vbroadcastss  0x2a138(%rip),%ymm9        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,13,152,164,2,0        ; vbroadcastss  0x2a498(%rip),%ymm9        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  196,194,93,184,192                  ; vfmadd231ps   %ymm8,%ymm4,%ymm0
   DB  196,193,116,89,201                  ; vmulps        %ymm9,%ymm1,%ymm1
@@ -1330,7 +1330,7 @@
 
 PUBLIC _sk_clamp_1_hsw
 _sk_clamp_1_hsw LABEL PROC
-  DB  196,98,125,24,5,38,159,2,0          ; vbroadcastss  0x29f26(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,134,162,2,0         ; vbroadcastss  0x2a286(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
@@ -1340,7 +1340,7 @@
 
 PUBLIC _sk_clamp_a_hsw
 _sk_clamp_a_hsw LABEL PROC
-  DB  196,98,125,24,5,5,159,2,0           ; vbroadcastss  0x29f05(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,101,162,2,0         ; vbroadcastss  0x2a265(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  197,252,93,195                      ; vminps        %ymm3,%ymm0,%ymm0
   DB  197,244,93,203                      ; vminps        %ymm3,%ymm1,%ymm1
@@ -1350,7 +1350,7 @@
 
 PUBLIC _sk_clamp_a_dst_hsw
 _sk_clamp_a_dst_hsw LABEL PROC
-  DB  196,98,125,24,5,231,158,2,0         ; vbroadcastss  0x29ee7(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,71,162,2,0          ; vbroadcastss  0x2a247(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,68,93,248                   ; vminps        %ymm8,%ymm7,%ymm7
   DB  197,220,93,231                      ; vminps        %ymm7,%ymm4,%ymm4
   DB  197,212,93,239                      ; vminps        %ymm7,%ymm5,%ymm5
@@ -1377,7 +1377,7 @@
 
 PUBLIC _sk_invert_hsw
 _sk_invert_hsw LABEL PROC
-  DB  196,98,125,24,5,162,158,2,0         ; vbroadcastss  0x29ea2(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,2,162,2,0           ; vbroadcastss  0x2a202(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,188,92,192                      ; vsubps        %ymm0,%ymm8,%ymm0
   DB  197,188,92,201                      ; vsubps        %ymm1,%ymm8,%ymm1
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
@@ -1423,7 +1423,7 @@
 _sk_unpremul_hsw LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,65,100,194,200,0                ; vcmpeqps      %ymm8,%ymm3,%ymm9
-  DB  196,98,125,24,21,50,158,2,0         ; vbroadcastss  0x29e32(%rip),%ymm10        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,21,146,161,2,0        ; vbroadcastss  0x2a192(%rip),%ymm10        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,44,94,211                       ; vdivps        %ymm3,%ymm10,%ymm10
   DB  196,67,45,74,192,144                ; vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
@@ -1434,16 +1434,16 @@
 
 PUBLIC _sk_from_srgb_hsw
 _sk_from_srgb_hsw LABEL PROC
-  DB  196,98,125,24,5,63,158,2,0          ; vbroadcastss  0x29e3f(%rip),%ymm8        # 2b518 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,125,24,5,159,161,2,0         ; vbroadcastss  0x2a19f(%rip),%ymm8        # 2b878 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  197,124,89,208                      ; vmulps        %ymm0,%ymm0,%ymm10
-  DB  196,98,125,24,29,49,158,2,0         ; vbroadcastss  0x29e31(%rip),%ymm11        # 2b51c <_sk_srcover_rgba_8888_sse2_lowp+0x874>
-  DB  196,98,125,24,37,20,158,2,0         ; vbroadcastss  0x29e14(%rip),%ymm12        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,29,145,161,2,0        ; vbroadcastss  0x2a191(%rip),%ymm11        # 2b87c <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  DB  196,98,125,24,37,116,161,2,0        ; vbroadcastss  0x2a174(%rip),%ymm12        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,124,40,236                   ; vmovaps       %ymm12,%ymm13
   DB  196,66,125,168,235                  ; vfmadd213ps   %ymm11,%ymm0,%ymm13
-  DB  196,98,125,24,53,25,158,2,0         ; vbroadcastss  0x29e19(%rip),%ymm14        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  DB  196,98,125,24,53,121,161,2,0        ; vbroadcastss  0x2a179(%rip),%ymm14        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   DB  196,66,45,168,238                   ; vfmadd213ps   %ymm14,%ymm10,%ymm13
-  DB  196,98,125,24,21,15,158,2,0         ; vbroadcastss  0x29e0f(%rip),%ymm10        # 2b524 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  DB  196,98,125,24,21,111,161,2,0        ; vbroadcastss  0x2a16f(%rip),%ymm10        # 2b884 <_sk_srcover_rgba_8888_sse2_lowp+0x880>
   DB  196,193,124,194,194,1               ; vcmpltps      %ymm10,%ymm0,%ymm0
   DB  196,195,21,74,193,0                 ; vblendvps     %ymm0,%ymm9,%ymm13,%ymm0
   DB  196,65,116,89,200                   ; vmulps        %ymm8,%ymm1,%ymm9
@@ -1464,16 +1464,16 @@
 
 PUBLIC _sk_from_srgb_dst_hsw
 _sk_from_srgb_dst_hsw LABEL PROC
-  DB  196,98,125,24,5,167,157,2,0         ; vbroadcastss  0x29da7(%rip),%ymm8        # 2b518 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,125,24,5,7,161,2,0           ; vbroadcastss  0x2a107(%rip),%ymm8        # 2b878 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   DB  196,65,92,89,200                    ; vmulps        %ymm8,%ymm4,%ymm9
   DB  197,92,89,212                       ; vmulps        %ymm4,%ymm4,%ymm10
-  DB  196,98,125,24,29,153,157,2,0        ; vbroadcastss  0x29d99(%rip),%ymm11        # 2b51c <_sk_srcover_rgba_8888_sse2_lowp+0x874>
-  DB  196,98,125,24,37,124,157,2,0        ; vbroadcastss  0x29d7c(%rip),%ymm12        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,29,249,160,2,0        ; vbroadcastss  0x2a0f9(%rip),%ymm11        # 2b87c <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  DB  196,98,125,24,37,220,160,2,0        ; vbroadcastss  0x2a0dc(%rip),%ymm12        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,124,40,236                   ; vmovaps       %ymm12,%ymm13
   DB  196,66,93,168,235                   ; vfmadd213ps   %ymm11,%ymm4,%ymm13
-  DB  196,98,125,24,53,129,157,2,0        ; vbroadcastss  0x29d81(%rip),%ymm14        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  DB  196,98,125,24,53,225,160,2,0        ; vbroadcastss  0x2a0e1(%rip),%ymm14        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   DB  196,66,45,168,238                   ; vfmadd213ps   %ymm14,%ymm10,%ymm13
-  DB  196,98,125,24,21,119,157,2,0        ; vbroadcastss  0x29d77(%rip),%ymm10        # 2b524 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  DB  196,98,125,24,21,215,160,2,0        ; vbroadcastss  0x2a0d7(%rip),%ymm10        # 2b884 <_sk_srcover_rgba_8888_sse2_lowp+0x880>
   DB  196,193,92,194,226,1                ; vcmpltps      %ymm10,%ymm4,%ymm4
   DB  196,195,21,74,225,64                ; vblendvps     %ymm4,%ymm9,%ymm13,%ymm4
   DB  196,65,84,89,200                    ; vmulps        %ymm8,%ymm5,%ymm9
@@ -1495,19 +1495,19 @@
 PUBLIC _sk_to_srgb_hsw
 _sk_to_srgb_hsw LABEL PROC
   DB  197,124,82,200                      ; vrsqrtps      %ymm0,%ymm9
-  DB  196,98,125,24,5,27,157,2,0          ; vbroadcastss  0x29d1b(%rip),%ymm8        # 2b528 <_sk_srcover_rgba_8888_sse2_lowp+0x880>
+  DB  196,98,125,24,5,123,160,2,0         ; vbroadcastss  0x2a07b(%rip),%ymm8        # 2b888 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
   DB  196,65,124,89,208                   ; vmulps        %ymm8,%ymm0,%ymm10
-  DB  196,98,125,24,29,17,157,2,0         ; vbroadcastss  0x29d11(%rip),%ymm11        # 2b52c <_sk_srcover_rgba_8888_sse2_lowp+0x884>
-  DB  196,98,125,24,37,12,157,2,0         ; vbroadcastss  0x29d0c(%rip),%ymm12        # 2b530 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  DB  196,98,125,24,29,113,160,2,0        ; vbroadcastss  0x2a071(%rip),%ymm11        # 2b88c <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  DB  196,98,125,24,37,108,160,2,0        ; vbroadcastss  0x2a06c(%rip),%ymm12        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
   DB  196,65,124,40,236                   ; vmovaps       %ymm12,%ymm13
   DB  196,66,53,168,235                   ; vfmadd213ps   %ymm11,%ymm9,%ymm13
-  DB  196,98,125,24,53,253,156,2,0        ; vbroadcastss  0x29cfd(%rip),%ymm14        # 2b534 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
+  DB  196,98,125,24,53,93,160,2,0         ; vbroadcastss  0x2a05d(%rip),%ymm14        # 2b894 <_sk_srcover_rgba_8888_sse2_lowp+0x890>
   DB  196,66,53,168,238                   ; vfmadd213ps   %ymm14,%ymm9,%ymm13
-  DB  196,98,125,24,61,243,156,2,0        ; vbroadcastss  0x29cf3(%rip),%ymm15        # 2b538 <_sk_srcover_rgba_8888_sse2_lowp+0x890>
+  DB  196,98,125,24,61,83,160,2,0         ; vbroadcastss  0x2a053(%rip),%ymm15        # 2b898 <_sk_srcover_rgba_8888_sse2_lowp+0x894>
   DB  196,65,52,88,207                    ; vaddps        %ymm15,%ymm9,%ymm9
   DB  196,65,124,83,201                   ; vrcpps        %ymm9,%ymm9
   DB  196,65,20,89,201                    ; vmulps        %ymm9,%ymm13,%ymm9
-  DB  196,98,125,24,45,223,156,2,0        ; vbroadcastss  0x29cdf(%rip),%ymm13        # 2b53c <_sk_srcover_rgba_8888_sse2_lowp+0x894>
+  DB  196,98,125,24,45,63,160,2,0         ; vbroadcastss  0x2a03f(%rip),%ymm13        # 2b89c <_sk_srcover_rgba_8888_sse2_lowp+0x898>
   DB  196,193,124,194,197,1               ; vcmpltps      %ymm13,%ymm0,%ymm0
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  197,124,82,201                      ; vrsqrtps      %ymm1,%ymm9
@@ -1539,26 +1539,26 @@
   DB  197,116,93,202                      ; vminps        %ymm2,%ymm1,%ymm9
   DB  196,65,124,93,201                   ; vminps        %ymm9,%ymm0,%ymm9
   DB  196,65,60,92,209                    ; vsubps        %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,29,250,155,2,0        ; vbroadcastss  0x29bfa(%rip),%ymm11        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,29,90,159,2,0         ; vbroadcastss  0x29f5a(%rip),%ymm11        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,65,36,94,218                    ; vdivps        %ymm10,%ymm11,%ymm11
   DB  197,116,92,226                      ; vsubps        %ymm2,%ymm1,%ymm12
   DB  197,116,194,234,1                   ; vcmpltps      %ymm2,%ymm1,%ymm13
-  DB  196,98,125,24,53,59,156,2,0         ; vbroadcastss  0x29c3b(%rip),%ymm14        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
+  DB  196,98,125,24,53,155,159,2,0        ; vbroadcastss  0x29f9b(%rip),%ymm14        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
   DB  196,65,4,87,255                     ; vxorps        %ymm15,%ymm15,%ymm15
   DB  196,67,5,74,238,208                 ; vblendvps     %ymm13,%ymm14,%ymm15,%ymm13
   DB  196,66,37,168,229                   ; vfmadd213ps   %ymm13,%ymm11,%ymm12
   DB  197,236,92,208                      ; vsubps        %ymm0,%ymm2,%ymm2
   DB  197,124,92,233                      ; vsubps        %ymm1,%ymm0,%ymm13
-  DB  196,98,125,24,53,34,156,2,0         ; vbroadcastss  0x29c22(%rip),%ymm14        # 2b548 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
+  DB  196,98,125,24,53,130,159,2,0        ; vbroadcastss  0x29f82(%rip),%ymm14        # 2b8a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   DB  196,66,37,168,238                   ; vfmadd213ps   %ymm14,%ymm11,%ymm13
-  DB  196,98,125,24,53,16,156,2,0         ; vbroadcastss  0x29c10(%rip),%ymm14        # 2b544 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
+  DB  196,98,125,24,53,112,159,2,0        ; vbroadcastss  0x29f70(%rip),%ymm14        # 2b8a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
   DB  196,194,37,168,214                  ; vfmadd213ps   %ymm14,%ymm11,%ymm2
   DB  197,188,194,201,0                   ; vcmpeqps      %ymm1,%ymm8,%ymm1
   DB  196,227,21,74,202,16                ; vblendvps     %ymm1,%ymm2,%ymm13,%ymm1
   DB  197,188,194,192,0                   ; vcmpeqps      %ymm0,%ymm8,%ymm0
   DB  196,195,117,74,196,0                ; vblendvps     %ymm0,%ymm12,%ymm1,%ymm0
   DB  196,193,60,88,201                   ; vaddps        %ymm9,%ymm8,%ymm1
-  DB  196,98,125,24,29,135,155,2,0        ; vbroadcastss  0x29b87(%rip),%ymm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,29,231,158,2,0        ; vbroadcastss  0x29ee7(%rip),%ymm11        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,116,89,211                  ; vmulps        %ymm11,%ymm1,%ymm2
   DB  197,36,194,218,1                    ; vcmpltps      %ymm2,%ymm11,%ymm11
   DB  196,65,12,92,224                    ; vsubps        %ymm8,%ymm14,%ymm12
@@ -1568,7 +1568,7 @@
   DB  197,172,94,201                      ; vdivps        %ymm1,%ymm10,%ymm1
   DB  196,195,125,74,199,128              ; vblendvps     %ymm8,%ymm15,%ymm0,%ymm0
   DB  196,195,117,74,207,128              ; vblendvps     %ymm8,%ymm15,%ymm1,%ymm1
-  DB  196,98,125,24,5,182,155,2,0         ; vbroadcastss  0x29bb6(%rip),%ymm8        # 2b54c <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  DB  196,98,125,24,5,22,159,2,0          ; vbroadcastss  0x29f16(%rip),%ymm8        # 2b8ac <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -1583,30 +1583,30 @@
   DB  197,252,17,28,36                    ; vmovups       %ymm3,(%rsp)
   DB  197,252,40,233                      ; vmovaps       %ymm1,%ymm5
   DB  197,252,40,224                      ; vmovaps       %ymm0,%ymm4
-  DB  196,98,125,24,5,13,155,2,0          ; vbroadcastss  0x29b0d(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,109,158,2,0         ; vbroadcastss  0x29e6d(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,60,194,202,2                    ; vcmpleps      %ymm2,%ymm8,%ymm9
   DB  197,84,89,210                       ; vmulps        %ymm2,%ymm5,%ymm10
   DB  196,65,84,92,218                    ; vsubps        %ymm10,%ymm5,%ymm11
   DB  196,67,45,74,203,144                ; vblendvps     %ymm9,%ymm11,%ymm10,%ymm9
   DB  197,52,88,210                       ; vaddps        %ymm2,%ymm9,%ymm10
-  DB  196,98,125,24,13,76,155,2,0         ; vbroadcastss  0x29b4c(%rip),%ymm9        # 2b544 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
+  DB  196,98,125,24,13,172,158,2,0        ; vbroadcastss  0x29eac(%rip),%ymm9        # 2b8a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
   DB  196,66,109,170,202                  ; vfmsub213ps   %ymm10,%ymm2,%ymm9
-  DB  196,98,125,24,29,74,155,2,0         ; vbroadcastss  0x29b4a(%rip),%ymm11        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
+  DB  196,98,125,24,29,170,158,2,0        ; vbroadcastss  0x29eaa(%rip),%ymm11        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
   DB  196,65,92,88,219                    ; vaddps        %ymm11,%ymm4,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,252                    ; vsubps        %ymm12,%ymm11,%ymm15
   DB  196,65,44,92,217                    ; vsubps        %ymm9,%ymm10,%ymm11
-  DB  196,98,125,24,45,28,155,2,0         ; vbroadcastss  0x29b1c(%rip),%ymm13        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
+  DB  196,98,125,24,45,124,158,2,0        ; vbroadcastss  0x29e7c(%rip),%ymm13        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
   DB  196,193,4,89,197                    ; vmulps        %ymm13,%ymm15,%ymm0
-  DB  196,98,125,24,53,22,155,2,0         ; vbroadcastss  0x29b16(%rip),%ymm14        # 2b548 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
+  DB  196,98,125,24,53,118,158,2,0        ; vbroadcastss  0x29e76(%rip),%ymm14        # 2b8a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   DB  197,12,92,224                       ; vsubps        %ymm0,%ymm14,%ymm12
   DB  196,66,37,168,225                   ; vfmadd213ps   %ymm9,%ymm11,%ymm12
-  DB  196,226,125,24,29,16,155,2,0        ; vbroadcastss  0x29b10(%rip),%ymm3        # 2b554 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
+  DB  196,226,125,24,29,112,158,2,0       ; vbroadcastss  0x29e70(%rip),%ymm3        # 2b8b4 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
   DB  196,193,100,194,255,2               ; vcmpleps      %ymm15,%ymm3,%ymm7
   DB  196,195,29,74,249,112               ; vblendvps     %ymm7,%ymm9,%ymm12,%ymm7
   DB  196,65,60,194,231,2                 ; vcmpleps      %ymm15,%ymm8,%ymm12
   DB  196,227,45,74,255,192               ; vblendvps     %ymm12,%ymm7,%ymm10,%ymm7
-  DB  196,98,125,24,37,231,154,2,0        ; vbroadcastss  0x29ae7(%rip),%ymm12        # 2b54c <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  DB  196,98,125,24,37,71,158,2,0         ; vbroadcastss  0x29e47(%rip),%ymm12        # 2b8ac <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   DB  196,65,28,194,255,2                 ; vcmpleps      %ymm15,%ymm12,%ymm15
   DB  196,194,37,168,193                  ; vfmadd213ps   %ymm9,%ymm11,%ymm0
   DB  196,99,125,74,255,240               ; vblendvps     %ymm15,%ymm7,%ymm0,%ymm15
@@ -1622,7 +1622,7 @@
   DB  197,156,194,192,2                   ; vcmpleps      %ymm0,%ymm12,%ymm0
   DB  196,194,37,168,249                  ; vfmadd213ps   %ymm9,%ymm11,%ymm7
   DB  196,227,69,74,201,0                 ; vblendvps     %ymm0,%ymm1,%ymm7,%ymm1
-  DB  196,226,125,24,5,155,154,2,0        ; vbroadcastss  0x29a9b(%rip),%ymm0        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  DB  196,226,125,24,5,251,157,2,0        ; vbroadcastss  0x29dfb(%rip),%ymm0        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   DB  197,220,88,192                      ; vaddps        %ymm0,%ymm4,%ymm0
   DB  196,227,125,8,224,1                 ; vroundps      $0x1,%ymm0,%ymm4
   DB  197,252,92,196                      ; vsubps        %ymm4,%ymm0,%ymm0
@@ -1672,10 +1672,10 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  117,58                              ; jne           1bb2 <_sk_scale_u8_hsw+0x52>
   DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,250,154,2,0            ; vpand         0x29afa(%rip),%xmm8,%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,57,219,5,90,158,2,0             ; vpand         0x29e5a(%rip),%xmm8,%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,195,153,2,0        ; vbroadcastss  0x299c3(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,35,157,2,0         ; vbroadcastss  0x29d23(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -1724,7 +1724,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf001c5c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd6fb4>
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf001c5c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd6c58>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,211                             ; callq         *%rbx
@@ -1748,20 +1748,20 @@
   DB  15,133,161,0,0,0                    ; jne           1d28 <_sk_scale_565_hsw+0xc0>
   DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
-  DB  196,98,125,88,13,197,152,2,0        ; vpbroadcastd  0x298c5(%rip),%ymm9        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,98,125,88,13,37,156,2,0         ; vpbroadcastd  0x29c25(%rip),%ymm9        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  196,65,61,219,201                   ; vpand         %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,182,152,2,0        ; vbroadcastss  0x298b6(%rip),%ymm10        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,98,125,24,21,22,156,2,0         ; vbroadcastss  0x29c16(%rip),%ymm10        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,88,21,172,152,2,0        ; vpbroadcastd  0x298ac(%rip),%ymm10        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,98,125,88,21,12,156,2,0         ; vpbroadcastd  0x29c0c(%rip),%ymm10        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  196,65,61,219,210                   ; vpand         %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,157,152,2,0        ; vbroadcastss  0x2989d(%rip),%ymm11        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,98,125,24,29,253,155,2,0        ; vbroadcastss  0x29bfd(%rip),%ymm11        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,88,29,147,152,2,0        ; vpbroadcastd  0x29893(%rip),%ymm11        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,98,125,88,29,243,155,2,0        ; vpbroadcastd  0x29bf3(%rip),%ymm11        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  196,65,61,219,195                   ; vpand         %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,132,152,2,0        ; vbroadcastss  0x29884(%rip),%ymm11        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,98,125,24,29,228,155,2,0        ; vbroadcastss  0x29be4(%rip),%ymm11        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -1848,10 +1848,10 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  117,78                              ; jne           1e61 <_sk_lerp_u8_hsw+0x66>
   DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,95,152,2,0             ; vpand         0x2985f(%rip),%xmm8,%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,57,219,5,191,155,2,0            ; vpand         0x29bbf(%rip),%xmm8,%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,40,151,2,0         ; vbroadcastss  0x29728(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,136,154,2,0        ; vbroadcastss  0x29a88(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,252,92,196                      ; vsubps        %ymm4,%ymm0,%ymm0
   DB  196,226,61,168,196                  ; vfmadd213ps   %ymm4,%ymm8,%ymm0
@@ -1903,7 +1903,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde001f0c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd7264>
+  DB  232,255,255,255,221                 ; callq         ffffffffde001f0c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd6f08>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -1927,20 +1927,20 @@
   DB  15,133,181,0,0,0                    ; jne           1fec <_sk_lerp_565_hsw+0xd4>
   DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
   DB  196,66,125,51,192                   ; vpmovzxwd     %xmm8,%ymm8
-  DB  196,98,125,88,13,21,150,2,0         ; vpbroadcastd  0x29615(%rip),%ymm9        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,98,125,88,13,117,153,2,0        ; vpbroadcastd  0x29975(%rip),%ymm9        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  196,65,61,219,201                   ; vpand         %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,6,150,2,0          ; vbroadcastss  0x29606(%rip),%ymm10        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,98,125,24,21,102,153,2,0        ; vbroadcastss  0x29966(%rip),%ymm10        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,88,21,252,149,2,0        ; vpbroadcastd  0x295fc(%rip),%ymm10        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,98,125,88,21,92,153,2,0         ; vpbroadcastd  0x2995c(%rip),%ymm10        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  196,65,61,219,210                   ; vpand         %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,237,149,2,0        ; vbroadcastss  0x295ed(%rip),%ymm11        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,98,125,24,29,77,153,2,0         ; vbroadcastss  0x2994d(%rip),%ymm11        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,88,29,227,149,2,0        ; vpbroadcastd  0x295e3(%rip),%ymm11        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,98,125,88,29,67,153,2,0         ; vpbroadcastd  0x29943(%rip),%ymm11        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  196,65,61,219,195                   ; vpand         %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,212,149,2,0        ; vbroadcastss  0x295d4(%rip),%ymm11        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,98,125,24,29,52,153,2,0         ; vbroadcastss  0x29934(%rip),%ymm11        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -2012,7 +2012,7 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  117,116                             ; jne           210e <_sk_load_tables_hsw+0x7e>
   DB  196,193,126,111,28,144              ; vmovdqu       (%r8,%rdx,4),%ymm3
-  DB  197,229,219,13,88,143,2,0           ; vpand         0x28f58(%rip),%ymm3,%ymm1        # 2b000 <_sk_srcover_rgba_8888_sse2_lowp+0x358>
+  DB  197,229,219,13,184,146,2,0          ; vpand         0x292b8(%rip),%ymm3,%ymm1        # 2b360 <_sk_srcover_rgba_8888_sse2_lowp+0x35c>
   DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  76,139,72,16                        ; mov           0x10(%rax),%r9
@@ -2020,16 +2020,16 @@
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  196,65,53,118,201                   ; vpcmpeqd      %ymm9,%ymm9,%ymm9
   DB  196,194,53,146,4,136                ; vgatherdps    %ymm9,(%r8,%ymm1,4),%ymm0
-  DB  196,98,101,0,13,79,143,2,0          ; vpshufb       0x28f4f(%rip),%ymm3,%ymm9        # 2b020 <_sk_srcover_rgba_8888_sse2_lowp+0x378>
+  DB  196,98,101,0,13,175,146,2,0         ; vpshufb       0x292af(%rip),%ymm3,%ymm9        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0x37c>
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,65,45,118,210                   ; vpcmpeqd      %ymm10,%ymm10,%ymm10
   DB  196,130,45,146,12,137               ; vgatherdps    %ymm10,(%r9,%ymm9,4),%ymm1
   DB  72,139,64,24                        ; mov           0x18(%rax),%rax
-  DB  196,98,101,0,13,83,143,2,0          ; vpshufb       0x28f53(%rip),%ymm3,%ymm9        # 2b040 <_sk_srcover_rgba_8888_sse2_lowp+0x398>
+  DB  196,98,101,0,13,179,146,2,0         ; vpshufb       0x292b3(%rip),%ymm3,%ymm9        # 2b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0x39c>
   DB  196,162,61,146,20,136               ; vgatherdps    %ymm8,(%rax,%ymm9,4),%ymm2
   DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,87,148,2,0          ; vbroadcastss  0x29457(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,183,151,2,0         ; vbroadcastss  0x297b7(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2108,7 +2108,7 @@
   DB  197,185,108,200                     ; vpunpcklqdq   %xmm0,%xmm8,%xmm1
   DB  197,57,109,192                      ; vpunpckhqdq   %xmm0,%xmm8,%xmm8
   DB  196,65,49,108,214                   ; vpunpcklqdq   %xmm14,%xmm9,%xmm10
-  DB  197,121,111,29,64,148,2,0           ; vmovdqa       0x29440(%rip),%xmm11        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,121,111,29,160,151,2,0          ; vmovdqa       0x297a0(%rip),%xmm11        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,193,113,219,195                 ; vpand         %xmm11,%xmm1,%xmm0
   DB  196,226,125,51,200                  ; vpmovzxwd     %xmm0,%ymm1
   DB  196,65,29,118,228                   ; vpcmpeqd      %ymm12,%ymm12,%ymm12
@@ -2133,7 +2133,7 @@
   DB  197,185,235,219                     ; vpor          %xmm3,%xmm8,%xmm3
   DB  196,226,125,51,219                  ; vpmovzxwd     %xmm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,188,146,2,0         ; vbroadcastss  0x292bc(%rip),%ymm8        # 2b578 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  DB  196,98,125,24,5,28,150,2,0          ; vbroadcastss  0x2961c(%rip),%ymm8        # 2b8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2191,7 +2191,7 @@
   DB  197,105,108,192                     ; vpunpcklqdq   %xmm0,%xmm2,%xmm8
   DB  197,241,108,195                     ; vpunpcklqdq   %xmm3,%xmm1,%xmm0
   DB  197,241,109,203                     ; vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  DB  197,249,111,29,192,146,2,0          ; vmovdqa       0x292c0(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,249,111,29,32,150,2,0           ; vmovdqa       0x29620(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  197,249,219,195                     ; vpand         %xmm3,%xmm0,%xmm0
   DB  196,98,125,51,200                   ; vpmovzxwd     %xmm0,%ymm9
   DB  196,65,45,118,210                   ; vpcmpeqd      %ymm10,%ymm10,%ymm10
@@ -2211,7 +2211,7 @@
   DB  196,226,125,51,219                  ; vpmovzxwd     %xmm3,%ymm3
   DB  196,226,45,146,20,152               ; vgatherdps    %ymm10,(%rax,%ymm3,4),%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,201,144,2,0       ; vbroadcastss  0x290c9(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,41,148,2,0        ; vbroadcastss  0x29429(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  196,129,121,110,4,72                ; vmovd         (%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
@@ -2278,7 +2278,7 @@
 PUBLIC _sk_byte_tables_hsw
 _sk_byte_tables_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,190,143,2,0         ; vbroadcastss  0x28fbe(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,30,147,2,0          ; vbroadcastss  0x2931e(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  197,125,91,200                      ; vcvtps2dq     %ymm0,%ymm9
   DB  196,65,249,126,200                  ; vmovq         %xmm9,%r8
@@ -2408,7 +2408,7 @@
   DB  67,15,182,4,17                      ; movzbl        (%r9,%r10,1),%eax
   DB  196,194,125,49,193                  ; vpmovzxbd     %xmm9,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,140,141,2,0         ; vbroadcastss  0x28d8c(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,236,144,2,0         ; vbroadcastss  0x290ec(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  196,226,125,49,201                  ; vpmovzxbd     %xmm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
@@ -2528,7 +2528,7 @@
   DB  67,15,182,4,17                      ; movzbl        (%r9,%r10,1),%eax
   DB  196,194,125,49,193                  ; vpmovzxbd     %xmm9,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,96,139,2,0          ; vbroadcastss  0x28b60(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,192,142,2,0         ; vbroadcastss  0x28ec0(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  196,226,125,49,201                  ; vpmovzxbd     %xmm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
@@ -2621,33 +2621,33 @@
   DB  196,66,125,168,211                  ; vfmadd213ps   %ymm11,%ymm0,%ymm10
   DB  196,226,125,24,0                    ; vbroadcastss  (%rax),%ymm0
   DB  196,65,124,91,218                   ; vcvtdq2ps     %ymm10,%ymm11
-  DB  196,98,125,24,37,70,138,2,0         ; vbroadcastss  0x28a46(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
-  DB  196,98,125,24,45,65,138,2,0         ; vbroadcastss  0x28a41(%rip),%ymm13        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,166,141,2,0        ; vbroadcastss  0x28da6(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,45,161,141,2,0        ; vbroadcastss  0x28da1(%rip),%ymm13        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,65,44,84,213                    ; vandps        %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,151,137,2,0        ; vbroadcastss  0x28997(%rip),%ymm13        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,45,247,140,2,0        ; vbroadcastss  0x28cf7(%rip),%ymm13        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,44,86,213                    ; vorps         %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,41,138,2,0         ; vbroadcastss  0x28a29(%rip),%ymm13        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,45,137,141,2,0        ; vbroadcastss  0x28d89(%rip),%ymm13        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,66,37,184,236                   ; vfmadd231ps   %ymm12,%ymm11,%ymm13
-  DB  196,98,125,24,29,31,138,2,0         ; vbroadcastss  0x28a1f(%rip),%ymm11        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,29,127,141,2,0        ; vbroadcastss  0x28d7f(%rip),%ymm11        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,66,45,172,221                   ; vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  DB  196,98,125,24,37,21,138,2,0         ; vbroadcastss  0x28a15(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,117,141,2,0        ; vbroadcastss  0x28d75(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,11,138,2,0         ; vbroadcastss  0x28a0b(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,107,141,2,0        ; vbroadcastss  0x28d6b(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  196,65,28,94,210                    ; vdivps        %ymm10,%ymm12,%ymm10
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  196,99,125,8,208,1                  ; vroundps      $0x1,%ymm0,%ymm10
   DB  196,65,124,92,210                   ; vsubps        %ymm10,%ymm0,%ymm10
-  DB  196,98,125,24,29,236,137,2,0        ; vbroadcastss  0x289ec(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,76,141,2,0         ; vbroadcastss  0x28d4c(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,124,88,195                  ; vaddps        %ymm11,%ymm0,%ymm0
-  DB  196,98,125,24,29,226,137,2,0        ; vbroadcastss  0x289e2(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,66,141,2,0         ; vbroadcastss  0x28d42(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,98,45,172,216                   ; vfnmadd213ps  %ymm0,%ymm10,%ymm11
-  DB  196,226,125,24,5,216,137,2,0        ; vbroadcastss  0x289d8(%rip),%ymm0        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,226,125,24,5,56,141,2,0         ; vbroadcastss  0x28d38(%rip),%ymm0        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,193,124,92,194                  ; vsubps        %ymm10,%ymm0,%ymm0
-  DB  196,98,125,24,21,206,137,2,0        ; vbroadcastss  0x289ce(%rip),%ymm10        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,21,46,141,2,0         ; vbroadcastss  0x28d2e(%rip),%ymm10        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  197,172,94,192                      ; vdivps        %ymm0,%ymm10,%ymm0
   DB  197,164,88,192                      ; vaddps        %ymm0,%ymm11,%ymm0
-  DB  196,98,125,24,21,193,137,2,0        ; vbroadcastss  0x289c1(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,33,141,2,0         ; vbroadcastss  0x28d21(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  197,253,91,192                      ; vcvtps2dq     %ymm0,%ymm0
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -2655,7 +2655,7 @@
   DB  196,195,125,74,193,128              ; vblendvps     %ymm8,%ymm9,%ymm0,%ymm0
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,217,136,2,0         ; vbroadcastss  0x288d9(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,57,140,2,0          ; vbroadcastss  0x28c39(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2673,33 +2673,33 @@
   DB  196,66,117,168,211                  ; vfmadd213ps   %ymm11,%ymm1,%ymm10
   DB  196,226,125,24,8                    ; vbroadcastss  (%rax),%ymm1
   DB  196,65,124,91,218                   ; vcvtdq2ps     %ymm10,%ymm11
-  DB  196,98,125,24,37,33,137,2,0         ; vbroadcastss  0x28921(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
-  DB  196,98,125,24,45,28,137,2,0         ; vbroadcastss  0x2891c(%rip),%ymm13        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,129,140,2,0        ; vbroadcastss  0x28c81(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,45,124,140,2,0        ; vbroadcastss  0x28c7c(%rip),%ymm13        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,65,44,84,213                    ; vandps        %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,114,136,2,0        ; vbroadcastss  0x28872(%rip),%ymm13        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,45,210,139,2,0        ; vbroadcastss  0x28bd2(%rip),%ymm13        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,44,86,213                    ; vorps         %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,4,137,2,0          ; vbroadcastss  0x28904(%rip),%ymm13        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,45,100,140,2,0        ; vbroadcastss  0x28c64(%rip),%ymm13        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,66,37,184,236                   ; vfmadd231ps   %ymm12,%ymm11,%ymm13
-  DB  196,98,125,24,29,250,136,2,0        ; vbroadcastss  0x288fa(%rip),%ymm11        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,29,90,140,2,0         ; vbroadcastss  0x28c5a(%rip),%ymm11        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,66,45,172,221                   ; vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  DB  196,98,125,24,37,240,136,2,0        ; vbroadcastss  0x288f0(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,80,140,2,0         ; vbroadcastss  0x28c50(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,230,136,2,0        ; vbroadcastss  0x288e6(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,70,140,2,0         ; vbroadcastss  0x28c46(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  196,65,28,94,210                    ; vdivps        %ymm10,%ymm12,%ymm10
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
   DB  196,193,116,89,202                  ; vmulps        %ymm10,%ymm1,%ymm1
   DB  196,99,125,8,209,1                  ; vroundps      $0x1,%ymm1,%ymm10
   DB  196,65,116,92,210                   ; vsubps        %ymm10,%ymm1,%ymm10
-  DB  196,98,125,24,29,199,136,2,0        ; vbroadcastss  0x288c7(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,39,140,2,0         ; vbroadcastss  0x28c27(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,189,136,2,0        ; vbroadcastss  0x288bd(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,29,140,2,0         ; vbroadcastss  0x28c1d(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,98,45,172,217                   ; vfnmadd213ps  %ymm1,%ymm10,%ymm11
-  DB  196,226,125,24,13,179,136,2,0       ; vbroadcastss  0x288b3(%rip),%ymm1        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,226,125,24,13,19,140,2,0        ; vbroadcastss  0x28c13(%rip),%ymm1        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,193,116,92,202                  ; vsubps        %ymm10,%ymm1,%ymm1
-  DB  196,98,125,24,21,169,136,2,0        ; vbroadcastss  0x288a9(%rip),%ymm10        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,21,9,140,2,0          ; vbroadcastss  0x28c09(%rip),%ymm10        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  197,172,94,201                      ; vdivps        %ymm1,%ymm10,%ymm1
   DB  197,164,88,201                      ; vaddps        %ymm1,%ymm11,%ymm1
-  DB  196,98,125,24,21,156,136,2,0        ; vbroadcastss  0x2889c(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,252,139,2,0        ; vbroadcastss  0x28bfc(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,116,89,202                  ; vmulps        %ymm10,%ymm1,%ymm1
   DB  197,253,91,201                      ; vcvtps2dq     %ymm1,%ymm1
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -2707,7 +2707,7 @@
   DB  196,195,117,74,201,128              ; vblendvps     %ymm8,%ymm9,%ymm1,%ymm1
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,116,95,200                  ; vmaxps        %ymm8,%ymm1,%ymm1
-  DB  196,98,125,24,5,180,135,2,0         ; vbroadcastss  0x287b4(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,20,139,2,0          ; vbroadcastss  0x28b14(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2725,33 +2725,33 @@
   DB  196,66,109,168,211                  ; vfmadd213ps   %ymm11,%ymm2,%ymm10
   DB  196,226,125,24,16                   ; vbroadcastss  (%rax),%ymm2
   DB  196,65,124,91,218                   ; vcvtdq2ps     %ymm10,%ymm11
-  DB  196,98,125,24,37,252,135,2,0        ; vbroadcastss  0x287fc(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
-  DB  196,98,125,24,45,247,135,2,0        ; vbroadcastss  0x287f7(%rip),%ymm13        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,92,139,2,0         ; vbroadcastss  0x28b5c(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,45,87,139,2,0         ; vbroadcastss  0x28b57(%rip),%ymm13        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,65,44,84,213                    ; vandps        %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,77,135,2,0         ; vbroadcastss  0x2874d(%rip),%ymm13        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,45,173,138,2,0        ; vbroadcastss  0x28aad(%rip),%ymm13        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,44,86,213                    ; vorps         %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,223,135,2,0        ; vbroadcastss  0x287df(%rip),%ymm13        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,45,63,139,2,0         ; vbroadcastss  0x28b3f(%rip),%ymm13        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,66,37,184,236                   ; vfmadd231ps   %ymm12,%ymm11,%ymm13
-  DB  196,98,125,24,29,213,135,2,0        ; vbroadcastss  0x287d5(%rip),%ymm11        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,29,53,139,2,0         ; vbroadcastss  0x28b35(%rip),%ymm11        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,66,45,172,221                   ; vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  DB  196,98,125,24,37,203,135,2,0        ; vbroadcastss  0x287cb(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,43,139,2,0         ; vbroadcastss  0x28b2b(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,193,135,2,0        ; vbroadcastss  0x287c1(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,33,139,2,0         ; vbroadcastss  0x28b21(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  196,65,28,94,210                    ; vdivps        %ymm10,%ymm12,%ymm10
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
   DB  196,193,108,89,210                  ; vmulps        %ymm10,%ymm2,%ymm2
   DB  196,99,125,8,210,1                  ; vroundps      $0x1,%ymm2,%ymm10
   DB  196,65,108,92,210                   ; vsubps        %ymm10,%ymm2,%ymm10
-  DB  196,98,125,24,29,162,135,2,0        ; vbroadcastss  0x287a2(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,2,139,2,0          ; vbroadcastss  0x28b02(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
-  DB  196,98,125,24,29,152,135,2,0        ; vbroadcastss  0x28798(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,248,138,2,0        ; vbroadcastss  0x28af8(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,98,45,172,218                   ; vfnmadd213ps  %ymm2,%ymm10,%ymm11
-  DB  196,226,125,24,21,142,135,2,0       ; vbroadcastss  0x2878e(%rip),%ymm2        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,226,125,24,21,238,138,2,0       ; vbroadcastss  0x28aee(%rip),%ymm2        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,193,108,92,210                  ; vsubps        %ymm10,%ymm2,%ymm2
-  DB  196,98,125,24,21,132,135,2,0        ; vbroadcastss  0x28784(%rip),%ymm10        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,21,228,138,2,0        ; vbroadcastss  0x28ae4(%rip),%ymm10        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  197,172,94,210                      ; vdivps        %ymm2,%ymm10,%ymm2
   DB  197,164,88,210                      ; vaddps        %ymm2,%ymm11,%ymm2
-  DB  196,98,125,24,21,119,135,2,0        ; vbroadcastss  0x28777(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,215,138,2,0        ; vbroadcastss  0x28ad7(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,108,89,210                  ; vmulps        %ymm10,%ymm2,%ymm2
   DB  197,253,91,210                      ; vcvtps2dq     %ymm2,%ymm2
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -2759,7 +2759,7 @@
   DB  196,195,109,74,209,128              ; vblendvps     %ymm8,%ymm9,%ymm2,%ymm2
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,108,95,208                  ; vmaxps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,143,134,2,0         ; vbroadcastss  0x2868f(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,239,137,2,0         ; vbroadcastss  0x289ef(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2777,33 +2777,33 @@
   DB  196,66,101,168,211                  ; vfmadd213ps   %ymm11,%ymm3,%ymm10
   DB  196,226,125,24,24                   ; vbroadcastss  (%rax),%ymm3
   DB  196,65,124,91,218                   ; vcvtdq2ps     %ymm10,%ymm11
-  DB  196,98,125,24,37,215,134,2,0        ; vbroadcastss  0x286d7(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
-  DB  196,98,125,24,45,210,134,2,0        ; vbroadcastss  0x286d2(%rip),%ymm13        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,55,138,2,0         ; vbroadcastss  0x28a37(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,45,50,138,2,0         ; vbroadcastss  0x28a32(%rip),%ymm13        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,65,44,84,213                    ; vandps        %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,40,134,2,0         ; vbroadcastss  0x28628(%rip),%ymm13        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,45,136,137,2,0        ; vbroadcastss  0x28988(%rip),%ymm13        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,44,86,213                    ; vorps         %ymm13,%ymm10,%ymm10
-  DB  196,98,125,24,45,186,134,2,0        ; vbroadcastss  0x286ba(%rip),%ymm13        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,45,26,138,2,0         ; vbroadcastss  0x28a1a(%rip),%ymm13        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,66,37,184,236                   ; vfmadd231ps   %ymm12,%ymm11,%ymm13
-  DB  196,98,125,24,29,176,134,2,0        ; vbroadcastss  0x286b0(%rip),%ymm11        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,29,16,138,2,0         ; vbroadcastss  0x28a10(%rip),%ymm11        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,66,45,172,221                   ; vfnmadd213ps  %ymm13,%ymm10,%ymm11
-  DB  196,98,125,24,37,166,134,2,0        ; vbroadcastss  0x286a6(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,6,138,2,0          ; vbroadcastss  0x28a06(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,156,134,2,0        ; vbroadcastss  0x2869c(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,252,137,2,0        ; vbroadcastss  0x289fc(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  196,65,28,94,210                    ; vdivps        %ymm10,%ymm12,%ymm10
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
   DB  196,193,100,89,218                  ; vmulps        %ymm10,%ymm3,%ymm3
   DB  196,99,125,8,211,1                  ; vroundps      $0x1,%ymm3,%ymm10
   DB  196,65,100,92,210                   ; vsubps        %ymm10,%ymm3,%ymm10
-  DB  196,98,125,24,29,125,134,2,0        ; vbroadcastss  0x2867d(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,221,137,2,0        ; vbroadcastss  0x289dd(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,100,88,219                  ; vaddps        %ymm11,%ymm3,%ymm3
-  DB  196,98,125,24,29,115,134,2,0        ; vbroadcastss  0x28673(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,211,137,2,0        ; vbroadcastss  0x289d3(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,98,45,172,219                   ; vfnmadd213ps  %ymm3,%ymm10,%ymm11
-  DB  196,226,125,24,29,105,134,2,0       ; vbroadcastss  0x28669(%rip),%ymm3        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,226,125,24,29,201,137,2,0       ; vbroadcastss  0x289c9(%rip),%ymm3        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,193,100,92,218                  ; vsubps        %ymm10,%ymm3,%ymm3
-  DB  196,98,125,24,21,95,134,2,0         ; vbroadcastss  0x2865f(%rip),%ymm10        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,21,191,137,2,0        ; vbroadcastss  0x289bf(%rip),%ymm10        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  197,172,94,219                      ; vdivps        %ymm3,%ymm10,%ymm3
   DB  197,164,88,219                      ; vaddps        %ymm3,%ymm11,%ymm3
-  DB  196,98,125,24,21,82,134,2,0         ; vbroadcastss  0x28652(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,178,137,2,0        ; vbroadcastss  0x289b2(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,100,89,218                  ; vmulps        %ymm10,%ymm3,%ymm3
   DB  197,253,91,219                      ; vcvtps2dq     %ymm3,%ymm3
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -2811,7 +2811,7 @@
   DB  196,195,101,74,217,128              ; vblendvps     %ymm8,%ymm9,%ymm3,%ymm3
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,100,95,216                  ; vmaxps        %ymm8,%ymm3,%ymm3
-  DB  196,98,125,24,5,106,133,2,0         ; vbroadcastss  0x2856a(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,202,136,2,0         ; vbroadcastss  0x288ca(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2828,35 +2828,35 @@
   DB  197,252,40,241                      ; vmovaps       %ymm1,%ymm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,124,91,208                      ; vcvtdq2ps     %ymm0,%ymm10
-  DB  196,98,125,24,29,183,133,2,0        ; vbroadcastss  0x285b7(%rip),%ymm11        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
-  DB  196,226,125,24,45,178,133,2,0       ; vbroadcastss  0x285b2(%rip),%ymm5        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,29,23,137,2,0         ; vbroadcastss  0x28917(%rip),%ymm11        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,226,125,24,45,18,137,2,0        ; vbroadcastss  0x28912(%rip),%ymm5        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  197,124,84,205                      ; vandps        %ymm5,%ymm0,%ymm9
-  DB  196,226,125,24,37,9,133,2,0         ; vbroadcastss  0x28509(%rip),%ymm4        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,37,105,136,2,0       ; vbroadcastss  0x28869(%rip),%ymm4        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,52,86,228                       ; vorps         %ymm4,%ymm9,%ymm12
-  DB  196,98,125,24,45,156,133,2,0        ; vbroadcastss  0x2859c(%rip),%ymm13        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,45,252,136,2,0        ; vbroadcastss  0x288fc(%rip),%ymm13        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,66,37,168,213                   ; vfmadd213ps   %ymm13,%ymm11,%ymm10
-  DB  196,98,125,24,13,146,133,2,0        ; vbroadcastss  0x28592(%rip),%ymm9        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,13,242,136,2,0        ; vbroadcastss  0x288f2(%rip),%ymm9        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,66,29,188,209                   ; vfnmadd231ps  %ymm9,%ymm12,%ymm10
   DB  197,124,91,246                      ; vcvtdq2ps     %ymm6,%ymm14
   DB  196,66,37,168,245                   ; vfmadd213ps   %ymm13,%ymm11,%ymm14
   DB  197,124,91,255                      ; vcvtdq2ps     %ymm7,%ymm15
   DB  196,66,37,168,253                   ; vfmadd213ps   %ymm13,%ymm11,%ymm15
-  DB  196,98,125,24,29,118,133,2,0        ; vbroadcastss  0x28576(%rip),%ymm11        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,29,214,136,2,0        ; vbroadcastss  0x288d6(%rip),%ymm11        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,65,28,88,227                    ; vaddps        %ymm11,%ymm12,%ymm12
-  DB  196,98,125,24,45,108,133,2,0        ; vbroadcastss  0x2856c(%rip),%ymm13        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,45,204,136,2,0        ; vbroadcastss  0x288cc(%rip),%ymm13        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  196,65,20,94,228                    ; vdivps        %ymm12,%ymm13,%ymm12
   DB  196,65,44,92,212                    ; vsubps        %ymm12,%ymm10,%ymm10
   DB  196,98,125,24,32                    ; vbroadcastss  (%rax),%ymm12
   DB  196,65,44,89,212                    ; vmulps        %ymm12,%ymm10,%ymm10
   DB  196,67,125,8,194,1                  ; vroundps      $0x1,%ymm10,%ymm8
   DB  196,65,44,92,192                    ; vsubps        %ymm8,%ymm10,%ymm8
-  DB  196,226,125,24,21,72,133,2,0        ; vbroadcastss  0x28548(%rip),%ymm2        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,226,125,24,21,168,136,2,0       ; vbroadcastss  0x288a8(%rip),%ymm2        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  197,44,88,210                       ; vaddps        %ymm2,%ymm10,%ymm10
-  DB  196,226,125,24,29,63,133,2,0        ; vbroadcastss  0x2853f(%rip),%ymm3        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,226,125,24,29,159,136,2,0       ; vbroadcastss  0x2889f(%rip),%ymm3        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,98,61,188,211                   ; vfnmadd231ps  %ymm3,%ymm8,%ymm10
-  DB  196,226,125,24,13,53,133,2,0        ; vbroadcastss  0x28535(%rip),%ymm1        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,226,125,24,13,149,136,2,0       ; vbroadcastss  0x28895(%rip),%ymm1        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,65,116,92,192                   ; vsubps        %ymm8,%ymm1,%ymm8
-  DB  196,226,125,24,5,43,133,2,0         ; vbroadcastss  0x2852b(%rip),%ymm0        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,226,125,24,5,139,136,2,0        ; vbroadcastss  0x2888b(%rip),%ymm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  196,65,124,94,192                   ; vdivps        %ymm8,%ymm0,%ymm8
   DB  196,65,44,88,192                    ; vaddps        %ymm8,%ymm10,%ymm8
   DB  197,204,84,245                      ; vandps        %ymm5,%ymm6,%ymm6
@@ -2887,7 +2887,7 @@
   DB  197,244,92,205                      ; vsubps        %ymm5,%ymm1,%ymm1
   DB  197,252,94,193                      ; vdivps        %ymm1,%ymm0,%ymm0
   DB  197,236,88,192                      ; vaddps        %ymm0,%ymm2,%ymm0
-  DB  196,226,125,24,13,156,132,2,0       ; vbroadcastss  0x2849c(%rip),%ymm1        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,226,125,24,13,252,135,2,0       ; vbroadcastss  0x287fc(%rip),%ymm1        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  197,188,89,209                      ; vmulps        %ymm1,%ymm8,%ymm2
   DB  197,204,89,217                      ; vmulps        %ymm1,%ymm6,%ymm3
   DB  197,252,89,225                      ; vmulps        %ymm1,%ymm0,%ymm4
@@ -2905,26 +2905,26 @@
 
 PUBLIC _sk_lab_to_xyz_hsw
 _sk_lab_to_xyz_hsw LABEL PROC
-  DB  196,98,125,24,5,84,132,2,0          ; vbroadcastss  0x28454(%rip),%ymm8        # 2b5a8 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
-  DB  196,98,125,24,13,183,131,2,0        ; vbroadcastss  0x283b7(%rip),%ymm9        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  196,98,125,24,21,70,132,2,0         ; vbroadcastss  0x28446(%rip),%ymm10        # 2b5ac <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  DB  196,98,125,24,5,180,135,2,0         ; vbroadcastss  0x287b4(%rip),%ymm8        # 2b908 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  DB  196,98,125,24,13,23,135,2,0         ; vbroadcastss  0x28717(%rip),%ymm9        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,125,24,21,166,135,2,0        ; vbroadcastss  0x287a6(%rip),%ymm10        # 2b90c <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   DB  196,194,53,168,202                  ; vfmadd213ps   %ymm10,%ymm9,%ymm1
   DB  196,194,53,168,210                  ; vfmadd213ps   %ymm10,%ymm9,%ymm2
-  DB  196,98,125,24,13,55,132,2,0         ; vbroadcastss  0x28437(%rip),%ymm9        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  DB  196,98,125,24,13,151,135,2,0        ; vbroadcastss  0x28797(%rip),%ymm9        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
   DB  196,66,125,184,200                  ; vfmadd231ps   %ymm8,%ymm0,%ymm9
-  DB  196,226,125,24,5,45,132,2,0         ; vbroadcastss  0x2842d(%rip),%ymm0        # 2b5b4 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
+  DB  196,226,125,24,5,141,135,2,0        ; vbroadcastss  0x2878d(%rip),%ymm0        # 2b914 <_sk_srcover_rgba_8888_sse2_lowp+0x910>
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
-  DB  196,98,125,24,5,36,132,2,0          ; vbroadcastss  0x28424(%rip),%ymm8        # 2b5b8 <_sk_srcover_rgba_8888_sse2_lowp+0x910>
+  DB  196,98,125,24,5,132,135,2,0         ; vbroadcastss  0x28784(%rip),%ymm8        # 2b918 <_sk_srcover_rgba_8888_sse2_lowp+0x914>
   DB  196,98,117,168,192                  ; vfmadd213ps   %ymm0,%ymm1,%ymm8
-  DB  196,98,125,24,13,26,132,2,0         ; vbroadcastss  0x2841a(%rip),%ymm9        # 2b5bc <_sk_srcover_rgba_8888_sse2_lowp+0x914>
+  DB  196,98,125,24,13,122,135,2,0        ; vbroadcastss  0x2877a(%rip),%ymm9        # 2b91c <_sk_srcover_rgba_8888_sse2_lowp+0x918>
   DB  196,98,109,172,200                  ; vfnmadd213ps  %ymm0,%ymm2,%ymm9
   DB  196,193,60,89,200                   ; vmulps        %ymm8,%ymm8,%ymm1
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
-  DB  196,226,125,24,21,7,132,2,0         ; vbroadcastss  0x28407(%rip),%ymm2        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0x918>
+  DB  196,226,125,24,21,103,135,2,0       ; vbroadcastss  0x28767(%rip),%ymm2        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
   DB  197,108,194,209,1                   ; vcmpltps      %ymm1,%ymm2,%ymm10
-  DB  196,98,125,24,29,253,131,2,0        ; vbroadcastss  0x283fd(%rip),%ymm11        # 2b5c4 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
+  DB  196,98,125,24,29,93,135,2,0         ; vbroadcastss  0x2875d(%rip),%ymm11        # 2b924 <_sk_srcover_rgba_8888_sse2_lowp+0x920>
   DB  196,65,60,88,195                    ; vaddps        %ymm11,%ymm8,%ymm8
-  DB  196,98,125,24,37,243,131,2,0        ; vbroadcastss  0x283f3(%rip),%ymm12        # 2b5c8 <_sk_srcover_rgba_8888_sse2_lowp+0x920>
+  DB  196,98,125,24,37,83,135,2,0         ; vbroadcastss  0x28753(%rip),%ymm12        # 2b928 <_sk_srcover_rgba_8888_sse2_lowp+0x924>
   DB  196,65,60,89,196                    ; vmulps        %ymm12,%ymm8,%ymm8
   DB  196,99,61,74,193,160                ; vblendvps     %ymm10,%ymm1,%ymm8,%ymm8
   DB  197,252,89,200                      ; vmulps        %ymm0,%ymm0,%ymm1
@@ -2939,9 +2939,9 @@
   DB  196,65,52,88,203                    ; vaddps        %ymm11,%ymm9,%ymm9
   DB  196,65,52,89,204                    ; vmulps        %ymm12,%ymm9,%ymm9
   DB  196,227,53,74,208,32                ; vblendvps     %ymm2,%ymm0,%ymm9,%ymm2
-  DB  196,226,125,24,5,168,131,2,0        ; vbroadcastss  0x283a8(%rip),%ymm0        # 2b5cc <_sk_srcover_rgba_8888_sse2_lowp+0x924>
+  DB  196,226,125,24,5,8,135,2,0          ; vbroadcastss  0x28708(%rip),%ymm0        # 2b92c <_sk_srcover_rgba_8888_sse2_lowp+0x928>
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,159,131,2,0         ; vbroadcastss  0x2839f(%rip),%ymm8        # 2b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0x928>
+  DB  196,98,125,24,5,255,134,2,0         ; vbroadcastss  0x286ff(%rip),%ymm8        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -2957,10 +2957,10 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  117,52                              ; jne           3286 <_sk_load_a8_hsw+0x4c>
   DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,32,132,2,0            ; vpand         0x28420(%rip),%xmm0,%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,249,219,5,128,135,2,0           ; vpand         0x28780(%rip),%xmm0,%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,234,130,2,0       ; vbroadcastss  0x282ea(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,74,134,2,0        ; vbroadcastss  0x2864a(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -3031,10 +3031,10 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  117,52                              ; jne           3384 <_sk_load_a8_dst_hsw+0x4c>
   DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,34,131,2,0           ; vpand         0x28322(%rip),%xmm4,%xmm4        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,217,219,37,130,134,2,0          ; vpand         0x28682(%rip),%xmm4,%xmm4        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,125,51,228                  ; vpmovzxwd     %xmm4,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,236,129,2,0       ; vbroadcastss  0x281ec(%rip),%ymm5        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,45,76,133,2,0        ; vbroadcastss  0x2854c(%rip),%ymm5        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,220,89,253                      ; vmulps        %ymm5,%ymm4,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
@@ -3082,7 +3082,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde00342c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd8784>
+  DB  232,255,255,255,221                 ; callq         ffffffffde00342c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfd8428>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -3100,6 +3100,16 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
@@ -3137,7 +3147,7 @@
   DB  196,227,121,32,192,7                ; vpinsrb       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,49,192                  ; vpmovzxbd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,96,128,2,0        ; vbroadcastss  0x28060(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,147,131,2,0       ; vbroadcastss  0x28393(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -3157,14 +3167,14 @@
   DB  77,15,175,193                       ; imul          %r9,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,225,127,2,0         ; vbroadcastss  0x27fe1(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,20,131,2,0          ; vbroadcastss  0x28314(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,65,100,89,192                   ; vmulps        %ymm8,%ymm3,%ymm8
   DB  196,65,125,91,192                   ; vcvtps2dq     %ymm8,%ymm8
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  197,57,103,192                      ; vpackuswb     %xmm0,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           355b <_sk_store_a8_hsw+0x44>
+  DB  117,10                              ; jne           3588 <_sk_store_a8_hsw+0x44>
   DB  196,1,121,214,4,24                  ; vmovq         %xmm8,(%r8,%r11,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3172,41 +3182,42 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            3557 <_sk_store_a8_hsw+0x40>
+  DB  119,236                             ; ja            3584 <_sk_store_a8_hsw+0x40>
   DB  196,66,121,48,192                   ; vpmovzxbw     %xmm8,%xmm8
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,85,0,0,0                  ; lea           0x55(%rip),%r10        # 35d0 <_sk_store_a8_hsw+0xb9>
+  DB  76,141,21,88,0,0,0                  ; lea           0x58(%rip),%r10        # 3600 <_sk_store_a8_hsw+0xbc>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,3,121,20,4,24,0                 ; vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,202                             ; jmp           3557 <_sk_store_a8_hsw+0x40>
+  DB  235,202                             ; jmp           3584 <_sk_store_a8_hsw+0x40>
   DB  196,3,121,20,68,24,2,4              ; vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  DB  196,98,57,0,5,242,128,2,0           ; vpshufb       0x280f2(%rip),%xmm8,%xmm8        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x9e8>
+  DB  196,98,57,0,5,37,132,2,0            ; vpshufb       0x28425(%rip),%xmm8,%xmm8        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ec>
   DB  196,3,121,21,4,24,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,176                             ; jmp           3557 <_sk_store_a8_hsw+0x40>
+  DB  235,176                             ; jmp           3584 <_sk_store_a8_hsw+0x40>
   DB  196,3,121,20,68,24,6,12             ; vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
   DB  196,3,121,20,68,24,5,10             ; vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
   DB  196,3,121,20,68,24,4,8              ; vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  DB  196,98,57,0,5,216,128,2,0           ; vpshufb       0x280d8(%rip),%xmm8,%xmm8        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9f8>
+  DB  196,98,57,0,5,11,132,2,0            ; vpshufb       0x2840b(%rip),%xmm8,%xmm8        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x9fc>
   DB  196,1,121,126,4,24                  ; vmovd         %xmm8,(%r8,%r11,1)
-  DB  235,135                             ; jmp           3557 <_sk_store_a8_hsw+0x40>
-  DB  180,255                             ; mov           $0xff,%ah
+  DB  235,135                             ; jmp           3584 <_sk_store_a8_hsw+0x40>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  177,255                             ; mov           $0xff,%cl
   DB  255                                 ; (bad)
-  DB  255,197                             ; inc           %ebp
+  DB  255,194                             ; inc           %edx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  189,255,255,255,239                 ; mov           $0xefffffff,%ebp
+  DB  186,255,255,255,236                 ; mov           $0xecffffff,%edx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,231                             ; jmpq          *%rdi
+  DB  255,228                             ; jmpq          *%rsp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
+  DB  220,255                             ; fdivr         %st,%st(7)
   DB  255                                 ; (bad)
-  DB  255,215                             ; callq         *%rdi
+  DB  255,212                             ; callq         *%rsp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -3220,15 +3231,15 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,57                              ; jne           363d <_sk_load_g8_hsw+0x51>
+  DB  117,57                              ; jne           366d <_sk_load_g8_hsw+0x51>
   DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,110,128,2,0           ; vpand         0x2806e(%rip),%xmm0,%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,249,219,5,158,131,2,0           ; vpand         0x2839e(%rip),%xmm0,%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,56,127,2,0        ; vbroadcastss  0x27f38(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,104,130,2,0       ; vbroadcastss  0x28268(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,181,126,2,0       ; vbroadcastss  0x27eb5(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,229,129,2,0       ; vbroadcastss  0x281e5(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
@@ -3237,15 +3248,15 @@
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,185                             ; ja            360a <_sk_load_g8_hsw+0x1e>
+  DB  119,185                             ; ja            363a <_sk_load_g8_hsw+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # 36d4 <_sk_load_g8_hsw+0xe8>
+  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # 3704 <_sk_load_g8_hsw+0xe8>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,154                             ; jmp           360a <_sk_load_g8_hsw+0x1e>
+  DB  235,154                             ; jmp           363a <_sk_load_g8_hsw+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
@@ -3253,7 +3264,7 @@
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,114,255,255,255                 ; jmpq          360a <_sk_load_g8_hsw+0x1e>
+  DB  233,114,255,255,255                 ; jmpq          363a <_sk_load_g8_hsw+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
@@ -3264,7 +3275,7 @@
   DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,55,255,255,255                  ; jmpq          360a <_sk_load_g8_hsw+0x1e>
+  DB  233,55,255,255,255                  ; jmpq          363a <_sk_load_g8_hsw+0x1e>
   DB  144                                 ; nop
   DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
@@ -3273,7 +3284,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf0036e4 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd8a3c>
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf003714 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd8710>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,211                             ; callq         *%rbx
@@ -3293,15 +3304,15 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,57                              ; jne           3741 <_sk_load_g8_dst_hsw+0x51>
+  DB  117,57                              ; jne           3771 <_sk_load_g8_dst_hsw+0x51>
   DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,106,127,2,0          ; vpand         0x27f6a(%rip),%xmm4,%xmm4        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,217,219,37,154,130,2,0          ; vpand         0x2829a(%rip),%xmm4,%xmm4        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,125,51,228                  ; vpmovzxwd     %xmm4,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,52,126,2,0        ; vbroadcastss  0x27e34(%rip),%ymm5        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,45,100,129,2,0       ; vbroadcastss  0x28164(%rip),%ymm5        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,177,125,2,0       ; vbroadcastss  0x27db1(%rip),%ymm7        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,61,225,128,2,0       ; vbroadcastss  0x280e1(%rip),%ymm7        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,236                      ; vmovaps       %ymm4,%ymm5
   DB  197,252,40,244                      ; vmovaps       %ymm4,%ymm6
   DB  255,224                             ; jmpq          *%rax
@@ -3310,15 +3321,15 @@
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,185                             ; ja            370e <_sk_load_g8_dst_hsw+0x1e>
+  DB  119,185                             ; ja            373e <_sk_load_g8_dst_hsw+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # 37d8 <_sk_load_g8_dst_hsw+0xe8>
+  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # 3808 <_sk_load_g8_dst_hsw+0xe8>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,154                             ; jmp           370e <_sk_load_g8_dst_hsw+0x1e>
+  DB  235,154                             ; jmp           373e <_sk_load_g8_dst_hsw+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
@@ -3326,7 +3337,7 @@
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,114,255,255,255                 ; jmpq          370e <_sk_load_g8_dst_hsw+0x1e>
+  DB  233,114,255,255,255                 ; jmpq          373e <_sk_load_g8_dst_hsw+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
@@ -3337,7 +3348,7 @@
   DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,55,255,255,255                  ; jmpq          370e <_sk_load_g8_dst_hsw+0x1e>
+  DB  233,55,255,255,255                  ; jmpq          373e <_sk_load_g8_dst_hsw+0x1e>
   DB  144                                 ; nop
   DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
@@ -3346,7 +3357,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf0037e8 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd8b40>
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf003818 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefd8814>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,211                             ; callq         *%rbx
@@ -3364,6 +3375,16 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
@@ -3401,10 +3422,10 @@
   DB  196,227,121,32,192,7                ; vpinsrb       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,49,192                  ; vpmovzxbd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,164,124,2,0       ; vbroadcastss  0x27ca4(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,167,127,2,0       ; vbroadcastss  0x27fa7(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,33,124,2,0        ; vbroadcastss  0x27c21(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,36,127,2,0        ; vbroadcastss  0x27f24(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  91                                  ; pop           %rbx
@@ -3423,72 +3444,69 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,114                             ; jne           3965 <_sk_load_565_hsw+0x8d>
+  DB  117,114                             ; jne           39c2 <_sk_load_565_hsw+0x8d>
   DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
   DB  196,226,125,51,208                  ; vpmovzxwd     %xmm0,%ymm2
-  DB  196,226,125,88,5,89,124,2,0         ; vpbroadcastd  0x27c59(%rip),%ymm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,226,125,88,5,92,127,2,0         ; vpbroadcastd  0x27f5c(%rip),%ymm0        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  197,237,219,192                     ; vpand         %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,76,124,2,0        ; vbroadcastss  0x27c4c(%rip),%ymm1        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,226,125,24,13,79,127,2,0        ; vbroadcastss  0x27f4f(%rip),%ymm1        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,67,124,2,0        ; vpbroadcastd  0x27c43(%rip),%ymm1        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,226,125,88,13,70,127,2,0        ; vpbroadcastd  0x27f46(%rip),%ymm1        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,54,124,2,0        ; vbroadcastss  0x27c36(%rip),%ymm3        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,226,125,24,29,57,127,2,0        ; vbroadcastss  0x27f39(%rip),%ymm3        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,88,29,45,124,2,0        ; vpbroadcastd  0x27c2d(%rip),%ymm3        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,226,125,88,29,48,127,2,0        ; vpbroadcastd  0x27f30(%rip),%ymm3        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,32,124,2,0        ; vbroadcastss  0x27c20(%rip),%ymm3        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,226,125,24,29,35,127,2,0        ; vbroadcastss  0x27f23(%rip),%ymm3        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,133,123,2,0       ; vbroadcastss  0x27b85(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,136,126,2,0       ; vbroadcastss  0x27e88(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,128                             ; ja            38f9 <_sk_load_565_hsw+0x21>
+  DB  119,128                             ; ja            3956 <_sk_load_565_hsw+0x21>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 39e8 <_sk_load_565_hsw+0x110>
+  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # 3a44 <_sk_load_565_hsw+0x10f>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,94,255,255,255                  ; jmpq          38f9 <_sk_load_565_hsw+0x21>
+  DB  233,94,255,255,255                  ; jmpq          3956 <_sk_load_565_hsw+0x21>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,65,255,255,255                  ; jmpq          38f9 <_sk_load_565_hsw+0x21>
+  DB  233,65,255,255,255                  ; jmpq          3956 <_sk_load_565_hsw+0x21>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,20,255,255,255                  ; jmpq          38f9 <_sk_load_565_hsw+0x21>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
+  DB  233,20,255,255,255                  ; jmpq          3956 <_sk_load_565_hsw+0x21>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,192                             ; inc           %eax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,180,255,255,255,237,255         ; pushq         -0x120001(%rdi,%rdi,8)
+  DB  255                                 ; (bad)
+  DB  255,229                             ; jmpq          *%rbp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  191,255,255,255,179                 ; mov           $0xb3ffffff,%edi
+  DB  221,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  236                                 ; in            (%dx),%al
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255,209                             ; callq         *%rcx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -3503,53 +3521,53 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,114                             ; jne           3a91 <_sk_load_565_dst_hsw+0x8d>
+  DB  117,114                             ; jne           3aed <_sk_load_565_dst_hsw+0x8d>
   DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
   DB  196,226,125,51,244                  ; vpmovzxwd     %xmm4,%ymm6
-  DB  196,226,125,88,37,45,123,2,0        ; vpbroadcastd  0x27b2d(%rip),%ymm4        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,226,125,88,37,49,126,2,0        ; vpbroadcastd  0x27e31(%rip),%ymm4        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  197,205,219,228                     ; vpand         %ymm4,%ymm6,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,32,123,2,0        ; vbroadcastss  0x27b20(%rip),%ymm5        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,226,125,24,45,36,126,2,0        ; vbroadcastss  0x27e24(%rip),%ymm5        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,88,45,23,123,2,0        ; vpbroadcastd  0x27b17(%rip),%ymm5        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,226,125,88,45,27,126,2,0        ; vpbroadcastd  0x27e1b(%rip),%ymm5        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  197,205,219,237                     ; vpand         %ymm5,%ymm6,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,61,10,123,2,0        ; vbroadcastss  0x27b0a(%rip),%ymm7        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,226,125,24,61,14,126,2,0        ; vbroadcastss  0x27e0e(%rip),%ymm7        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  197,212,89,239                      ; vmulps        %ymm7,%ymm5,%ymm5
-  DB  196,226,125,88,61,1,123,2,0         ; vpbroadcastd  0x27b01(%rip),%ymm7        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,226,125,88,61,5,126,2,0         ; vpbroadcastd  0x27e05(%rip),%ymm7        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  197,205,219,247                     ; vpand         %ymm7,%ymm6,%ymm6
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,226,125,24,61,244,122,2,0       ; vbroadcastss  0x27af4(%rip),%ymm7        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,226,125,24,61,248,125,2,0       ; vbroadcastss  0x27df8(%rip),%ymm7        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  197,204,89,247                      ; vmulps        %ymm7,%ymm6,%ymm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,89,122,2,0        ; vbroadcastss  0x27a59(%rip),%ymm7        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,61,93,125,2,0        ; vbroadcastss  0x27d5d(%rip),%ymm7        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,128                             ; ja            3a25 <_sk_load_565_dst_hsw+0x21>
+  DB  119,128                             ; ja            3a81 <_sk_load_565_dst_hsw+0x21>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 3b14 <_sk_load_565_dst_hsw+0x110>
+  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 3b70 <_sk_load_565_dst_hsw+0x110>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,94,255,255,255                  ; jmpq          3a25 <_sk_load_565_dst_hsw+0x21>
+  DB  233,94,255,255,255                  ; jmpq          3a81 <_sk_load_565_dst_hsw+0x21>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,65,255,255,255                  ; jmpq          3a25 <_sk_load_565_dst_hsw+0x21>
+  DB  233,65,255,255,255                  ; jmpq          3a81 <_sk_load_565_dst_hsw+0x21>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,20,255,255,255                  ; jmpq          3a25 <_sk_load_565_dst_hsw+0x21>
+  DB  233,20,255,255,255                  ; jmpq          3a81 <_sk_load_565_dst_hsw+0x21>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -3580,6 +3598,16 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
@@ -3616,23 +3644,23 @@
   DB  65,15,183,4,88                      ; movzwl        (%r8,%rbx,2),%eax
   DB  197,249,196,192,7                   ; vpinsrw       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,51,208                  ; vpmovzxwd     %xmm0,%ymm2
-  DB  196,226,125,88,5,117,121,2,0        ; vpbroadcastd  0x27975(%rip),%ymm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,226,125,88,5,76,124,2,0         ; vpbroadcastd  0x27c4c(%rip),%ymm0        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  197,237,219,192                     ; vpand         %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,104,121,2,0       ; vbroadcastss  0x27968(%rip),%ymm1        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,226,125,24,13,63,124,2,0        ; vbroadcastss  0x27c3f(%rip),%ymm1        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,95,121,2,0        ; vpbroadcastd  0x2795f(%rip),%ymm1        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,226,125,88,13,54,124,2,0        ; vpbroadcastd  0x27c36(%rip),%ymm1        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,82,121,2,0        ; vbroadcastss  0x27952(%rip),%ymm3        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,226,125,24,29,41,124,2,0        ; vbroadcastss  0x27c29(%rip),%ymm3        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,88,29,73,121,2,0        ; vpbroadcastd  0x27949(%rip),%ymm3        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,226,125,88,29,32,124,2,0        ; vpbroadcastd  0x27c20(%rip),%ymm3        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,60,121,2,0        ; vbroadcastss  0x2793c(%rip),%ymm3        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,226,125,24,29,19,124,2,0        ; vbroadcastss  0x27c13(%rip),%ymm3        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,161,120,2,0       ; vbroadcastss  0x278a1(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,120,123,2,0       ; vbroadcastss  0x27b78(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -3648,11 +3676,11 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,101,121,2,0         ; vbroadcastss  0x27965(%rip),%ymm8        # 2b5d4 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
+  DB  196,98,125,24,5,60,124,2,0          ; vbroadcastss  0x27c3c(%rip),%ymm8        # 2b934 <_sk_srcover_rgba_8888_sse2_lowp+0x930>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,53,114,241,11               ; vpslld        $0xb,%ymm9,%ymm9
-  DB  196,98,125,24,21,80,121,2,0         ; vbroadcastss  0x27950(%rip),%ymm10        # 2b5d8 <_sk_srcover_rgba_8888_sse2_lowp+0x930>
+  DB  196,98,125,24,21,39,124,2,0         ; vbroadcastss  0x27c27(%rip),%ymm10        # 2b938 <_sk_srcover_rgba_8888_sse2_lowp+0x934>
   DB  196,65,116,89,210                   ; vmulps        %ymm10,%ymm1,%ymm10
   DB  196,65,125,91,210                   ; vcvtps2dq     %ymm10,%ymm10
   DB  196,193,45,114,242,5                ; vpslld        $0x5,%ymm10,%ymm10
@@ -3663,7 +3691,7 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           3cc6 <_sk_store_565_hsw+0x76>
+  DB  117,10                              ; jne           3d4f <_sk_store_565_hsw+0x76>
   DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3671,44 +3699,41 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            3cc2 <_sk_store_565_hsw+0x72>
+  DB  119,236                             ; ja            3d4b <_sk_store_565_hsw+0x72>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,67,0,0,0                  ; lea           0x43(%rip),%r10        # 3d24 <_sk_store_565_hsw+0xd4>
+  DB  76,141,21,66,0,0,0                  ; lea           0x42(%rip),%r10        # 3dac <_sk_store_565_hsw+0xd3>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           3cc2 <_sk_store_565_hsw+0x72>
+  DB  235,207                             ; jmp           3d4b <_sk_store_565_hsw+0x72>
   DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           3cc2 <_sk_store_565_hsw+0x72>
+  DB  235,191                             ; jmp           3d4b <_sk_store_565_hsw+0x72>
   DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           3cc2 <_sk_store_565_hsw+0x72>
-  DB  144                                 ; nop
-  DB  198                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,215                             ; callq         *%rdi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,207                             ; dec           %edi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,247                             ; push          %rdi
+  DB  235,159                             ; jmp           3d4b <_sk_store_565_hsw+0x72>
+  DB  199                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  239                                 ; out           %eax,(%dx)
+  DB  216,255                             ; fdivr         %st(7),%st
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,231                             ; jmpq          *%rdi
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
+  DB  248                                 ; clc
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,240                             ; push          %rax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  232,255,255,255,224                 ; callq         ffffffffe1003dc4 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fd8dc0>
+  DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
@@ -3722,28 +3747,28 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,138,0,0,0                    ; jne           3de9 <_sk_load_4444_hsw+0xa9>
+  DB  15,133,138,0,0,0                    ; jne           3e71 <_sk_load_4444_hsw+0xa9>
   DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
   DB  196,226,125,51,216                  ; vpmovzxwd     %xmm0,%ymm3
-  DB  196,226,125,88,5,105,120,2,0        ; vpbroadcastd  0x27869(%rip),%ymm0        # 2b5dc <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  DB  196,226,125,88,5,65,123,2,0         ; vpbroadcastd  0x27b41(%rip),%ymm0        # 2b93c <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   DB  197,229,219,192                     ; vpand         %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,92,120,2,0        ; vbroadcastss  0x2785c(%rip),%ymm1        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  DB  196,226,125,24,13,52,123,2,0        ; vbroadcastss  0x27b34(%rip),%ymm1        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,83,120,2,0        ; vpbroadcastd  0x27853(%rip),%ymm1        # 2b5e4 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  DB  196,226,125,88,13,43,123,2,0        ; vpbroadcastd  0x27b2b(%rip),%ymm1        # 2b944 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   DB  197,229,219,201                     ; vpand         %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,70,120,2,0        ; vbroadcastss  0x27846(%rip),%ymm2        # 2b5e8 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  DB  196,226,125,24,21,30,123,2,0        ; vbroadcastss  0x27b1e(%rip),%ymm2        # 2b948 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,88,21,61,120,2,0        ; vpbroadcastd  0x2783d(%rip),%ymm2        # 2b5ec <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  DB  196,226,125,88,21,21,123,2,0        ; vpbroadcastd  0x27b15(%rip),%ymm2        # 2b94c <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   DB  197,229,219,210                     ; vpand         %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,48,120,2,0          ; vbroadcastss  0x27830(%rip),%ymm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  DB  196,98,125,24,5,8,123,2,0           ; vbroadcastss  0x27b08(%rip),%ymm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,88,5,38,120,2,0          ; vpbroadcastd  0x27826(%rip),%ymm8        # 2b5f4 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  DB  196,98,125,88,5,254,122,2,0         ; vpbroadcastd  0x27afe(%rip),%ymm8        # 2b954 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   DB  196,193,101,219,216                 ; vpand         %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,24,120,2,0          ; vbroadcastss  0x27818(%rip),%ymm8        # 2b5f8 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  DB  196,98,125,24,5,240,122,2,0         ; vbroadcastss  0x27af0(%rip),%ymm8        # 2b958 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3752,27 +3777,27 @@
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,100,255,255,255              ; ja            3d65 <_sk_load_4444_hsw+0x25>
+  DB  15,135,100,255,255,255              ; ja            3ded <_sk_load_4444_hsw+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 3e70 <_sk_load_4444_hsw+0x130>
+  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 3ef8 <_sk_load_4444_hsw+0x130>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,66,255,255,255                  ; jmpq          3d65 <_sk_load_4444_hsw+0x25>
+  DB  233,66,255,255,255                  ; jmpq          3ded <_sk_load_4444_hsw+0x25>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,37,255,255,255                  ; jmpq          3d65 <_sk_load_4444_hsw+0x25>
+  DB  233,37,255,255,255                  ; jmpq          3ded <_sk_load_4444_hsw+0x25>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  233,248,254,255,255                 ; jmpq          3d65 <_sk_load_4444_hsw+0x25>
+  DB  233,248,254,255,255                 ; jmpq          3ded <_sk_load_4444_hsw+0x25>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -3806,28 +3831,28 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,138,0,0,0                    ; jne           3f35 <_sk_load_4444_dst_hsw+0xa9>
+  DB  15,133,138,0,0,0                    ; jne           3fbd <_sk_load_4444_dst_hsw+0xa9>
   DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
   DB  196,226,125,51,252                  ; vpmovzxwd     %xmm4,%ymm7
-  DB  196,226,125,88,37,29,119,2,0        ; vpbroadcastd  0x2771d(%rip),%ymm4        # 2b5dc <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  DB  196,226,125,88,37,245,121,2,0       ; vpbroadcastd  0x279f5(%rip),%ymm4        # 2b93c <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   DB  197,197,219,228                     ; vpand         %ymm4,%ymm7,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,16,119,2,0        ; vbroadcastss  0x27710(%rip),%ymm5        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  DB  196,226,125,24,45,232,121,2,0       ; vbroadcastss  0x279e8(%rip),%ymm5        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,88,45,7,119,2,0         ; vpbroadcastd  0x27707(%rip),%ymm5        # 2b5e4 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  DB  196,226,125,88,45,223,121,2,0       ; vpbroadcastd  0x279df(%rip),%ymm5        # 2b944 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   DB  197,197,219,237                     ; vpand         %ymm5,%ymm7,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,53,250,118,2,0       ; vbroadcastss  0x276fa(%rip),%ymm6        # 2b5e8 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  DB  196,226,125,24,53,210,121,2,0       ; vbroadcastss  0x279d2(%rip),%ymm6        # 2b948 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   DB  197,212,89,238                      ; vmulps        %ymm6,%ymm5,%ymm5
-  DB  196,226,125,88,53,241,118,2,0       ; vpbroadcastd  0x276f1(%rip),%ymm6        # 2b5ec <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  DB  196,226,125,88,53,201,121,2,0       ; vpbroadcastd  0x279c9(%rip),%ymm6        # 2b94c <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   DB  197,197,219,246                     ; vpand         %ymm6,%ymm7,%ymm6
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,98,125,24,5,228,118,2,0         ; vbroadcastss  0x276e4(%rip),%ymm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  DB  196,98,125,24,5,188,121,2,0         ; vbroadcastss  0x279bc(%rip),%ymm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   DB  196,193,76,89,240                   ; vmulps        %ymm8,%ymm6,%ymm6
-  DB  196,98,125,88,5,218,118,2,0         ; vpbroadcastd  0x276da(%rip),%ymm8        # 2b5f4 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  DB  196,98,125,88,5,178,121,2,0         ; vpbroadcastd  0x279b2(%rip),%ymm8        # 2b954 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   DB  196,193,69,219,248                  ; vpand         %ymm8,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,5,204,118,2,0         ; vbroadcastss  0x276cc(%rip),%ymm8        # 2b5f8 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  DB  196,98,125,24,5,164,121,2,0         ; vbroadcastss  0x279a4(%rip),%ymm8        # 2b958 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3836,27 +3861,27 @@
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,100,255,255,255              ; ja            3eb1 <_sk_load_4444_dst_hsw+0x25>
+  DB  15,135,100,255,255,255              ; ja            3f39 <_sk_load_4444_dst_hsw+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 3fbc <_sk_load_4444_dst_hsw+0x130>
+  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # 4044 <_sk_load_4444_dst_hsw+0x130>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,66,255,255,255                  ; jmpq          3eb1 <_sk_load_4444_dst_hsw+0x25>
+  DB  233,66,255,255,255                  ; jmpq          3f39 <_sk_load_4444_dst_hsw+0x25>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,37,255,255,255                  ; jmpq          3eb1 <_sk_load_4444_dst_hsw+0x25>
+  DB  233,37,255,255,255                  ; jmpq          3f39 <_sk_load_4444_dst_hsw+0x25>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  233,248,254,255,255                 ; jmpq          3eb1 <_sk_load_4444_dst_hsw+0x25>
+  DB  233,248,254,255,255                 ; jmpq          3f39 <_sk_load_4444_dst_hsw+0x25>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -3887,6 +3912,16 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
@@ -3923,25 +3958,25 @@
   DB  65,15,183,4,88                      ; movzwl        (%r8,%rbx,2),%eax
   DB  197,249,196,192,7                   ; vpinsrw       $0x7,%eax,%xmm0,%xmm0
   DB  196,226,125,51,216                  ; vpmovzxwd     %xmm0,%ymm3
-  DB  196,226,125,88,5,73,117,2,0         ; vpbroadcastd  0x27549(%rip),%ymm0        # 2b5dc <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  DB  196,226,125,88,5,244,119,2,0        ; vpbroadcastd  0x277f4(%rip),%ymm0        # 2b93c <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   DB  197,229,219,192                     ; vpand         %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,60,117,2,0        ; vbroadcastss  0x2753c(%rip),%ymm1        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  DB  196,226,125,24,13,231,119,2,0       ; vbroadcastss  0x277e7(%rip),%ymm1        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,88,13,51,117,2,0        ; vpbroadcastd  0x27533(%rip),%ymm1        # 2b5e4 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  DB  196,226,125,88,13,222,119,2,0       ; vpbroadcastd  0x277de(%rip),%ymm1        # 2b944 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   DB  197,229,219,201                     ; vpand         %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,38,117,2,0        ; vbroadcastss  0x27526(%rip),%ymm2        # 2b5e8 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  DB  196,226,125,24,21,209,119,2,0       ; vbroadcastss  0x277d1(%rip),%ymm2        # 2b948 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,88,21,29,117,2,0        ; vpbroadcastd  0x2751d(%rip),%ymm2        # 2b5ec <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  DB  196,226,125,88,21,200,119,2,0       ; vpbroadcastd  0x277c8(%rip),%ymm2        # 2b94c <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   DB  197,229,219,210                     ; vpand         %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,16,117,2,0          ; vbroadcastss  0x27510(%rip),%ymm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  DB  196,98,125,24,5,187,119,2,0         ; vbroadcastss  0x277bb(%rip),%ymm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,88,5,6,117,2,0           ; vpbroadcastd  0x27506(%rip),%ymm8        # 2b5f4 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  DB  196,98,125,88,5,177,119,2,0         ; vpbroadcastd  0x277b1(%rip),%ymm8        # 2b954 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   DB  196,193,101,219,216                 ; vpand         %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,248,116,2,0         ; vbroadcastss  0x274f8(%rip),%ymm8        # 2b5f8 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  DB  196,98,125,24,5,163,119,2,0         ; vbroadcastss  0x277a3(%rip),%ymm8        # 2b958 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
@@ -3959,7 +3994,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,205,116,2,0         ; vbroadcastss  0x274cd(%rip),%ymm8        # 2b5fc <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  DB  196,98,125,24,5,120,119,2,0         ; vbroadcastss  0x27778(%rip),%ymm8        # 2b95c <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,53,114,241,12               ; vpslld        $0xc,%ymm9,%ymm9
@@ -3977,7 +4012,7 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           4192 <_sk_store_4444_hsw+0x82>
+  DB  117,10                              ; jne           4247 <_sk_store_4444_hsw+0x82>
   DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -3985,44 +4020,41 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            418e <_sk_store_4444_hsw+0x7e>
+  DB  119,236                             ; ja            4243 <_sk_store_4444_hsw+0x7e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,67,0,0,0                  ; lea           0x43(%rip),%r10        # 41f0 <_sk_store_4444_hsw+0xe0>
+  DB  76,141,21,66,0,0,0                  ; lea           0x42(%rip),%r10        # 42a4 <_sk_store_4444_hsw+0xdf>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           418e <_sk_store_4444_hsw+0x7e>
+  DB  235,207                             ; jmp           4243 <_sk_store_4444_hsw+0x7e>
   DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           418e <_sk_store_4444_hsw+0x7e>
+  DB  235,191                             ; jmp           4243 <_sk_store_4444_hsw+0x7e>
   DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           418e <_sk_store_4444_hsw+0x7e>
-  DB  144                                 ; nop
-  DB  198                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,215                             ; callq         *%rdi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,207                             ; dec           %edi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,247                             ; push          %rdi
+  DB  235,159                             ; jmp           4243 <_sk_store_4444_hsw+0x7e>
+  DB  199                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  239                                 ; out           %eax,(%dx)
+  DB  216,255                             ; fdivr         %st(7),%st
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,231                             ; jmpq          *%rdi
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  223,255                             ; (bad)
+  DB  248                                 ; clc
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,240                             ; push          %rax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  232,255,255,255,224                 ; callq         ffffffffe10042bc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fd92b8>
+  DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
@@ -4036,16 +4068,16 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           427e <_sk_load_8888_hsw+0x72>
+  DB  117,86                              ; jne           4332 <_sk_load_8888_hsw+0x72>
   DB  196,129,126,111,28,152              ; vmovdqu       (%r8,%r11,4),%ymm3
-  DB  197,229,219,5,42,110,2,0            ; vpand         0x26e2a(%rip),%ymm3,%ymm0        # 2b060 <_sk_srcover_rgba_8888_sse2_lowp+0x3b8>
+  DB  197,229,219,5,214,112,2,0           ; vpand         0x270d6(%rip),%ymm3,%ymm0        # 2b3c0 <_sk_srcover_rgba_8888_sse2_lowp+0x3bc>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,25,115,2,0          ; vbroadcastss  0x27319(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,197,117,2,0         ; vbroadcastss  0x275c5(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,226,101,0,13,47,110,2,0         ; vpshufb       0x26e2f(%rip),%ymm3,%ymm1        # 2b080 <_sk_srcover_rgba_8888_sse2_lowp+0x3d8>
+  DB  196,226,101,0,13,219,112,2,0        ; vpshufb       0x270db(%rip),%ymm3,%ymm1        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0x3dc>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
-  DB  196,226,101,0,21,61,110,2,0         ; vpshufb       0x26e3d(%rip),%ymm3,%ymm2        # 2b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x3f8>
+  DB  196,226,101,0,21,233,112,2,0        ; vpshufb       0x270e9(%rip),%ymm3,%ymm2        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0x3fc>
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
@@ -4058,21 +4090,21 @@
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            422e <_sk_load_8888_hsw+0x22>
+  DB  119,156                             ; ja            42e2 <_sk_load_8888_hsw+0x22>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4324 <_sk_load_8888_hsw+0x118>
+  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 43d8 <_sk_load_8888_hsw+0x118>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,129,121,110,28,152              ; vmovd         (%r8,%r11,4),%xmm3
-  DB  235,128                             ; jmp           422e <_sk_load_8888_hsw+0x22>
+  DB  235,128                             ; jmp           42e2 <_sk_load_8888_hsw+0x22>
   DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,4                 ; vpblendd      $0x4,%ymm0,%ymm1,%ymm3
   DB  196,129,122,126,4,152               ; vmovq         (%r8,%r11,4),%xmm0
   DB  196,227,101,2,216,3                 ; vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  DB  233,89,255,255,255                  ; jmpq          422e <_sk_load_8888_hsw+0x22>
+  DB  233,89,255,255,255                  ; jmpq          42e2 <_sk_load_8888_hsw+0x22>
   DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -4085,7 +4117,7 @@
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   DB  196,129,122,111,4,152               ; vmovdqu       (%r8,%r11,4),%xmm0
   DB  196,227,125,2,219,240               ; vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  DB  233,10,255,255,255                  ; jmpq          422e <_sk_load_8888_hsw+0x22>
+  DB  233,10,255,255,255                  ; jmpq          42e2 <_sk_load_8888_hsw+0x22>
   DB  130                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -4117,16 +4149,16 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           43b2 <_sk_load_8888_dst_hsw+0x72>
+  DB  117,86                              ; jne           4466 <_sk_load_8888_dst_hsw+0x72>
   DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,86,109,2,0           ; vpand         0x26d56(%rip),%ymm7,%ymm4        # 2b0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x418>
+  DB  197,197,219,37,2,112,2,0            ; vpand         0x27002(%rip),%ymm7,%ymm4        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0x41c>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,98,125,24,5,229,113,2,0         ; vbroadcastss  0x271e5(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,145,116,2,0         ; vbroadcastss  0x27491(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,92,89,224                   ; vmulps        %ymm8,%ymm4,%ymm4
-  DB  196,226,69,0,45,91,109,2,0          ; vpshufb       0x26d5b(%rip),%ymm7,%ymm5        # 2b0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x438>
+  DB  196,226,69,0,45,7,112,2,0           ; vpshufb       0x27007(%rip),%ymm7,%ymm5        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0x43c>
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
   DB  196,193,84,89,232                   ; vmulps        %ymm8,%ymm5,%ymm5
-  DB  196,226,69,0,53,105,109,2,0         ; vpshufb       0x26d69(%rip),%ymm7,%ymm6        # 2b100 <_sk_srcover_rgba_8888_sse2_lowp+0x458>
+  DB  196,226,69,0,53,21,112,2,0          ; vpshufb       0x27015(%rip),%ymm7,%ymm6        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0x45c>
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
   DB  196,193,76,89,240                   ; vmulps        %ymm8,%ymm6,%ymm6
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
@@ -4139,21 +4171,21 @@
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            4362 <_sk_load_8888_dst_hsw+0x22>
+  DB  119,156                             ; ja            4416 <_sk_load_8888_dst_hsw+0x22>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4458 <_sk_load_8888_dst_hsw+0x118>
+  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 450c <_sk_load_8888_dst_hsw+0x118>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,129,121,110,60,152              ; vmovd         (%r8,%r11,4),%xmm7
-  DB  235,128                             ; jmp           4362 <_sk_load_8888_dst_hsw+0x22>
+  DB  235,128                             ; jmp           4416 <_sk_load_8888_dst_hsw+0x22>
   DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,4                  ; vpblendd      $0x4,%ymm4,%ymm5,%ymm7
   DB  196,129,122,126,36,152              ; vmovq         (%r8,%r11,4),%xmm4
   DB  196,227,69,2,252,3                  ; vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  DB  233,89,255,255,255                  ; jmpq          4362 <_sk_load_8888_dst_hsw+0x22>
+  DB  233,89,255,255,255                  ; jmpq          4416 <_sk_load_8888_dst_hsw+0x22>
   DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -4166,7 +4198,7 @@
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   DB  196,129,122,111,36,152              ; vmovdqu       (%r8,%r11,4),%xmm4
   DB  196,227,93,2,255,240                ; vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  DB  233,10,255,255,255                  ; jmpq          4362 <_sk_load_8888_dst_hsw+0x22>
+  DB  233,10,255,255,255                  ; jmpq          4416 <_sk_load_8888_dst_hsw+0x22>
   DB  130                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -4191,28 +4223,36 @@
 PUBLIC _sk_gather_8888_hsw
 _sk_gather_8888_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
   DB  196,226,109,64,201                  ; vpmulld       %ymm1,%ymm2,%ymm1
   DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
   DB  197,245,254,192                     ; vpaddd        %ymm0,%ymm1,%ymm0
-  DB  197,245,118,201                     ; vpcmpeqd      %ymm1,%ymm1,%ymm1
-  DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
-  DB  196,194,117,144,28,128              ; vpgatherdd    %ymm1,(%r8,%ymm0,4),%ymm3
-  DB  197,229,219,5,122,108,2,0           ; vpand         0x26c7a(%rip),%ymm3,%ymm0        # 2b120 <_sk_srcover_rgba_8888_sse2_lowp+0x478>
+  DB  196,66,101,144,4,128                ; vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
+  DB  197,189,219,5,1,111,2,0             ; vpand         0x26f01(%rip),%ymm8,%ymm0        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0x47c>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,169,112,2,0         ; vbroadcastss  0x270a9(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
-  DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,226,101,0,13,127,108,2,0        ; vpshufb       0x26c7f(%rip),%ymm3,%ymm1        # 2b140 <_sk_srcover_rgba_8888_sse2_lowp+0x498>
+  DB  196,226,125,24,29,48,115,2,0        ; vbroadcastss  0x27330(%rip),%ymm3        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
+  DB  196,226,61,0,13,7,111,2,0           ; vpshufb       0x26f07(%rip),%ymm8,%ymm1        # 2b4a0 <_sk_srcover_rgba_8888_sse2_lowp+0x49c>
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
-  DB  196,226,101,0,21,141,108,2,0        ; vpshufb       0x26c8d(%rip),%ymm3,%ymm2        # 2b160 <_sk_srcover_rgba_8888_sse2_lowp+0x4b8>
+  DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
+  DB  196,226,61,0,21,22,111,2,0          ; vpshufb       0x26f16(%rip),%ymm8,%ymm2        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0x4bc>
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
-  DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
+  DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
+  DB  196,193,61,114,208,24               ; vpsrld        $0x18,%ymm8,%ymm8
+  DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
+  DB  197,188,89,219                      ; vmulps        %ymm3,%ymm8,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -4225,7 +4265,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,6,112,2,0           ; vbroadcastss  0x27006(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,143,114,2,0         ; vbroadcastss  0x2728f(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,65,116,89,208                   ; vmulps        %ymm8,%ymm1,%ymm10
@@ -4241,7 +4281,7 @@
   DB  196,65,45,235,192                   ; vpor          %ymm8,%ymm10,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           4566 <_sk_store_8888_hsw+0x78>
+  DB  117,10                              ; jne           463d <_sk_store_8888_hsw+0x78>
   DB  196,1,126,127,4,152                 ; vmovdqu       %ymm8,(%r8,%r11,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -4249,17 +4289,17 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            4562 <_sk_store_8888_hsw+0x74>
+  DB  119,236                             ; ja            4639 <_sk_store_8888_hsw+0x74>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,83,0,0,0                  ; lea           0x53(%rip),%r10        # 45d4 <_sk_store_8888_hsw+0xe6>
+  DB  76,141,21,84,0,0,0                  ; lea           0x54(%rip),%r10        # 46ac <_sk_store_8888_hsw+0xe7>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           4562 <_sk_store_8888_hsw+0x74>
+  DB  235,208                             ; jmp           4639 <_sk_store_8888_hsw+0x74>
   DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           4562 <_sk_store_8888_hsw+0x74>
+  DB  235,192                             ; jmp           4639 <_sk_store_8888_hsw+0x74>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -4267,25 +4307,22 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
   DB  196,1,122,127,4,152                 ; vmovdqu       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           4562 <_sk_store_8888_hsw+0x74>
-  DB  144                                 ; nop
-  DB  182,255                             ; mov           $0xff,%dh
+  DB  235,143                             ; jmp           4639 <_sk_store_8888_hsw+0x74>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  181,255                             ; mov           $0xff,%ch
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
+  DB  189,255,255,255,246                 ; mov           $0xf6ffffff,%ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  233,255,255,255,219                 ; jmpq          ffffffffdc0046c0 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdbfd96bc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,205                             ; dec           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -4300,16 +4337,16 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           4662 <_sk_load_bgra_hsw+0x72>
+  DB  117,86                              ; jne           473a <_sk_load_bgra_hsw+0x72>
   DB  196,129,126,111,28,152              ; vmovdqu       (%r8,%r11,4),%ymm3
-  DB  197,229,219,5,102,107,2,0           ; vpand         0x26b66(%rip),%ymm3,%ymm0        # 2b180 <_sk_srcover_rgba_8888_sse2_lowp+0x4d8>
+  DB  197,229,219,5,238,109,2,0           ; vpand         0x26dee(%rip),%ymm3,%ymm0        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0x4dc>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,53,111,2,0          ; vbroadcastss  0x26f35(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,189,113,2,0         ; vbroadcastss  0x271bd(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,208                  ; vmulps        %ymm8,%ymm0,%ymm2
-  DB  196,226,101,0,5,107,107,2,0         ; vpshufb       0x26b6b(%rip),%ymm3,%ymm0        # 2b1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x4f8>
+  DB  196,226,101,0,5,243,109,2,0         ; vpshufb       0x26df3(%rip),%ymm3,%ymm0        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0x4fc>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  196,193,124,89,200                  ; vmulps        %ymm8,%ymm0,%ymm1
-  DB  196,226,101,0,5,121,107,2,0         ; vpshufb       0x26b79(%rip),%ymm3,%ymm0        # 2b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x518>
+  DB  196,226,101,0,5,1,110,2,0           ; vpshufb       0x26e01(%rip),%ymm3,%ymm0        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0x51c>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
@@ -4322,21 +4359,21 @@
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            4612 <_sk_load_bgra_hsw+0x22>
+  DB  119,156                             ; ja            46ea <_sk_load_bgra_hsw+0x22>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4708 <_sk_load_bgra_hsw+0x118>
+  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 47e0 <_sk_load_bgra_hsw+0x118>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,129,121,110,28,152              ; vmovd         (%r8,%r11,4),%xmm3
-  DB  235,128                             ; jmp           4612 <_sk_load_bgra_hsw+0x22>
+  DB  235,128                             ; jmp           46ea <_sk_load_bgra_hsw+0x22>
   DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
   DB  196,227,117,2,216,4                 ; vpblendd      $0x4,%ymm0,%ymm1,%ymm3
   DB  196,129,122,126,4,152               ; vmovq         (%r8,%r11,4),%xmm0
   DB  196,227,101,2,216,3                 ; vpblendd      $0x3,%ymm0,%ymm3,%ymm3
-  DB  233,89,255,255,255                  ; jmpq          4612 <_sk_load_bgra_hsw+0x22>
+  DB  233,89,255,255,255                  ; jmpq          46ea <_sk_load_bgra_hsw+0x22>
   DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -4349,7 +4386,7 @@
   DB  196,227,101,56,216,1                ; vinserti128   $0x1,%xmm0,%ymm3,%ymm3
   DB  196,129,122,111,4,152               ; vmovdqu       (%r8,%r11,4),%xmm0
   DB  196,227,125,2,219,240               ; vpblendd      $0xf0,%ymm3,%ymm0,%ymm3
-  DB  233,10,255,255,255                  ; jmpq          4612 <_sk_load_bgra_hsw+0x22>
+  DB  233,10,255,255,255                  ; jmpq          46ea <_sk_load_bgra_hsw+0x22>
   DB  130                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -4381,16 +4418,16 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,86                              ; jne           4796 <_sk_load_bgra_dst_hsw+0x72>
+  DB  117,86                              ; jne           486e <_sk_load_bgra_dst_hsw+0x72>
   DB  196,129,126,111,60,152              ; vmovdqu       (%r8,%r11,4),%ymm7
-  DB  197,197,219,37,146,106,2,0          ; vpand         0x26a92(%rip),%ymm7,%ymm4        # 2b1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x538>
+  DB  197,197,219,37,26,109,2,0           ; vpand         0x26d1a(%rip),%ymm7,%ymm4        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0x53c>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,98,125,24,5,1,110,2,0           ; vbroadcastss  0x26e01(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,137,112,2,0         ; vbroadcastss  0x27089(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,92,89,240                   ; vmulps        %ymm8,%ymm4,%ymm6
-  DB  196,226,69,0,37,151,106,2,0         ; vpshufb       0x26a97(%rip),%ymm7,%ymm4        # 2b200 <_sk_srcover_rgba_8888_sse2_lowp+0x558>
+  DB  196,226,69,0,37,31,109,2,0          ; vpshufb       0x26d1f(%rip),%ymm7,%ymm4        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x55c>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  196,193,92,89,232                   ; vmulps        %ymm8,%ymm4,%ymm5
-  DB  196,226,69,0,37,165,106,2,0         ; vpshufb       0x26aa5(%rip),%ymm7,%ymm4        # 2b220 <_sk_srcover_rgba_8888_sse2_lowp+0x578>
+  DB  196,226,69,0,37,45,109,2,0          ; vpshufb       0x26d2d(%rip),%ymm7,%ymm4        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x57c>
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  196,193,92,89,224                   ; vmulps        %ymm8,%ymm4,%ymm4
   DB  197,197,114,215,24                  ; vpsrld        $0x18,%ymm7,%ymm7
@@ -4403,21 +4440,21 @@
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,156                             ; ja            4746 <_sk_load_bgra_dst_hsw+0x22>
+  DB  119,156                             ; ja            481e <_sk_load_bgra_dst_hsw+0x22>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 483c <_sk_load_bgra_dst_hsw+0x118>
+  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 4914 <_sk_load_bgra_dst_hsw+0x118>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,129,121,110,60,152              ; vmovd         (%r8,%r11,4),%xmm7
-  DB  235,128                             ; jmp           4746 <_sk_load_bgra_dst_hsw+0x22>
+  DB  235,128                             ; jmp           481e <_sk_load_bgra_dst_hsw+0x22>
   DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  196,227,85,2,252,4                  ; vpblendd      $0x4,%ymm4,%ymm5,%ymm7
   DB  196,129,122,126,36,152              ; vmovq         (%r8,%r11,4),%xmm4
   DB  196,227,69,2,252,3                  ; vpblendd      $0x3,%ymm4,%ymm7,%ymm7
-  DB  233,89,255,255,255                  ; jmpq          4746 <_sk_load_bgra_dst_hsw+0x22>
+  DB  233,89,255,255,255                  ; jmpq          481e <_sk_load_bgra_dst_hsw+0x22>
   DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -4430,7 +4467,7 @@
   DB  196,227,69,56,252,1                 ; vinserti128   $0x1,%xmm4,%ymm7,%ymm7
   DB  196,129,122,111,36,152              ; vmovdqu       (%r8,%r11,4),%xmm4
   DB  196,227,93,2,255,240                ; vpblendd      $0xf0,%ymm7,%ymm4,%ymm7
-  DB  233,10,255,255,255                  ; jmpq          4746 <_sk_load_bgra_dst_hsw+0x22>
+  DB  233,10,255,255,255                  ; jmpq          481e <_sk_load_bgra_dst_hsw+0x22>
   DB  130                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -4455,28 +4492,36 @@
 PUBLIC _sk_gather_bgra_hsw
 _sk_gather_bgra_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
   DB  196,226,109,64,201                  ; vpmulld       %ymm1,%ymm2,%ymm1
   DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
   DB  197,245,254,192                     ; vpaddd        %ymm0,%ymm1,%ymm0
-  DB  197,245,118,201                     ; vpcmpeqd      %ymm1,%ymm1,%ymm1
-  DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
-  DB  196,194,117,144,28,128              ; vpgatherdd    %ymm1,(%r8,%ymm0,4),%ymm3
-  DB  197,229,219,5,182,105,2,0           ; vpand         0x269b6(%rip),%ymm3,%ymm0        # 2b240 <_sk_srcover_rgba_8888_sse2_lowp+0x598>
+  DB  196,66,101,144,4,128                ; vpgatherdd    %ymm3,(%r8,%ymm0,4),%ymm8
+  DB  197,189,219,5,25,108,2,0            ; vpand         0x26c19(%rip),%ymm8,%ymm0        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x59c>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,197,108,2,0         ; vbroadcastss  0x26cc5(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
-  DB  196,193,124,89,208                  ; vmulps        %ymm8,%ymm0,%ymm2
-  DB  196,226,101,0,5,187,105,2,0         ; vpshufb       0x269bb(%rip),%ymm3,%ymm0        # 2b260 <_sk_srcover_rgba_8888_sse2_lowp+0x5b8>
+  DB  196,226,125,24,29,40,111,2,0        ; vbroadcastss  0x26f28(%rip),%ymm3        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  197,252,89,211                      ; vmulps        %ymm3,%ymm0,%ymm2
+  DB  196,226,61,0,5,31,108,2,0           ; vpshufb       0x26c1f(%rip),%ymm8,%ymm0        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0x5bc>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,193,124,89,200                  ; vmulps        %ymm8,%ymm0,%ymm1
-  DB  196,226,101,0,5,201,105,2,0         ; vpshufb       0x269c9(%rip),%ymm3,%ymm0        # 2b280 <_sk_srcover_rgba_8888_sse2_lowp+0x5d8>
+  DB  197,252,89,203                      ; vmulps        %ymm3,%ymm0,%ymm1
+  DB  196,226,61,0,5,46,108,2,0           ; vpshufb       0x26c2e(%rip),%ymm8,%ymm0        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x5dc>
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  197,229,114,211,24                  ; vpsrld        $0x18,%ymm3,%ymm3
-  DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
+  DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
+  DB  196,193,61,114,208,24               ; vpsrld        $0x18,%ymm8,%ymm8
+  DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
+  DB  197,188,89,219                      ; vmulps        %ymm3,%ymm8,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -4489,7 +4534,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,34,108,2,0          ; vbroadcastss  0x26c22(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,135,110,2,0         ; vbroadcastss  0x26e87(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,65,108,89,200                   ; vmulps        %ymm8,%ymm2,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,65,116,89,208                   ; vmulps        %ymm8,%ymm1,%ymm10
@@ -4505,7 +4550,7 @@
   DB  196,65,45,235,192                   ; vpor          %ymm8,%ymm10,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           494a <_sk_store_bgra_hsw+0x78>
+  DB  117,10                              ; jne           4a45 <_sk_store_bgra_hsw+0x78>
   DB  196,1,126,127,4,152                 ; vmovdqu       %ymm8,(%r8,%r11,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -4513,17 +4558,17 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            4946 <_sk_store_bgra_hsw+0x74>
+  DB  119,236                             ; ja            4a41 <_sk_store_bgra_hsw+0x74>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,83,0,0,0                  ; lea           0x53(%rip),%r10        # 49b8 <_sk_store_bgra_hsw+0xe6>
+  DB  76,141,21,84,0,0,0                  ; lea           0x54(%rip),%r10        # 4ab4 <_sk_store_bgra_hsw+0xe7>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           4946 <_sk_store_bgra_hsw+0x74>
+  DB  235,208                             ; jmp           4a41 <_sk_store_bgra_hsw+0x74>
   DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           4946 <_sk_store_bgra_hsw+0x74>
+  DB  235,192                             ; jmp           4a41 <_sk_store_bgra_hsw+0x74>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -4531,25 +4576,22 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,1,121,126,76,152,16             ; vmovd         %xmm9,0x10(%r8,%r11,4)
   DB  196,1,122,127,4,152                 ; vmovdqu       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           4946 <_sk_store_bgra_hsw+0x74>
-  DB  144                                 ; nop
-  DB  182,255                             ; mov           $0xff,%dh
+  DB  235,143                             ; jmp           4a41 <_sk_store_bgra_hsw+0x74>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  181,255                             ; mov           $0xff,%ch
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,197                             ; inc           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
+  DB  189,255,255,255,246                 ; mov           $0xf6ffffff,%ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  233,255,255,255,219                 ; jmpq          ffffffffdc004ac8 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdbfd9ac4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,205                             ; dec           %ebp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -4564,7 +4606,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,101                             ; jne           4a55 <_sk_load_f16_hsw+0x81>
+  DB  117,101                             ; jne           4b51 <_sk_load_f16_hsw+0x81>
   DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
   DB  196,193,121,16,84,192,16            ; vmovupd       0x10(%r8,%rax,8),%xmm2
   DB  196,193,121,16,92,192,32            ; vmovupd       0x20(%r8,%rax,8),%xmm3
@@ -4590,29 +4632,29 @@
   DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            4abb <_sk_load_f16_hsw+0xe7>
+  DB  116,85                              ; je            4bb7 <_sk_load_f16_hsw+0xe7>
   DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            4abb <_sk_load_f16_hsw+0xe7>
+  DB  114,72                              ; jb            4bb7 <_sk_load_f16_hsw+0xe7>
   DB  196,193,123,16,84,192,16            ; vmovsd        0x10(%r8,%rax,8),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            4ac8 <_sk_load_f16_hsw+0xf4>
+  DB  116,72                              ; je            4bc4 <_sk_load_f16_hsw+0xf4>
   DB  196,193,105,22,84,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            4ac8 <_sk_load_f16_hsw+0xf4>
+  DB  114,59                              ; jb            4bc4 <_sk_load_f16_hsw+0xf4>
   DB  196,193,123,16,92,192,32            ; vmovsd        0x20(%r8,%rax,8),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,109,255,255,255              ; je            4a0b <_sk_load_f16_hsw+0x37>
+  DB  15,132,109,255,255,255              ; je            4b07 <_sk_load_f16_hsw+0x37>
   DB  196,193,97,22,92,192,40             ; vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,92,255,255,255               ; jb            4a0b <_sk_load_f16_hsw+0x37>
+  DB  15,130,92,255,255,255               ; jb            4b07 <_sk_load_f16_hsw+0x37>
   DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,80,255,255,255                  ; jmpq          4a0b <_sk_load_f16_hsw+0x37>
+  DB  233,80,255,255,255                  ; jmpq          4b07 <_sk_load_f16_hsw+0x37>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,67,255,255,255                  ; jmpq          4a0b <_sk_load_f16_hsw+0x37>
+  DB  233,67,255,255,255                  ; jmpq          4b07 <_sk_load_f16_hsw+0x37>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,58,255,255,255                  ; jmpq          4a0b <_sk_load_f16_hsw+0x37>
+  DB  233,58,255,255,255                  ; jmpq          4b07 <_sk_load_f16_hsw+0x37>
 
 PUBLIC _sk_load_f16_dst_hsw
 _sk_load_f16_dst_hsw LABEL PROC
@@ -4624,7 +4666,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,101                             ; jne           4b52 <_sk_load_f16_dst_hsw+0x81>
+  DB  117,101                             ; jne           4c4e <_sk_load_f16_dst_hsw+0x81>
   DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
   DB  196,193,121,16,116,192,16           ; vmovupd       0x10(%r8,%rax,8),%xmm6
   DB  196,193,121,16,124,192,32           ; vmovupd       0x20(%r8,%rax,8),%xmm7
@@ -4650,33 +4692,43 @@
   DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            4bb8 <_sk_load_f16_dst_hsw+0xe7>
+  DB  116,85                              ; je            4cb4 <_sk_load_f16_dst_hsw+0xe7>
   DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            4bb8 <_sk_load_f16_dst_hsw+0xe7>
+  DB  114,72                              ; jb            4cb4 <_sk_load_f16_dst_hsw+0xe7>
   DB  196,193,123,16,116,192,16           ; vmovsd        0x10(%r8,%rax,8),%xmm6
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            4bc5 <_sk_load_f16_dst_hsw+0xf4>
+  DB  116,72                              ; je            4cc1 <_sk_load_f16_dst_hsw+0xf4>
   DB  196,193,73,22,116,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            4bc5 <_sk_load_f16_dst_hsw+0xf4>
+  DB  114,59                              ; jb            4cc1 <_sk_load_f16_dst_hsw+0xf4>
   DB  196,193,123,16,124,192,32           ; vmovsd        0x20(%r8,%rax,8),%xmm7
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,109,255,255,255              ; je            4b08 <_sk_load_f16_dst_hsw+0x37>
+  DB  15,132,109,255,255,255              ; je            4c04 <_sk_load_f16_dst_hsw+0x37>
   DB  196,193,65,22,124,192,40            ; vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,92,255,255,255               ; jb            4b08 <_sk_load_f16_dst_hsw+0x37>
+  DB  15,130,92,255,255,255               ; jb            4c04 <_sk_load_f16_dst_hsw+0x37>
   DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,80,255,255,255                  ; jmpq          4b08 <_sk_load_f16_dst_hsw+0x37>
+  DB  233,80,255,255,255                  ; jmpq          4c04 <_sk_load_f16_dst_hsw+0x37>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
   DB  197,201,87,246                      ; vxorpd        %xmm6,%xmm6,%xmm6
-  DB  233,67,255,255,255                  ; jmpq          4b08 <_sk_load_f16_dst_hsw+0x37>
+  DB  233,67,255,255,255                  ; jmpq          4c04 <_sk_load_f16_dst_hsw+0x37>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
-  DB  233,58,255,255,255                  ; jmpq          4b08 <_sk_load_f16_dst_hsw+0x37>
+  DB  233,58,255,255,255                  ; jmpq          4c04 <_sk_load_f16_dst_hsw+0x37>
 
 PUBLIC _sk_gather_f16_hsw
 _sk_gather_f16_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,88,80,12                ; vpbroadcastd  0xc(%rax),%ymm2
+  DB  197,229,118,219                     ; vpcmpeqd      %ymm3,%ymm3,%ymm3
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
+  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,88,80,16                ; vpbroadcastd  0x10(%rax),%ymm2
+  DB  197,237,254,211                     ; vpaddd        %ymm3,%ymm2,%ymm2
+  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  196,226,125,88,80,8                 ; vpbroadcastd  0x8(%rax),%ymm2
@@ -4685,28 +4737,26 @@
   DB  197,245,254,192                     ; vpaddd        %ymm0,%ymm1,%ymm0
   DB  197,245,118,201                     ; vpcmpeqd      %ymm1,%ymm1,%ymm1
   DB  197,237,239,210                     ; vpxor         %ymm2,%ymm2,%ymm2
-  DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
-  DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
-  DB  196,194,189,144,28,192              ; vpgatherdq    %ymm8,(%r8,%xmm0,8),%ymm3
-  DB  196,227,125,57,192,1                ; vextracti128  $0x1,%ymm0,%xmm0
   DB  196,194,245,144,20,192              ; vpgatherdq    %ymm1,(%r8,%xmm0,8),%ymm2
-  DB  196,227,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm0
-  DB  196,227,125,57,209,1                ; vextracti128  $0x1,%ymm2,%xmm1
+  DB  196,227,125,57,192,1                ; vextracti128  $0x1,%ymm0,%xmm0
+  DB  196,66,229,144,4,192                ; vpgatherdq    %ymm3,(%r8,%xmm0,8),%ymm8
+  DB  196,227,125,57,208,1                ; vextracti128  $0x1,%ymm2,%xmm0
+  DB  196,99,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm1
+  DB  197,233,97,216                      ; vpunpcklwd    %xmm0,%xmm2,%xmm3
+  DB  197,233,105,192                     ; vpunpckhwd    %xmm0,%xmm2,%xmm0
+  DB  197,185,97,209                      ; vpunpcklwd    %xmm1,%xmm8,%xmm2
+  DB  197,185,105,201                     ; vpunpckhwd    %xmm1,%xmm8,%xmm1
   DB  197,97,97,192                       ; vpunpcklwd    %xmm0,%xmm3,%xmm8
-  DB  197,225,105,192                     ; vpunpckhwd    %xmm0,%xmm3,%xmm0
+  DB  197,97,105,200                      ; vpunpckhwd    %xmm0,%xmm3,%xmm9
   DB  197,233,97,217                      ; vpunpcklwd    %xmm1,%xmm2,%xmm3
-  DB  197,233,105,201                     ; vpunpckhwd    %xmm1,%xmm2,%xmm1
-  DB  197,57,97,200                       ; vpunpcklwd    %xmm0,%xmm8,%xmm9
-  DB  197,57,105,192                      ; vpunpckhwd    %xmm0,%xmm8,%xmm8
-  DB  197,225,97,209                      ; vpunpcklwd    %xmm1,%xmm3,%xmm2
-  DB  197,225,105,217                     ; vpunpckhwd    %xmm1,%xmm3,%xmm3
-  DB  197,177,108,194                     ; vpunpcklqdq   %xmm2,%xmm9,%xmm0
+  DB  197,105,105,209                     ; vpunpckhwd    %xmm1,%xmm2,%xmm10
+  DB  197,185,108,195                     ; vpunpcklqdq   %xmm3,%xmm8,%xmm0
   DB  196,226,125,19,192                  ; vcvtph2ps     %xmm0,%ymm0
-  DB  197,177,109,202                     ; vpunpckhqdq   %xmm2,%xmm9,%xmm1
+  DB  197,185,109,203                     ; vpunpckhqdq   %xmm3,%xmm8,%xmm1
   DB  196,226,125,19,201                  ; vcvtph2ps     %xmm1,%ymm1
-  DB  197,185,108,211                     ; vpunpcklqdq   %xmm3,%xmm8,%xmm2
+  DB  196,193,49,108,210                  ; vpunpcklqdq   %xmm10,%xmm9,%xmm2
   DB  196,226,125,19,210                  ; vcvtph2ps     %xmm2,%ymm2
-  DB  197,185,109,219                     ; vpunpckhqdq   %xmm3,%xmm8,%xmm3
+  DB  196,193,49,109,218                  ; vpunpckhqdq   %xmm10,%xmm9,%xmm3
   DB  196,226,125,19,219                  ; vcvtph2ps     %xmm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -4733,7 +4783,7 @@
   DB  196,65,57,98,205                    ; vpunpckldq    %xmm13,%xmm8,%xmm9
   DB  196,65,57,106,197                   ; vpunpckhdq    %xmm13,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,31                              ; jne           4cdc <_sk_store_f16_hsw+0x7b>
+  DB  117,31                              ; jne           4dfe <_sk_store_f16_hsw+0x7b>
   DB  196,65,122,127,28,192               ; vmovdqu       %xmm11,(%r8,%rax,8)
   DB  196,65,122,127,84,192,16            ; vmovdqu       %xmm10,0x10(%r8,%rax,8)
   DB  196,65,122,127,76,192,32            ; vmovdqu       %xmm9,0x20(%r8,%rax,8)
@@ -4742,22 +4792,22 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,214,28,192               ; vmovq         %xmm11,(%r8,%rax,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            4cd8 <_sk_store_f16_hsw+0x77>
+  DB  116,240                             ; je            4dfa <_sk_store_f16_hsw+0x77>
   DB  196,65,121,23,92,192,8              ; vmovhpd       %xmm11,0x8(%r8,%rax,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            4cd8 <_sk_store_f16_hsw+0x77>
+  DB  114,227                             ; jb            4dfa <_sk_store_f16_hsw+0x77>
   DB  196,65,121,214,84,192,16            ; vmovq         %xmm10,0x10(%r8,%rax,8)
-  DB  116,218                             ; je            4cd8 <_sk_store_f16_hsw+0x77>
+  DB  116,218                             ; je            4dfa <_sk_store_f16_hsw+0x77>
   DB  196,65,121,23,84,192,24             ; vmovhpd       %xmm10,0x18(%r8,%rax,8)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            4cd8 <_sk_store_f16_hsw+0x77>
+  DB  114,205                             ; jb            4dfa <_sk_store_f16_hsw+0x77>
   DB  196,65,121,214,76,192,32            ; vmovq         %xmm9,0x20(%r8,%rax,8)
-  DB  116,196                             ; je            4cd8 <_sk_store_f16_hsw+0x77>
+  DB  116,196                             ; je            4dfa <_sk_store_f16_hsw+0x77>
   DB  196,65,121,23,76,192,40             ; vmovhpd       %xmm9,0x28(%r8,%rax,8)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,183                             ; jb            4cd8 <_sk_store_f16_hsw+0x77>
+  DB  114,183                             ; jb            4dfa <_sk_store_f16_hsw+0x77>
   DB  196,65,121,214,68,192,48            ; vmovq         %xmm8,0x30(%r8,%rax,8)
-  DB  235,174                             ; jmp           4cd8 <_sk_store_f16_hsw+0x77>
+  DB  235,174                             ; jmp           4dfa <_sk_store_f16_hsw+0x77>
 
 PUBLIC _sk_load_u16_be_hsw
 _sk_load_u16_be_hsw LABEL PROC
@@ -4770,7 +4820,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,204,0,0,0                    ; jne           4e1d <_sk_load_u16_be_hsw+0xf3>
+  DB  15,133,204,0,0,0                    ; jne           4f3f <_sk_load_u16_be_hsw+0xf3>
   DB  196,65,121,16,4,64                  ; vmovupd       (%r8,%rax,2),%xmm8
   DB  196,193,121,16,84,64,16             ; vmovupd       0x10(%r8,%rax,2),%xmm2
   DB  196,193,121,16,92,64,32             ; vmovupd       0x20(%r8,%rax,2),%xmm3
@@ -4789,7 +4839,7 @@
   DB  197,241,235,192                     ; vpor          %xmm0,%xmm1,%xmm0
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,21,198,103,2,0        ; vbroadcastss  0x267c6(%rip),%ymm10        # 2b578 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  DB  196,98,125,24,21,4,106,2,0          ; vbroadcastss  0x26a04(%rip),%ymm10        # 2b8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  197,185,109,202                     ; vpunpckhqdq   %xmm2,%xmm8,%xmm1
   DB  197,233,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm2
@@ -4817,29 +4867,29 @@
   DB  196,65,123,16,4,64                  ; vmovsd        (%r8,%rax,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            4e83 <_sk_load_u16_be_hsw+0x159>
+  DB  116,85                              ; je            4fa5 <_sk_load_u16_be_hsw+0x159>
   DB  196,65,57,22,68,64,8                ; vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            4e83 <_sk_load_u16_be_hsw+0x159>
+  DB  114,72                              ; jb            4fa5 <_sk_load_u16_be_hsw+0x159>
   DB  196,193,123,16,84,64,16             ; vmovsd        0x10(%r8,%rax,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            4e90 <_sk_load_u16_be_hsw+0x166>
+  DB  116,72                              ; je            4fb2 <_sk_load_u16_be_hsw+0x166>
   DB  196,193,105,22,84,64,24             ; vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            4e90 <_sk_load_u16_be_hsw+0x166>
+  DB  114,59                              ; jb            4fb2 <_sk_load_u16_be_hsw+0x166>
   DB  196,193,123,16,92,64,32             ; vmovsd        0x20(%r8,%rax,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,6,255,255,255                ; je            4d6c <_sk_load_u16_be_hsw+0x42>
+  DB  15,132,6,255,255,255                ; je            4e8e <_sk_load_u16_be_hsw+0x42>
   DB  196,193,97,22,92,64,40              ; vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,245,254,255,255              ; jb            4d6c <_sk_load_u16_be_hsw+0x42>
+  DB  15,130,245,254,255,255              ; jb            4e8e <_sk_load_u16_be_hsw+0x42>
   DB  196,65,122,126,76,64,48             ; vmovq         0x30(%r8,%rax,2),%xmm9
-  DB  233,233,254,255,255                 ; jmpq          4d6c <_sk_load_u16_be_hsw+0x42>
+  DB  233,233,254,255,255                 ; jmpq          4e8e <_sk_load_u16_be_hsw+0x42>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,220,254,255,255                 ; jmpq          4d6c <_sk_load_u16_be_hsw+0x42>
+  DB  233,220,254,255,255                 ; jmpq          4e8e <_sk_load_u16_be_hsw+0x42>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,211,254,255,255                 ; jmpq          4d6c <_sk_load_u16_be_hsw+0x42>
+  DB  233,211,254,255,255                 ; jmpq          4e8e <_sk_load_u16_be_hsw+0x42>
 
 PUBLIC _sk_load_rgb_u16_be_hsw
 _sk_load_rgb_u16_be_hsw LABEL PROC
@@ -4854,7 +4904,7 @@
   DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
   DB  72,193,248,32                       ; sar           $0x20,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,205,0,0,0                    ; jne           4f91 <_sk_load_rgb_u16_be_hsw+0xf8>
+  DB  15,133,205,0,0,0                    ; jne           50b3 <_sk_load_rgb_u16_be_hsw+0xf8>
   DB  196,65,122,111,28,64                ; vmovdqu       (%r8,%rax,2),%xmm11
   DB  196,193,122,111,92,64,12            ; vmovdqu       0xc(%r8,%rax,2),%xmm3
   DB  196,193,122,111,84,64,24            ; vmovdqu       0x18(%r8,%rax,2),%xmm2
@@ -4879,7 +4929,7 @@
   DB  197,241,235,192                     ; vpor          %xmm0,%xmm1,%xmm0
   DB  196,226,125,51,192                  ; vpmovzxwd     %xmm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,53,102,2,0         ; vbroadcastss  0x26635(%rip),%ymm9        # 2b578 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  DB  196,98,125,24,13,115,104,2,0        ; vbroadcastss  0x26873(%rip),%ymm9        # 2b8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,185,109,203                     ; vpunpckhqdq   %xmm3,%xmm8,%xmm1
   DB  197,225,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm3
@@ -4895,69 +4945,69 @@
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  196,193,108,89,209                  ; vmulps        %ymm9,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,89,101,2,0        ; vbroadcastss  0x26559(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,151,103,2,0       ; vbroadcastss  0x26797(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,4,64                ; vmovd         (%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,65,121,196,92,64,4,2            ; vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           4fc9 <_sk_load_rgb_u16_be_hsw+0x130>
+  DB  117,31                              ; jne           50eb <_sk_load_rgb_u16_be_hsw+0x130>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,48,255,255,255                  ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,48,255,255,255                  ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
   DB  196,193,121,110,68,64,6             ; vmovd         0x6(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,65,121,196,68,64,10,2           ; vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            5013 <_sk_load_rgb_u16_be_hsw+0x17a>
+  DB  114,48                              ; jb            5135 <_sk_load_rgb_u16_be_hsw+0x17a>
   DB  196,193,121,110,68,64,12            ; vmovd         0xc(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,92,64,16,2          ; vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           502d <_sk_load_rgb_u16_be_hsw+0x194>
+  DB  117,48                              ; jne           514f <_sk_load_rgb_u16_be_hsw+0x194>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,230,254,255,255                 ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,230,254,255,255                 ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,204,254,255,255                 ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,204,254,255,255                 ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
   DB  196,193,121,110,68,64,18            ; vmovd         0x12(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,65,121,196,84,64,22,2           ; vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            506e <_sk_load_rgb_u16_be_hsw+0x1d5>
+  DB  114,39                              ; jb            5190 <_sk_load_rgb_u16_be_hsw+0x1d5>
   DB  196,193,121,110,68,64,24            ; vmovd         0x18(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,84,64,28,2          ; vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           507f <_sk_load_rgb_u16_be_hsw+0x1e6>
+  DB  117,30                              ; jne           51a1 <_sk_load_rgb_u16_be_hsw+0x1e6>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,139,254,255,255                 ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,139,254,255,255                 ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,122,254,255,255                 ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,122,254,255,255                 ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
   DB  196,193,121,110,68,64,30            ; vmovd         0x1e(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,76,64,34,2          ; vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            50b2 <_sk_load_rgb_u16_be_hsw+0x219>
+  DB  114,25                              ; jb            51d4 <_sk_load_rgb_u16_be_hsw+0x219>
   DB  196,193,121,110,68,64,36            ; vmovd         0x24(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,68,64,40,2          ; vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  DB  233,71,254,255,255                  ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,71,254,255,255                  ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,62,254,255,255                  ; jmpq          4ef9 <_sk_load_rgb_u16_be_hsw+0x60>
+  DB  233,62,254,255,255                  ; jmpq          501b <_sk_load_rgb_u16_be_hsw+0x60>
 
 PUBLIC _sk_store_u16_be_hsw
 _sk_store_u16_be_hsw LABEL PROC
@@ -4969,7 +5019,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  196,98,125,24,5,30,101,2,0          ; vbroadcastss  0x2651e(%rip),%ymm8        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  DB  196,98,125,24,5,92,103,2,0          ; vbroadcastss  0x2675c(%rip),%ymm8        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,67,125,25,202,1                 ; vextractf128  $0x1,%ymm9,%xmm10
@@ -5007,7 +5057,7 @@
   DB  196,65,17,98,200                    ; vpunpckldq    %xmm8,%xmm13,%xmm9
   DB  196,65,17,106,192                   ; vpunpckhdq    %xmm8,%xmm13,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,31                              ; jne           51c6 <_sk_store_u16_be_hsw+0x10b>
+  DB  117,31                              ; jne           52e8 <_sk_store_u16_be_hsw+0x10b>
   DB  196,65,122,127,28,64                ; vmovdqu       %xmm11,(%r8,%rax,2)
   DB  196,65,122,127,84,64,16             ; vmovdqu       %xmm10,0x10(%r8,%rax,2)
   DB  196,65,122,127,76,64,32             ; vmovdqu       %xmm9,0x20(%r8,%rax,2)
@@ -5016,22 +5066,22 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,214,28,64                ; vmovq         %xmm11,(%r8,%rax,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  116,240                             ; je            52e4 <_sk_store_u16_be_hsw+0x107>
   DB  196,65,121,23,92,64,8               ; vmovhpd       %xmm11,0x8(%r8,%rax,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  114,227                             ; jb            52e4 <_sk_store_u16_be_hsw+0x107>
   DB  196,65,121,214,84,64,16             ; vmovq         %xmm10,0x10(%r8,%rax,2)
-  DB  116,218                             ; je            51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  116,218                             ; je            52e4 <_sk_store_u16_be_hsw+0x107>
   DB  196,65,121,23,84,64,24              ; vmovhpd       %xmm10,0x18(%r8,%rax,2)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  114,205                             ; jb            52e4 <_sk_store_u16_be_hsw+0x107>
   DB  196,65,121,214,76,64,32             ; vmovq         %xmm9,0x20(%r8,%rax,2)
-  DB  116,196                             ; je            51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  116,196                             ; je            52e4 <_sk_store_u16_be_hsw+0x107>
   DB  196,65,121,23,76,64,40              ; vmovhpd       %xmm9,0x28(%r8,%rax,2)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,183                             ; jb            51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  114,183                             ; jb            52e4 <_sk_store_u16_be_hsw+0x107>
   DB  196,65,121,214,68,64,48             ; vmovq         %xmm8,0x30(%r8,%rax,2)
-  DB  235,174                             ; jmp           51c2 <_sk_store_u16_be_hsw+0x107>
+  DB  235,174                             ; jmp           52e4 <_sk_store_u16_be_hsw+0x107>
 
 PUBLIC _sk_load_f32_hsw
 _sk_load_f32_hsw LABEL PROC
@@ -5039,7 +5089,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            5389 <_sk_load_f32_hsw+0x175>
+  DB  15,135,94,1,0,0                     ; ja            54ab <_sk_load_f32_hsw+0x175>
   DB  197,253,17,36,36                    ; vmovupd       %ymm4,(%rsp)
   DB  197,253,17,108,36,32                ; vmovupd       %ymm5,0x20(%rsp)
   DB  197,253,17,116,36,64                ; vmovupd       %ymm6,0x40(%rsp)
@@ -5051,7 +5101,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # 5398 <_sk_load_f32_hsw+0x184>
+  DB  76,141,21,52,1,0,0                  ; lea           0x134(%rip),%r10        # 54bc <_sk_load_f32_hsw+0x186>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
@@ -5114,18 +5164,22 @@
   DB  197,229,87,219                      ; vxorpd        %ymm3,%ymm3,%ymm3
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,245,87,201                      ; vxorpd        %ymm1,%ymm1,%ymm1
-  DB  235,196                             ; jmp           535c <_sk_load_f32_hsw+0x148>
-  DB  27,255                              ; sbb           %edi,%edi
+  DB  235,196                             ; jmp           547e <_sk_load_f32_hsw+0x148>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  25,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
+  DB  255,159,255,255,255,138             ; lcall         *-0x75000001(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,119,255                         ; pushq         -0x1(%rdi)
+  DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
-  DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
-  DB  255,70,255                          ; incl          -0x1(%rsi)
+  DB  255,90,255                          ; lcall         *-0x1(%rdx)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 290053b4 <_sk_srcover_rgba_8888_sse2_lowp+0x28fda70c>
+  DB  255,68,255,255                      ; incl          -0x1(%rdi,%rdi,8)
+  DB  255,51                              ; pushq         (%rbx)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,38                              ; jmpq          *(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -5136,7 +5190,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            552d <_sk_load_f32_dst_hsw+0x175>
+  DB  15,135,94,1,0,0                     ; ja            5651 <_sk_load_f32_dst_hsw+0x175>
   DB  197,253,17,4,36                     ; vmovupd       %ymm0,(%rsp)
   DB  197,253,17,76,36,32                 ; vmovupd       %ymm1,0x20(%rsp)
   DB  197,253,17,84,36,64                 ; vmovupd       %ymm2,0x40(%rsp)
@@ -5148,7 +5202,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # 553c <_sk_load_f32_dst_hsw+0x184>
+  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # 5660 <_sk_load_f32_dst_hsw+0x184>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
@@ -5211,7 +5265,7 @@
   DB  197,197,87,255                      ; vxorpd        %ymm7,%ymm7,%ymm7
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,213,87,237                      ; vxorpd        %ymm5,%ymm5,%ymm5
-  DB  235,196                             ; jmp           5500 <_sk_load_f32_dst_hsw+0x148>
+  DB  235,196                             ; jmp           5624 <_sk_load_f32_dst_hsw+0x148>
   DB  27,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
   DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
@@ -5222,7 +5276,7 @@
   DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
   DB  255,70,255                          ; incl          -0x1(%rsi)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 29005558 <_sk_srcover_rgba_8888_sse2_lowp+0x28fda8b0>
+  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 2900567c <_sk_srcover_rgba_8888_sse2_lowp+0x28fda678>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -5246,7 +5300,7 @@
   DB  196,65,37,20,196                    ; vunpcklpd     %ymm12,%ymm11,%ymm8
   DB  196,65,37,21,220                    ; vunpckhpd     %ymm12,%ymm11,%ymm11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,55                              ; jne           55db <_sk_store_f32_hsw+0x7f>
+  DB  117,55                              ; jne           56ff <_sk_store_f32_hsw+0x7f>
   DB  196,67,45,24,225,1                  ; vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   DB  196,67,61,24,235,1                  ; vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   DB  196,67,45,6,201,49                  ; vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
@@ -5259,46 +5313,22 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,17,20,128                ; vmovupd       %xmm10,(%r8,%rax,4)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            55d7 <_sk_store_f32_hsw+0x7b>
+  DB  116,240                             ; je            56fb <_sk_store_f32_hsw+0x7b>
   DB  196,65,121,17,76,128,16             ; vmovupd       %xmm9,0x10(%r8,%rax,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            55d7 <_sk_store_f32_hsw+0x7b>
+  DB  114,227                             ; jb            56fb <_sk_store_f32_hsw+0x7b>
   DB  196,65,121,17,68,128,32             ; vmovupd       %xmm8,0x20(%r8,%rax,4)
-  DB  116,218                             ; je            55d7 <_sk_store_f32_hsw+0x7b>
+  DB  116,218                             ; je            56fb <_sk_store_f32_hsw+0x7b>
   DB  196,65,121,17,92,128,48             ; vmovupd       %xmm11,0x30(%r8,%rax,4)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            55d7 <_sk_store_f32_hsw+0x7b>
+  DB  114,205                             ; jb            56fb <_sk_store_f32_hsw+0x7b>
   DB  196,67,125,25,84,128,64,1           ; vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  DB  116,195                             ; je            55d7 <_sk_store_f32_hsw+0x7b>
+  DB  116,195                             ; je            56fb <_sk_store_f32_hsw+0x7b>
   DB  196,67,125,25,76,128,80,1           ; vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,181                             ; jb            55d7 <_sk_store_f32_hsw+0x7b>
+  DB  114,181                             ; jb            56fb <_sk_store_f32_hsw+0x7b>
   DB  196,67,125,25,68,128,96,1           ; vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  DB  235,171                             ; jmp           55d7 <_sk_store_f32_hsw+0x7b>
-
-PUBLIC _sk_clamp_x_hsw
-_sk_clamp_x_hsw LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,88,0                     ; vpbroadcastd  (%rax),%ymm8
-  DB  196,65,53,118,201                   ; vpcmpeqd      %ymm9,%ymm9,%ymm9
-  DB  196,65,61,254,193                   ; vpaddd        %ymm9,%ymm8,%ymm8
-  DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  255,224                             ; jmpq          *%rax
-
-PUBLIC _sk_clamp_y_hsw
-_sk_clamp_y_hsw LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
-  DB  196,98,125,88,0                     ; vpbroadcastd  (%rax),%ymm8
-  DB  196,65,53,118,201                   ; vpcmpeqd      %ymm9,%ymm9,%ymm9
-  DB  196,65,61,254,193                   ; vpaddd        %ymm9,%ymm8,%ymm8
-  DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  255,224                             ; jmpq          *%rax
+  DB  235,171                             ; jmp           56fb <_sk_store_f32_hsw+0x7b>
 
 PUBLIC _sk_repeat_x_hsw
 _sk_repeat_x_hsw LABEL PROC
@@ -5307,12 +5337,7 @@
   DB  197,60,89,192                       ; vmulps        %ymm0,%ymm8,%ymm8
   DB  196,67,125,8,192,1                  ; vroundps      $0x1,%ymm8,%ymm8
   DB  196,98,125,24,8                     ; vbroadcastss  (%rax),%ymm9
-  DB  196,98,53,172,192                   ; vfnmadd213ps  %ymm0,%ymm9,%ymm8
-  DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
-  DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
-  DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
-  DB  196,65,53,254,192                   ; vpaddd        %ymm8,%ymm9,%ymm8
-  DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
+  DB  196,194,61,188,193                  ; vfnmadd231ps  %ymm9,%ymm8,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -5323,12 +5348,7 @@
   DB  197,60,89,193                       ; vmulps        %ymm1,%ymm8,%ymm8
   DB  196,67,125,8,192,1                  ; vroundps      $0x1,%ymm8,%ymm8
   DB  196,98,125,24,8                     ; vbroadcastss  (%rax),%ymm9
-  DB  196,98,53,172,193                   ; vfnmadd213ps  %ymm1,%ymm9,%ymm8
-  DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
-  DB  196,193,116,95,200                  ; vmaxps        %ymm8,%ymm1,%ymm1
-  DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
-  DB  196,65,53,254,192                   ; vpaddd        %ymm8,%ymm9,%ymm8
-  DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
+  DB  196,194,61,188,201                  ; vfnmadd231ps  %ymm9,%ymm8,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -5341,19 +5361,15 @@
   DB  196,65,124,92,218                   ; vsubps        %ymm10,%ymm0,%ymm11
   DB  196,193,58,88,192                   ; vaddss        %xmm8,%xmm8,%xmm0
   DB  196,98,125,24,192                   ; vbroadcastss  %xmm0,%ymm8
-  DB  197,178,89,5,219,93,2,0             ; vmulss        0x25ddb(%rip),%xmm9,%xmm0        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  197,178,89,5,141,96,2,0             ; vmulss        0x2608d(%rip),%xmm9,%xmm0        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,226,125,24,192                  ; vbroadcastss  %xmm0,%ymm0
   DB  197,164,89,192                      ; vmulps        %ymm0,%ymm11,%ymm0
   DB  196,227,125,8,192,1                 ; vroundps      $0x1,%ymm0,%ymm0
   DB  196,194,61,172,195                  ; vfnmadd213ps  %ymm11,%ymm8,%ymm0
   DB  196,193,124,92,194                  ; vsubps        %ymm10,%ymm0,%ymm0
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,92,200                       ; vsubps        %ymm0,%ymm8,%ymm9
-  DB  197,180,84,192                      ; vandps        %ymm0,%ymm9,%ymm0
-  DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
-  DB  196,65,45,254,192                   ; vpaddd        %ymm8,%ymm10,%ymm8
-  DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
+  DB  197,60,92,192                       ; vsubps        %ymm0,%ymm8,%ymm8
+  DB  197,188,84,192                      ; vandps        %ymm0,%ymm8,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -5366,19 +5382,15 @@
   DB  196,65,116,92,218                   ; vsubps        %ymm10,%ymm1,%ymm11
   DB  196,193,58,88,200                   ; vaddss        %xmm8,%xmm8,%xmm1
   DB  196,98,125,24,193                   ; vbroadcastss  %xmm1,%ymm8
-  DB  197,178,89,13,119,93,2,0            ; vmulss        0x25d77(%rip),%xmm9,%xmm1        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  197,178,89,13,60,96,2,0             ; vmulss        0x2603c(%rip),%xmm9,%xmm1        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,226,125,24,201                  ; vbroadcastss  %xmm1,%ymm1
   DB  197,164,89,201                      ; vmulps        %ymm1,%ymm11,%ymm1
   DB  196,227,125,8,201,1                 ; vroundps      $0x1,%ymm1,%ymm1
   DB  196,194,61,172,203                  ; vfnmadd213ps  %ymm11,%ymm8,%ymm1
   DB  196,193,116,92,202                  ; vsubps        %ymm10,%ymm1,%ymm1
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,92,201                       ; vsubps        %ymm1,%ymm8,%ymm9
-  DB  197,180,84,201                      ; vandps        %ymm1,%ymm9,%ymm1
-  DB  197,188,95,201                      ; vmaxps        %ymm1,%ymm8,%ymm1
-  DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
-  DB  196,65,45,254,192                   ; vpaddd        %ymm8,%ymm10,%ymm8
-  DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
+  DB  197,60,92,193                       ; vsubps        %ymm1,%ymm8,%ymm8
+  DB  197,188,84,201                      ; vandps        %ymm1,%ymm8,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -5386,7 +5398,7 @@
 _sk_clamp_x_1_hsw LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,44,93,2,0           ; vbroadcastss  0x25d2c(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,4,96,2,0            ; vbroadcastss  0x26004(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -5400,9 +5412,9 @@
 
 PUBLIC _sk_mirror_x_1_hsw
 _sk_mirror_x_1_hsw LABEL PROC
-  DB  196,98,125,24,5,35,93,2,0           ; vbroadcastss  0x25d23(%rip),%ymm8        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  DB  196,98,125,24,5,251,95,2,0          ; vbroadcastss  0x25ffb(%rip),%ymm8        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,13,249,92,2,0         ; vbroadcastss  0x25cf9(%rip),%ymm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,13,209,95,2,0         ; vbroadcastss  0x25fd1(%rip),%ymm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,124,89,201                   ; vmulps        %ymm9,%ymm0,%ymm9
   DB  196,67,125,8,201,1                  ; vroundps      $0x1,%ymm9,%ymm9
   DB  196,65,52,88,201                    ; vaddps        %ymm9,%ymm9,%ymm9
@@ -5416,11 +5428,11 @@
 
 PUBLIC _sk_luminance_to_alpha_hsw
 _sk_luminance_to_alpha_hsw LABEL PROC
-  DB  196,226,125,24,29,229,93,2,0        ; vbroadcastss  0x25de5(%rip),%ymm3        # 2b604 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
-  DB  196,98,125,24,5,224,93,2,0          ; vbroadcastss  0x25de0(%rip),%ymm8        # 2b608 <_sk_srcover_rgba_8888_sse2_lowp+0x960>
+  DB  196,226,125,24,29,189,96,2,0        ; vbroadcastss  0x260bd(%rip),%ymm3        # 2b964 <_sk_srcover_rgba_8888_sse2_lowp+0x960>
+  DB  196,98,125,24,5,184,96,2,0          ; vbroadcastss  0x260b8(%rip),%ymm8        # 2b968 <_sk_srcover_rgba_8888_sse2_lowp+0x964>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
   DB  196,226,125,184,203                 ; vfmadd231ps   %ymm3,%ymm0,%ymm1
-  DB  196,226,125,24,29,209,93,2,0        ; vbroadcastss  0x25dd1(%rip),%ymm3        # 2b60c <_sk_srcover_rgba_8888_sse2_lowp+0x964>
+  DB  196,226,125,24,29,169,96,2,0        ; vbroadcastss  0x260a9(%rip),%ymm3        # 2b96c <_sk_srcover_rgba_8888_sse2_lowp+0x968>
   DB  196,226,109,168,217                 ; vfmadd213ps   %ymm1,%ymm2,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -5603,9 +5615,9 @@
   DB  76,139,64,8                         ; mov           0x8(%rax),%r8
   DB  77,137,202                          ; mov           %r9,%r10
   DB  73,255,202                          ; dec           %r10
-  DB  120,7                               ; js            5b33 <_sk_evenly_spaced_gradient_hsw+0x18>
+  DB  120,7                               ; js            5bbb <_sk_evenly_spaced_gradient_hsw+0x18>
   DB  196,193,242,42,202                  ; vcvtsi2ss     %r10,%xmm1,%xmm1
-  DB  235,22                              ; jmp           5b49 <_sk_evenly_spaced_gradient_hsw+0x2e>
+  DB  235,22                              ; jmp           5bd1 <_sk_evenly_spaced_gradient_hsw+0x2e>
   DB  77,137,211                          ; mov           %r10,%r11
   DB  73,209,235                          ; shr           %r11
   DB  65,131,226,1                        ; and           $0x1,%r10d
@@ -5616,7 +5628,7 @@
   DB  197,244,89,200                      ; vmulps        %ymm0,%ymm1,%ymm1
   DB  197,126,91,225                      ; vcvttps2dq    %ymm1,%ymm12
   DB  73,131,249,8                        ; cmp           $0x8,%r9
-  DB  119,73                              ; ja            5ba5 <_sk_evenly_spaced_gradient_hsw+0x8a>
+  DB  119,73                              ; ja            5c2d <_sk_evenly_spaced_gradient_hsw+0x8a>
   DB  196,66,29,22,0                      ; vpermps       (%r8),%ymm12,%ymm8
   DB  76,139,64,40                        ; mov           0x28(%rax),%r8
   DB  196,66,29,22,8                      ; vpermps       (%r8),%ymm12,%ymm9
@@ -5632,7 +5644,7 @@
   DB  196,194,29,22,24                    ; vpermps       (%r8),%ymm12,%ymm3
   DB  72,139,64,64                        ; mov           0x40(%rax),%rax
   DB  196,98,29,22,16                     ; vpermps       (%rax),%ymm12,%ymm10
-  DB  233,147,0,0,0                       ; jmpq          5c38 <_sk_evenly_spaced_gradient_hsw+0x11d>
+  DB  233,147,0,0,0                       ; jmpq          5cc0 <_sk_evenly_spaced_gradient_hsw+0x11d>
   DB  196,65,13,118,246                   ; vpcmpeqd      %ymm14,%ymm14,%ymm14
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  197,245,118,201                     ; vpcmpeqd      %ymm1,%ymm1,%ymm1
@@ -5674,14 +5686,14 @@
 
 PUBLIC _sk_gauss_a_to_rgba_hsw
 _sk_gauss_a_to_rgba_hsw LABEL PROC
-  DB  196,226,125,24,5,179,89,2,0         ; vbroadcastss  0x259b3(%rip),%ymm0        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x968>
-  DB  196,226,125,24,13,174,89,2,0        ; vbroadcastss  0x259ae(%rip),%ymm1        # 2b614 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
+  DB  196,226,125,24,5,139,92,2,0         ; vbroadcastss  0x25c8b(%rip),%ymm0        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
+  DB  196,226,125,24,13,134,92,2,0        ; vbroadcastss  0x25c86(%rip),%ymm1        # 2b974 <_sk_srcover_rgba_8888_sse2_lowp+0x970>
   DB  196,226,101,168,200                 ; vfmadd213ps   %ymm0,%ymm3,%ymm1
-  DB  196,226,125,24,5,164,89,2,0         ; vbroadcastss  0x259a4(%rip),%ymm0        # 2b618 <_sk_srcover_rgba_8888_sse2_lowp+0x970>
+  DB  196,226,125,24,5,124,92,2,0         ; vbroadcastss  0x25c7c(%rip),%ymm0        # 2b978 <_sk_srcover_rgba_8888_sse2_lowp+0x974>
   DB  196,226,101,184,193                 ; vfmadd231ps   %ymm1,%ymm3,%ymm0
-  DB  196,226,125,24,13,154,89,2,0        ; vbroadcastss  0x2599a(%rip),%ymm1        # 2b61c <_sk_srcover_rgba_8888_sse2_lowp+0x974>
+  DB  196,226,125,24,13,114,92,2,0        ; vbroadcastss  0x25c72(%rip),%ymm1        # 2b97c <_sk_srcover_rgba_8888_sse2_lowp+0x978>
   DB  196,226,101,184,200                 ; vfmadd231ps   %ymm0,%ymm3,%ymm1
-  DB  196,226,125,24,5,144,89,2,0         ; vbroadcastss  0x25990(%rip),%ymm0        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x978>
+  DB  196,226,125,24,5,104,92,2,0         ; vbroadcastss  0x25c68(%rip),%ymm0        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
   DB  196,226,101,184,193                 ; vfmadd231ps   %ymm1,%ymm3,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
@@ -5694,11 +5706,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  73,131,248,1                        ; cmp           $0x1,%r8
-  DB  15,134,220,0,0,0                    ; jbe           5d90 <_sk_gradient_hsw+0xeb>
+  DB  15,134,220,0,0,0                    ; jbe           5e18 <_sk_gradient_hsw+0xeb>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  65,186,1,0,0,0                      ; mov           $0x1,%r10d
-  DB  196,226,125,24,21,33,88,2,0         ; vbroadcastss  0x25821(%rip),%ymm2        # 2b4ec <_sk_srcover_rgba_8888_sse2_lowp+0x844>
+  DB  196,226,125,24,21,249,90,2,0        ; vbroadcastss  0x25af9(%rip),%ymm2        # 2b84c <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   DB  196,65,53,239,201                   ; vpxor         %ymm9,%ymm9,%ymm9
   DB  196,130,125,24,28,145               ; vbroadcastss  (%r9,%r10,4),%ymm3
   DB  197,228,194,216,2                   ; vcmpleps      %ymm0,%ymm3,%ymm3
@@ -5706,10 +5718,10 @@
   DB  197,53,254,203                      ; vpaddd        %ymm3,%ymm9,%ymm9
   DB  73,255,194                          ; inc           %r10
   DB  77,57,208                           ; cmp           %r10,%r8
-  DB  117,227                             ; jne           5cd0 <_sk_gradient_hsw+0x2b>
+  DB  117,227                             ; jne           5d58 <_sk_gradient_hsw+0x2b>
   DB  76,139,72,8                         ; mov           0x8(%rax),%r9
   DB  73,131,248,8                        ; cmp           $0x8,%r8
-  DB  15,134,158,0,0,0                    ; jbe           5d99 <_sk_gradient_hsw+0xf4>
+  DB  15,134,158,0,0,0                    ; jbe           5e21 <_sk_gradient_hsw+0xf4>
   DB  196,65,13,118,246                   ; vpcmpeqd      %ymm14,%ymm14,%ymm14
   DB  196,65,36,87,219                    ; vxorps        %ymm11,%ymm11,%ymm11
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
@@ -5741,7 +5753,7 @@
   DB  196,130,5,146,28,136                ; vgatherdps    %ymm15,(%r8,%ymm9,4),%ymm3
   DB  72,139,64,64                        ; mov           0x40(%rax),%rax
   DB  196,34,13,146,28,136                ; vgatherdps    %ymm14,(%rax,%ymm9,4),%ymm11
-  DB  235,77                              ; jmp           5ddd <_sk_gradient_hsw+0x138>
+  DB  235,77                              ; jmp           5e65 <_sk_gradient_hsw+0x138>
   DB  76,139,72,8                         ; mov           0x8(%rax),%r9
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  196,66,53,22,1                      ; vpermps       (%r9),%ymm9,%ymm8
@@ -5797,24 +5809,24 @@
   DB  196,65,52,95,226                    ; vmaxps        %ymm10,%ymm9,%ymm12
   DB  196,65,36,94,220                    ; vdivps        %ymm12,%ymm11,%ymm11
   DB  196,65,36,89,227                    ; vmulps        %ymm11,%ymm11,%ymm12
-  DB  196,98,125,24,45,172,87,2,0         ; vbroadcastss  0x257ac(%rip),%ymm13        # 2b624 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
-  DB  196,98,125,24,53,167,87,2,0         ; vbroadcastss  0x257a7(%rip),%ymm14        # 2b628 <_sk_srcover_rgba_8888_sse2_lowp+0x980>
+  DB  196,98,125,24,45,132,90,2,0         ; vbroadcastss  0x25a84(%rip),%ymm13        # 2b984 <_sk_srcover_rgba_8888_sse2_lowp+0x980>
+  DB  196,98,125,24,53,127,90,2,0         ; vbroadcastss  0x25a7f(%rip),%ymm14        # 2b988 <_sk_srcover_rgba_8888_sse2_lowp+0x984>
   DB  196,66,29,184,245                   ; vfmadd231ps   %ymm13,%ymm12,%ymm14
-  DB  196,98,125,24,45,157,87,2,0         ; vbroadcastss  0x2579d(%rip),%ymm13        # 2b62c <_sk_srcover_rgba_8888_sse2_lowp+0x984>
+  DB  196,98,125,24,45,117,90,2,0         ; vbroadcastss  0x25a75(%rip),%ymm13        # 2b98c <_sk_srcover_rgba_8888_sse2_lowp+0x988>
   DB  196,66,29,184,238                   ; vfmadd231ps   %ymm14,%ymm12,%ymm13
-  DB  196,98,125,24,53,147,87,2,0         ; vbroadcastss  0x25793(%rip),%ymm14        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x988>
+  DB  196,98,125,24,53,107,90,2,0         ; vbroadcastss  0x25a6b(%rip),%ymm14        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
   DB  196,66,29,184,245                   ; vfmadd231ps   %ymm13,%ymm12,%ymm14
   DB  196,65,36,89,222                    ; vmulps        %ymm14,%ymm11,%ymm11
   DB  196,65,52,194,202,1                 ; vcmpltps      %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,126,87,2,0         ; vbroadcastss  0x2577e(%rip),%ymm10        # 2b634 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
+  DB  196,98,125,24,21,86,90,2,0          ; vbroadcastss  0x25a56(%rip),%ymm10        # 2b994 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
   DB  196,65,44,92,211                    ; vsubps        %ymm11,%ymm10,%ymm10
   DB  196,67,37,74,202,144                ; vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   DB  196,193,124,194,192,1               ; vcmpltps      %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,21,20,86,2,0          ; vbroadcastss  0x25614(%rip),%ymm10        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,21,236,88,2,0         ; vbroadcastss  0x258ec(%rip),%ymm10        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,44,92,209                    ; vsubps        %ymm9,%ymm10,%ymm10
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  196,65,116,194,200,1                ; vcmpltps      %ymm8,%ymm1,%ymm9
-  DB  196,98,125,24,21,254,85,2,0         ; vbroadcastss  0x255fe(%rip),%ymm10        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,21,214,88,2,0         ; vbroadcastss  0x258d6(%rip),%ymm10        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,44,92,208                       ; vsubps        %ymm0,%ymm10,%ymm10
   DB  196,195,125,74,194,144              ; vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   DB  196,65,124,194,200,3                ; vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -5838,23 +5850,23 @@
   DB  197,50,89,80,44                     ; vmulss        0x2c(%rax),%xmm9,%xmm10
   DB  196,66,125,24,210                   ; vbroadcastss  %xmm10,%ymm10
   DB  197,44,88,208                       ; vaddps        %ymm0,%ymm10,%ymm10
-  DB  196,98,125,24,29,254,86,2,0         ; vbroadcastss  0x256fe(%rip),%ymm11        # 2b638 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  DB  196,98,125,24,29,214,89,2,0         ; vbroadcastss  0x259d6(%rip),%ymm11        # 2b998 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
   DB  197,116,89,217                      ; vmulps        %ymm1,%ymm1,%ymm11
   DB  196,98,125,184,216                  ; vfmadd231ps   %ymm0,%ymm0,%ymm11
   DB  196,193,50,89,193                   ; vmulss        %xmm9,%xmm9,%xmm0
   DB  196,226,125,24,192                  ; vbroadcastss  %xmm0,%ymm0
   DB  197,164,92,192                      ; vsubps        %ymm0,%ymm11,%ymm0
-  DB  196,98,125,24,13,221,86,2,0         ; vbroadcastss  0x256dd(%rip),%ymm9        # 2b63c <_sk_srcover_rgba_8888_sse2_lowp+0x994>
+  DB  196,98,125,24,13,181,89,2,0         ; vbroadcastss  0x259b5(%rip),%ymm9        # 2b99c <_sk_srcover_rgba_8888_sse2_lowp+0x998>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  196,194,45,184,194                  ; vfmadd231ps   %ymm10,%ymm10,%ymm0
   DB  197,252,81,192                      ; vsqrtps       %ymm0,%ymm0
   DB  196,98,125,24,64,36                 ; vbroadcastss  0x24(%rax),%ymm8
-  DB  196,98,125,24,13,192,86,2,0         ; vbroadcastss  0x256c0(%rip),%ymm9        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,13,152,89,2,0         ; vbroadcastss  0x25998(%rip),%ymm9        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,65,44,87,201                    ; vxorps        %ymm9,%ymm10,%ymm9
   DB  196,65,124,92,210                   ; vsubps        %ymm10,%ymm0,%ymm10
-  DB  196,98,125,24,29,81,85,2,0          ; vbroadcastss  0x25551(%rip),%ymm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,29,41,88,2,0          ; vbroadcastss  0x25829(%rip),%ymm11        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  196,65,44,89,208                    ; vmulps        %ymm8,%ymm10,%ymm10
   DB  197,180,92,192                      ; vsubps        %ymm0,%ymm9,%ymm0
@@ -5871,23 +5883,23 @@
   DB  197,50,89,80,44                     ; vmulss        0x2c(%rax),%xmm9,%xmm10
   DB  196,66,125,24,210                   ; vbroadcastss  %xmm10,%ymm10
   DB  197,44,88,208                       ; vaddps        %ymm0,%ymm10,%ymm10
-  DB  196,98,125,24,29,102,86,2,0         ; vbroadcastss  0x25666(%rip),%ymm11        # 2b638 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  DB  196,98,125,24,29,62,89,2,0          ; vbroadcastss  0x2593e(%rip),%ymm11        # 2b998 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
   DB  197,116,89,217                      ; vmulps        %ymm1,%ymm1,%ymm11
   DB  196,98,125,184,216                  ; vfmadd231ps   %ymm0,%ymm0,%ymm11
   DB  196,193,50,89,193                   ; vmulss        %xmm9,%xmm9,%xmm0
   DB  196,226,125,24,192                  ; vbroadcastss  %xmm0,%ymm0
   DB  197,164,92,192                      ; vsubps        %ymm0,%ymm11,%ymm0
-  DB  196,98,125,24,13,69,86,2,0          ; vbroadcastss  0x25645(%rip),%ymm9        # 2b63c <_sk_srcover_rgba_8888_sse2_lowp+0x994>
+  DB  196,98,125,24,13,29,89,2,0          ; vbroadcastss  0x2591d(%rip),%ymm9        # 2b99c <_sk_srcover_rgba_8888_sse2_lowp+0x998>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  196,194,45,184,194                  ; vfmadd231ps   %ymm10,%ymm10,%ymm0
   DB  197,252,81,192                      ; vsqrtps       %ymm0,%ymm0
   DB  196,98,125,24,64,36                 ; vbroadcastss  0x24(%rax),%ymm8
-  DB  196,98,125,24,13,40,86,2,0          ; vbroadcastss  0x25628(%rip),%ymm9        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,13,0,89,2,0           ; vbroadcastss  0x25900(%rip),%ymm9        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,65,44,87,201                    ; vxorps        %ymm9,%ymm10,%ymm9
   DB  196,65,124,92,210                   ; vsubps        %ymm10,%ymm0,%ymm10
-  DB  196,98,125,24,29,185,84,2,0         ; vbroadcastss  0x254b9(%rip),%ymm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,29,145,87,2,0         ; vbroadcastss  0x25791(%rip),%ymm11        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  196,65,44,89,208                    ; vmulps        %ymm8,%ymm10,%ymm10
   DB  197,180,92,192                      ; vsubps        %ymm0,%ymm9,%ymm0
@@ -5903,14 +5915,14 @@
   DB  197,58,89,72,44                     ; vmulss        0x2c(%rax),%xmm8,%xmm9
   DB  196,66,125,24,201                   ; vbroadcastss  %xmm9,%ymm9
   DB  197,52,88,200                       ; vaddps        %ymm0,%ymm9,%ymm9
-  DB  196,98,125,24,21,212,85,2,0         ; vbroadcastss  0x255d4(%rip),%ymm10        # 2b638 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  DB  196,98,125,24,21,172,88,2,0         ; vbroadcastss  0x258ac(%rip),%ymm10        # 2b998 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
   DB  197,116,89,209                      ; vmulps        %ymm1,%ymm1,%ymm10
   DB  196,98,125,184,208                  ; vfmadd231ps   %ymm0,%ymm0,%ymm10
   DB  196,193,58,89,192                   ; vmulss        %xmm8,%xmm8,%xmm0
   DB  196,226,125,24,192                  ; vbroadcastss  %xmm0,%ymm0
   DB  197,172,92,192                      ; vsubps        %ymm0,%ymm10,%ymm0
-  DB  196,98,125,24,5,183,85,2,0          ; vbroadcastss  0x255b7(%rip),%ymm8        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,5,143,88,2,0          ; vbroadcastss  0x2588f(%rip),%ymm8        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,193,124,87,192                  ; vxorps        %ymm8,%ymm0,%ymm0
   DB  196,193,124,94,193                  ; vdivps        %ymm9,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -5944,7 +5956,7 @@
 PUBLIC _sk_save_xy_hsw
 _sk_save_xy_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,247,83,2,0          ; vbroadcastss  0x253f7(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,207,86,2,0          ; vbroadcastss  0x256cf(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,124,88,200                   ; vaddps        %ymm8,%ymm0,%ymm9
   DB  196,67,125,8,209,1                  ; vroundps      $0x1,%ymm9,%ymm10
   DB  196,65,52,92,202                    ; vsubps        %ymm10,%ymm9,%ymm9
@@ -5974,9 +5986,9 @@
 PUBLIC _sk_bilinear_nx_hsw
 _sk_bilinear_nx_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,231,84,2,0         ; vbroadcastss  0x254e7(%rip),%ymm0        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,5,191,87,2,0         ; vbroadcastss  0x257bf(%rip),%ymm0        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,126,83,2,0          ; vbroadcastss  0x2537e(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,86,86,2,0           ; vbroadcastss  0x25656(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,64                     ; vsubps        0x40(%rax),%ymm8,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -5985,7 +5997,7 @@
 PUBLIC _sk_bilinear_px_hsw
 _sk_bilinear_px_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,94,83,2,0          ; vbroadcastss  0x2535e(%rip),%ymm0        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,5,54,86,2,0          ; vbroadcastss  0x25636(%rip),%ymm0        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,64,64                    ; vmovups       0x40(%rax),%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
@@ -5995,9 +6007,9 @@
 PUBLIC _sk_bilinear_ny_hsw
 _sk_bilinear_ny_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,158,84,2,0        ; vbroadcastss  0x2549e(%rip),%ymm1        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,13,118,87,2,0        ; vbroadcastss  0x25776(%rip),%ymm1        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,52,83,2,0           ; vbroadcastss  0x25334(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,12,86,2,0           ; vbroadcastss  0x2560c(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,96                     ; vsubps        0x60(%rax),%ymm8,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6006,7 +6018,7 @@
 PUBLIC _sk_bilinear_py_hsw
 _sk_bilinear_py_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,20,83,2,0         ; vbroadcastss  0x25314(%rip),%ymm1        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,13,236,85,2,0        ; vbroadcastss  0x255ec(%rip),%ymm1        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
   DB  197,124,16,64,96                    ; vmovups       0x60(%rax),%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
@@ -6016,13 +6028,13 @@
 PUBLIC _sk_bicubic_n3x_hsw
 _sk_bicubic_n3x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,87,84,2,0          ; vbroadcastss  0x25457(%rip),%ymm0        # 2b648 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  DB  196,226,125,24,5,47,87,2,0          ; vbroadcastss  0x2572f(%rip),%ymm0        # 2b9a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,234,82,2,0          ; vbroadcastss  0x252ea(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,194,85,2,0          ; vbroadcastss  0x255c2(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,64                     ; vsubps        0x40(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,71,83,2,0          ; vbroadcastss  0x25347(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
-  DB  196,98,125,24,29,50,84,2,0          ; vbroadcastss  0x25432(%rip),%ymm11        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,31,86,2,0          ; vbroadcastss  0x2561f(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,29,10,87,2,0          ; vbroadcastss  0x2570a(%rip),%ymm11        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,36,89,193                    ; vmulps        %ymm9,%ymm11,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
@@ -6032,16 +6044,16 @@
 PUBLIC _sk_bicubic_n1x_hsw
 _sk_bicubic_n1x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,9,84,2,0           ; vbroadcastss  0x25409(%rip),%ymm0        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,5,225,86,2,0         ; vbroadcastss  0x256e1(%rip),%ymm0        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,160,82,2,0          ; vbroadcastss  0x252a0(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,120,85,2,0          ; vbroadcastss  0x25578(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,64                     ; vsubps        0x40(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,250,83,2,0         ; vbroadcastss  0x253fa(%rip),%ymm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
-  DB  196,98,125,24,21,245,83,2,0         ; vbroadcastss  0x253f5(%rip),%ymm10        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,13,210,86,2,0         ; vbroadcastss  0x256d2(%rip),%ymm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,21,205,86,2,0         ; vbroadcastss  0x256cd(%rip),%ymm10        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,66,61,168,209                   ; vfmadd213ps   %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,13,119,82,2,0         ; vbroadcastss  0x25277(%rip),%ymm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,13,79,85,2,0          ; vbroadcastss  0x2554f(%rip),%ymm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,66,61,184,202                   ; vfmadd231ps   %ymm10,%ymm8,%ymm9
-  DB  196,98,125,24,21,221,83,2,0         ; vbroadcastss  0x253dd(%rip),%ymm10        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,21,181,86,2,0         ; vbroadcastss  0x256b5(%rip),%ymm10        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,66,61,184,209                   ; vfmadd231ps   %ymm9,%ymm8,%ymm10
   DB  197,124,17,144,128,0,0,0            ; vmovups       %ymm10,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6050,14 +6062,14 @@
 PUBLIC _sk_bicubic_p1x_hsw
 _sk_bicubic_p1x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,77,82,2,0           ; vbroadcastss  0x2524d(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,37,85,2,0           ; vbroadcastss  0x25525(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,188,88,0                        ; vaddps        (%rax),%ymm8,%ymm0
   DB  197,124,16,72,64                    ; vmovups       0x40(%rax),%ymm9
-  DB  196,98,125,24,21,167,83,2,0         ; vbroadcastss  0x253a7(%rip),%ymm10        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
-  DB  196,98,125,24,29,162,83,2,0         ; vbroadcastss  0x253a2(%rip),%ymm11        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,21,127,86,2,0         ; vbroadcastss  0x2567f(%rip),%ymm10        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,29,122,86,2,0         ; vbroadcastss  0x2567a(%rip),%ymm11        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,66,53,168,218                   ; vfmadd213ps   %ymm10,%ymm9,%ymm11
   DB  196,66,53,168,216                   ; vfmadd213ps   %ymm8,%ymm9,%ymm11
-  DB  196,98,125,24,5,147,83,2,0          ; vbroadcastss  0x25393(%rip),%ymm8        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,5,107,86,2,0          ; vbroadcastss  0x2566b(%rip),%ymm8        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,66,53,184,195                   ; vfmadd231ps   %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6066,12 +6078,12 @@
 PUBLIC _sk_bicubic_p3x_hsw
 _sk_bicubic_p3x_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,111,83,2,0         ; vbroadcastss  0x2536f(%rip),%ymm0        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,226,125,24,5,71,86,2,0          ; vbroadcastss  0x25647(%rip),%ymm0        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,64,64                    ; vmovups       0x40(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,96,82,2,0          ; vbroadcastss  0x25260(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
-  DB  196,98,125,24,29,75,83,2,0          ; vbroadcastss  0x2534b(%rip),%ymm11        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,56,85,2,0          ; vbroadcastss  0x25538(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,29,35,86,2,0          ; vbroadcastss  0x25623(%rip),%ymm11        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,52,89,195                    ; vmulps        %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
@@ -6081,13 +6093,13 @@
 PUBLIC _sk_bicubic_n3y_hsw
 _sk_bicubic_n3y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,38,83,2,0         ; vbroadcastss  0x25326(%rip),%ymm1        # 2b648 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  DB  196,226,125,24,13,254,85,2,0        ; vbroadcastss  0x255fe(%rip),%ymm1        # 2b9a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,184,81,2,0          ; vbroadcastss  0x251b8(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,144,84,2,0          ; vbroadcastss  0x25490(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,96                     ; vsubps        0x60(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,21,82,2,0          ; vbroadcastss  0x25215(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
-  DB  196,98,125,24,29,0,83,2,0           ; vbroadcastss  0x25300(%rip),%ymm11        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,237,84,2,0         ; vbroadcastss  0x254ed(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,29,216,85,2,0         ; vbroadcastss  0x255d8(%rip),%ymm11        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,36,89,193                    ; vmulps        %ymm9,%ymm11,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
@@ -6097,16 +6109,16 @@
 PUBLIC _sk_bicubic_n1y_hsw
 _sk_bicubic_n1y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,215,82,2,0        ; vbroadcastss  0x252d7(%rip),%ymm1        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,13,175,85,2,0        ; vbroadcastss  0x255af(%rip),%ymm1        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,109,81,2,0          ; vbroadcastss  0x2516d(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,69,84,2,0           ; vbroadcastss  0x25445(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,96                     ; vsubps        0x60(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,199,82,2,0         ; vbroadcastss  0x252c7(%rip),%ymm9        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
-  DB  196,98,125,24,21,194,82,2,0         ; vbroadcastss  0x252c2(%rip),%ymm10        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,13,159,85,2,0         ; vbroadcastss  0x2559f(%rip),%ymm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,21,154,85,2,0         ; vbroadcastss  0x2559a(%rip),%ymm10        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,66,61,168,209                   ; vfmadd213ps   %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,13,68,81,2,0          ; vbroadcastss  0x25144(%rip),%ymm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,13,28,84,2,0          ; vbroadcastss  0x2541c(%rip),%ymm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,66,61,184,202                   ; vfmadd231ps   %ymm10,%ymm8,%ymm9
-  DB  196,98,125,24,21,170,82,2,0         ; vbroadcastss  0x252aa(%rip),%ymm10        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,21,130,85,2,0         ; vbroadcastss  0x25582(%rip),%ymm10        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,66,61,184,209                   ; vfmadd231ps   %ymm9,%ymm8,%ymm10
   DB  197,124,17,144,160,0,0,0            ; vmovups       %ymm10,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6115,14 +6127,14 @@
 PUBLIC _sk_bicubic_p1y_hsw
 _sk_bicubic_p1y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,26,81,2,0           ; vbroadcastss  0x2511a(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,242,83,2,0          ; vbroadcastss  0x253f2(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,188,88,72,32                    ; vaddps        0x20(%rax),%ymm8,%ymm1
   DB  197,124,16,72,96                    ; vmovups       0x60(%rax),%ymm9
-  DB  196,98,125,24,21,115,82,2,0         ; vbroadcastss  0x25273(%rip),%ymm10        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
-  DB  196,98,125,24,29,110,82,2,0         ; vbroadcastss  0x2526e(%rip),%ymm11        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,21,75,85,2,0          ; vbroadcastss  0x2554b(%rip),%ymm10        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,29,70,85,2,0          ; vbroadcastss  0x25546(%rip),%ymm11        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,66,53,168,218                   ; vfmadd213ps   %ymm10,%ymm9,%ymm11
   DB  196,66,53,168,216                   ; vfmadd213ps   %ymm8,%ymm9,%ymm11
-  DB  196,98,125,24,5,95,82,2,0           ; vbroadcastss  0x2525f(%rip),%ymm8        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,5,55,85,2,0           ; vbroadcastss  0x25537(%rip),%ymm8        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,66,53,184,195                   ; vfmadd231ps   %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -6131,12 +6143,12 @@
 PUBLIC _sk_bicubic_p3y_hsw
 _sk_bicubic_p3y_hsw LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,59,82,2,0         ; vbroadcastss  0x2523b(%rip),%ymm1        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,226,125,24,13,19,85,2,0         ; vbroadcastss  0x25513(%rip),%ymm1        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
   DB  197,124,16,64,96                    ; vmovups       0x60(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,43,81,2,0          ; vbroadcastss  0x2512b(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
-  DB  196,98,125,24,29,22,82,2,0          ; vbroadcastss  0x25216(%rip),%ymm11        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,3,84,2,0           ; vbroadcastss  0x25403(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,29,238,84,2,0         ; vbroadcastss  0x254ee(%rip),%ymm11        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,66,61,168,218                   ; vfmadd213ps   %ymm10,%ymm8,%ymm11
   DB  196,65,52,89,195                    ; vmulps        %ymm11,%ymm9,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
@@ -6264,7 +6276,7 @@
   DB  196,98,93,64,218                    ; vpmulld       %ymm2,%ymm4,%ymm11
   DB  72,139,0                            ; mov           (%rax),%rax
   DB  197,165,254,193                     ; vpaddd        %ymm1,%ymm11,%ymm0
-  DB  196,98,125,88,61,229,79,2,0         ; vpbroadcastd  0x24fe5(%rip),%ymm15        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  DB  196,98,125,88,61,189,82,2,0         ; vpbroadcastd  0x252bd(%rip),%ymm15        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   DB  196,194,125,64,199                  ; vpmulld       %ymm15,%ymm0,%ymm0
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
   DB  197,237,118,210                     ; vpcmpeqd      %ymm2,%ymm2,%ymm2
@@ -6276,13 +6288,13 @@
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,226,85,146,60,144               ; vgatherdps    %ymm5,(%rax,%ymm2,4),%ymm7
   DB  197,252,17,188,36,128,2,0,0         ; vmovups       %ymm7,0x280(%rsp)
-  DB  196,226,125,88,61,51,78,2,0         ; vpbroadcastd  0x24e33(%rip),%ymm7        # 2b4f4 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,226,125,88,61,11,81,2,0         ; vpbroadcastd  0x2510b(%rip),%ymm7        # 2b854 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   DB  197,253,254,199                     ; vpaddd        %ymm7,%ymm0,%ymm0
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,226,85,146,20,128               ; vgatherdps    %ymm5,(%rax,%ymm0,4),%ymm2
   DB  197,252,17,148,36,160,1,0,0         ; vmovups       %ymm2,0x1a0(%rsp)
-  DB  196,226,125,24,5,119,79,2,0         ; vbroadcastss  0x24f77(%rip),%ymm0        # 2b65c <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  DB  196,226,125,24,5,79,82,2,0          ; vbroadcastss  0x2524f(%rip),%ymm0        # 2b9bc <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   DB  197,172,88,232                      ; vaddps        %ymm0,%ymm10,%ymm5
   DB  197,254,91,237                      ; vcvttps2dq    %ymm5,%ymm5
   DB  196,226,93,64,213                   ; vpmulld       %ymm5,%ymm4,%ymm2
@@ -6542,7 +6554,7 @@
   DB  197,254,127,132,36,128,1,0,0        ; vmovdqu       %ymm0,0x180(%rsp)
   DB  196,98,109,64,200                   ; vpmulld       %ymm0,%ymm2,%ymm9
   DB  197,181,254,199                     ; vpaddd        %ymm7,%ymm9,%ymm0
-  DB  196,98,125,88,21,249,73,2,0         ; vpbroadcastd  0x249f9(%rip),%ymm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  DB  196,98,125,88,21,209,76,2,0         ; vpbroadcastd  0x24cd1(%rip),%ymm10        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   DB  196,194,125,64,194                  ; vpmulld       %ymm10,%ymm0,%ymm0
   DB  197,213,118,237                     ; vpcmpeqd      %ymm5,%ymm5,%ymm5
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
@@ -6554,13 +6566,13 @@
   DB  196,65,36,87,219                    ; vxorps        %ymm11,%ymm11,%ymm11
   DB  196,98,61,146,28,168                ; vgatherdps    %ymm8,(%rax,%ymm5,4),%ymm11
   DB  197,124,17,156,36,64,1,0,0          ; vmovups       %ymm11,0x140(%rsp)
-  DB  196,98,125,88,29,68,72,2,0          ; vpbroadcastd  0x24844(%rip),%ymm11        # 2b4f4 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,98,125,88,29,28,75,2,0          ; vpbroadcastd  0x24b1c(%rip),%ymm11        # 2b854 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   DB  196,193,125,254,195                 ; vpaddd        %ymm11,%ymm0,%ymm0
   DB  196,65,61,118,192                   ; vpcmpeqd      %ymm8,%ymm8,%ymm8
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,226,61,146,44,128               ; vgatherdps    %ymm8,(%rax,%ymm0,4),%ymm5
   DB  197,252,17,172,36,160,0,0,0         ; vmovups       %ymm5,0xa0(%rsp)
-  DB  196,226,125,24,5,134,73,2,0         ; vbroadcastss  0x24986(%rip),%ymm0        # 2b65c <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  DB  196,226,125,24,5,94,76,2,0          ; vbroadcastss  0x24c5e(%rip),%ymm0        # 2b9bc <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   DB  197,116,88,192                      ; vaddps        %ymm0,%ymm1,%ymm8
   DB  196,65,126,91,192                   ; vcvttps2dq    %ymm8,%ymm8
   DB  196,194,109,64,232                  ; vpmulld       %ymm8,%ymm2,%ymm5
@@ -6993,7 +7005,7 @@
   DB  196,193,100,92,210                  ; vsubps        %ymm10,%ymm3,%ymm2
   DB  196,194,77,168,210                  ; vfmadd213ps   %ymm10,%ymm6,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,54,62,2,0         ; vbroadcastss  0x23e36(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,14,65,2,0         ; vbroadcastss  0x2410e(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,16,164,36,224,6,0,0         ; vmovups       0x6e0(%rsp),%ymm4
   DB  197,252,16,172,36,0,7,0,0           ; vmovups       0x700(%rsp),%ymm5
   DB  197,252,16,180,36,32,7,0,0          ; vmovups       0x720(%rsp),%ymm6
@@ -7033,13 +7045,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  115,101                             ; jae           77c4 <_sk_start_pipeline_avx+0xe4>
+  DB  115,101                             ; jae           784c <_sk_start_pipeline_avx+0xe4>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,8                         ; lea           0x8(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
-  DB  119,38                              ; ja            77a7 <_sk_start_pipeline_avx+0xc7>
+  DB  119,38                              ; ja            782f <_sk_start_pipeline_avx+0xc7>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  76,137,246                          ; mov           %r14,%rsi
@@ -7050,16 +7062,16 @@
   DB  73,131,196,16                       ; add           $0x10,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,225                             ; jbe           7788 <_sk_start_pipeline_avx+0xa8>
+  DB  118,225                             ; jbe           7810 <_sk_start_pipeline_avx+0xa8>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,9                               ; je            77b8 <_sk_start_pipeline_avx+0xd8>
+  DB  116,9                               ; je            7840 <_sk_start_pipeline_avx+0xd8>
   DB  76,137,246                          ; mov           %r14,%rsi
   DB  72,137,217                          ; mov           %rbx,%rcx
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  117,173                             ; jne           7771 <_sk_start_pipeline_avx+0x91>
+  DB  117,173                             ; jne           77f9 <_sk_start_pipeline_avx+0x91>
   DB  197,248,40,181,32,255,255,255       ; vmovaps       -0xe0(%rbp),%xmm6
   DB  197,248,40,189,48,255,255,255       ; vmovaps       -0xd0(%rbp),%xmm7
   DB  197,120,40,133,64,255,255,255       ; vmovaps       -0xc0(%rbp),%xmm8
@@ -7092,15 +7104,15 @@
   DB  197,249,112,192,0                   ; vpshufd       $0x0,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  197,252,88,5,101,58,2,0             ; vaddps        0x23a65(%rip),%ymm0,%ymm0        # 2b2a0 <_sk_srcover_rgba_8888_sse2_lowp+0x5f8>
+  DB  197,252,88,5,61,61,2,0              ; vaddps        0x23d3d(%rip),%ymm0,%ymm0        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0x5fc>
   DB  197,249,110,201                     ; vmovd         %ecx,%xmm1
   DB  197,249,112,201,0                   ; vpshufd       $0x0,%xmm1,%xmm1
   DB  196,227,117,24,201,1                ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,141,60,2,0        ; vbroadcastss  0x23c8d(%rip),%ymm2        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,21,101,63,2,0        ; vbroadcastss  0x23f65(%rip),%ymm2        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,244,88,202                      ; vaddps        %ymm2,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,21,130,60,2,0        ; vbroadcastss  0x23c82(%rip),%ymm2        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,21,90,63,2,0         ; vbroadcastss  0x23f5a(%rip),%ymm2        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,228,87,219                      ; vxorps        %ymm3,%ymm3,%ymm3
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
@@ -7112,46 +7124,46 @@
 _sk_dither_avx LABEL PROC
   DB  197,121,110,194                     ; vmovd         %edx,%xmm8
   DB  196,65,121,112,192,0                ; vpshufd       $0x0,%xmm8,%xmm8
-  DB  197,57,254,13,34,62,2,0             ; vpaddd        0x23e22(%rip),%xmm8,%xmm9        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0xa08>
-  DB  197,57,254,5,42,62,2,0              ; vpaddd        0x23e2a(%rip),%xmm8,%xmm8        # 2b6c0 <_sk_srcover_rgba_8888_sse2_lowp+0xa18>
+  DB  197,57,254,13,250,64,2,0            ; vpaddd        0x240fa(%rip),%xmm8,%xmm9        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xa0c>
+  DB  197,57,254,5,2,65,2,0               ; vpaddd        0x24102(%rip),%xmm8,%xmm8        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xa1c>
   DB  196,67,53,24,208,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm10
   DB  197,121,110,217                     ; vmovd         %ecx,%xmm11
   DB  196,65,121,112,219,0                ; vpshufd       $0x0,%xmm11,%xmm11
   DB  196,67,37,24,219,1                  ; vinsertf128   $0x1,%xmm11,%ymm11,%ymm11
   DB  196,65,36,87,218                    ; vxorps        %ymm10,%ymm11,%ymm11
-  DB  196,98,125,24,21,50,60,2,0          ; vbroadcastss  0x23c32(%rip),%ymm10        # 2b4ec <_sk_srcover_rgba_8888_sse2_lowp+0x844>
+  DB  196,98,125,24,21,10,63,2,0          ; vbroadcastss  0x23f0a(%rip),%ymm10        # 2b84c <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   DB  196,65,36,84,210                    ; vandps        %ymm10,%ymm11,%ymm10
   DB  196,193,25,114,242,5                ; vpslld        $0x5,%xmm10,%xmm12
   DB  196,67,125,25,210,1                 ; vextractf128  $0x1,%ymm10,%xmm10
   DB  196,193,41,114,242,5                ; vpslld        $0x5,%xmm10,%xmm10
   DB  196,67,29,24,210,1                  ; vinsertf128   $0x1,%xmm10,%ymm12,%ymm10
-  DB  197,123,18,37,225,69,2,0            ; vmovddup      0x245e1(%rip),%xmm12        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0x1218>
+  DB  197,123,18,37,185,72,2,0            ; vmovddup      0x248b9(%rip),%xmm12        # 2c220 <_sk_srcover_rgba_8888_sse2_lowp+0x121c>
   DB  196,65,49,219,236                   ; vpand         %xmm12,%xmm9,%xmm13
   DB  196,193,17,114,245,4                ; vpslld        $0x4,%xmm13,%xmm13
   DB  196,65,57,219,228                   ; vpand         %xmm12,%xmm8,%xmm12
   DB  196,193,25,114,244,4                ; vpslld        $0x4,%xmm12,%xmm12
   DB  196,67,21,24,228,1                  ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm12
-  DB  196,98,125,24,45,240,59,2,0         ; vbroadcastss  0x23bf0(%rip),%ymm13        # 2b4f4 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,98,125,24,45,200,62,2,0         ; vbroadcastss  0x23ec8(%rip),%ymm13        # 2b854 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   DB  196,65,36,84,237                    ; vandps        %ymm13,%ymm11,%ymm13
   DB  196,193,9,114,245,2                 ; vpslld        $0x2,%xmm13,%xmm14
   DB  196,67,125,25,237,1                 ; vextractf128  $0x1,%ymm13,%xmm13
   DB  196,193,17,114,245,2                ; vpslld        $0x2,%xmm13,%xmm13
   DB  196,67,13,24,237,1                  ; vinsertf128   $0x1,%xmm13,%ymm14,%ymm13
-  DB  197,123,18,53,159,69,2,0            ; vmovddup      0x2459f(%rip),%xmm14        # 2bec8 <_sk_srcover_rgba_8888_sse2_lowp+0x1220>
+  DB  197,123,18,53,119,72,2,0            ; vmovddup      0x24877(%rip),%xmm14        # 2c228 <_sk_srcover_rgba_8888_sse2_lowp+0x1224>
   DB  196,65,49,219,254                   ; vpand         %xmm14,%xmm9,%xmm15
   DB  196,65,1,254,255                    ; vpaddd        %xmm15,%xmm15,%xmm15
   DB  196,65,57,219,246                   ; vpand         %xmm14,%xmm8,%xmm14
   DB  196,65,9,254,246                    ; vpaddd        %xmm14,%xmm14,%xmm14
   DB  196,67,5,24,246,1                   ; vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
   DB  196,65,12,86,228                    ; vorps         %ymm12,%ymm14,%ymm12
-  DB  196,98,125,24,53,159,59,2,0         ; vbroadcastss  0x23b9f(%rip),%ymm14        # 2b4f0 <_sk_srcover_rgba_8888_sse2_lowp+0x848>
+  DB  196,98,125,24,53,119,62,2,0         ; vbroadcastss  0x23e77(%rip),%ymm14        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
   DB  196,65,36,84,222                    ; vandps        %ymm14,%ymm11,%ymm11
   DB  196,193,9,114,211,1                 ; vpsrld        $0x1,%xmm11,%xmm14
   DB  196,67,125,25,219,1                 ; vextractf128  $0x1,%ymm11,%xmm11
   DB  196,193,33,114,211,1                ; vpsrld        $0x1,%xmm11,%xmm11
   DB  196,67,13,24,219,1                  ; vinsertf128   $0x1,%xmm11,%ymm14,%ymm11
   DB  196,65,20,86,219                    ; vorps         %ymm11,%ymm13,%ymm11
-  DB  197,123,18,45,85,69,2,0             ; vmovddup      0x24555(%rip),%xmm13        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0x1228>
+  DB  197,123,18,45,45,72,2,0             ; vmovddup      0x2482d(%rip),%xmm13        # 2c230 <_sk_srcover_rgba_8888_sse2_lowp+0x122c>
   DB  196,65,49,219,205                   ; vpand         %xmm13,%xmm9,%xmm9
   DB  196,65,57,219,197                   ; vpand         %xmm13,%xmm8,%xmm8
   DB  196,193,49,114,209,2                ; vpsrld        $0x2,%xmm9,%xmm9
@@ -7162,9 +7174,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  196,65,60,86,195                    ; vorps         %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,66,59,2,0          ; vbroadcastss  0x23b42(%rip),%ymm9        # 2b4f8 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
+  DB  196,98,125,24,13,26,62,2,0          ; vbroadcastss  0x23e1a(%rip),%ymm9        # 2b858 <_sk_srcover_rgba_8888_sse2_lowp+0x854>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,56,59,2,0          ; vbroadcastss  0x23b38(%rip),%ymm9        # 2b4fc <_sk_srcover_rgba_8888_sse2_lowp+0x854>
+  DB  196,98,125,24,13,16,62,2,0          ; vbroadcastss  0x23e10(%rip),%ymm9        # 2b85c <_sk_srcover_rgba_8888_sse2_lowp+0x858>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  196,98,125,24,8                     ; vbroadcastss  (%rax),%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
@@ -7194,7 +7206,7 @@
 PUBLIC _sk_black_color_avx
 _sk_black_color_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,192,58,2,0        ; vbroadcastss  0x23ac0(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,152,61,2,0        ; vbroadcastss  0x23d98(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -7203,7 +7215,7 @@
 PUBLIC _sk_white_color_avx
 _sk_white_color_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,167,58,2,0         ; vbroadcastss  0x23aa7(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,127,61,2,0         ; vbroadcastss  0x23d7f(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,252,40,216                      ; vmovaps       %ymm0,%ymm3
@@ -7241,7 +7253,7 @@
 PUBLIC _sk_srcatop_avx
 _sk_srcatop_avx LABEL PROC
   DB  197,252,89,199                      ; vmulps        %ymm7,%ymm0,%ymm0
-  DB  196,98,125,24,5,70,58,2,0           ; vbroadcastss  0x23a46(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,30,61,2,0           ; vbroadcastss  0x23d1e(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,204                       ; vmulps        %ymm4,%ymm8,%ymm9
   DB  197,180,88,192                      ; vaddps        %ymm0,%ymm9,%ymm0
@@ -7260,7 +7272,7 @@
 PUBLIC _sk_dstatop_avx
 _sk_dstatop_avx LABEL PROC
   DB  197,100,89,196                      ; vmulps        %ymm4,%ymm3,%ymm8
-  DB  196,98,125,24,13,4,58,2,0           ; vbroadcastss  0x23a04(%rip),%ymm9        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,13,220,60,2,0         ; vbroadcastss  0x23cdc(%rip),%ymm9        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,52,92,207                       ; vsubps        %ymm7,%ymm9,%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
   DB  197,188,88,192                      ; vaddps        %ymm0,%ymm8,%ymm0
@@ -7296,7 +7308,7 @@
 
 PUBLIC _sk_srcout_avx
 _sk_srcout_avx LABEL PROC
-  DB  196,98,125,24,5,159,57,2,0          ; vbroadcastss  0x2399f(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,119,60,2,0          ; vbroadcastss  0x23c77(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -7307,7 +7319,7 @@
 
 PUBLIC _sk_dstout_avx
 _sk_dstout_avx LABEL PROC
-  DB  196,226,125,24,5,126,57,2,0         ; vbroadcastss  0x2397e(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,86,60,2,0          ; vbroadcastss  0x23c56(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,92,219                      ; vsubps        %ymm3,%ymm0,%ymm3
   DB  197,228,89,196                      ; vmulps        %ymm4,%ymm3,%ymm0
   DB  197,228,89,205                      ; vmulps        %ymm5,%ymm3,%ymm1
@@ -7318,7 +7330,7 @@
 
 PUBLIC _sk_srcover_avx
 _sk_srcover_avx LABEL PROC
-  DB  196,98,125,24,5,93,57,2,0           ; vbroadcastss  0x2395d(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,53,60,2,0           ; vbroadcastss  0x23c35(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,204                       ; vmulps        %ymm4,%ymm8,%ymm9
   DB  197,180,88,192                      ; vaddps        %ymm0,%ymm9,%ymm0
@@ -7333,7 +7345,7 @@
 
 PUBLIC _sk_dstover_avx
 _sk_dstover_avx LABEL PROC
-  DB  196,98,125,24,5,44,57,2,0           ; vbroadcastss  0x2392c(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,4,60,2,0            ; vbroadcastss  0x23c04(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,199                       ; vsubps        %ymm7,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,252,88,196                      ; vaddps        %ymm4,%ymm0,%ymm0
@@ -7357,7 +7369,7 @@
 
 PUBLIC _sk_multiply_avx
 _sk_multiply_avx LABEL PROC
-  DB  196,98,125,24,5,231,56,2,0          ; vbroadcastss  0x238e7(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,191,59,2,0          ; vbroadcastss  0x23bbf(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,208                       ; vmulps        %ymm0,%ymm9,%ymm10
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -7386,7 +7398,7 @@
 PUBLIC _sk_plus__avx
 _sk_plus__avx LABEL PROC
   DB  197,252,88,196                      ; vaddps        %ymm4,%ymm0,%ymm0
-  DB  196,98,125,24,5,118,56,2,0          ; vbroadcastss  0x23876(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,78,59,2,0           ; vbroadcastss  0x23b4e(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  197,244,88,205                      ; vaddps        %ymm5,%ymm1,%ymm1
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
@@ -7416,7 +7428,7 @@
 
 PUBLIC _sk_xor__avx
 _sk_xor__avx LABEL PROC
-  DB  196,98,125,24,5,21,56,2,0           ; vbroadcastss  0x23815(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,237,58,2,0          ; vbroadcastss  0x23aed(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,192                      ; vmulps        %ymm0,%ymm9,%ymm0
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -7451,7 +7463,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,95,209                  ; vmaxps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,145,55,2,0          ; vbroadcastss  0x23791(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,105,58,2,0          ; vbroadcastss  0x23a69(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -7475,7 +7487,7 @@
   DB  197,100,89,206                      ; vmulps        %ymm6,%ymm3,%ymm9
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,57,55,2,0           ; vbroadcastss  0x23739(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,17,58,2,0           ; vbroadcastss  0x23a11(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -7502,7 +7514,7 @@
   DB  196,193,108,93,209                  ; vminps        %ymm9,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,213,54,2,0          ; vbroadcastss  0x236d5(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,173,57,2,0          ; vbroadcastss  0x239ad(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -7523,7 +7535,7 @@
   DB  197,236,89,214                      ; vmulps        %ymm6,%ymm2,%ymm2
   DB  197,236,88,210                      ; vaddps        %ymm2,%ymm2,%ymm2
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
-  DB  196,98,125,24,5,140,54,2,0          ; vbroadcastss  0x2368c(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,100,57,2,0          ; vbroadcastss  0x23964(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
   DB  197,60,89,199                       ; vmulps        %ymm7,%ymm8,%ymm8
   DB  197,188,88,219                      ; vaddps        %ymm3,%ymm8,%ymm3
@@ -7532,7 +7544,7 @@
 
 PUBLIC _sk_colorburn_avx
 _sk_colorburn_avx LABEL PROC
-  DB  196,98,125,24,5,115,54,2,0          ; vbroadcastss  0x23673(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,75,57,2,0           ; vbroadcastss  0x2394b(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,52,89,216                       ; vmulps        %ymm0,%ymm9,%ymm11
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
@@ -7592,7 +7604,7 @@
 PUBLIC _sk_colordodge_avx
 _sk_colordodge_avx LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  196,98,125,24,13,119,53,2,0         ; vbroadcastss  0x23577(%rip),%ymm9        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,13,79,56,2,0          ; vbroadcastss  0x2384f(%rip),%ymm9        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,52,92,215                       ; vsubps        %ymm7,%ymm9,%ymm10
   DB  197,44,89,216                       ; vmulps        %ymm0,%ymm10,%ymm11
   DB  197,52,92,203                       ; vsubps        %ymm3,%ymm9,%ymm9
@@ -7647,7 +7659,7 @@
 
 PUBLIC _sk_hardlight_avx
 _sk_hardlight_avx LABEL PROC
-  DB  196,98,125,24,5,130,52,2,0          ; vbroadcastss  0x23482(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,90,55,2,0           ; vbroadcastss  0x2375a(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,200                       ; vmulps        %ymm0,%ymm10,%ymm9
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -7700,7 +7712,7 @@
 
 PUBLIC _sk_overlay_avx
 _sk_overlay_avx LABEL PROC
-  DB  196,98,125,24,5,167,51,2,0          ; vbroadcastss  0x233a7(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,127,54,2,0          ; vbroadcastss  0x2367f(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,215                       ; vsubps        %ymm7,%ymm8,%ymm10
   DB  197,44,89,200                       ; vmulps        %ymm0,%ymm10,%ymm9
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -7765,10 +7777,10 @@
   DB  196,65,60,88,192                    ; vaddps        %ymm8,%ymm8,%ymm8
   DB  196,65,60,89,216                    ; vmulps        %ymm8,%ymm8,%ymm11
   DB  196,65,60,88,195                    ; vaddps        %ymm11,%ymm8,%ymm8
-  DB  196,98,125,24,29,170,50,2,0         ; vbroadcastss  0x232aa(%rip),%ymm11        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  DB  196,98,125,24,29,130,53,2,0         ; vbroadcastss  0x23582(%rip),%ymm11        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
   DB  196,65,28,88,235                    ; vaddps        %ymm11,%ymm12,%ymm13
   DB  196,65,20,89,192                    ; vmulps        %ymm8,%ymm13,%ymm8
-  DB  196,98,125,24,45,155,50,2,0         ; vbroadcastss  0x2329b(%rip),%ymm13        # 2b504 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
+  DB  196,98,125,24,45,115,53,2,0         ; vbroadcastss  0x23573(%rip),%ymm13        # 2b864 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
   DB  196,65,28,89,245                    ; vmulps        %ymm13,%ymm12,%ymm14
   DB  196,65,12,88,192                    ; vaddps        %ymm8,%ymm14,%ymm8
   DB  196,65,124,82,244                   ; vrsqrtps      %ymm12,%ymm14
@@ -7779,7 +7791,7 @@
   DB  197,4,194,255,2                     ; vcmpleps      %ymm7,%ymm15,%ymm15
   DB  196,67,13,74,240,240                ; vblendvps     %ymm15,%ymm8,%ymm14,%ymm14
   DB  197,116,88,249                      ; vaddps        %ymm1,%ymm1,%ymm15
-  DB  196,98,125,24,5,69,50,2,0           ; vbroadcastss  0x23245(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,29,53,2,0           ; vbroadcastss  0x2351d(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,65,60,92,228                    ; vsubps        %ymm12,%ymm8,%ymm12
   DB  197,132,92,195                      ; vsubps        %ymm3,%ymm15,%ymm0
   DB  196,65,124,89,228                   ; vmulps        %ymm12,%ymm0,%ymm12
@@ -7906,12 +7918,12 @@
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,65,36,94,222                    ; vdivps        %ymm14,%ymm11,%ymm11
   DB  196,67,37,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  DB  196,98,125,24,53,35,48,2,0          ; vbroadcastss  0x23023(%rip),%ymm14        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,53,251,50,2,0         ; vbroadcastss  0x232fb(%rip),%ymm14        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,92,89,222                    ; vmulps        %ymm14,%ymm4,%ymm11
-  DB  196,98,125,24,61,25,48,2,0          ; vbroadcastss  0x23019(%rip),%ymm15        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,61,241,50,2,0         ; vbroadcastss  0x232f1(%rip),%ymm15        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,226,125,24,5,10,48,2,0          ; vbroadcastss  0x2300a(%rip),%ymm0        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,226,125,24,5,226,50,2,0         ; vbroadcastss  0x232e2(%rip),%ymm0        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  197,76,89,232                       ; vmulps        %ymm0,%ymm6,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
   DB  196,65,52,89,238                    ; vmulps        %ymm14,%ymm9,%ymm13
@@ -7972,7 +7984,7 @@
   DB  196,65,36,95,208                    ; vmaxps        %ymm8,%ymm11,%ymm10
   DB  196,195,109,74,209,240              ; vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   DB  196,193,108,95,208                  ; vmaxps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,183,46,2,0          ; vbroadcastss  0x22eb7(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,143,49,2,0          ; vbroadcastss  0x2318f(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,201                      ; vmulps        %ymm1,%ymm9,%ymm1
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -8029,12 +8041,12 @@
   DB  196,65,28,89,219                    ; vmulps        %ymm11,%ymm12,%ymm11
   DB  196,65,36,94,222                    ; vdivps        %ymm14,%ymm11,%ymm11
   DB  196,67,37,74,224,240                ; vblendvps     %ymm15,%ymm8,%ymm11,%ymm12
-  DB  196,98,125,24,53,219,45,2,0         ; vbroadcastss  0x22ddb(%rip),%ymm14        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,53,179,48,2,0         ; vbroadcastss  0x230b3(%rip),%ymm14        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,92,89,222                    ; vmulps        %ymm14,%ymm4,%ymm11
-  DB  196,98,125,24,61,209,45,2,0         ; vbroadcastss  0x22dd1(%rip),%ymm15        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,61,169,48,2,0         ; vbroadcastss  0x230a9(%rip),%ymm15        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,84,89,239                    ; vmulps        %ymm15,%ymm5,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
-  DB  196,226,125,24,5,194,45,2,0         ; vbroadcastss  0x22dc2(%rip),%ymm0        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,226,125,24,5,154,48,2,0         ; vbroadcastss  0x2309a(%rip),%ymm0        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  197,76,89,232                       ; vmulps        %ymm0,%ymm6,%ymm13
   DB  196,65,36,88,221                    ; vaddps        %ymm13,%ymm11,%ymm11
   DB  196,65,52,89,238                    ; vmulps        %ymm14,%ymm9,%ymm13
@@ -8095,7 +8107,7 @@
   DB  196,65,36,95,208                    ; vmaxps        %ymm8,%ymm11,%ymm10
   DB  196,195,109,74,209,240              ; vblendvps     %ymm15,%ymm9,%ymm2,%ymm2
   DB  196,193,108,95,208                  ; vmaxps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,111,44,2,0          ; vbroadcastss  0x22c6f(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,71,47,2,0           ; vbroadcastss  0x22f47(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,207                       ; vsubps        %ymm7,%ymm8,%ymm9
   DB  197,180,89,201                      ; vmulps        %ymm1,%ymm9,%ymm1
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
@@ -8124,12 +8136,12 @@
   DB  197,252,17,68,36,32                 ; vmovups       %ymm0,0x20(%rsp)
   DB  197,124,89,199                      ; vmulps        %ymm7,%ymm0,%ymm8
   DB  197,116,89,207                      ; vmulps        %ymm7,%ymm1,%ymm9
-  DB  196,98,125,24,45,27,44,2,0          ; vbroadcastss  0x22c1b(%rip),%ymm13        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,45,243,46,2,0         ; vbroadcastss  0x22ef3(%rip),%ymm13        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,92,89,213                    ; vmulps        %ymm13,%ymm4,%ymm10
-  DB  196,98,125,24,53,17,44,2,0          ; vbroadcastss  0x22c11(%rip),%ymm14        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,53,233,46,2,0         ; vbroadcastss  0x22ee9(%rip),%ymm14        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,84,89,222                    ; vmulps        %ymm14,%ymm5,%ymm11
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,61,2,44,2,0           ; vbroadcastss  0x22c02(%rip),%ymm15        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,98,125,24,61,218,46,2,0         ; vbroadcastss  0x22eda(%rip),%ymm15        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  196,65,76,89,223                    ; vmulps        %ymm15,%ymm6,%ymm11
   DB  196,193,44,88,195                   ; vaddps        %ymm11,%ymm10,%ymm0
   DB  196,65,60,89,221                    ; vmulps        %ymm13,%ymm8,%ymm11
@@ -8192,7 +8204,7 @@
   DB  196,65,44,95,207                    ; vmaxps        %ymm15,%ymm10,%ymm9
   DB  196,195,37,74,192,0                 ; vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   DB  196,65,124,95,199                   ; vmaxps        %ymm15,%ymm0,%ymm8
-  DB  196,226,125,24,5,157,42,2,0         ; vbroadcastss  0x22a9d(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,117,45,2,0         ; vbroadcastss  0x22d75(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,84,36,32                 ; vmulps        0x20(%rsp),%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -8222,12 +8234,12 @@
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  197,100,89,196                      ; vmulps        %ymm4,%ymm3,%ymm8
   DB  197,100,89,205                      ; vmulps        %ymm5,%ymm3,%ymm9
-  DB  196,98,125,24,45,69,42,2,0          ; vbroadcastss  0x22a45(%rip),%ymm13        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,45,29,45,2,0          ; vbroadcastss  0x22d1d(%rip),%ymm13        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,108,89,213                   ; vmulps        %ymm13,%ymm2,%ymm10
-  DB  196,98,125,24,53,59,42,2,0          ; vbroadcastss  0x22a3b(%rip),%ymm14        # 2b50c <_sk_srcover_rgba_8888_sse2_lowp+0x864>
+  DB  196,98,125,24,53,19,45,2,0          ; vbroadcastss  0x22d13(%rip),%ymm14        # 2b86c <_sk_srcover_rgba_8888_sse2_lowp+0x868>
   DB  196,65,116,89,222                   ; vmulps        %ymm14,%ymm1,%ymm11
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,61,44,42,2,0          ; vbroadcastss  0x22a2c(%rip),%ymm15        # 2b510 <_sk_srcover_rgba_8888_sse2_lowp+0x868>
+  DB  196,98,125,24,61,4,45,2,0           ; vbroadcastss  0x22d04(%rip),%ymm15        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
   DB  196,65,28,89,223                    ; vmulps        %ymm15,%ymm12,%ymm11
   DB  196,193,44,88,195                   ; vaddps        %ymm11,%ymm10,%ymm0
   DB  196,65,60,89,221                    ; vmulps        %ymm13,%ymm8,%ymm11
@@ -8290,7 +8302,7 @@
   DB  196,65,44,95,207                    ; vmaxps        %ymm15,%ymm10,%ymm9
   DB  196,195,37,74,192,0                 ; vblendvps     %ymm0,%ymm8,%ymm11,%ymm0
   DB  196,65,124,95,199                   ; vmaxps        %ymm15,%ymm0,%ymm8
-  DB  196,226,125,24,5,199,40,2,0         ; vbroadcastss  0x228c7(%rip),%ymm0        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,5,159,43,2,0         ; vbroadcastss  0x22b9f(%rip),%ymm0        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,124,92,215                      ; vsubps        %ymm7,%ymm0,%ymm10
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  197,124,92,219                      ; vsubps        %ymm3,%ymm0,%ymm11
@@ -8321,9 +8333,9 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,42,1,0,0                     ; jne           8db9 <_sk_srcover_rgba_8888_avx+0x14a>
+  DB  15,133,42,1,0,0                     ; jne           8e41 <_sk_srcover_rgba_8888_avx+0x14a>
   DB  196,1,125,16,4,152                  ; vmovupd       (%r8,%r11,4),%ymm8
-  DB  197,125,40,13,35,38,2,0             ; vmovapd       0x22623(%rip),%ymm9        # 2b2c0 <_sk_srcover_rgba_8888_sse2_lowp+0x618>
+  DB  197,125,40,13,251,40,2,0            ; vmovapd       0x228fb(%rip),%ymm9        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x61c>
   DB  196,193,61,84,225                   ; vandpd        %ymm9,%ymm8,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
   DB  196,193,81,114,208,8                ; vpsrld        $0x8,%xmm8,%xmm5
@@ -8341,9 +8353,9 @@
   DB  197,193,114,215,24                  ; vpsrld        $0x18,%xmm7,%xmm7
   DB  196,227,61,24,255,1                 ; vinsertf128   $0x1,%xmm7,%ymm8,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,5,234,39,2,0          ; vbroadcastss  0x227ea(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,194,42,2,0          ; vbroadcastss  0x22ac2(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,195                       ; vsubps        %ymm3,%ymm8,%ymm8
-  DB  196,98,125,24,13,9,40,2,0           ; vbroadcastss  0x22809(%rip),%ymm9        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,13,225,42,2,0         ; vbroadcastss  0x22ae1(%rip),%ymm9        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,60,89,212                       ; vmulps        %ymm4,%ymm8,%ymm10
   DB  196,193,124,88,194                  ; vaddps        %ymm10,%ymm0,%ymm0
@@ -8376,7 +8388,7 @@
   DB  196,65,53,86,202                    ; vorpd         %ymm10,%ymm9,%ymm9
   DB  196,65,61,86,193                    ; vorpd         %ymm9,%ymm8,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           8df1 <_sk_srcover_rgba_8888_avx+0x182>
+  DB  117,66                              ; jne           8e79 <_sk_srcover_rgba_8888_avx+0x182>
   DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -8385,33 +8397,33 @@
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,195,254,255,255              ; ja            8c95 <_sk_srcover_rgba_8888_avx+0x26>
+  DB  15,135,195,254,255,255              ; ja            8d1d <_sk_srcover_rgba_8888_avx+0x26>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,3,1,0,0                   ; lea           0x103(%rip),%r10        # 8ee0 <_sk_srcover_rgba_8888_avx+0x271>
+  DB  76,141,21,3,1,0,0                   ; lea           0x103(%rip),%r10        # 8f68 <_sk_srcover_rgba_8888_avx+0x271>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,122,16,4,152                  ; vmovss        (%r8,%r11,4),%xmm8
-  DB  233,164,254,255,255                 ; jmpq          8c95 <_sk_srcover_rgba_8888_avx+0x26>
+  DB  233,164,254,255,255                 ; jmpq          8d1d <_sk_srcover_rgba_8888_avx+0x26>
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,180                             ; ja            8db5 <_sk_srcover_rgba_8888_avx+0x146>
+  DB  119,180                             ; ja            8e3d <_sk_srcover_rgba_8888_avx+0x146>
   DB  65,15,182,193                       ; movzbl        %r9b,%eax
-  DB  76,141,13,240,0,0,0                 ; lea           0xf0(%rip),%r9        # 8efc <_sk_srcover_rgba_8888_avx+0x28d>
+  DB  76,141,13,240,0,0,0                 ; lea           0xf0(%rip),%r9        # 8f84 <_sk_srcover_rgba_8888_avx+0x28d>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,152                             ; jmp           8db5 <_sk_srcover_rgba_8888_avx+0x146>
+  DB  235,152                             ; jmp           8e3d <_sk_srcover_rgba_8888_avx+0x146>
   DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,196,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm8
   DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
   DB  196,99,61,13,196,1                  ; vblendpd      $0x1,%ymm4,%ymm8,%ymm8
-  DB  233,81,254,255,255                  ; jmpq          8c95 <_sk_srcover_rgba_8888_avx+0x26>
+  DB  233,81,254,255,255                  ; jmpq          8d1d <_sk_srcover_rgba_8888_avx+0x26>
   DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
@@ -8425,10 +8437,10 @@
   DB  196,99,61,24,196,1                  ; vinsertf128   $0x1,%xmm4,%ymm8,%ymm8
   DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
   DB  196,67,93,13,192,12                 ; vblendpd      $0xc,%ymm8,%ymm4,%ymm8
-  DB  233,252,253,255,255                 ; jmpq          8c95 <_sk_srcover_rgba_8888_avx+0x26>
+  DB  233,252,253,255,255                 ; jmpq          8d1d <_sk_srcover_rgba_8888_avx+0x26>
   DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  233,9,255,255,255                   ; jmpq          8db5 <_sk_srcover_rgba_8888_avx+0x146>
+  DB  233,9,255,255,255                   ; jmpq          8e3d <_sk_srcover_rgba_8888_avx+0x146>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
@@ -8436,7 +8448,7 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,1,122,17,76,152,16              ; vmovss        %xmm9,0x10(%r8,%r11,4)
   DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  233,213,254,255,255                 ; jmpq          8db5 <_sk_srcover_rgba_8888_avx+0x146>
+  DB  233,213,254,255,255                 ; jmpq          8e3d <_sk_srcover_rgba_8888_avx+0x146>
   DB  6                                   ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -8479,7 +8491,7 @@
 
 PUBLIC _sk_clamp_1_avx
 _sk_clamp_1_avx LABEL PROC
-  DB  196,98,125,24,5,170,37,2,0          ; vbroadcastss  0x225aa(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,130,40,2,0          ; vbroadcastss  0x22882(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
@@ -8489,7 +8501,7 @@
 
 PUBLIC _sk_clamp_a_avx
 _sk_clamp_a_avx LABEL PROC
-  DB  196,98,125,24,5,137,37,2,0          ; vbroadcastss  0x22589(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,97,40,2,0           ; vbroadcastss  0x22861(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  197,252,93,195                      ; vminps        %ymm3,%ymm0,%ymm0
   DB  197,244,93,203                      ; vminps        %ymm3,%ymm1,%ymm1
@@ -8499,7 +8511,7 @@
 
 PUBLIC _sk_clamp_a_dst_avx
 _sk_clamp_a_dst_avx LABEL PROC
-  DB  196,98,125,24,5,107,37,2,0          ; vbroadcastss  0x2256b(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,67,40,2,0           ; vbroadcastss  0x22843(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,68,93,248                   ; vminps        %ymm8,%ymm7,%ymm7
   DB  197,220,93,231                      ; vminps        %ymm7,%ymm4,%ymm4
   DB  197,212,93,239                      ; vminps        %ymm7,%ymm5,%ymm5
@@ -8526,7 +8538,7 @@
 
 PUBLIC _sk_invert_avx
 _sk_invert_avx LABEL PROC
-  DB  196,98,125,24,5,38,37,2,0           ; vbroadcastss  0x22526(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,254,39,2,0          ; vbroadcastss  0x227fe(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,188,92,192                      ; vsubps        %ymm0,%ymm8,%ymm0
   DB  197,188,92,201                      ; vsubps        %ymm1,%ymm8,%ymm1
   DB  197,188,92,210                      ; vsubps        %ymm2,%ymm8,%ymm2
@@ -8572,7 +8584,7 @@
 _sk_unpremul_avx LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,65,100,194,200,0                ; vcmpeqps      %ymm8,%ymm3,%ymm9
-  DB  196,98,125,24,21,182,36,2,0         ; vbroadcastss  0x224b6(%rip),%ymm10        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,21,142,39,2,0         ; vbroadcastss  0x2278e(%rip),%ymm10        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,44,94,211                       ; vdivps        %ymm3,%ymm10,%ymm10
   DB  196,67,45,74,192,144                ; vblendvps     %ymm9,%ymm8,%ymm10,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
@@ -8583,17 +8595,17 @@
 
 PUBLIC _sk_from_srgb_avx
 _sk_from_srgb_avx LABEL PROC
-  DB  196,98,125,24,5,195,36,2,0          ; vbroadcastss  0x224c3(%rip),%ymm8        # 2b518 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,125,24,5,155,39,2,0          ; vbroadcastss  0x2279b(%rip),%ymm8        # 2b878 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  197,124,89,208                      ; vmulps        %ymm0,%ymm0,%ymm10
-  DB  196,98,125,24,29,161,36,2,0         ; vbroadcastss  0x224a1(%rip),%ymm11        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,29,121,39,2,0         ; vbroadcastss  0x22779(%rip),%ymm11        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,124,89,227                   ; vmulps        %ymm11,%ymm0,%ymm12
-  DB  196,98,125,24,45,167,36,2,0         ; vbroadcastss  0x224a7(%rip),%ymm13        # 2b51c <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  DB  196,98,125,24,45,127,39,2,0         ; vbroadcastss  0x2277f(%rip),%ymm13        # 2b87c <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,44,89,212                    ; vmulps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,152,36,2,0         ; vbroadcastss  0x22498(%rip),%ymm12        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  DB  196,98,125,24,37,112,39,2,0         ; vbroadcastss  0x22770(%rip),%ymm12        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,53,142,36,2,0         ; vbroadcastss  0x2248e(%rip),%ymm14        # 2b524 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  DB  196,98,125,24,53,102,39,2,0         ; vbroadcastss  0x22766(%rip),%ymm14        # 2b884 <_sk_srcover_rgba_8888_sse2_lowp+0x880>
   DB  196,193,124,194,198,1               ; vcmpltps      %ymm14,%ymm0,%ymm0
   DB  196,195,45,74,193,0                 ; vblendvps     %ymm0,%ymm9,%ymm10,%ymm0
   DB  196,65,116,89,200                   ; vmulps        %ymm8,%ymm1,%ymm9
@@ -8617,17 +8629,17 @@
 
 PUBLIC _sk_from_srgb_dst_avx
 _sk_from_srgb_dst_avx LABEL PROC
-  DB  196,98,125,24,5,23,36,2,0           ; vbroadcastss  0x22417(%rip),%ymm8        # 2b518 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,125,24,5,239,38,2,0          ; vbroadcastss  0x226ef(%rip),%ymm8        # 2b878 <_sk_srcover_rgba_8888_sse2_lowp+0x874>
   DB  196,65,92,89,200                    ; vmulps        %ymm8,%ymm4,%ymm9
   DB  197,92,89,212                       ; vmulps        %ymm4,%ymm4,%ymm10
-  DB  196,98,125,24,29,245,35,2,0         ; vbroadcastss  0x223f5(%rip),%ymm11        # 2b508 <_sk_srcover_rgba_8888_sse2_lowp+0x860>
+  DB  196,98,125,24,29,205,38,2,0         ; vbroadcastss  0x226cd(%rip),%ymm11        # 2b868 <_sk_srcover_rgba_8888_sse2_lowp+0x864>
   DB  196,65,92,89,227                    ; vmulps        %ymm11,%ymm4,%ymm12
-  DB  196,98,125,24,45,251,35,2,0         ; vbroadcastss  0x223fb(%rip),%ymm13        # 2b51c <_sk_srcover_rgba_8888_sse2_lowp+0x874>
+  DB  196,98,125,24,45,211,38,2,0         ; vbroadcastss  0x226d3(%rip),%ymm13        # 2b87c <_sk_srcover_rgba_8888_sse2_lowp+0x878>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,44,89,212                    ; vmulps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,37,236,35,2,0         ; vbroadcastss  0x223ec(%rip),%ymm12        # 2b520 <_sk_srcover_rgba_8888_sse2_lowp+0x878>
+  DB  196,98,125,24,37,196,38,2,0         ; vbroadcastss  0x226c4(%rip),%ymm12        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
   DB  196,65,44,88,212                    ; vaddps        %ymm12,%ymm10,%ymm10
-  DB  196,98,125,24,53,226,35,2,0         ; vbroadcastss  0x223e2(%rip),%ymm14        # 2b524 <_sk_srcover_rgba_8888_sse2_lowp+0x87c>
+  DB  196,98,125,24,53,186,38,2,0         ; vbroadcastss  0x226ba(%rip),%ymm14        # 2b884 <_sk_srcover_rgba_8888_sse2_lowp+0x880>
   DB  196,193,92,194,230,1                ; vcmpltps      %ymm14,%ymm4,%ymm4
   DB  196,195,45,74,225,64                ; vblendvps     %ymm4,%ymm9,%ymm10,%ymm4
   DB  196,65,84,89,200                    ; vmulps        %ymm8,%ymm5,%ymm9
@@ -8652,20 +8664,20 @@
 PUBLIC _sk_to_srgb_avx
 _sk_to_srgb_avx LABEL PROC
   DB  197,124,82,200                      ; vrsqrtps      %ymm0,%ymm9
-  DB  196,98,125,24,5,119,35,2,0          ; vbroadcastss  0x22377(%rip),%ymm8        # 2b528 <_sk_srcover_rgba_8888_sse2_lowp+0x880>
+  DB  196,98,125,24,5,79,38,2,0           ; vbroadcastss  0x2264f(%rip),%ymm8        # 2b888 <_sk_srcover_rgba_8888_sse2_lowp+0x884>
   DB  196,65,124,89,208                   ; vmulps        %ymm8,%ymm0,%ymm10
-  DB  196,98,125,24,29,113,35,2,0         ; vbroadcastss  0x22371(%rip),%ymm11        # 2b530 <_sk_srcover_rgba_8888_sse2_lowp+0x888>
+  DB  196,98,125,24,29,73,38,2,0          ; vbroadcastss  0x22649(%rip),%ymm11        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
   DB  196,65,52,89,227                    ; vmulps        %ymm11,%ymm9,%ymm12
-  DB  196,98,125,24,45,95,35,2,0          ; vbroadcastss  0x2235f(%rip),%ymm13        # 2b52c <_sk_srcover_rgba_8888_sse2_lowp+0x884>
+  DB  196,98,125,24,45,55,38,2,0          ; vbroadcastss  0x22637(%rip),%ymm13        # 2b88c <_sk_srcover_rgba_8888_sse2_lowp+0x888>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,52,89,228                    ; vmulps        %ymm12,%ymm9,%ymm12
-  DB  196,98,125,24,53,84,35,2,0          ; vbroadcastss  0x22354(%rip),%ymm14        # 2b534 <_sk_srcover_rgba_8888_sse2_lowp+0x88c>
+  DB  196,98,125,24,53,44,38,2,0          ; vbroadcastss  0x2262c(%rip),%ymm14        # 2b894 <_sk_srcover_rgba_8888_sse2_lowp+0x890>
   DB  196,65,28,88,230                    ; vaddps        %ymm14,%ymm12,%ymm12
-  DB  196,98,125,24,61,74,35,2,0          ; vbroadcastss  0x2234a(%rip),%ymm15        # 2b538 <_sk_srcover_rgba_8888_sse2_lowp+0x890>
+  DB  196,98,125,24,61,34,38,2,0          ; vbroadcastss  0x22622(%rip),%ymm15        # 2b898 <_sk_srcover_rgba_8888_sse2_lowp+0x894>
   DB  196,65,52,88,207                    ; vaddps        %ymm15,%ymm9,%ymm9
   DB  196,65,124,83,201                   ; vrcpps        %ymm9,%ymm9
   DB  196,65,52,89,204                    ; vmulps        %ymm12,%ymm9,%ymm9
-  DB  196,98,125,24,37,54,35,2,0          ; vbroadcastss  0x22336(%rip),%ymm12        # 2b53c <_sk_srcover_rgba_8888_sse2_lowp+0x894>
+  DB  196,98,125,24,37,14,38,2,0          ; vbroadcastss  0x2260e(%rip),%ymm12        # 2b89c <_sk_srcover_rgba_8888_sse2_lowp+0x898>
   DB  196,193,124,194,196,1               ; vcmpltps      %ymm12,%ymm0,%ymm0
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  197,124,82,201                      ; vrsqrtps      %ymm1,%ymm9
@@ -8700,7 +8712,7 @@
   DB  197,116,93,202                      ; vminps        %ymm2,%ymm1,%ymm9
   DB  196,65,124,93,201                   ; vminps        %ymm9,%ymm0,%ymm9
   DB  196,65,60,92,209                    ; vsubps        %ymm9,%ymm8,%ymm10
-  DB  196,98,125,24,29,66,34,2,0          ; vbroadcastss  0x22242(%rip),%ymm11        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,29,26,37,2,0          ; vbroadcastss  0x2251a(%rip),%ymm11        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,65,36,94,218                    ; vdivps        %ymm10,%ymm11,%ymm11
   DB  197,116,92,226                      ; vsubps        %ymm2,%ymm1,%ymm12
   DB  196,65,28,89,227                    ; vmulps        %ymm11,%ymm12,%ymm12
@@ -8710,19 +8722,19 @@
   DB  196,193,108,89,211                  ; vmulps        %ymm11,%ymm2,%ymm2
   DB  197,252,92,201                      ; vsubps        %ymm1,%ymm0,%ymm1
   DB  196,193,116,89,203                  ; vmulps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,111,34,2,0         ; vbroadcastss  0x2226f(%rip),%ymm11        # 2b548 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
+  DB  196,98,125,24,29,71,37,2,0          ; vbroadcastss  0x22547(%rip),%ymm11        # 2b8a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,93,34,2,0          ; vbroadcastss  0x2225d(%rip),%ymm11        # 2b544 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
+  DB  196,98,125,24,29,53,37,2,0          ; vbroadcastss  0x22535(%rip),%ymm11        # 2b8a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
   DB  196,227,117,74,202,224              ; vblendvps     %ymm14,%ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,69,34,2,0         ; vbroadcastss  0x22245(%rip),%ymm2        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
+  DB  196,226,125,24,21,29,37,2,0         ; vbroadcastss  0x2251d(%rip),%ymm2        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
   DB  196,65,12,87,246                    ; vxorps        %ymm14,%ymm14,%ymm14
   DB  196,227,13,74,210,208               ; vblendvps     %ymm13,%ymm2,%ymm14,%ymm2
   DB  197,188,194,192,0                   ; vcmpeqps      %ymm0,%ymm8,%ymm0
   DB  196,193,108,88,212                  ; vaddps        %ymm12,%ymm2,%ymm2
   DB  196,227,117,74,194,0                ; vblendvps     %ymm0,%ymm2,%ymm1,%ymm0
   DB  196,193,60,88,201                   ; vaddps        %ymm9,%ymm8,%ymm1
-  DB  196,98,125,24,37,192,33,2,0         ; vbroadcastss  0x221c0(%rip),%ymm12        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,37,152,36,2,0         ; vbroadcastss  0x22498(%rip),%ymm12        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,116,89,212                  ; vmulps        %ymm12,%ymm1,%ymm2
   DB  197,28,194,226,1                    ; vcmpltps      %ymm2,%ymm12,%ymm12
   DB  196,65,36,92,216                    ; vsubps        %ymm8,%ymm11,%ymm11
@@ -8732,7 +8744,7 @@
   DB  197,172,94,201                      ; vdivps        %ymm1,%ymm10,%ymm1
   DB  196,195,125,74,198,128              ; vblendvps     %ymm8,%ymm14,%ymm0,%ymm0
   DB  196,195,117,74,206,128              ; vblendvps     %ymm8,%ymm14,%ymm1,%ymm1
-  DB  196,98,125,24,5,239,33,2,0          ; vbroadcastss  0x221ef(%rip),%ymm8        # 2b54c <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  DB  196,98,125,24,5,199,36,2,0          ; vbroadcastss  0x224c7(%rip),%ymm8        # 2b8ac <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -8747,7 +8759,7 @@
   DB  197,252,17,28,36                    ; vmovups       %ymm3,(%rsp)
   DB  197,252,40,225                      ; vmovaps       %ymm1,%ymm4
   DB  197,252,40,216                      ; vmovaps       %ymm0,%ymm3
-  DB  196,98,125,24,5,70,33,2,0           ; vbroadcastss  0x22146(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,30,36,2,0           ; vbroadcastss  0x2241e(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,60,194,202,2                    ; vcmpleps      %ymm2,%ymm8,%ymm9
   DB  197,92,89,210                       ; vmulps        %ymm2,%ymm4,%ymm10
   DB  196,65,92,92,218                    ; vsubps        %ymm10,%ymm4,%ymm11
@@ -8755,23 +8767,23 @@
   DB  197,52,88,210                       ; vaddps        %ymm2,%ymm9,%ymm10
   DB  197,108,88,202                      ; vaddps        %ymm2,%ymm2,%ymm9
   DB  196,65,52,92,202                    ; vsubps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,29,136,33,2,0         ; vbroadcastss  0x22188(%rip),%ymm11        # 2b550 <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
+  DB  196,98,125,24,29,96,36,2,0          ; vbroadcastss  0x22460(%rip),%ymm11        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
   DB  196,65,100,88,219                   ; vaddps        %ymm11,%ymm3,%ymm11
   DB  196,67,125,8,227,1                  ; vroundps      $0x1,%ymm11,%ymm12
   DB  196,65,36,92,252                    ; vsubps        %ymm12,%ymm11,%ymm15
   DB  196,65,44,92,217                    ; vsubps        %ymm9,%ymm10,%ymm11
-  DB  196,98,125,24,37,90,33,2,0          ; vbroadcastss  0x2215a(%rip),%ymm12        # 2b540 <_sk_srcover_rgba_8888_sse2_lowp+0x898>
+  DB  196,98,125,24,37,50,36,2,0          ; vbroadcastss  0x22432(%rip),%ymm12        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0x89c>
   DB  196,193,4,89,196                    ; vmulps        %ymm12,%ymm15,%ymm0
-  DB  196,98,125,24,45,84,33,2,0          ; vbroadcastss  0x22154(%rip),%ymm13        # 2b548 <_sk_srcover_rgba_8888_sse2_lowp+0x8a0>
+  DB  196,98,125,24,45,44,36,2,0          ; vbroadcastss  0x2242c(%rip),%ymm13        # 2b8a8 <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
   DB  197,20,92,240                       ; vsubps        %ymm0,%ymm13,%ymm14
   DB  196,65,36,89,246                    ; vmulps        %ymm14,%ymm11,%ymm14
   DB  196,65,52,88,246                    ; vaddps        %ymm14,%ymm9,%ymm14
-  DB  196,226,125,24,13,73,33,2,0         ; vbroadcastss  0x22149(%rip),%ymm1        # 2b554 <_sk_srcover_rgba_8888_sse2_lowp+0x8ac>
+  DB  196,226,125,24,13,33,36,2,0         ; vbroadcastss  0x22421(%rip),%ymm1        # 2b8b4 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
   DB  196,193,116,194,255,2               ; vcmpleps      %ymm15,%ymm1,%ymm7
   DB  196,195,13,74,249,112               ; vblendvps     %ymm7,%ymm9,%ymm14,%ymm7
   DB  196,65,60,194,247,2                 ; vcmpleps      %ymm15,%ymm8,%ymm14
   DB  196,227,45,74,255,224               ; vblendvps     %ymm14,%ymm7,%ymm10,%ymm7
-  DB  196,98,125,24,53,32,33,2,0          ; vbroadcastss  0x22120(%rip),%ymm14        # 2b54c <_sk_srcover_rgba_8888_sse2_lowp+0x8a4>
+  DB  196,98,125,24,53,248,35,2,0         ; vbroadcastss  0x223f8(%rip),%ymm14        # 2b8ac <_sk_srcover_rgba_8888_sse2_lowp+0x8a8>
   DB  196,65,12,194,255,2                 ; vcmpleps      %ymm15,%ymm14,%ymm15
   DB  196,193,124,89,195                  ; vmulps        %ymm11,%ymm0,%ymm0
   DB  197,180,88,192                      ; vaddps        %ymm0,%ymm9,%ymm0
@@ -8790,7 +8802,7 @@
   DB  197,164,89,247                      ; vmulps        %ymm7,%ymm11,%ymm6
   DB  197,180,88,246                      ; vaddps        %ymm6,%ymm9,%ymm6
   DB  196,227,77,74,237,0                 ; vblendvps     %ymm0,%ymm5,%ymm6,%ymm5
-  DB  196,226,125,24,5,202,32,2,0         ; vbroadcastss  0x220ca(%rip),%ymm0        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  DB  196,226,125,24,5,162,35,2,0         ; vbroadcastss  0x223a2(%rip),%ymm0        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   DB  197,228,88,192                      ; vaddps        %ymm0,%ymm3,%ymm0
   DB  196,227,125,8,216,1                 ; vroundps      $0x1,%ymm0,%ymm3
   DB  197,252,92,195                      ; vsubps        %ymm3,%ymm0,%ymm0
@@ -8840,15 +8852,15 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,75                              ; jne           959a <_sk_scale_u8_avx+0x63>
+  DB  117,75                              ; jne           9622 <_sk_scale_u8_avx+0x63>
   DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,35,33,2,0              ; vpand         0x22123(%rip),%xmm8,%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,57,219,5,251,35,2,0             ; vpand         0x223fb(%rip),%xmm8,%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,219,31,2,0         ; vbroadcastss  0x21fdb(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,179,34,2,0         ; vbroadcastss  0x222b3(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  197,188,89,201                      ; vmulps        %ymm1,%ymm8,%ymm1
@@ -8861,15 +8873,15 @@
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,166                             ; ja            9555 <_sk_scale_u8_avx+0x1e>
+  DB  119,166                             ; ja            95dd <_sk_scale_u8_avx+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,122,0,0,0                 ; lea           0x7a(%rip),%r10        # 9634 <_sk_scale_u8_avx+0xfd>
+  DB  76,141,21,122,0,0,0                 ; lea           0x7a(%rip),%r10        # 96bc <_sk_scale_u8_avx+0xfd>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  235,135                             ; jmp           9555 <_sk_scale_u8_avx+0x1e>
+  DB  235,135                             ; jmp           95dd <_sk_scale_u8_avx+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,2                    ; vpinsrw       $0x2,%eax,%xmm8,%xmm8
@@ -8877,7 +8889,7 @@
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,94,255,255,255                  ; jmpq          9555 <_sk_scale_u8_avx+0x1e>
+  DB  233,94,255,255,255                  ; jmpq          95dd <_sk_scale_u8_avx+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,6                    ; vpinsrw       $0x6,%eax,%xmm8,%xmm8
@@ -8888,7 +8900,7 @@
   DB  196,1,121,110,12,24                 ; vmovd         (%r8,%r11,1),%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,34,255,255,255                  ; jmpq          9555 <_sk_scale_u8_avx+0x1e>
+  DB  233,34,255,255,255                  ; jmpq          95dd <_sk_scale_u8_avx+0x1e>
   DB  144                                 ; nop
   DB  143                                 ; (bad)
   DB  255                                 ; (bad)
@@ -8897,7 +8909,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf009644 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefde99c>
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf0096cc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefde6c8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,211                             ; callq         *%rbx
@@ -8918,26 +8930,26 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,178,0,0,0                    ; jne           9721 <_sk_scale_565_avx+0xd1>
+  DB  15,133,178,0,0,0                    ; jne           97a9 <_sk_scale_565_avx+0xd1>
   DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,204,30,2,0         ; vbroadcastss  0x21ecc(%rip),%ymm9        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,98,125,24,13,164,33,2,0         ; vbroadcastss  0x221a4(%rip),%ymm9        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  196,65,60,84,201                    ; vandps        %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,189,30,2,0         ; vbroadcastss  0x21ebd(%rip),%ymm10        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,98,125,24,21,149,33,2,0         ; vbroadcastss  0x22195(%rip),%ymm10        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,179,30,2,0         ; vbroadcastss  0x21eb3(%rip),%ymm10        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,98,125,24,21,139,33,2,0         ; vbroadcastss  0x2218b(%rip),%ymm10        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  196,65,60,84,210                    ; vandps        %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,164,30,2,0         ; vbroadcastss  0x21ea4(%rip),%ymm11        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,98,125,24,29,124,33,2,0         ; vbroadcastss  0x2217c(%rip),%ymm11        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,29,154,30,2,0         ; vbroadcastss  0x21e9a(%rip),%ymm11        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,98,125,24,29,114,33,2,0         ; vbroadcastss  0x22172(%rip),%ymm11        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  196,65,60,84,195                    ; vandps        %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,139,30,2,0         ; vbroadcastss  0x21e8b(%rip),%ymm11        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,98,125,24,29,99,33,2,0          ; vbroadcastss  0x22163(%rip),%ymm11        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -8956,27 +8968,27 @@
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,59,255,255,255               ; ja            9675 <_sk_scale_565_avx+0x25>
+  DB  15,135,59,255,255,255               ; ja            96fd <_sk_scale_565_avx+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # 97a8 <_sk_scale_565_avx+0x158>
+  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # 9830 <_sk_scale_565_avx+0x158>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,25,255,255,255                  ; jmpq          9675 <_sk_scale_565_avx+0x25>
+  DB  233,25,255,255,255                  ; jmpq          96fd <_sk_scale_565_avx+0x25>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,1,57,196,68,88,4,2              ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,121,110,12,88                 ; vmovd         (%r8,%r11,2),%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,251,254,255,255                 ; jmpq          9675 <_sk_scale_565_avx+0x25>
+  DB  233,251,254,255,255                 ; jmpq          96fd <_sk_scale_565_avx+0x25>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,1,57,196,68,88,12,6             ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,57,196,68,88,10,5             ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,57,196,68,88,8,4              ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,122,126,12,88                 ; vmovq         (%r8,%r11,2),%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,205,254,255,255                 ; jmpq          9675 <_sk_scale_565_avx+0x25>
+  DB  233,205,254,255,255                 ; jmpq          96fd <_sk_scale_565_avx+0x25>
   DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -9024,15 +9036,15 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,111                             ; jne           988a <_sk_lerp_u8_avx+0x87>
+  DB  117,111                             ; jne           9912 <_sk_lerp_u8_avx+0x87>
   DB  196,2,121,48,4,24                   ; vpmovzxbw     (%r8,%r11,1),%xmm8
-  DB  197,57,219,5,87,30,2,0              ; vpand         0x21e57(%rip),%xmm8,%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,57,219,5,47,33,2,0              ; vpand         0x2212f(%rip),%xmm8,%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,13,15,29,2,0          ; vbroadcastss  0x21d0f(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,231,31,2,0         ; vbroadcastss  0x21fe7(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,252,92,196                      ; vsubps        %ymm4,%ymm0,%ymm0
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
@@ -9053,15 +9065,15 @@
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,130                             ; ja            9821 <_sk_lerp_u8_avx+0x1e>
+  DB  119,130                             ; ja            98a9 <_sk_lerp_u8_avx+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,126,0,0,0                 ; lea           0x7e(%rip),%r10        # 9928 <_sk_lerp_u8_avx+0x125>
+  DB  76,141,21,126,0,0,0                 ; lea           0x7e(%rip),%r10        # 99b0 <_sk_lerp_u8_avx+0x125>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,96,255,255,255                  ; jmpq          9821 <_sk_lerp_u8_avx+0x1e>
+  DB  233,96,255,255,255                  ; jmpq          98a9 <_sk_lerp_u8_avx+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,2                    ; vpinsrw       $0x2,%eax,%xmm8,%xmm8
@@ -9069,7 +9081,7 @@
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,55,255,255,255                  ; jmpq          9821 <_sk_lerp_u8_avx+0x1e>
+  DB  233,55,255,255,255                  ; jmpq          98a9 <_sk_lerp_u8_avx+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  197,57,196,192,6                    ; vpinsrw       $0x6,%eax,%xmm8,%xmm8
@@ -9080,7 +9092,7 @@
   DB  196,1,121,110,12,24                 ; vmovd         (%r8,%r11,1),%xmm9
   DB  196,66,121,48,201                   ; vpmovzxbw     %xmm9,%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,251,254,255,255                 ; jmpq          9821 <_sk_lerp_u8_avx+0x1e>
+  DB  233,251,254,255,255                 ; jmpq          98a9 <_sk_lerp_u8_avx+0x1e>
   DB  102,144                             ; xchg          %ax,%ax
   DB  139,255                             ; mov           %edi,%edi
   DB  255                                 ; (bad)
@@ -9088,7 +9100,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde009938 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfdec90>
+  DB  232,255,255,255,221                 ; callq         ffffffffde0099c0 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfde9bc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -9109,26 +9121,26 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,214,0,0,0                    ; jne           9a39 <_sk_lerp_565_avx+0xf5>
+  DB  15,133,214,0,0,0                    ; jne           9ac1 <_sk_lerp_565_avx+0xf5>
   DB  196,1,122,111,4,88                  ; vmovdqu       (%r8,%r11,2),%xmm8
   DB  196,66,121,51,200                   ; vpmovzxwd     %xmm8,%xmm9
   DB  196,65,121,112,192,78               ; vpshufd       $0x4e,%xmm8,%xmm8
   DB  196,66,121,51,192                   ; vpmovzxwd     %xmm8,%xmm8
   DB  196,67,53,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,216,27,2,0         ; vbroadcastss  0x21bd8(%rip),%ymm9        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,98,125,24,13,176,30,2,0         ; vbroadcastss  0x21eb0(%rip),%ymm9        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  196,65,60,84,201                    ; vandps        %ymm9,%ymm8,%ymm9
   DB  196,65,124,91,201                   ; vcvtdq2ps     %ymm9,%ymm9
-  DB  196,98,125,24,21,201,27,2,0         ; vbroadcastss  0x21bc9(%rip),%ymm10        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,98,125,24,21,161,30,2,0         ; vbroadcastss  0x21ea1(%rip),%ymm10        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,191,27,2,0         ; vbroadcastss  0x21bbf(%rip),%ymm10        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,98,125,24,21,151,30,2,0         ; vbroadcastss  0x21e97(%rip),%ymm10        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  196,65,60,84,210                    ; vandps        %ymm10,%ymm8,%ymm10
   DB  196,65,124,91,210                   ; vcvtdq2ps     %ymm10,%ymm10
-  DB  196,98,125,24,29,176,27,2,0         ; vbroadcastss  0x21bb0(%rip),%ymm11        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,98,125,24,29,136,30,2,0         ; vbroadcastss  0x21e88(%rip),%ymm11        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
-  DB  196,98,125,24,29,166,27,2,0         ; vbroadcastss  0x21ba6(%rip),%ymm11        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,98,125,24,29,126,30,2,0         ; vbroadcastss  0x21e7e(%rip),%ymm11        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  196,65,60,84,195                    ; vandps        %ymm11,%ymm8,%ymm8
   DB  196,65,124,91,192                   ; vcvtdq2ps     %ymm8,%ymm8
-  DB  196,98,125,24,29,151,27,2,0         ; vbroadcastss  0x21b97(%rip),%ymm11        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,98,125,24,29,111,30,2,0         ; vbroadcastss  0x21e6f(%rip),%ymm11        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  197,100,194,223,1                   ; vcmpltps      %ymm7,%ymm3,%ymm11
   DB  196,65,44,93,224                    ; vminps        %ymm8,%ymm10,%ymm12
@@ -9155,27 +9167,27 @@
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,23,255,255,255               ; ja            9969 <_sk_lerp_565_avx+0x25>
+  DB  15,135,23,255,255,255               ; ja            99f1 <_sk_lerp_565_avx+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # 9ac0 <_sk_lerp_565_avx+0x17c>
+  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # 9b48 <_sk_lerp_565_avx+0x17c>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,245,254,255,255                 ; jmpq          9969 <_sk_lerp_565_avx+0x25>
+  DB  233,245,254,255,255                 ; jmpq          99f1 <_sk_lerp_565_avx+0x25>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,1,57,196,68,88,4,2              ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,121,110,12,88                 ; vmovd         (%r8,%r11,2),%xmm9
   DB  196,67,57,14,193,3                  ; vpblendw      $0x3,%xmm9,%xmm8,%xmm8
-  DB  233,215,254,255,255                 ; jmpq          9969 <_sk_lerp_565_avx+0x25>
+  DB  233,215,254,255,255                 ; jmpq          99f1 <_sk_lerp_565_avx+0x25>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,1,57,196,68,88,12,6             ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,57,196,68,88,10,5             ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,57,196,68,88,8,4              ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm8,%xmm8
   DB  196,1,122,126,12,88                 ; vmovq         (%r8,%r11,2),%xmm9
   DB  196,67,49,14,192,240                ; vpblendw      $0xf0,%xmm8,%xmm9,%xmm8
-  DB  233,169,254,255,255                 ; jmpq          9969 <_sk_lerp_565_avx+0x25>
+  DB  233,169,254,255,255                 ; jmpq          99f1 <_sk_lerp_565_avx+0x25>
   DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
@@ -9202,9 +9214,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,7,2,0,0                      ; jne           9cfa <_sk_load_tables_avx+0x21e>
+  DB  15,133,7,2,0,0                      ; jne           9d82 <_sk_load_tables_avx+0x21e>
   DB  196,65,125,16,20,144                ; vmovupd       (%r8,%rdx,4),%ymm10
-  DB  197,125,40,13,223,23,2,0            ; vmovapd       0x217df(%rip),%ymm9        # 2b2e0 <_sk_srcover_rgba_8888_sse2_lowp+0x638>
+  DB  197,125,40,13,183,26,2,0            ; vmovapd       0x21ab7(%rip),%ymm9        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x63c>
   DB  196,193,45,84,201                   ; vandpd        %ymm9,%ymm10,%ymm1
   DB  196,227,125,25,200,1                ; vextractf128  $0x1,%ymm1,%xmm0
   DB  196,193,249,126,192                 ; vmovq         %xmm0,%r8
@@ -9296,7 +9308,7 @@
   DB  196,193,65,114,213,24               ; vpsrld        $0x18,%xmm13,%xmm7
   DB  196,227,101,24,223,1                ; vinsertf128   $0x1,%xmm7,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,226,125,24,61,115,24,2,0        ; vbroadcastss  0x21873(%rip),%ymm7        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,61,75,27,2,0         ; vbroadcastss  0x21b4b(%rip),%ymm7        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,228,89,223                      ; vmulps        %ymm7,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,16,60,36                    ; vmovups       (%rsp),%ymm7
@@ -9307,21 +9319,21 @@
   DB  196,65,44,87,210                    ; vxorps        %ymm10,%ymm10,%ymm10
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,230,253,255,255              ; ja            9af9 <_sk_load_tables_avx+0x1d>
+  DB  15,135,230,253,255,255              ; ja            9b81 <_sk_load_tables_avx+0x1d>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,146,0,0,0                 ; lea           0x92(%rip),%r10        # 9db0 <_sk_load_tables_avx+0x2d4>
+  DB  76,141,21,146,0,0,0                 ; lea           0x92(%rip),%r10        # 9e38 <_sk_load_tables_avx+0x2d4>
   DB  79,99,12,138                        ; movslq        (%r10,%r9,4),%r9
   DB  77,1,209                            ; add           %r10,%r9
   DB  65,255,225                          ; jmpq          *%r9
   DB  196,65,122,16,20,144                ; vmovss        (%r8,%rdx,4),%xmm10
-  DB  233,198,253,255,255                 ; jmpq          9af9 <_sk_load_tables_avx+0x1d>
+  DB  233,198,253,255,255                 ; jmpq          9b81 <_sk_load_tables_avx+0x1d>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,208,4                 ; vblendps      $0x4,%ymm0,%ymm1,%ymm10
   DB  196,193,123,16,4,144                ; vmovsd        (%r8,%rdx,4),%xmm0
   DB  196,99,45,13,208,1                  ; vblendpd      $0x1,%ymm0,%ymm10,%ymm10
-  DB  233,159,253,255,255                 ; jmpq          9af9 <_sk_load_tables_avx+0x1d>
+  DB  233,159,253,255,255                 ; jmpq          9b81 <_sk_load_tables_avx+0x1d>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -9335,9 +9347,9 @@
   DB  196,99,45,24,208,1                  ; vinsertf128   $0x1,%xmm0,%ymm10,%ymm10
   DB  196,193,121,16,4,144                ; vmovupd       (%r8,%rdx,4),%xmm0
   DB  196,67,125,13,210,12                ; vblendpd      $0xc,%ymm10,%ymm0,%ymm10
-  DB  233,74,253,255,255                  ; jmpq          9af9 <_sk_load_tables_avx+0x1d>
+  DB  233,74,253,255,255                  ; jmpq          9b81 <_sk_load_tables_avx+0x1d>
   DB  144                                 ; nop
-  DB  120,255                             ; js            9db1 <_sk_load_tables_avx+0x2d5>
+  DB  120,255                             ; js            9e39 <_sk_load_tables_avx+0x2d5>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
   DB  255                                 ; (bad)
@@ -9367,7 +9379,7 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  197,252,17,124,36,32                ; vmovups       %ymm7,0x20(%rsp)
   DB  197,252,17,52,36                    ; vmovups       %ymm6,(%rsp)
-  DB  15,133,78,2,0,0                     ; jne           a03f <_sk_load_tables_u16_be_avx+0x273>
+  DB  15,133,78,2,0,0                     ; jne           a0c7 <_sk_load_tables_u16_be_avx+0x273>
   DB  196,1,121,16,4,72                   ; vmovupd       (%r8,%r9,2),%xmm8
   DB  196,129,121,16,84,72,16             ; vmovupd       0x10(%r8,%r9,2),%xmm2
   DB  196,129,121,16,92,72,32             ; vmovupd       0x20(%r8,%r9,2),%xmm3
@@ -9383,7 +9395,7 @@
   DB  197,177,108,208                     ; vpunpcklqdq   %xmm0,%xmm9,%xmm2
   DB  197,49,109,232                      ; vpunpckhqdq   %xmm0,%xmm9,%xmm13
   DB  196,65,57,108,212                   ; vpunpcklqdq   %xmm12,%xmm8,%xmm10
-  DB  197,121,111,29,61,24,2,0            ; vmovdqa       0x2183d(%rip),%xmm11        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,121,111,29,21,27,2,0            ; vmovdqa       0x21b15(%rip),%xmm11        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,193,105,219,195                 ; vpand         %xmm11,%xmm2,%xmm0
   DB  197,249,112,208,78                  ; vpshufd       $0x4e,%xmm0,%xmm2
   DB  196,226,121,51,210                  ; vpmovzxwd     %xmm2,%xmm2
@@ -9477,7 +9489,7 @@
   DB  196,226,121,51,219                  ; vpmovzxwd     %xmm3,%xmm3
   DB  196,227,77,24,219,1                 ; vinsertf128   $0x1,%xmm3,%ymm6,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,226,125,24,53,80,21,2,0         ; vbroadcastss  0x21550(%rip),%ymm6        # 2b578 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  DB  196,226,125,24,53,40,24,2,0         ; vbroadcastss  0x21828(%rip),%ymm6        # 2b8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   DB  197,228,89,222                      ; vmulps        %ymm6,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,16,52,36                    ; vmovups       (%rsp),%ymm6
@@ -9487,29 +9499,29 @@
   DB  196,1,123,16,4,72                   ; vmovsd        (%r8,%r9,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            a0a5 <_sk_load_tables_u16_be_avx+0x2d9>
+  DB  116,85                              ; je            a12d <_sk_load_tables_u16_be_avx+0x2d9>
   DB  196,1,57,22,68,72,8                 ; vmovhpd       0x8(%r8,%r9,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            a0a5 <_sk_load_tables_u16_be_avx+0x2d9>
+  DB  114,72                              ; jb            a12d <_sk_load_tables_u16_be_avx+0x2d9>
   DB  196,129,123,16,84,72,16             ; vmovsd        0x10(%r8,%r9,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            a0b2 <_sk_load_tables_u16_be_avx+0x2e6>
+  DB  116,72                              ; je            a13a <_sk_load_tables_u16_be_avx+0x2e6>
   DB  196,129,105,22,84,72,24             ; vmovhpd       0x18(%r8,%r9,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            a0b2 <_sk_load_tables_u16_be_avx+0x2e6>
+  DB  114,59                              ; jb            a13a <_sk_load_tables_u16_be_avx+0x2e6>
   DB  196,129,123,16,92,72,32             ; vmovsd        0x20(%r8,%r9,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,132,253,255,255              ; je            9e0c <_sk_load_tables_u16_be_avx+0x40>
+  DB  15,132,132,253,255,255              ; je            9e94 <_sk_load_tables_u16_be_avx+0x40>
   DB  196,129,97,22,92,72,40              ; vmovhpd       0x28(%r8,%r9,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,115,253,255,255              ; jb            9e0c <_sk_load_tables_u16_be_avx+0x40>
+  DB  15,130,115,253,255,255              ; jb            9e94 <_sk_load_tables_u16_be_avx+0x40>
   DB  196,1,122,126,76,72,48              ; vmovq         0x30(%r8,%r9,2),%xmm9
-  DB  233,103,253,255,255                 ; jmpq          9e0c <_sk_load_tables_u16_be_avx+0x40>
+  DB  233,103,253,255,255                 ; jmpq          9e94 <_sk_load_tables_u16_be_avx+0x40>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,90,253,255,255                  ; jmpq          9e0c <_sk_load_tables_u16_be_avx+0x40>
+  DB  233,90,253,255,255                  ; jmpq          9e94 <_sk_load_tables_u16_be_avx+0x40>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,81,253,255,255                  ; jmpq          9e0c <_sk_load_tables_u16_be_avx+0x40>
+  DB  233,81,253,255,255                  ; jmpq          9e94 <_sk_load_tables_u16_be_avx+0x40>
 
 PUBLIC _sk_load_tables_rgb_u16_be_avx
 _sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -9520,7 +9532,7 @@
   DB  72,133,255                          ; test          %rdi,%rdi
   DB  197,252,17,124,36,32                ; vmovups       %ymm7,0x20(%rsp)
   DB  197,252,17,52,36                    ; vmovups       %ymm6,(%rsp)
-  DB  15,133,57,2,0,0                     ; jne           a315 <_sk_load_tables_rgb_u16_be_avx+0x25a>
+  DB  15,133,57,2,0,0                     ; jne           a39d <_sk_load_tables_rgb_u16_be_avx+0x25a>
   DB  196,1,122,111,28,72                 ; vmovdqu       (%r8,%r9,2),%xmm11
   DB  196,129,122,111,92,72,12            ; vmovdqu       0xc(%r8,%r9,2),%xmm3
   DB  196,129,122,111,84,72,24            ; vmovdqu       0x18(%r8,%r9,2),%xmm2
@@ -9541,7 +9553,7 @@
   DB  197,105,108,216                     ; vpunpcklqdq   %xmm0,%xmm2,%xmm11
   DB  197,241,108,211                     ; vpunpcklqdq   %xmm3,%xmm1,%xmm2
   DB  197,241,109,203                     ; vpunpckhqdq   %xmm3,%xmm1,%xmm1
-  DB  197,121,111,53,55,21,2,0            ; vmovdqa       0x21537(%rip),%xmm14        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,121,111,53,15,24,2,0            ; vmovdqa       0x2180f(%rip),%xmm14        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,193,105,219,214                 ; vpand         %xmm14,%xmm2,%xmm2
   DB  197,249,112,218,78                  ; vpshufd       $0x4e,%xmm2,%xmm3
   DB  196,226,121,51,219                  ; vpmovzxwd     %xmm3,%xmm3
@@ -9627,7 +9639,7 @@
   DB  196,227,105,33,215,48               ; vinsertps     $0x30,%xmm7,%xmm2,%xmm2
   DB  196,227,77,24,210,1                 ; vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,228,17,2,0        ; vbroadcastss  0x211e4(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,188,20,2,0        ; vbroadcastss  0x214bc(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,16,52,36                    ; vmovups       (%rsp),%ymm6
   DB  197,252,16,124,36,32                ; vmovups       0x20(%rsp),%ymm7
   DB  72,131,196,88                       ; add           $0x58,%rsp
@@ -9636,68 +9648,68 @@
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,92,72,4,2             ; vpinsrw       $0x2,0x4(%r8,%r9,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           a34d <_sk_load_tables_rgb_u16_be_avx+0x292>
+  DB  117,31                              ; jne           a3d5 <_sk_load_tables_rgb_u16_be_avx+0x292>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,196,253,255,255                 ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,196,253,255,255                 ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  196,129,121,110,68,72,6             ; vmovd         0x6(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,68,72,10,2            ; vpinsrw       $0x2,0xa(%r8,%r9,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            a397 <_sk_load_tables_rgb_u16_be_avx+0x2dc>
+  DB  114,48                              ; jb            a41f <_sk_load_tables_rgb_u16_be_avx+0x2dc>
   DB  196,129,121,110,68,72,12            ; vmovd         0xc(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,92,72,16,2          ; vpinsrw       $0x2,0x10(%r8,%r9,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           a3b1 <_sk_load_tables_rgb_u16_be_avx+0x2f6>
+  DB  117,48                              ; jne           a439 <_sk_load_tables_rgb_u16_be_avx+0x2f6>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,122,253,255,255                 ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,122,253,255,255                 ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,96,253,255,255                  ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,96,253,255,255                  ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  196,129,121,110,68,72,18            ; vmovd         0x12(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,1,121,196,84,72,22,2            ; vpinsrw       $0x2,0x16(%r8,%r9,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            a3f2 <_sk_load_tables_rgb_u16_be_avx+0x337>
+  DB  114,39                              ; jb            a47a <_sk_load_tables_rgb_u16_be_avx+0x337>
   DB  196,129,121,110,68,72,24            ; vmovd         0x18(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,84,72,28,2          ; vpinsrw       $0x2,0x1c(%r8,%r9,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           a403 <_sk_load_tables_rgb_u16_be_avx+0x348>
+  DB  117,30                              ; jne           a48b <_sk_load_tables_rgb_u16_be_avx+0x348>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,31,253,255,255                  ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,31,253,255,255                  ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,14,253,255,255                  ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,14,253,255,255                  ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  196,129,121,110,68,72,30            ; vmovd         0x1e(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,76,72,34,2          ; vpinsrw       $0x2,0x22(%r8,%r9,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            a436 <_sk_load_tables_rgb_u16_be_avx+0x37b>
+  DB  114,25                              ; jb            a4be <_sk_load_tables_rgb_u16_be_avx+0x37b>
   DB  196,129,121,110,68,72,36            ; vmovd         0x24(%r8,%r9,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,129,121,196,68,72,40,2          ; vpinsrw       $0x2,0x28(%r8,%r9,2),%xmm0,%xmm0
-  DB  233,219,252,255,255                 ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,219,252,255,255                 ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,210,252,255,255                 ; jmpq          a111 <_sk_load_tables_rgb_u16_be_avx+0x56>
+  DB  233,210,252,255,255                 ; jmpq          a199 <_sk_load_tables_rgb_u16_be_avx+0x56>
 
 PUBLIC _sk_byte_tables_avx
 _sk_byte_tables_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,202,16,2,0          ; vbroadcastss  0x210ca(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,162,19,2,0          ; vbroadcastss  0x213a2(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  197,125,91,200                      ; vcvtps2dq     %ymm0,%ymm9
   DB  196,65,249,126,200                  ; vmovq         %xmm9,%r8
@@ -9832,7 +9844,7 @@
   DB  196,194,121,49,204                  ; vpmovzxbd     %xmm12,%xmm1
   DB  196,194,121,49,213                  ; vpmovzxbd     %xmm13,%xmm2
   DB  196,227,117,24,202,1                ; vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
-  DB  196,98,125,24,13,130,14,2,0         ; vbroadcastss  0x20e82(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,90,17,2,0          ; vbroadcastss  0x2115a(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
   DB  196,193,116,89,201                  ; vmulps        %ymm9,%ymm1,%ymm1
@@ -9958,7 +9970,7 @@
   DB  196,194,121,49,203                  ; vpmovzxbd     %xmm11,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,55,12,2,0          ; vbroadcastss  0x20c37(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,15,15,2,0          ; vbroadcastss  0x20f0f(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  196,194,121,49,202                  ; vpmovzxbd     %xmm10,%xmm1
   DB  196,194,121,49,212                  ; vpmovzxbd     %xmm12,%xmm2
@@ -10185,36 +10197,36 @@
   DB  196,193,124,88,195                  ; vaddps        %ymm11,%ymm0,%ymm0
   DB  196,98,125,24,16                    ; vbroadcastss  (%rax),%ymm10
   DB  197,124,91,216                      ; vcvtdq2ps     %ymm0,%ymm11
-  DB  196,98,125,24,37,200,8,2,0          ; vbroadcastss  0x208c8(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  DB  196,98,125,24,37,160,11,2,0         ; vbroadcastss  0x20ba0(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,190,8,2,0          ; vbroadcastss  0x208be(%rip),%ymm12        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,150,11,2,0         ; vbroadcastss  0x20b96(%rip),%ymm12        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,193,124,84,196                  ; vandps        %ymm12,%ymm0,%ymm0
-  DB  196,98,125,24,37,20,8,2,0           ; vbroadcastss  0x20814(%rip),%ymm12        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,37,236,10,2,0         ; vbroadcastss  0x20aec(%rip),%ymm12        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,124,86,196                  ; vorps         %ymm12,%ymm0,%ymm0
-  DB  196,98,125,24,37,166,8,2,0          ; vbroadcastss  0x208a6(%rip),%ymm12        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,37,126,11,2,0         ; vbroadcastss  0x20b7e(%rip),%ymm12        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,156,8,2,0          ; vbroadcastss  0x2089c(%rip),%ymm12        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,37,116,11,2,0         ; vbroadcastss  0x20b74(%rip),%ymm12        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,65,124,89,228                   ; vmulps        %ymm12,%ymm0,%ymm12
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,141,8,2,0          ; vbroadcastss  0x2088d(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,101,11,2,0         ; vbroadcastss  0x20b65(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,193,124,88,196                  ; vaddps        %ymm12,%ymm0,%ymm0
-  DB  196,98,125,24,37,131,8,2,0          ; vbroadcastss  0x20883(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,91,11,2,0          ; vbroadcastss  0x20b5b(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  197,156,94,192                      ; vdivps        %ymm0,%ymm12,%ymm0
   DB  197,164,92,192                      ; vsubps        %ymm0,%ymm11,%ymm0
   DB  197,172,89,192                      ; vmulps        %ymm0,%ymm10,%ymm0
   DB  196,99,125,8,208,1                  ; vroundps      $0x1,%ymm0,%ymm10
   DB  196,65,124,92,210                   ; vsubps        %ymm10,%ymm0,%ymm10
-  DB  196,98,125,24,29,103,8,2,0          ; vbroadcastss  0x20867(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,63,11,2,0          ; vbroadcastss  0x20b3f(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,124,88,195                  ; vaddps        %ymm11,%ymm0,%ymm0
-  DB  196,98,125,24,29,93,8,2,0           ; vbroadcastss  0x2085d(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,53,11,2,0          ; vbroadcastss  0x20b35(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,65,44,89,219                    ; vmulps        %ymm11,%ymm10,%ymm11
   DB  196,193,124,92,195                  ; vsubps        %ymm11,%ymm0,%ymm0
-  DB  196,98,125,24,29,78,8,2,0           ; vbroadcastss  0x2084e(%rip),%ymm11        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,98,125,24,29,38,11,2,0          ; vbroadcastss  0x20b26(%rip),%ymm11        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
-  DB  196,98,125,24,29,68,8,2,0           ; vbroadcastss  0x20844(%rip),%ymm11        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,29,28,11,2,0          ; vbroadcastss  0x20b1c(%rip),%ymm11        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  196,65,36,94,210                    ; vdivps        %ymm10,%ymm11,%ymm10
   DB  196,193,124,88,194                  ; vaddps        %ymm10,%ymm0,%ymm0
-  DB  196,98,125,24,21,53,8,2,0           ; vbroadcastss  0x20835(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,13,11,2,0          ; vbroadcastss  0x20b0d(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,124,89,194                  ; vmulps        %ymm10,%ymm0,%ymm0
   DB  197,253,91,192                      ; vcvtps2dq     %ymm0,%ymm0
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -10222,7 +10234,7 @@
   DB  196,195,125,74,193,128              ; vblendvps     %ymm8,%ymm9,%ymm0,%ymm0
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,124,95,192                  ; vmaxps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,77,7,2,0            ; vbroadcastss  0x2074d(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,37,10,2,0           ; vbroadcastss  0x20a25(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10242,36 +10254,36 @@
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
   DB  196,98,125,24,16                    ; vbroadcastss  (%rax),%ymm10
   DB  197,124,91,217                      ; vcvtdq2ps     %ymm1,%ymm11
-  DB  196,98,125,24,37,142,7,2,0          ; vbroadcastss  0x2078e(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  DB  196,98,125,24,37,102,10,2,0         ; vbroadcastss  0x20a66(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,132,7,2,0          ; vbroadcastss  0x20784(%rip),%ymm12        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,92,10,2,0          ; vbroadcastss  0x20a5c(%rip),%ymm12        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,193,116,84,204                  ; vandps        %ymm12,%ymm1,%ymm1
-  DB  196,98,125,24,37,218,6,2,0          ; vbroadcastss  0x206da(%rip),%ymm12        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,37,178,9,2,0          ; vbroadcastss  0x209b2(%rip),%ymm12        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,116,86,204                  ; vorps         %ymm12,%ymm1,%ymm1
-  DB  196,98,125,24,37,108,7,2,0          ; vbroadcastss  0x2076c(%rip),%ymm12        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,37,68,10,2,0          ; vbroadcastss  0x20a44(%rip),%ymm12        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,98,7,2,0           ; vbroadcastss  0x20762(%rip),%ymm12        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,37,58,10,2,0          ; vbroadcastss  0x20a3a(%rip),%ymm12        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,65,116,89,228                   ; vmulps        %ymm12,%ymm1,%ymm12
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,83,7,2,0           ; vbroadcastss  0x20753(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,43,10,2,0          ; vbroadcastss  0x20a2b(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,193,116,88,204                  ; vaddps        %ymm12,%ymm1,%ymm1
-  DB  196,98,125,24,37,73,7,2,0           ; vbroadcastss  0x20749(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,33,10,2,0          ; vbroadcastss  0x20a21(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  197,156,94,201                      ; vdivps        %ymm1,%ymm12,%ymm1
   DB  197,164,92,201                      ; vsubps        %ymm1,%ymm11,%ymm1
   DB  197,172,89,201                      ; vmulps        %ymm1,%ymm10,%ymm1
   DB  196,99,125,8,209,1                  ; vroundps      $0x1,%ymm1,%ymm10
   DB  196,65,116,92,210                   ; vsubps        %ymm10,%ymm1,%ymm10
-  DB  196,98,125,24,29,45,7,2,0           ; vbroadcastss  0x2072d(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,5,10,2,0           ; vbroadcastss  0x20a05(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,35,7,2,0           ; vbroadcastss  0x20723(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,251,9,2,0          ; vbroadcastss  0x209fb(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,65,44,89,219                    ; vmulps        %ymm11,%ymm10,%ymm11
   DB  196,193,116,92,203                  ; vsubps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,29,20,7,2,0           ; vbroadcastss  0x20714(%rip),%ymm11        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,98,125,24,29,236,9,2,0          ; vbroadcastss  0x209ec(%rip),%ymm11        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
-  DB  196,98,125,24,29,10,7,2,0           ; vbroadcastss  0x2070a(%rip),%ymm11        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,29,226,9,2,0          ; vbroadcastss  0x209e2(%rip),%ymm11        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  196,65,36,94,210                    ; vdivps        %ymm10,%ymm11,%ymm10
   DB  196,193,116,88,202                  ; vaddps        %ymm10,%ymm1,%ymm1
-  DB  196,98,125,24,21,251,6,2,0          ; vbroadcastss  0x206fb(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,211,9,2,0          ; vbroadcastss  0x209d3(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,116,89,202                  ; vmulps        %ymm10,%ymm1,%ymm1
   DB  197,253,91,201                      ; vcvtps2dq     %ymm1,%ymm1
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -10279,7 +10291,7 @@
   DB  196,195,117,74,201,128              ; vblendvps     %ymm8,%ymm9,%ymm1,%ymm1
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,116,95,200                  ; vmaxps        %ymm8,%ymm1,%ymm1
-  DB  196,98,125,24,5,19,6,2,0            ; vbroadcastss  0x20613(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,235,8,2,0           ; vbroadcastss  0x208eb(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,116,93,200                  ; vminps        %ymm8,%ymm1,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10299,36 +10311,36 @@
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
   DB  196,98,125,24,16                    ; vbroadcastss  (%rax),%ymm10
   DB  197,124,91,218                      ; vcvtdq2ps     %ymm2,%ymm11
-  DB  196,98,125,24,37,84,6,2,0           ; vbroadcastss  0x20654(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  DB  196,98,125,24,37,44,9,2,0           ; vbroadcastss  0x2092c(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,74,6,2,0           ; vbroadcastss  0x2064a(%rip),%ymm12        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,34,9,2,0           ; vbroadcastss  0x20922(%rip),%ymm12        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,193,108,84,212                  ; vandps        %ymm12,%ymm2,%ymm2
-  DB  196,98,125,24,37,160,5,2,0          ; vbroadcastss  0x205a0(%rip),%ymm12        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,37,120,8,2,0          ; vbroadcastss  0x20878(%rip),%ymm12        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,108,86,212                  ; vorps         %ymm12,%ymm2,%ymm2
-  DB  196,98,125,24,37,50,6,2,0           ; vbroadcastss  0x20632(%rip),%ymm12        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,37,10,9,2,0           ; vbroadcastss  0x2090a(%rip),%ymm12        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,40,6,2,0           ; vbroadcastss  0x20628(%rip),%ymm12        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,37,0,9,2,0            ; vbroadcastss  0x20900(%rip),%ymm12        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,65,108,89,228                   ; vmulps        %ymm12,%ymm2,%ymm12
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,25,6,2,0           ; vbroadcastss  0x20619(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,241,8,2,0          ; vbroadcastss  0x208f1(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,193,108,88,212                  ; vaddps        %ymm12,%ymm2,%ymm2
-  DB  196,98,125,24,37,15,6,2,0           ; vbroadcastss  0x2060f(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,231,8,2,0          ; vbroadcastss  0x208e7(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  197,156,94,210                      ; vdivps        %ymm2,%ymm12,%ymm2
   DB  197,164,92,210                      ; vsubps        %ymm2,%ymm11,%ymm2
   DB  197,172,89,210                      ; vmulps        %ymm2,%ymm10,%ymm2
   DB  196,99,125,8,210,1                  ; vroundps      $0x1,%ymm2,%ymm10
   DB  196,65,108,92,210                   ; vsubps        %ymm10,%ymm2,%ymm10
-  DB  196,98,125,24,29,243,5,2,0          ; vbroadcastss  0x205f3(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,203,8,2,0          ; vbroadcastss  0x208cb(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
-  DB  196,98,125,24,29,233,5,2,0          ; vbroadcastss  0x205e9(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,193,8,2,0          ; vbroadcastss  0x208c1(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,65,44,89,219                    ; vmulps        %ymm11,%ymm10,%ymm11
   DB  196,193,108,92,211                  ; vsubps        %ymm11,%ymm2,%ymm2
-  DB  196,98,125,24,29,218,5,2,0          ; vbroadcastss  0x205da(%rip),%ymm11        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,98,125,24,29,178,8,2,0          ; vbroadcastss  0x208b2(%rip),%ymm11        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
-  DB  196,98,125,24,29,208,5,2,0          ; vbroadcastss  0x205d0(%rip),%ymm11        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,29,168,8,2,0          ; vbroadcastss  0x208a8(%rip),%ymm11        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  196,65,36,94,210                    ; vdivps        %ymm10,%ymm11,%ymm10
   DB  196,193,108,88,210                  ; vaddps        %ymm10,%ymm2,%ymm2
-  DB  196,98,125,24,21,193,5,2,0          ; vbroadcastss  0x205c1(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,153,8,2,0          ; vbroadcastss  0x20899(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,108,89,210                  ; vmulps        %ymm10,%ymm2,%ymm2
   DB  197,253,91,210                      ; vcvtps2dq     %ymm2,%ymm2
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -10336,7 +10348,7 @@
   DB  196,195,109,74,209,128              ; vblendvps     %ymm8,%ymm9,%ymm2,%ymm2
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,108,95,208                  ; vmaxps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,217,4,2,0           ; vbroadcastss  0x204d9(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,177,7,2,0           ; vbroadcastss  0x207b1(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,108,93,208                  ; vminps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10356,36 +10368,36 @@
   DB  196,193,100,88,219                  ; vaddps        %ymm11,%ymm3,%ymm3
   DB  196,98,125,24,16                    ; vbroadcastss  (%rax),%ymm10
   DB  197,124,91,219                      ; vcvtdq2ps     %ymm3,%ymm11
-  DB  196,98,125,24,37,26,5,2,0           ; vbroadcastss  0x2051a(%rip),%ymm12        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  DB  196,98,125,24,37,242,7,2,0          ; vbroadcastss  0x207f2(%rip),%ymm12        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,16,5,2,0           ; vbroadcastss  0x20510(%rip),%ymm12        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,37,232,7,2,0          ; vbroadcastss  0x207e8(%rip),%ymm12        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,193,100,84,220                  ; vandps        %ymm12,%ymm3,%ymm3
-  DB  196,98,125,24,37,102,4,2,0          ; vbroadcastss  0x20466(%rip),%ymm12        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,37,62,7,2,0           ; vbroadcastss  0x2073e(%rip),%ymm12        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,100,86,220                  ; vorps         %ymm12,%ymm3,%ymm3
-  DB  196,98,125,24,37,248,4,2,0          ; vbroadcastss  0x204f8(%rip),%ymm12        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,37,208,7,2,0          ; vbroadcastss  0x207d0(%rip),%ymm12        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,65,36,88,220                    ; vaddps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,238,4,2,0          ; vbroadcastss  0x204ee(%rip),%ymm12        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,37,198,7,2,0          ; vbroadcastss  0x207c6(%rip),%ymm12        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,65,100,89,228                   ; vmulps        %ymm12,%ymm3,%ymm12
   DB  196,65,36,92,220                    ; vsubps        %ymm12,%ymm11,%ymm11
-  DB  196,98,125,24,37,223,4,2,0          ; vbroadcastss  0x204df(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,183,7,2,0          ; vbroadcastss  0x207b7(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,193,100,88,220                  ; vaddps        %ymm12,%ymm3,%ymm3
-  DB  196,98,125,24,37,213,4,2,0          ; vbroadcastss  0x204d5(%rip),%ymm12        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,37,173,7,2,0          ; vbroadcastss  0x207ad(%rip),%ymm12        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  197,156,94,219                      ; vdivps        %ymm3,%ymm12,%ymm3
   DB  197,164,92,219                      ; vsubps        %ymm3,%ymm11,%ymm3
   DB  197,172,89,219                      ; vmulps        %ymm3,%ymm10,%ymm3
   DB  196,99,125,8,211,1                  ; vroundps      $0x1,%ymm3,%ymm10
   DB  196,65,100,92,210                   ; vsubps        %ymm10,%ymm3,%ymm10
-  DB  196,98,125,24,29,185,4,2,0          ; vbroadcastss  0x204b9(%rip),%ymm11        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,29,145,7,2,0          ; vbroadcastss  0x20791(%rip),%ymm11        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,100,88,219                  ; vaddps        %ymm11,%ymm3,%ymm3
-  DB  196,98,125,24,29,175,4,2,0          ; vbroadcastss  0x204af(%rip),%ymm11        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,98,125,24,29,135,7,2,0          ; vbroadcastss  0x20787(%rip),%ymm11        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  196,65,44,89,219                    ; vmulps        %ymm11,%ymm10,%ymm11
   DB  196,193,100,92,219                  ; vsubps        %ymm11,%ymm3,%ymm3
-  DB  196,98,125,24,29,160,4,2,0          ; vbroadcastss  0x204a0(%rip),%ymm11        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,98,125,24,29,120,7,2,0          ; vbroadcastss  0x20778(%rip),%ymm11        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  196,65,36,92,210                    ; vsubps        %ymm10,%ymm11,%ymm10
-  DB  196,98,125,24,29,150,4,2,0          ; vbroadcastss  0x20496(%rip),%ymm11        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,98,125,24,29,110,7,2,0          ; vbroadcastss  0x2076e(%rip),%ymm11        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  196,65,36,94,210                    ; vdivps        %ymm10,%ymm11,%ymm10
   DB  196,193,100,88,218                  ; vaddps        %ymm10,%ymm3,%ymm3
-  DB  196,98,125,24,21,135,4,2,0          ; vbroadcastss  0x20487(%rip),%ymm10        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,98,125,24,21,95,7,2,0           ; vbroadcastss  0x2075f(%rip),%ymm10        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  196,193,100,89,218                  ; vmulps        %ymm10,%ymm3,%ymm3
   DB  197,253,91,219                      ; vcvtps2dq     %ymm3,%ymm3
   DB  196,98,125,24,80,20                 ; vbroadcastss  0x14(%rax),%ymm10
@@ -10393,7 +10405,7 @@
   DB  196,195,101,74,217,128              ; vblendvps     %ymm8,%ymm9,%ymm3,%ymm3
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  196,193,100,95,216                  ; vmaxps        %ymm8,%ymm3,%ymm3
-  DB  196,98,125,24,5,159,3,2,0           ; vbroadcastss  0x2039f(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,119,6,2,0           ; vbroadcastss  0x20677(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,100,93,216                  ; vminps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10410,34 +10422,34 @@
   DB  197,252,40,233                      ; vmovaps       %ymm1,%ymm5
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,91,200                      ; vcvtdq2ps     %ymm0,%ymm1
-  DB  196,98,125,24,5,232,3,2,0           ; vbroadcastss  0x203e8(%rip),%ymm8        # 2b57c <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
+  DB  196,98,125,24,5,192,6,2,0           ; vbroadcastss  0x206c0(%rip),%ymm8        # 2b8dc <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
-  DB  196,98,125,24,13,222,3,2,0          ; vbroadcastss  0x203de(%rip),%ymm9        # 2b580 <_sk_srcover_rgba_8888_sse2_lowp+0x8d8>
+  DB  196,98,125,24,13,182,6,2,0          ; vbroadcastss  0x206b6(%rip),%ymm9        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
   DB  196,193,124,84,193                  ; vandps        %ymm9,%ymm0,%ymm0
-  DB  196,226,125,24,37,52,3,2,0          ; vbroadcastss  0x20334(%rip),%ymm4        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,37,12,6,2,0          ; vbroadcastss  0x2060c(%rip),%ymm4        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,252,86,196                      ; vorps         %ymm4,%ymm0,%ymm0
-  DB  196,98,125,24,21,199,3,2,0          ; vbroadcastss  0x203c7(%rip),%ymm10        # 2b584 <_sk_srcover_rgba_8888_sse2_lowp+0x8dc>
+  DB  196,98,125,24,21,159,6,2,0          ; vbroadcastss  0x2069f(%rip),%ymm10        # 2b8e4 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
   DB  196,193,116,88,202                  ; vaddps        %ymm10,%ymm1,%ymm1
-  DB  196,98,125,24,29,189,3,2,0          ; vbroadcastss  0x203bd(%rip),%ymm11        # 2b588 <_sk_srcover_rgba_8888_sse2_lowp+0x8e0>
+  DB  196,98,125,24,29,149,6,2,0          ; vbroadcastss  0x20695(%rip),%ymm11        # 2b8e8 <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
   DB  196,193,124,89,211                  ; vmulps        %ymm11,%ymm0,%ymm2
   DB  197,244,92,202                      ; vsubps        %ymm2,%ymm1,%ymm1
-  DB  196,98,125,24,37,175,3,2,0          ; vbroadcastss  0x203af(%rip),%ymm12        # 2b58c <_sk_srcover_rgba_8888_sse2_lowp+0x8e4>
+  DB  196,98,125,24,37,135,6,2,0          ; vbroadcastss  0x20687(%rip),%ymm12        # 2b8ec <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
   DB  196,193,124,88,196                  ; vaddps        %ymm12,%ymm0,%ymm0
-  DB  196,98,125,24,45,165,3,2,0          ; vbroadcastss  0x203a5(%rip),%ymm13        # 2b590 <_sk_srcover_rgba_8888_sse2_lowp+0x8e8>
+  DB  196,98,125,24,45,125,6,2,0          ; vbroadcastss  0x2067d(%rip),%ymm13        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
   DB  197,148,94,192                      ; vdivps        %ymm0,%ymm13,%ymm0
   DB  197,244,92,192                      ; vsubps        %ymm0,%ymm1,%ymm0
   DB  196,98,125,24,48                    ; vbroadcastss  (%rax),%ymm14
   DB  196,193,124,89,198                  ; vmulps        %ymm14,%ymm0,%ymm0
   DB  196,227,125,8,200,1                 ; vroundps      $0x1,%ymm0,%ymm1
   DB  197,252,92,241                      ; vsubps        %ymm1,%ymm0,%ymm6
-  DB  196,98,125,24,61,132,3,2,0          ; vbroadcastss  0x20384(%rip),%ymm15        # 2b594 <_sk_srcover_rgba_8888_sse2_lowp+0x8ec>
+  DB  196,98,125,24,61,92,6,2,0           ; vbroadcastss  0x2065c(%rip),%ymm15        # 2b8f4 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
   DB  196,193,124,88,199                  ; vaddps        %ymm15,%ymm0,%ymm0
-  DB  196,226,125,24,29,122,3,2,0         ; vbroadcastss  0x2037a(%rip),%ymm3        # 2b598 <_sk_srcover_rgba_8888_sse2_lowp+0x8f0>
+  DB  196,226,125,24,29,82,6,2,0          ; vbroadcastss  0x20652(%rip),%ymm3        # 2b8f8 <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
   DB  197,204,89,203                      ; vmulps        %ymm3,%ymm6,%ymm1
   DB  197,252,92,201                      ; vsubps        %ymm1,%ymm0,%ymm1
-  DB  196,226,125,24,21,109,3,2,0         ; vbroadcastss  0x2036d(%rip),%ymm2        # 2b59c <_sk_srcover_rgba_8888_sse2_lowp+0x8f4>
+  DB  196,226,125,24,21,69,6,2,0          ; vbroadcastss  0x20645(%rip),%ymm2        # 2b8fc <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
   DB  197,236,92,198                      ; vsubps        %ymm6,%ymm2,%ymm0
-  DB  196,226,125,24,53,100,3,2,0         ; vbroadcastss  0x20364(%rip),%ymm6        # 2b5a0 <_sk_srcover_rgba_8888_sse2_lowp+0x8f8>
+  DB  196,226,125,24,53,60,6,2,0          ; vbroadcastss  0x2063c(%rip),%ymm6        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
   DB  197,204,94,192                      ; vdivps        %ymm0,%ymm6,%ymm0
   DB  197,244,88,192                      ; vaddps        %ymm0,%ymm1,%ymm0
   DB  197,252,17,4,36                     ; vmovups       %ymm0,(%rsp)
@@ -10479,7 +10491,7 @@
   DB  197,236,92,212                      ; vsubps        %ymm4,%ymm2,%ymm2
   DB  197,204,94,210                      ; vdivps        %ymm2,%ymm6,%ymm2
   DB  197,244,88,202                      ; vaddps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,168,2,2,0         ; vbroadcastss  0x202a8(%rip),%ymm2        # 2b5a4 <_sk_srcover_rgba_8888_sse2_lowp+0x8fc>
+  DB  196,226,125,24,21,128,5,2,0         ; vbroadcastss  0x20580(%rip),%ymm2        # 2b904 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
   DB  197,236,89,28,36                    ; vmulps        (%rsp),%ymm2,%ymm3
   DB  197,252,89,226                      ; vmulps        %ymm2,%ymm0,%ymm4
   DB  197,244,89,210                      ; vmulps        %ymm2,%ymm1,%ymm2
@@ -10497,31 +10509,31 @@
 
 PUBLIC _sk_lab_to_xyz_avx
 _sk_lab_to_xyz_avx LABEL PROC
-  DB  196,98,125,24,5,91,2,2,0            ; vbroadcastss  0x2025b(%rip),%ymm8        # 2b5a8 <_sk_srcover_rgba_8888_sse2_lowp+0x900>
+  DB  196,98,125,24,5,51,5,2,0            ; vbroadcastss  0x20533(%rip),%ymm8        # 2b908 <_sk_srcover_rgba_8888_sse2_lowp+0x904>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,185,1,2,0           ; vbroadcastss  0x201b9(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,145,4,2,0           ; vbroadcastss  0x20491(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
-  DB  196,98,125,24,13,67,2,2,0           ; vbroadcastss  0x20243(%rip),%ymm9        # 2b5ac <_sk_srcover_rgba_8888_sse2_lowp+0x904>
+  DB  196,98,125,24,13,27,5,2,0           ; vbroadcastss  0x2051b(%rip),%ymm9        # 2b90c <_sk_srcover_rgba_8888_sse2_lowp+0x908>
   DB  196,193,116,88,201                  ; vaddps        %ymm9,%ymm1,%ymm1
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  196,193,108,88,209                  ; vaddps        %ymm9,%ymm2,%ymm2
-  DB  196,98,125,24,5,47,2,2,0            ; vbroadcastss  0x2022f(%rip),%ymm8        # 2b5b0 <_sk_srcover_rgba_8888_sse2_lowp+0x908>
+  DB  196,98,125,24,5,7,5,2,0             ; vbroadcastss  0x20507(%rip),%ymm8        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,37,2,2,0            ; vbroadcastss  0x20225(%rip),%ymm8        # 2b5b4 <_sk_srcover_rgba_8888_sse2_lowp+0x90c>
+  DB  196,98,125,24,5,253,4,2,0           ; vbroadcastss  0x204fd(%rip),%ymm8        # 2b914 <_sk_srcover_rgba_8888_sse2_lowp+0x910>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,5,27,2,2,0            ; vbroadcastss  0x2021b(%rip),%ymm8        # 2b5b8 <_sk_srcover_rgba_8888_sse2_lowp+0x910>
+  DB  196,98,125,24,5,243,4,2,0           ; vbroadcastss  0x204f3(%rip),%ymm8        # 2b918 <_sk_srcover_rgba_8888_sse2_lowp+0x914>
   DB  196,193,116,89,200                  ; vmulps        %ymm8,%ymm1,%ymm1
   DB  197,252,88,201                      ; vaddps        %ymm1,%ymm0,%ymm1
-  DB  196,98,125,24,5,13,2,2,0            ; vbroadcastss  0x2020d(%rip),%ymm8        # 2b5bc <_sk_srcover_rgba_8888_sse2_lowp+0x914>
+  DB  196,98,125,24,5,229,4,2,0           ; vbroadcastss  0x204e5(%rip),%ymm8        # 2b91c <_sk_srcover_rgba_8888_sse2_lowp+0x918>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  197,252,92,210                      ; vsubps        %ymm2,%ymm0,%ymm2
   DB  197,116,89,193                      ; vmulps        %ymm1,%ymm1,%ymm8
   DB  196,65,116,89,192                   ; vmulps        %ymm8,%ymm1,%ymm8
-  DB  196,98,125,24,13,246,1,2,0          ; vbroadcastss  0x201f6(%rip),%ymm9        # 2b5c0 <_sk_srcover_rgba_8888_sse2_lowp+0x918>
+  DB  196,98,125,24,13,206,4,2,0          ; vbroadcastss  0x204ce(%rip),%ymm9        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
   DB  196,65,52,194,208,1                 ; vcmpltps      %ymm8,%ymm9,%ymm10
-  DB  196,98,125,24,29,235,1,2,0          ; vbroadcastss  0x201eb(%rip),%ymm11        # 2b5c4 <_sk_srcover_rgba_8888_sse2_lowp+0x91c>
+  DB  196,98,125,24,29,195,4,2,0          ; vbroadcastss  0x204c3(%rip),%ymm11        # 2b924 <_sk_srcover_rgba_8888_sse2_lowp+0x920>
   DB  196,193,116,88,203                  ; vaddps        %ymm11,%ymm1,%ymm1
-  DB  196,98,125,24,37,225,1,2,0          ; vbroadcastss  0x201e1(%rip),%ymm12        # 2b5c8 <_sk_srcover_rgba_8888_sse2_lowp+0x920>
+  DB  196,98,125,24,37,185,4,2,0          ; vbroadcastss  0x204b9(%rip),%ymm12        # 2b928 <_sk_srcover_rgba_8888_sse2_lowp+0x924>
   DB  196,193,116,89,204                  ; vmulps        %ymm12,%ymm1,%ymm1
   DB  196,67,117,74,192,160               ; vblendvps     %ymm10,%ymm8,%ymm1,%ymm8
   DB  197,252,89,200                      ; vmulps        %ymm0,%ymm0,%ymm1
@@ -10536,9 +10548,9 @@
   DB  196,193,108,88,211                  ; vaddps        %ymm11,%ymm2,%ymm2
   DB  196,193,108,89,212                  ; vmulps        %ymm12,%ymm2,%ymm2
   DB  196,227,109,74,208,144              ; vblendvps     %ymm9,%ymm0,%ymm2,%ymm2
-  DB  196,226,125,24,5,151,1,2,0          ; vbroadcastss  0x20197(%rip),%ymm0        # 2b5cc <_sk_srcover_rgba_8888_sse2_lowp+0x924>
+  DB  196,226,125,24,5,111,4,2,0          ; vbroadcastss  0x2046f(%rip),%ymm0        # 2b92c <_sk_srcover_rgba_8888_sse2_lowp+0x928>
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,142,1,2,0           ; vbroadcastss  0x2018e(%rip),%ymm8        # 2b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0x928>
+  DB  196,98,125,24,5,102,4,2,0           ; vbroadcastss  0x20466(%rip),%ymm8        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10552,15 +10564,15 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,68                              ; jne           b4a7 <_sk_load_a8_avx+0x5c>
+  DB  117,68                              ; jne           b52f <_sk_load_a8_avx+0x5c>
   DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,15,2,2,0              ; vpand         0x2020f(%rip),%xmm0,%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,249,219,5,231,4,2,0             ; vpand         0x204e7(%rip),%xmm0,%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,201,0,2,0         ; vbroadcastss  0x200c9(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,161,3,2,0         ; vbroadcastss  0x203a1(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -10572,15 +10584,15 @@
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,174                             ; ja            b469 <_sk_load_a8_avx+0x1e>
+  DB  119,174                             ; ja            b4f1 <_sk_load_a8_avx+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,122,0,0,0                 ; lea           0x7a(%rip),%r10        # b540 <_sk_load_a8_avx+0xf5>
+  DB  76,141,21,122,0,0,0                 ; lea           0x7a(%rip),%r10        # b5c8 <_sk_load_a8_avx+0xf5>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,143                             ; jmp           b469 <_sk_load_a8_avx+0x1e>
+  DB  235,143                             ; jmp           b4f1 <_sk_load_a8_avx+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
@@ -10588,7 +10600,7 @@
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,103,255,255,255                 ; jmpq          b469 <_sk_load_a8_avx+0x1e>
+  DB  233,103,255,255,255                 ; jmpq          b4f1 <_sk_load_a8_avx+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
@@ -10599,7 +10611,7 @@
   DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,44,255,255,255                  ; jmpq          b469 <_sk_load_a8_avx+0x1e>
+  DB  233,44,255,255,255                  ; jmpq          b4f1 <_sk_load_a8_avx+0x1e>
   DB  15,31,0                             ; nopl          (%rax)
   DB  143                                 ; (bad)
   DB  255                                 ; (bad)
@@ -10630,15 +10642,15 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,68                              ; jne           b5b8 <_sk_load_a8_dst_avx+0x5c>
+  DB  117,68                              ; jne           b640 <_sk_load_a8_dst_avx+0x5c>
   DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,254,0,2,0            ; vpand         0x200fe(%rip),%xmm4,%xmm4        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,217,219,37,214,3,2,0            ; vpand         0x203d6(%rip),%xmm4,%xmm4        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
   DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,184,255,1,0       ; vbroadcastss  0x1ffb8(%rip),%ymm5        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,45,144,2,2,0         ; vbroadcastss  0x20290(%rip),%ymm5        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,220,89,253                      ; vmulps        %ymm5,%ymm4,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
@@ -10650,15 +10662,15 @@
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,174                             ; ja            b57a <_sk_load_a8_dst_avx+0x1e>
+  DB  119,174                             ; ja            b602 <_sk_load_a8_dst_avx+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # b650 <_sk_load_a8_dst_avx+0xf4>
+  DB  76,141,21,121,0,0,0                 ; lea           0x79(%rip),%r10        # b6d8 <_sk_load_a8_dst_avx+0xf4>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,143                             ; jmp           b57a <_sk_load_a8_dst_avx+0x1e>
+  DB  235,143                             ; jmp           b602 <_sk_load_a8_dst_avx+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
@@ -10666,7 +10678,7 @@
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,103,255,255,255                 ; jmpq          b57a <_sk_load_a8_dst_avx+0x1e>
+  DB  233,103,255,255,255                 ; jmpq          b602 <_sk_load_a8_dst_avx+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
@@ -10677,7 +10689,7 @@
   DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,44,255,255,255                  ; jmpq          b57a <_sk_load_a8_dst_avx+0x1e>
+  DB  233,44,255,255,255                  ; jmpq          b602 <_sk_load_a8_dst_avx+0x1e>
   DB  102,144                             ; xchg          %ax,%ax
   DB  144                                 ; nop
   DB  255                                 ; (bad)
@@ -10686,7 +10698,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,255,255,255,221                 ; callq         ffffffffde00b660 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfe09b8>
+  DB  232,255,255,255,221                 ; callq         ffffffffde00b6e8 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffddfe06e4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,210                             ; callq         *%rdx
@@ -10705,23 +10717,39 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,139,0                            ; mov           (%rax),%r8
-  DB  197,254,91,209                      ; vcvttps2dq    %ymm1,%ymm2
-  DB  197,249,110,72,8                    ; vmovd         0x8(%rax),%xmm1
-  DB  197,249,112,217,0                   ; vpshufd       $0x0,%xmm1,%xmm3
-  DB  196,226,97,64,202                   ; vpmulld       %xmm2,%xmm3,%xmm1
-  DB  196,227,125,25,210,1                ; vextractf128  $0x1,%ymm2,%xmm2
-  DB  196,226,97,64,210                   ; vpmulld       %xmm2,%xmm3,%xmm2
-  DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,57,118,192                   ; vpcmpeqd      %xmm8,%xmm8,%xmm8
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
+  DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
+  DB  197,252,93,210                      ; vminps        %ymm2,%ymm0,%ymm2
+  DB  196,226,125,24,64,16                ; vbroadcastss  0x10(%rax),%ymm0
   DB  196,227,125,25,195,1                ; vextractf128  $0x1,%ymm0,%xmm3
-  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
-  DB  196,227,249,22,208,1                ; vpextrq       $0x1,%xmm2,%rax
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,121,254,192                 ; vpaddd        %xmm8,%xmm0,%xmm0
+  DB  196,227,125,24,195,1                ; vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
+  DB  197,244,93,192                      ; vminps        %ymm0,%ymm1,%ymm0
+  DB  76,139,0                            ; mov           (%rax),%r8
+  DB  197,254,91,200                      ; vcvttps2dq    %ymm0,%ymm1
+  DB  197,249,110,64,8                    ; vmovd         0x8(%rax),%xmm0
+  DB  197,249,112,216,0                   ; vpshufd       $0x0,%xmm0,%xmm3
+  DB  196,226,97,64,193                   ; vpmulld       %xmm1,%xmm3,%xmm0
+  DB  196,227,125,25,201,1                ; vextractf128  $0x1,%ymm1,%xmm1
+  DB  196,226,97,64,201                   ; vpmulld       %xmm1,%xmm3,%xmm1
+  DB  197,254,91,210                      ; vcvttps2dq    %ymm2,%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
+  DB  196,227,249,22,200,1                ; vpextrq       $0x1,%xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  196,193,249,126,210                 ; vmovq         %xmm2,%r10
+  DB  196,193,249,126,202                 ; vmovq         %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
-  DB  197,241,254,192                     ; vpaddd        %xmm0,%xmm1,%xmm0
+  DB  197,249,254,194                     ; vpaddd        %xmm2,%xmm0,%xmm0
   DB  196,227,249,22,195,1                ; vpextrq       $0x1,%xmm0,%rbx
   DB  65,137,222                          ; mov           %ebx,%r14d
   DB  72,193,235,32                       ; shr           $0x20,%rbx
@@ -10748,7 +10776,7 @@
   DB  196,226,121,49,201                  ; vpmovzxbd     %xmm1,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,16,254,1,0        ; vbroadcastss  0x1fe10(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,150,0,2,0         ; vbroadcastss  0x20096(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,217                      ; vmulps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -10769,14 +10797,14 @@
   DB  77,15,175,193                       ; imul          %r9,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,144,253,1,0         ; vbroadcastss  0x1fd90(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,22,0,2,0            ; vbroadcastss  0x20016(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,65,100,89,192                   ; vmulps        %ymm8,%ymm3,%ymm8
   DB  196,65,125,91,192                   ; vcvtps2dq     %ymm8,%ymm8
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  197,57,103,192                      ; vpackuswb     %xmm0,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           b7ac <_sk_store_a8_avx+0x44>
+  DB  117,10                              ; jne           b886 <_sk_store_a8_avx+0x44>
   DB  196,1,121,214,4,24                  ; vmovq         %xmm8,(%r8,%r11,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -10784,42 +10812,42 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            b7a8 <_sk_store_a8_avx+0x40>
+  DB  119,236                             ; ja            b882 <_sk_store_a8_avx+0x40>
   DB  196,66,121,48,192                   ; vpmovzxbw     %xmm8,%xmm8
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,88,0,0,0                  ; lea           0x58(%rip),%r10        # b824 <_sk_store_a8_avx+0xbc>
+  DB  76,141,21,86,0,0,0                  ; lea           0x56(%rip),%r10        # b8fc <_sk_store_a8_avx+0xba>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,3,121,20,4,24,0                 ; vpextrb       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,202                             ; jmp           b7a8 <_sk_store_a8_avx+0x40>
+  DB  235,202                             ; jmp           b882 <_sk_store_a8_avx+0x40>
   DB  196,3,121,20,68,24,2,4              ; vpextrb       $0x4,%xmm8,0x2(%r8,%r11,1)
-  DB  196,98,57,0,5,161,254,1,0           ; vpshufb       0x1fea1(%rip),%xmm8,%xmm8        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x9e8>
+  DB  196,98,57,0,5,39,1,2,0              ; vpshufb       0x20127(%rip),%xmm8,%xmm8        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ec>
   DB  196,3,121,21,4,24,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,1)
-  DB  235,176                             ; jmp           b7a8 <_sk_store_a8_avx+0x40>
+  DB  235,176                             ; jmp           b882 <_sk_store_a8_avx+0x40>
   DB  196,3,121,20,68,24,6,12             ; vpextrb       $0xc,%xmm8,0x6(%r8,%r11,1)
   DB  196,3,121,20,68,24,5,10             ; vpextrb       $0xa,%xmm8,0x5(%r8,%r11,1)
   DB  196,3,121,20,68,24,4,8              ; vpextrb       $0x8,%xmm8,0x4(%r8,%r11,1)
-  DB  196,98,57,0,5,135,254,1,0           ; vpshufb       0x1fe87(%rip),%xmm8,%xmm8        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9f8>
+  DB  196,98,57,0,5,13,1,2,0              ; vpshufb       0x2010d(%rip),%xmm8,%xmm8        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x9fc>
   DB  196,1,121,126,4,24                  ; vmovd         %xmm8,(%r8,%r11,1)
-  DB  235,135                             ; jmp           b7a8 <_sk_store_a8_avx+0x40>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  177,255                             ; mov           $0xff,%cl
+  DB  235,135                             ; jmp           b882 <_sk_store_a8_avx+0x40>
+  DB  144                                 ; nop
+  DB  179,255                             ; mov           $0xff,%bl
   DB  255                                 ; (bad)
-  DB  255,194                             ; inc           %edx
+  DB  255,196                             ; inc           %esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  186,255,255,255,236                 ; mov           $0xecffffff,%edx
+  DB  188,255,255,255,238                 ; mov           $0xeeffffff,%esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,228                             ; jmpq          *%rsp
+  DB  255,230                             ; jmpq          *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
+  DB  222,255                             ; fdivrp        %st,%st(7)
   DB  255                                 ; (bad)
-  DB  255,212                             ; callq         *%rsp
+  DB  255,214                             ; callq         *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -10833,18 +10861,18 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,73                              ; jne           b8a1 <_sk_load_g8_avx+0x61>
+  DB  117,73                              ; jne           b979 <_sk_load_g8_avx+0x61>
   DB  196,130,121,48,4,24                 ; vpmovzxbw     (%r8,%r11,1),%xmm0
-  DB  197,249,219,5,26,254,1,0            ; vpand         0x1fe1a(%rip),%xmm0,%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,249,219,5,162,0,2,0             ; vpand         0x200a2(%rip),%xmm0,%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,212,252,1,0       ; vbroadcastss  0x1fcd4(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,92,255,1,0        ; vbroadcastss  0x1ff5c(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,81,252,1,0        ; vbroadcastss  0x1fc51(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,217,254,1,0       ; vbroadcastss  0x1fed9(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
@@ -10853,15 +10881,15 @@
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,169                             ; ja            b85e <_sk_load_g8_avx+0x1e>
+  DB  119,169                             ; ja            b936 <_sk_load_g8_avx+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # b938 <_sk_load_g8_avx+0xf8>
+  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # ba10 <_sk_load_g8_avx+0xf8>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  235,138                             ; jmp           b85e <_sk_load_g8_avx+0x1e>
+  DB  235,138                             ; jmp           b936 <_sk_load_g8_avx+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,2                   ; vpinsrw       $0x2,%eax,%xmm0,%xmm0
@@ -10869,7 +10897,7 @@
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,98,255,255,255                  ; jmpq          b85e <_sk_load_g8_avx+0x1e>
+  DB  233,98,255,255,255                  ; jmpq          b936 <_sk_load_g8_avx+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,249,196,192,6                   ; vpinsrw       $0x6,%eax,%xmm0,%xmm0
@@ -10880,7 +10908,7 @@
   DB  196,129,121,110,12,24               ; vmovd         (%r8,%r11,1),%xmm1
   DB  196,226,121,48,201                  ; vpmovzxbw     %xmm1,%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,39,255,255,255                  ; jmpq          b85e <_sk_load_g8_avx+0x1e>
+  DB  233,39,255,255,255                  ; jmpq          b936 <_sk_load_g8_avx+0x1e>
   DB  144                                 ; nop
   DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
@@ -10889,7 +10917,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00b948 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0ca0>
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0a1c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,211                             ; callq         *%rbx
@@ -10909,18 +10937,18 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,73                              ; jne           b9b5 <_sk_load_g8_dst_avx+0x61>
+  DB  117,73                              ; jne           ba8d <_sk_load_g8_dst_avx+0x61>
   DB  196,130,121,48,36,24                ; vpmovzxbw     (%r8,%r11,1),%xmm4
-  DB  197,217,219,37,6,253,1,0            ; vpand         0x1fd06(%rip),%xmm4,%xmm4        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  197,217,219,37,142,255,1,0          ; vpand         0x1ff8e(%rip),%xmm4,%xmm4        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
   DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,192,251,1,0       ; vbroadcastss  0x1fbc0(%rip),%ymm5        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,45,72,254,1,0        ; vbroadcastss  0x1fe48(%rip),%ymm5        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,61,251,1,0        ; vbroadcastss  0x1fb3d(%rip),%ymm7        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,61,197,253,1,0       ; vbroadcastss  0x1fdc5(%rip),%ymm7        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,236                      ; vmovaps       %ymm4,%ymm5
   DB  197,252,40,244                      ; vmovaps       %ymm4,%ymm6
   DB  255,224                             ; jmpq          *%rax
@@ -10929,15 +10957,15 @@
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,169                             ; ja            b972 <_sk_load_g8_dst_avx+0x1e>
+  DB  119,169                             ; ja            ba4a <_sk_load_g8_dst_avx+0x1e>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # ba4c <_sk_load_g8_dst_avx+0xf8>
+  DB  76,141,21,120,0,0,0                 ; lea           0x78(%rip),%r10        # bb24 <_sk_load_g8_dst_avx+0xf8>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,182,4,24                      ; movzbl        (%r8,%r11,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  235,138                             ; jmp           b972 <_sk_load_g8_dst_avx+0x1e>
+  DB  235,138                             ; jmp           ba4a <_sk_load_g8_dst_avx+0x1e>
   DB  67,15,182,68,24,2                   ; movzbl        0x2(%r8,%r11,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,2                   ; vpinsrw       $0x2,%eax,%xmm4,%xmm4
@@ -10945,7 +10973,7 @@
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,98,255,255,255                  ; jmpq          b972 <_sk_load_g8_dst_avx+0x1e>
+  DB  233,98,255,255,255                  ; jmpq          ba4a <_sk_load_g8_dst_avx+0x1e>
   DB  67,15,182,68,24,6                   ; movzbl        0x6(%r8,%r11,1),%eax
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  197,217,196,224,6                   ; vpinsrw       $0x6,%eax,%xmm4,%xmm4
@@ -10956,7 +10984,7 @@
   DB  196,129,121,110,44,24               ; vmovd         (%r8,%r11,1),%xmm5
   DB  196,226,121,48,237                  ; vpmovzxbw     %xmm5,%xmm5
   DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,39,255,255,255                  ; jmpq          b972 <_sk_load_g8_dst_avx+0x1e>
+  DB  233,39,255,255,255                  ; jmpq          ba4a <_sk_load_g8_dst_avx+0x1e>
   DB  144                                 ; nop
   DB  145                                 ; xchg          %eax,%ecx
   DB  255                                 ; (bad)
@@ -10965,7 +10993,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00ba5c <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0db4>
+  DB  233,255,255,255,222                 ; jmpq          ffffffffdf00bb34 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdefe0b30>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,211                             ; callq         *%rbx
@@ -10984,23 +11012,39 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,139,0                            ; mov           (%rax),%r8
-  DB  197,254,91,209                      ; vcvttps2dq    %ymm1,%ymm2
-  DB  197,249,110,72,8                    ; vmovd         0x8(%rax),%xmm1
-  DB  197,249,112,217,0                   ; vpshufd       $0x0,%xmm1,%xmm3
-  DB  196,226,97,64,202                   ; vpmulld       %xmm2,%xmm3,%xmm1
-  DB  196,227,125,25,210,1                ; vextractf128  $0x1,%ymm2,%xmm2
-  DB  196,226,97,64,210                   ; vpmulld       %xmm2,%xmm3,%xmm2
-  DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,57,118,192                   ; vpcmpeqd      %xmm8,%xmm8,%xmm8
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
+  DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
+  DB  197,252,93,210                      ; vminps        %ymm2,%ymm0,%ymm2
+  DB  196,226,125,24,64,16                ; vbroadcastss  0x10(%rax),%ymm0
   DB  196,227,125,25,195,1                ; vextractf128  $0x1,%ymm0,%xmm3
-  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
-  DB  196,227,249,22,208,1                ; vpextrq       $0x1,%xmm2,%rax
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,121,254,192                 ; vpaddd        %xmm8,%xmm0,%xmm0
+  DB  196,227,125,24,195,1                ; vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
+  DB  197,244,93,192                      ; vminps        %ymm0,%ymm1,%ymm0
+  DB  76,139,0                            ; mov           (%rax),%r8
+  DB  197,254,91,200                      ; vcvttps2dq    %ymm0,%ymm1
+  DB  197,249,110,64,8                    ; vmovd         0x8(%rax),%xmm0
+  DB  197,249,112,216,0                   ; vpshufd       $0x0,%xmm0,%xmm3
+  DB  196,226,97,64,193                   ; vpmulld       %xmm1,%xmm3,%xmm0
+  DB  196,227,125,25,201,1                ; vextractf128  $0x1,%ymm1,%xmm1
+  DB  196,226,97,64,201                   ; vpmulld       %xmm1,%xmm3,%xmm1
+  DB  197,254,91,210                      ; vcvttps2dq    %ymm2,%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
+  DB  196,227,249,22,200,1                ; vpextrq       $0x1,%xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  196,193,249,126,210                 ; vmovq         %xmm2,%r10
+  DB  196,193,249,126,202                 ; vmovq         %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
-  DB  197,241,254,192                     ; vpaddd        %xmm0,%xmm1,%xmm0
+  DB  197,249,254,194                     ; vpaddd        %xmm2,%xmm0,%xmm0
   DB  196,227,249,22,195,1                ; vpextrq       $0x1,%xmm0,%rbx
   DB  65,137,222                          ; mov           %ebx,%r14d
   DB  72,193,235,32                       ; shr           $0x20,%rbx
@@ -11027,10 +11071,10 @@
   DB  196,226,121,49,201                  ; vpmovzxbd     %xmm1,%xmm1
   DB  196,227,125,24,193,1                ; vinsertf128   $0x1,%xmm1,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,20,250,1,0        ; vbroadcastss  0x1fa14(%rip),%ymm1        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,226,125,24,13,74,252,1,0        ; vbroadcastss  0x1fc4a(%rip),%ymm1        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,145,249,1,0       ; vbroadcastss  0x1f991(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,199,251,1,0       ; vbroadcastss  0x1fbc7(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
   DB  197,252,40,208                      ; vmovaps       %ymm0,%ymm2
   DB  91                                  ; pop           %rbx
@@ -11050,72 +11094,71 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,130,0,0,0                    ; jne           bc0a <_sk_load_565_avx+0xa1>
+  DB  15,133,130,0,0,0                    ; jne           bd34 <_sk_load_565_avx+0xa1>
   DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,208,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  DB  196,226,125,24,5,180,249,1,0        ; vbroadcastss  0x1f9b4(%rip),%ymm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,226,125,24,5,234,251,1,0        ; vbroadcastss  0x1fbea(%rip),%ymm0        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  197,236,84,192                      ; vandps        %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,167,249,1,0       ; vbroadcastss  0x1f9a7(%rip),%ymm1        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,226,125,24,13,221,251,1,0       ; vbroadcastss  0x1fbdd(%rip),%ymm1        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,158,249,1,0       ; vbroadcastss  0x1f99e(%rip),%ymm1        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,226,125,24,13,212,251,1,0       ; vbroadcastss  0x1fbd4(%rip),%ymm1        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  197,236,84,201                      ; vandps        %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,145,249,1,0       ; vbroadcastss  0x1f991(%rip),%ymm3        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,226,125,24,29,199,251,1,0       ; vbroadcastss  0x1fbc7(%rip),%ymm3        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,24,29,136,249,1,0       ; vbroadcastss  0x1f988(%rip),%ymm3        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,226,125,24,29,190,251,1,0       ; vbroadcastss  0x1fbbe(%rip),%ymm3        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  197,236,84,211                      ; vandps        %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,123,249,1,0       ; vbroadcastss  0x1f97b(%rip),%ymm3        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,226,125,24,29,177,251,1,0       ; vbroadcastss  0x1fbb1(%rip),%ymm3        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,224,248,1,0       ; vbroadcastss  0x1f8e0(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,22,251,1,0        ; vbroadcastss  0x1fb16(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,108,255,255,255              ; ja            bb8e <_sk_load_565_avx+0x25>
+  DB  15,135,108,255,255,255              ; ja            bcb8 <_sk_load_565_avx+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,99,0,0,0                  ; lea           0x63(%rip),%r10        # bc90 <_sk_load_565_avx+0x127>
+  DB  76,141,21,97,0,0,0                  ; lea           0x61(%rip),%r10        # bdb8 <_sk_load_565_avx+0x125>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,74,255,255,255                  ; jmpq          bb8e <_sk_load_565_avx+0x25>
+  DB  233,74,255,255,255                  ; jmpq          bcb8 <_sk_load_565_avx+0x25>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,45,255,255,255                  ; jmpq          bb8e <_sk_load_565_avx+0x25>
+  DB  233,45,255,255,255                  ; jmpq          bcb8 <_sk_load_565_avx+0x25>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,0,255,255,255                   ; jmpq          bb8e <_sk_load_565_avx+0x25>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  166                                 ; cmpsb         %es:(%rdi),%ds:(%rsi)
+  DB  233,0,255,255,255                   ; jmpq          bcb8 <_sk_load_565_avx+0x25>
+  DB  168,255                             ; test          $0xff,%al
+  DB  255                                 ; (bad)
+  DB  255,194                             ; inc           %edx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,192                             ; inc           %eax
+  DB  255,182,255,255,255,239             ; pushq         -0x10000001(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,180,255,255,255,237,255         ; pushq         -0x120001(%rdi,%rdi,8)
-  DB  255                                 ; (bad)
-  DB  255,229                             ; jmpq          *%rbp
+  DB  255,231                             ; jmpq          *%rdi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  221,255                             ; (bad)
+  DB  223,255                             ; (bad)
   DB  255                                 ; (bad)
-  DB  255,209                             ; callq         *%rcx
+  DB  255,211                             ; callq         *%rbx
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -11130,56 +11173,56 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,130,0,0,0                    ; jne           bd4d <_sk_load_565_dst_avx+0xa1>
+  DB  15,133,130,0,0,0                    ; jne           be75 <_sk_load_565_dst_avx+0xa1>
   DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
   DB  196,227,85,24,244,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm6
-  DB  196,226,125,24,37,113,248,1,0       ; vbroadcastss  0x1f871(%rip),%ymm4        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,226,125,24,37,169,250,1,0       ; vbroadcastss  0x1faa9(%rip),%ymm4        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  197,204,84,228                      ; vandps        %ymm4,%ymm6,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,100,248,1,0       ; vbroadcastss  0x1f864(%rip),%ymm5        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,226,125,24,45,156,250,1,0       ; vbroadcastss  0x1fa9c(%rip),%ymm5        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,24,45,91,248,1,0        ; vbroadcastss  0x1f85b(%rip),%ymm5        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,226,125,24,45,147,250,1,0       ; vbroadcastss  0x1fa93(%rip),%ymm5        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  197,204,84,237                      ; vandps        %ymm5,%ymm6,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,61,78,248,1,0        ; vbroadcastss  0x1f84e(%rip),%ymm7        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,226,125,24,61,134,250,1,0       ; vbroadcastss  0x1fa86(%rip),%ymm7        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  197,212,89,239                      ; vmulps        %ymm7,%ymm5,%ymm5
-  DB  196,226,125,24,61,69,248,1,0        ; vbroadcastss  0x1f845(%rip),%ymm7        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,226,125,24,61,125,250,1,0       ; vbroadcastss  0x1fa7d(%rip),%ymm7        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  197,204,84,247                      ; vandps        %ymm7,%ymm6,%ymm6
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,226,125,24,61,56,248,1,0        ; vbroadcastss  0x1f838(%rip),%ymm7        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,226,125,24,61,112,250,1,0       ; vbroadcastss  0x1fa70(%rip),%ymm7        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  197,204,89,247                      ; vmulps        %ymm7,%ymm6,%ymm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,61,157,247,1,0       ; vbroadcastss  0x1f79d(%rip),%ymm7        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,61,213,249,1,0       ; vbroadcastss  0x1f9d5(%rip),%ymm7        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,108,255,255,255              ; ja            bcd1 <_sk_load_565_dst_avx+0x25>
+  DB  15,135,108,255,255,255              ; ja            bdf9 <_sk_load_565_dst_avx+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # bdd4 <_sk_load_565_dst_avx+0x128>
+  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # befc <_sk_load_565_dst_avx+0x128>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,74,255,255,255                  ; jmpq          bcd1 <_sk_load_565_dst_avx+0x25>
+  DB  233,74,255,255,255                  ; jmpq          bdf9 <_sk_load_565_dst_avx+0x25>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
   DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,45,255,255,255                  ; jmpq          bcd1 <_sk_load_565_dst_avx+0x25>
+  DB  233,45,255,255,255                  ; jmpq          bdf9 <_sk_load_565_dst_avx+0x25>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
   DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,0,255,255,255                   ; jmpq          bcd1 <_sk_load_565_dst_avx+0x25>
+  DB  233,0,255,255,255                   ; jmpq          bdf9 <_sk_load_565_dst_avx+0x25>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -11211,23 +11254,39 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,139,0                            ; mov           (%rax),%r8
-  DB  197,254,91,209                      ; vcvttps2dq    %ymm1,%ymm2
-  DB  197,249,110,72,8                    ; vmovd         0x8(%rax),%xmm1
-  DB  197,249,112,217,0                   ; vpshufd       $0x0,%xmm1,%xmm3
-  DB  196,226,97,64,202                   ; vpmulld       %xmm2,%xmm3,%xmm1
-  DB  196,227,125,25,210,1                ; vextractf128  $0x1,%ymm2,%xmm2
-  DB  196,226,97,64,210                   ; vpmulld       %xmm2,%xmm3,%xmm2
-  DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,57,118,192                   ; vpcmpeqd      %xmm8,%xmm8,%xmm8
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
+  DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
+  DB  197,252,93,210                      ; vminps        %ymm2,%ymm0,%ymm2
+  DB  196,226,125,24,64,16                ; vbroadcastss  0x10(%rax),%ymm0
   DB  196,227,125,25,195,1                ; vextractf128  $0x1,%ymm0,%xmm3
-  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
-  DB  196,227,249,22,208,1                ; vpextrq       $0x1,%xmm2,%rax
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,121,254,192                 ; vpaddd        %xmm8,%xmm0,%xmm0
+  DB  196,227,125,24,195,1                ; vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
+  DB  197,244,93,192                      ; vminps        %ymm0,%ymm1,%ymm0
+  DB  76,139,0                            ; mov           (%rax),%r8
+  DB  197,254,91,200                      ; vcvttps2dq    %ymm0,%ymm1
+  DB  197,249,110,64,8                    ; vmovd         0x8(%rax),%xmm0
+  DB  197,249,112,216,0                   ; vpshufd       $0x0,%xmm0,%xmm3
+  DB  196,226,97,64,193                   ; vpmulld       %xmm1,%xmm3,%xmm0
+  DB  196,227,125,25,201,1                ; vextractf128  $0x1,%ymm1,%xmm1
+  DB  196,226,97,64,201                   ; vpmulld       %xmm1,%xmm3,%xmm1
+  DB  197,254,91,210                      ; vcvttps2dq    %ymm2,%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
+  DB  196,227,249,22,200,1                ; vpextrq       $0x1,%xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  196,193,249,126,210                 ; vmovq         %xmm2,%r10
+  DB  196,193,249,126,202                 ; vmovq         %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
-  DB  197,241,254,192                     ; vpaddd        %xmm0,%xmm1,%xmm0
+  DB  197,249,254,194                     ; vpaddd        %xmm2,%xmm0,%xmm0
   DB  196,227,249,22,195,1                ; vpextrq       $0x1,%xmm0,%rbx
   DB  65,137,222                          ; mov           %ebx,%r14d
   DB  72,193,235,32                       ; shr           $0x20,%rbx
@@ -11254,23 +11313,23 @@
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,208,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm2
-  DB  196,226,125,24,5,147,246,1,0        ; vbroadcastss  0x1f693(%rip),%ymm0        # 2b560 <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
+  DB  196,226,125,24,5,121,248,1,0        ; vbroadcastss  0x1f879(%rip),%ymm0        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
   DB  197,236,84,192                      ; vandps        %ymm0,%ymm2,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,134,246,1,0       ; vbroadcastss  0x1f686(%rip),%ymm1        # 2b564 <_sk_srcover_rgba_8888_sse2_lowp+0x8bc>
+  DB  196,226,125,24,13,108,248,1,0       ; vbroadcastss  0x1f86c(%rip),%ymm1        # 2b8c4 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,125,246,1,0       ; vbroadcastss  0x1f67d(%rip),%ymm1        # 2b568 <_sk_srcover_rgba_8888_sse2_lowp+0x8c0>
+  DB  196,226,125,24,13,99,248,1,0        ; vbroadcastss  0x1f863(%rip),%ymm1        # 2b8c8 <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
   DB  197,236,84,201                      ; vandps        %ymm1,%ymm2,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,29,112,246,1,0       ; vbroadcastss  0x1f670(%rip),%ymm3        # 2b56c <_sk_srcover_rgba_8888_sse2_lowp+0x8c4>
+  DB  196,226,125,24,29,86,248,1,0        ; vbroadcastss  0x1f856(%rip),%ymm3        # 2b8cc <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
-  DB  196,226,125,24,29,103,246,1,0       ; vbroadcastss  0x1f667(%rip),%ymm3        # 2b570 <_sk_srcover_rgba_8888_sse2_lowp+0x8c8>
+  DB  196,226,125,24,29,77,248,1,0        ; vbroadcastss  0x1f84d(%rip),%ymm3        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
   DB  197,236,84,211                      ; vandps        %ymm3,%ymm2,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,226,125,24,29,90,246,1,0        ; vbroadcastss  0x1f65a(%rip),%ymm3        # 2b574 <_sk_srcover_rgba_8888_sse2_lowp+0x8cc>
+  DB  196,226,125,24,29,64,248,1,0        ; vbroadcastss  0x1f840(%rip),%ymm3        # 2b8d4 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
   DB  197,236,89,211                      ; vmulps        %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,191,245,1,0       ; vbroadcastss  0x1f5bf(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,165,247,1,0       ; vbroadcastss  0x1f7a5(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -11287,14 +11346,14 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,130,246,1,0         ; vbroadcastss  0x1f682(%rip),%ymm8        # 2b5d4 <_sk_srcover_rgba_8888_sse2_lowp+0x92c>
+  DB  196,98,125,24,5,104,248,1,0         ; vbroadcastss  0x1f868(%rip),%ymm8        # 2b934 <_sk_srcover_rgba_8888_sse2_lowp+0x930>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,41,114,241,11               ; vpslld        $0xb,%xmm9,%xmm10
   DB  196,67,125,25,201,1                 ; vextractf128  $0x1,%ymm9,%xmm9
   DB  196,193,49,114,241,11               ; vpslld        $0xb,%xmm9,%xmm9
   DB  196,67,45,24,201,1                  ; vinsertf128   $0x1,%xmm9,%ymm10,%ymm9
-  DB  196,98,125,24,21,91,246,1,0         ; vbroadcastss  0x1f65b(%rip),%ymm10        # 2b5d8 <_sk_srcover_rgba_8888_sse2_lowp+0x930>
+  DB  196,98,125,24,21,65,248,1,0         ; vbroadcastss  0x1f841(%rip),%ymm10        # 2b938 <_sk_srcover_rgba_8888_sse2_lowp+0x934>
   DB  196,65,116,89,210                   ; vmulps        %ymm10,%ymm1,%ymm10
   DB  196,65,125,91,210                   ; vcvtps2dq     %ymm10,%ymm10
   DB  196,193,33,114,242,5                ; vpslld        $0x5,%xmm10,%xmm11
@@ -11308,7 +11367,7 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           bfcd <_sk_store_565_avx+0x9a>
+  DB  117,10                              ; jne           c147 <_sk_store_565_avx+0x9a>
   DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11316,42 +11375,41 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            bfc9 <_sk_store_565_avx+0x96>
+  DB  119,236                             ; ja            c143 <_sk_store_565_avx+0x96>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,68,0,0,0                  ; lea           0x44(%rip),%r10        # c02c <_sk_store_565_avx+0xf9>
+  DB  76,141,21,66,0,0,0                  ; lea           0x42(%rip),%r10        # c1a4 <_sk_store_565_avx+0xf7>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           bfc9 <_sk_store_565_avx+0x96>
+  DB  235,207                             ; jmp           c143 <_sk_store_565_avx+0x96>
   DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           bfc9 <_sk_store_565_avx+0x96>
+  DB  235,191                             ; jmp           c143 <_sk_store_565_avx+0x96>
   DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           bfc9 <_sk_store_565_avx+0x96>
-  DB  102,144                             ; xchg          %ax,%ax
-  DB  197,255,255                         ; (bad)
-  DB  255,214                             ; callq         *%rsi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,246                             ; push          %rsi
+  DB  235,159                             ; jmp           c143 <_sk_store_565_avx+0x96>
+  DB  199                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  238                                 ; out           %al,(%dx)
+  DB  216,255                             ; fdivr         %st(7),%st
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,230                             ; jmpq          *%rsi
+  DB  255,208                             ; callq         *%rax
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  222,255                             ; fdivrp        %st,%st(7)
+  DB  248                                 ; clc
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,240                             ; push          %rax
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  232,255,255,255,224                 ; callq         ffffffffe100c1bc <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fe11b8>
+  DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
@@ -11365,31 +11423,31 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,154,0,0,0                    ; jne           c101 <_sk_load_4444_avx+0xb9>
+  DB  15,133,154,0,0,0                    ; jne           c279 <_sk_load_4444_avx+0xb9>
   DB  196,129,122,111,4,88                ; vmovdqu       (%r8,%r11,2),%xmm0
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,216,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  DB  196,226,125,24,5,81,245,1,0         ; vbroadcastss  0x1f551(%rip),%ymm0        # 2b5dc <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  DB  196,226,125,24,5,57,247,1,0         ; vbroadcastss  0x1f739(%rip),%ymm0        # 2b93c <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   DB  197,228,84,192                      ; vandps        %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,68,245,1,0        ; vbroadcastss  0x1f544(%rip),%ymm1        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  DB  196,226,125,24,13,44,247,1,0        ; vbroadcastss  0x1f72c(%rip),%ymm1        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,59,245,1,0        ; vbroadcastss  0x1f53b(%rip),%ymm1        # 2b5e4 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  DB  196,226,125,24,13,35,247,1,0        ; vbroadcastss  0x1f723(%rip),%ymm1        # 2b944 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   DB  197,228,84,201                      ; vandps        %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,46,245,1,0        ; vbroadcastss  0x1f52e(%rip),%ymm2        # 2b5e8 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  DB  196,226,125,24,21,22,247,1,0        ; vbroadcastss  0x1f716(%rip),%ymm2        # 2b948 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,37,245,1,0        ; vbroadcastss  0x1f525(%rip),%ymm2        # 2b5ec <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  DB  196,226,125,24,21,13,247,1,0        ; vbroadcastss  0x1f70d(%rip),%ymm2        # 2b94c <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   DB  197,228,84,210                      ; vandps        %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,24,245,1,0          ; vbroadcastss  0x1f518(%rip),%ymm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  DB  196,98,125,24,5,0,247,1,0           ; vbroadcastss  0x1f700(%rip),%ymm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,14,245,1,0          ; vbroadcastss  0x1f50e(%rip),%ymm8        # 2b5f4 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  DB  196,98,125,24,5,246,246,1,0         ; vbroadcastss  0x1f6f6(%rip),%ymm8        # 2b954 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   DB  196,193,100,84,216                  ; vandps        %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,0,245,1,0           ; vbroadcastss  0x1f500(%rip),%ymm8        # 2b5f8 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  DB  196,98,125,24,5,232,246,1,0         ; vbroadcastss  0x1f6e8(%rip),%ymm8        # 2b958 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11398,27 +11456,27 @@
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,84,255,255,255               ; ja            c06d <_sk_load_4444_avx+0x25>
+  DB  15,135,84,255,255,255               ; ja            c1e5 <_sk_load_4444_avx+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # c188 <_sk_load_4444_avx+0x140>
+  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # c300 <_sk_load_4444_avx+0x140>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,50,255,255,255                  ; jmpq          c06d <_sk_load_4444_avx+0x25>
+  DB  233,50,255,255,255                  ; jmpq          c1e5 <_sk_load_4444_avx+0x25>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,110,12,88               ; vmovd         (%r8,%r11,2),%xmm1
   DB  196,227,121,14,193,3                ; vpblendw      $0x3,%xmm1,%xmm0,%xmm0
-  DB  233,21,255,255,255                  ; jmpq          c06d <_sk_load_4444_avx+0x25>
+  DB  233,21,255,255,255                  ; jmpq          c1e5 <_sk_load_4444_avx+0x25>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,129,121,196,68,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,121,196,68,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm0,%xmm0
   DB  196,129,122,126,12,88               ; vmovq         (%r8,%r11,2),%xmm1
   DB  196,227,113,14,192,240              ; vpblendw      $0xf0,%xmm0,%xmm1,%xmm0
-  DB  233,232,254,255,255                 ; jmpq          c06d <_sk_load_4444_avx+0x25>
+  DB  233,232,254,255,255                 ; jmpq          c1e5 <_sk_load_4444_avx+0x25>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -11452,31 +11510,31 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,154,0,0,0                    ; jne           c25d <_sk_load_4444_dst_avx+0xb9>
+  DB  15,133,154,0,0,0                    ; jne           c3d5 <_sk_load_4444_dst_avx+0xb9>
   DB  196,129,122,111,36,88               ; vmovdqu       (%r8,%r11,2),%xmm4
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
   DB  196,227,85,24,252,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm7
-  DB  196,226,125,24,37,245,243,1,0       ; vbroadcastss  0x1f3f5(%rip),%ymm4        # 2b5dc <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  DB  196,226,125,24,37,221,245,1,0       ; vbroadcastss  0x1f5dd(%rip),%ymm4        # 2b93c <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   DB  197,196,84,228                      ; vandps        %ymm4,%ymm7,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,226,125,24,45,232,243,1,0       ; vbroadcastss  0x1f3e8(%rip),%ymm5        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  DB  196,226,125,24,45,208,245,1,0       ; vbroadcastss  0x1f5d0(%rip),%ymm5        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   DB  197,220,89,229                      ; vmulps        %ymm5,%ymm4,%ymm4
-  DB  196,226,125,24,45,223,243,1,0       ; vbroadcastss  0x1f3df(%rip),%ymm5        # 2b5e4 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  DB  196,226,125,24,45,199,245,1,0       ; vbroadcastss  0x1f5c7(%rip),%ymm5        # 2b944 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   DB  197,196,84,237                      ; vandps        %ymm5,%ymm7,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,226,125,24,53,210,243,1,0       ; vbroadcastss  0x1f3d2(%rip),%ymm6        # 2b5e8 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  DB  196,226,125,24,53,186,245,1,0       ; vbroadcastss  0x1f5ba(%rip),%ymm6        # 2b948 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   DB  197,212,89,238                      ; vmulps        %ymm6,%ymm5,%ymm5
-  DB  196,226,125,24,53,201,243,1,0       ; vbroadcastss  0x1f3c9(%rip),%ymm6        # 2b5ec <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  DB  196,226,125,24,53,177,245,1,0       ; vbroadcastss  0x1f5b1(%rip),%ymm6        # 2b94c <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   DB  197,196,84,246                      ; vandps        %ymm6,%ymm7,%ymm6
   DB  197,252,91,246                      ; vcvtdq2ps     %ymm6,%ymm6
-  DB  196,98,125,24,5,188,243,1,0         ; vbroadcastss  0x1f3bc(%rip),%ymm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  DB  196,98,125,24,5,164,245,1,0         ; vbroadcastss  0x1f5a4(%rip),%ymm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   DB  196,193,76,89,240                   ; vmulps        %ymm8,%ymm6,%ymm6
-  DB  196,98,125,24,5,178,243,1,0         ; vbroadcastss  0x1f3b2(%rip),%ymm8        # 2b5f4 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  DB  196,98,125,24,5,154,245,1,0         ; vbroadcastss  0x1f59a(%rip),%ymm8        # 2b954 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   DB  196,193,68,84,248                   ; vandps        %ymm8,%ymm7,%ymm7
   DB  197,252,91,255                      ; vcvtdq2ps     %ymm7,%ymm7
-  DB  196,98,125,24,5,164,243,1,0         ; vbroadcastss  0x1f3a4(%rip),%ymm8        # 2b5f8 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  DB  196,98,125,24,5,140,245,1,0         ; vbroadcastss  0x1f58c(%rip),%ymm8        # 2b958 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   DB  196,193,68,89,248                   ; vmulps        %ymm8,%ymm7,%ymm7
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11485,27 +11543,27 @@
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,84,255,255,255               ; ja            c1c9 <_sk_load_4444_dst_avx+0x25>
+  DB  15,135,84,255,255,255               ; ja            c341 <_sk_load_4444_dst_avx+0x25>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # c2e4 <_sk_load_4444_dst_avx+0x140>
+  DB  76,141,21,100,0,0,0                 ; lea           0x64(%rip),%r10        # c45c <_sk_load_4444_dst_avx+0x140>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  67,15,183,4,88                      ; movzwl        (%r8,%r11,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,50,255,255,255                  ; jmpq          c1c9 <_sk_load_4444_dst_avx+0x25>
+  DB  233,50,255,255,255                  ; jmpq          c341 <_sk_load_4444_dst_avx+0x25>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,4,2           ; vpinsrw       $0x2,0x4(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,121,110,44,88               ; vmovd         (%r8,%r11,2),%xmm5
   DB  196,227,89,14,229,3                 ; vpblendw      $0x3,%xmm5,%xmm4,%xmm4
-  DB  233,21,255,255,255                  ; jmpq          c1c9 <_sk_load_4444_dst_avx+0x25>
+  DB  233,21,255,255,255                  ; jmpq          c341 <_sk_load_4444_dst_avx+0x25>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,129,89,196,100,88,12,6          ; vpinsrw       $0x6,0xc(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,10,5          ; vpinsrw       $0x5,0xa(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,89,196,100,88,8,4           ; vpinsrw       $0x4,0x8(%r8,%r11,2),%xmm4,%xmm4
   DB  196,129,122,126,44,88               ; vmovq         (%r8,%r11,2),%xmm5
   DB  196,227,81,14,228,240               ; vpblendw      $0xf0,%xmm4,%xmm5,%xmm4
-  DB  233,232,254,255,255                 ; jmpq          c1c9 <_sk_load_4444_dst_avx+0x25>
+  DB  233,232,254,255,255                 ; jmpq          c341 <_sk_load_4444_dst_avx+0x25>
   DB  15,31,0                             ; nopl          (%rax)
   DB  165                                 ; movsl         %ds:(%rsi),%es:(%rdi)
   DB  255                                 ; (bad)
@@ -11537,23 +11595,39 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,139,0                            ; mov           (%rax),%r8
-  DB  197,254,91,209                      ; vcvttps2dq    %ymm1,%ymm2
-  DB  197,249,110,72,8                    ; vmovd         0x8(%rax),%xmm1
-  DB  197,249,112,217,0                   ; vpshufd       $0x0,%xmm1,%xmm3
-  DB  196,226,97,64,202                   ; vpmulld       %xmm2,%xmm3,%xmm1
-  DB  196,227,125,25,210,1                ; vextractf128  $0x1,%ymm2,%xmm2
-  DB  196,226,97,64,210                   ; vpmulld       %xmm2,%xmm3,%xmm2
-  DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,57,118,192                   ; vpcmpeqd      %xmm8,%xmm8,%xmm8
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
+  DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
+  DB  197,252,93,210                      ; vminps        %ymm2,%ymm0,%ymm2
+  DB  196,226,125,24,64,16                ; vbroadcastss  0x10(%rax),%ymm0
   DB  196,227,125,25,195,1                ; vextractf128  $0x1,%ymm0,%xmm3
-  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
-  DB  196,227,249,22,208,1                ; vpextrq       $0x1,%xmm2,%rax
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,121,254,192                 ; vpaddd        %xmm8,%xmm0,%xmm0
+  DB  196,227,125,24,195,1                ; vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
+  DB  197,244,93,192                      ; vminps        %ymm0,%ymm1,%ymm0
+  DB  76,139,0                            ; mov           (%rax),%r8
+  DB  197,254,91,200                      ; vcvttps2dq    %ymm0,%ymm1
+  DB  197,249,110,64,8                    ; vmovd         0x8(%rax),%xmm0
+  DB  197,249,112,216,0                   ; vpshufd       $0x0,%xmm0,%xmm3
+  DB  196,226,97,64,193                   ; vpmulld       %xmm1,%xmm3,%xmm0
+  DB  196,227,125,25,201,1                ; vextractf128  $0x1,%ymm1,%xmm1
+  DB  196,226,97,64,201                   ; vpmulld       %xmm1,%xmm3,%xmm1
+  DB  197,254,91,210                      ; vcvttps2dq    %ymm2,%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
+  DB  196,227,249,22,200,1                ; vpextrq       $0x1,%xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  196,193,249,126,210                 ; vmovq         %xmm2,%r10
+  DB  196,193,249,126,202                 ; vmovq         %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
-  DB  197,241,254,192                     ; vpaddd        %xmm0,%xmm1,%xmm0
+  DB  197,249,254,194                     ; vpaddd        %xmm2,%xmm0,%xmm0
   DB  196,227,249,22,195,1                ; vpextrq       $0x1,%xmm0,%rbx
   DB  65,137,222                          ; mov           %ebx,%r14d
   DB  72,193,235,32                       ; shr           $0x20,%rbx
@@ -11580,25 +11654,25 @@
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,216,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm3
-  DB  196,226,125,24,5,255,241,1,0        ; vbroadcastss  0x1f1ff(%rip),%ymm0        # 2b5dc <_sk_srcover_rgba_8888_sse2_lowp+0x934>
+  DB  196,226,125,24,5,149,243,1,0        ; vbroadcastss  0x1f395(%rip),%ymm0        # 2b93c <_sk_srcover_rgba_8888_sse2_lowp+0x938>
   DB  197,228,84,192                      ; vandps        %ymm0,%ymm3,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,226,125,24,13,242,241,1,0       ; vbroadcastss  0x1f1f2(%rip),%ymm1        # 2b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x938>
+  DB  196,226,125,24,13,136,243,1,0       ; vbroadcastss  0x1f388(%rip),%ymm1        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
   DB  197,252,89,193                      ; vmulps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,233,241,1,0       ; vbroadcastss  0x1f1e9(%rip),%ymm1        # 2b5e4 <_sk_srcover_rgba_8888_sse2_lowp+0x93c>
+  DB  196,226,125,24,13,127,243,1,0       ; vbroadcastss  0x1f37f(%rip),%ymm1        # 2b944 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
   DB  197,228,84,201                      ; vandps        %ymm1,%ymm3,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,226,125,24,21,220,241,1,0       ; vbroadcastss  0x1f1dc(%rip),%ymm2        # 2b5e8 <_sk_srcover_rgba_8888_sse2_lowp+0x940>
+  DB  196,226,125,24,21,114,243,1,0       ; vbroadcastss  0x1f372(%rip),%ymm2        # 2b948 <_sk_srcover_rgba_8888_sse2_lowp+0x944>
   DB  197,244,89,202                      ; vmulps        %ymm2,%ymm1,%ymm1
-  DB  196,226,125,24,21,211,241,1,0       ; vbroadcastss  0x1f1d3(%rip),%ymm2        # 2b5ec <_sk_srcover_rgba_8888_sse2_lowp+0x944>
+  DB  196,226,125,24,21,105,243,1,0       ; vbroadcastss  0x1f369(%rip),%ymm2        # 2b94c <_sk_srcover_rgba_8888_sse2_lowp+0x948>
   DB  197,228,84,210                      ; vandps        %ymm2,%ymm3,%ymm2
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
-  DB  196,98,125,24,5,198,241,1,0         ; vbroadcastss  0x1f1c6(%rip),%ymm8        # 2b5f0 <_sk_srcover_rgba_8888_sse2_lowp+0x948>
+  DB  196,98,125,24,5,92,243,1,0          ; vbroadcastss  0x1f35c(%rip),%ymm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
   DB  196,193,108,89,208                  ; vmulps        %ymm8,%ymm2,%ymm2
-  DB  196,98,125,24,5,188,241,1,0         ; vbroadcastss  0x1f1bc(%rip),%ymm8        # 2b5f4 <_sk_srcover_rgba_8888_sse2_lowp+0x94c>
+  DB  196,98,125,24,5,82,243,1,0          ; vbroadcastss  0x1f352(%rip),%ymm8        # 2b954 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
   DB  196,193,100,84,216                  ; vandps        %ymm8,%ymm3,%ymm3
   DB  197,252,91,219                      ; vcvtdq2ps     %ymm3,%ymm3
-  DB  196,98,125,24,5,174,241,1,0         ; vbroadcastss  0x1f1ae(%rip),%ymm8        # 2b5f8 <_sk_srcover_rgba_8888_sse2_lowp+0x950>
+  DB  196,98,125,24,5,68,243,1,0          ; vbroadcastss  0x1f344(%rip),%ymm8        # 2b958 <_sk_srcover_rgba_8888_sse2_lowp+0x954>
   DB  196,193,100,89,216                  ; vmulps        %ymm8,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
@@ -11617,7 +11691,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,130,241,1,0         ; vbroadcastss  0x1f182(%rip),%ymm8        # 2b5fc <_sk_srcover_rgba_8888_sse2_lowp+0x954>
+  DB  196,98,125,24,5,24,243,1,0          ; vbroadcastss  0x1f318(%rip),%ymm8        # 2b95c <_sk_srcover_rgba_8888_sse2_lowp+0x958>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,193,41,114,241,12               ; vpslld        $0xc,%xmm9,%xmm10
@@ -11644,7 +11718,7 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,66,57,43,193                    ; vpackusdw     %xmm9,%xmm8,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           c513 <_sk_store_4444_avx+0xb8>
+  DB  117,10                              ; jne           c6dd <_sk_store_4444_avx+0xb8>
   DB  196,1,122,127,4,88                  ; vmovdqu       %xmm8,(%r8,%r11,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11652,41 +11726,42 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            c50f <_sk_store_4444_avx+0xb4>
+  DB  119,236                             ; ja            c6d9 <_sk_store_4444_avx+0xb4>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,66,0,0,0                  ; lea           0x42(%rip),%r10        # c570 <_sk_store_4444_avx+0x115>
+  DB  76,141,21,68,0,0,0                  ; lea           0x44(%rip),%r10        # c73c <_sk_store_4444_avx+0x117>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,3,121,21,4,88,0                 ; vpextrw       $0x0,%xmm8,(%r8,%r11,2)
-  DB  235,207                             ; jmp           c50f <_sk_store_4444_avx+0xb4>
+  DB  235,207                             ; jmp           c6d9 <_sk_store_4444_avx+0xb4>
   DB  196,3,121,21,68,88,4,2              ; vpextrw       $0x2,%xmm8,0x4(%r8,%r11,2)
   DB  196,1,121,126,4,88                  ; vmovd         %xmm8,(%r8,%r11,2)
-  DB  235,191                             ; jmp           c50f <_sk_store_4444_avx+0xb4>
+  DB  235,191                             ; jmp           c6d9 <_sk_store_4444_avx+0xb4>
   DB  196,3,121,21,68,88,12,6             ; vpextrw       $0x6,%xmm8,0xc(%r8,%r11,2)
   DB  196,3,121,21,68,88,10,5             ; vpextrw       $0x5,%xmm8,0xa(%r8,%r11,2)
   DB  196,3,121,21,68,88,8,4              ; vpextrw       $0x4,%xmm8,0x8(%r8,%r11,2)
   DB  196,1,121,214,4,88                  ; vmovq         %xmm8,(%r8,%r11,2)
-  DB  235,159                             ; jmp           c50f <_sk_store_4444_avx+0xb4>
-  DB  199                                 ; (bad)
+  DB  235,159                             ; jmp           c6d9 <_sk_store_4444_avx+0xb4>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  197,255,255                         ; (bad)
+  DB  255,214                             ; callq         *%rsi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,206                             ; dec           %esi
+  DB  255                                 ; (bad)
+  DB  255                                 ; (bad)
+  DB  255,246                             ; push          %rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  216,255                             ; fdivr         %st(7),%st
+  DB  238                                 ; out           %al,(%dx)
   DB  255                                 ; (bad)
-  DB  255,208                             ; callq         *%rax
+  DB  255                                 ; (bad)
+  DB  255,230                             ; jmpq          *%rsi
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  248                                 ; clc
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255,240                             ; push          %rax
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  232,255,255,255,224                 ; callq         ffffffffe100c588 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe0fe18e0>
-  DB  255                                 ; (bad)
+  DB  222,255                             ; fdivrp        %st,%st(7)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
 
@@ -11700,12 +11775,12 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           c633 <_sk_load_8888_avx+0xa7>
+  DB  15,133,135,0,0,0                    ; jne           c7ff <_sk_load_8888_avx+0xa7>
   DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,70,237,1,0            ; vmovapd       0x1ed46(%rip),%ymm10        # 2b300 <_sk_srcover_rgba_8888_sse2_lowp+0x658>
+  DB  197,125,40,21,218,238,1,0           ; vmovapd       0x1eeda(%rip),%ymm10        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x65c>
   DB  196,193,53,84,194                   ; vandpd        %ymm10,%ymm9,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,5,144,239,1,0         ; vbroadcastss  0x1ef90(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,36,241,1,0          ; vbroadcastss  0x1f124(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,192                  ; vmulps        %ymm8,%ymm0,%ymm0
   DB  196,193,113,114,209,8               ; vpsrld        $0x8,%xmm9,%xmm1
   DB  196,99,125,25,203,1                 ; vextractf128  $0x1,%ymm9,%xmm3
@@ -11732,21 +11807,21 @@
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            c5b2 <_sk_load_8888_avx+0x26>
+  DB  15,135,102,255,255,255              ; ja            c77e <_sk_load_8888_avx+0x26>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # c6e8 <_sk_load_8888_avx+0x15c>
+  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # c8b4 <_sk_load_8888_avx+0x15c>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          c5b2 <_sk_load_8888_avx+0x26>
+  DB  233,71,255,255,255                  ; jmpq          c77e <_sk_load_8888_avx+0x26>
   DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,200,4                 ; vblendps      $0x4,%ymm0,%ymm1,%ymm9
   DB  196,129,123,16,4,152                ; vmovsd        (%r8,%r11,4),%xmm0
   DB  196,99,53,13,200,1                  ; vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          c5b2 <_sk_load_8888_avx+0x26>
+  DB  233,32,255,255,255                  ; jmpq          c77e <_sk_load_8888_avx+0x26>
   DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -11760,9 +11835,9 @@
   DB  196,99,53,24,200,1                  ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   DB  196,129,121,16,4,152                ; vmovupd       (%r8,%r11,4),%xmm0
   DB  196,67,125,13,201,12                ; vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          c5b2 <_sk_load_8888_avx+0x26>
+  DB  233,203,254,255,255                 ; jmpq          c77e <_sk_load_8888_avx+0x26>
   DB  144                                 ; nop
-  DB  120,255                             ; js            c6e9 <_sk_load_8888_avx+0x15d>
+  DB  120,255                             ; js            c8b5 <_sk_load_8888_avx+0x15d>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
   DB  255                                 ; (bad)
@@ -11793,12 +11868,12 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           c7ab <_sk_load_8888_dst_avx+0xa7>
+  DB  15,133,135,0,0,0                    ; jne           c977 <_sk_load_8888_dst_avx+0xa7>
   DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,238,235,1,0           ; vmovapd       0x1ebee(%rip),%ymm10        # 2b320 <_sk_srcover_rgba_8888_sse2_lowp+0x678>
+  DB  197,125,40,21,130,237,1,0           ; vmovapd       0x1ed82(%rip),%ymm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x67c>
   DB  196,193,53,84,226                   ; vandpd        %ymm10,%ymm9,%ymm4
   DB  197,252,91,228                      ; vcvtdq2ps     %ymm4,%ymm4
-  DB  196,98,125,24,5,24,238,1,0          ; vbroadcastss  0x1ee18(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,172,239,1,0         ; vbroadcastss  0x1efac(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,92,89,224                   ; vmulps        %ymm8,%ymm4,%ymm4
   DB  196,193,81,114,209,8                ; vpsrld        $0x8,%xmm9,%xmm5
   DB  196,99,125,25,207,1                 ; vextractf128  $0x1,%ymm9,%xmm7
@@ -11825,21 +11900,21 @@
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            c72a <_sk_load_8888_dst_avx+0x26>
+  DB  15,135,102,255,255,255              ; ja            c8f6 <_sk_load_8888_dst_avx+0x26>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # c860 <_sk_load_8888_dst_avx+0x15c>
+  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # ca2c <_sk_load_8888_dst_avx+0x15c>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          c72a <_sk_load_8888_dst_avx+0x26>
+  DB  233,71,255,255,255                  ; jmpq          c8f6 <_sk_load_8888_dst_avx+0x26>
   DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm9
   DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
   DB  196,99,53,13,204,1                  ; vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          c72a <_sk_load_8888_dst_avx+0x26>
+  DB  233,32,255,255,255                  ; jmpq          c8f6 <_sk_load_8888_dst_avx+0x26>
   DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
@@ -11853,9 +11928,9 @@
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
   DB  196,67,93,13,201,12                 ; vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          c72a <_sk_load_8888_dst_avx+0x26>
+  DB  233,203,254,255,255                 ; jmpq          c8f6 <_sk_load_8888_dst_avx+0x26>
   DB  144                                 ; nop
-  DB  120,255                             ; js            c861 <_sk_load_8888_dst_avx+0x15d>
+  DB  120,255                             ; js            ca2d <_sk_load_8888_dst_avx+0x15d>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
   DB  255                                 ; (bad)
@@ -11883,6 +11958,22 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,57,118,192                   ; vpcmpeqd      %xmm8,%xmm8,%xmm8
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
+  DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,24,80,16                ; vbroadcastss  0x10(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  197,249,110,80,8                    ; vmovd         0x8(%rax),%xmm2
@@ -11915,10 +12006,10 @@
   DB  196,131,121,34,4,176,2              ; vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   DB  196,195,121,34,28,152,3             ; vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   DB  196,227,61,24,195,1                 ; vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  DB  197,124,40,21,18,234,1,0            ; vmovaps       0x1ea12(%rip),%ymm10        # 2b340 <_sk_srcover_rgba_8888_sse2_lowp+0x698>
+  DB  197,124,40,21,84,235,1,0            ; vmovaps       0x1eb54(%rip),%ymm10        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x69c>
   DB  196,193,124,84,194                  ; vandps        %ymm10,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,28,236,1,0         ; vbroadcastss  0x1ec1c(%rip),%ymm9        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,13,94,237,1,0         ; vbroadcastss  0x1ed5e(%rip),%ymm9        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  196,193,113,114,208,8               ; vpsrld        $0x8,%xmm8,%xmm1
   DB  197,233,114,211,8                   ; vpsrld        $0x8,%xmm3,%xmm2
@@ -11953,7 +12044,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,76,235,1,0          ; vbroadcastss  0x1eb4c(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,142,236,1,0         ; vbroadcastss  0x1ec8e(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,65,116,89,208                   ; vmulps        %ymm8,%ymm1,%ymm10
@@ -11978,7 +12069,7 @@
   DB  196,65,45,86,192                    ; vorpd         %ymm8,%ymm10,%ymm8
   DB  196,65,53,86,192                    ; vorpd         %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           ca56 <_sk_store_8888_avx+0xae>
+  DB  117,10                              ; jne           cc74 <_sk_store_8888_avx+0xae>
   DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -11986,17 +12077,17 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            ca52 <_sk_store_8888_avx+0xaa>
+  DB  119,236                             ; ja            cc70 <_sk_store_8888_avx+0xaa>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,83,0,0,0                  ; lea           0x53(%rip),%r10        # cac4 <_sk_store_8888_avx+0x11c>
+  DB  76,141,21,85,0,0,0                  ; lea           0x55(%rip),%r10        # cce4 <_sk_store_8888_avx+0x11e>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           ca52 <_sk_store_8888_avx+0xaa>
+  DB  235,208                             ; jmp           cc70 <_sk_store_8888_avx+0xaa>
   DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           ca52 <_sk_store_8888_avx+0xaa>
+  DB  235,192                             ; jmp           cc70 <_sk_store_8888_avx+0xaa>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
@@ -12004,25 +12095,22 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,1,122,17,76,152,16              ; vmovss        %xmm9,0x10(%r8,%r11,4)
   DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           ca52 <_sk_store_8888_avx+0xaa>
-  DB  144                                 ; nop
-  DB  182,255                             ; mov           $0xff,%dh
+  DB  235,143                             ; jmp           cc70 <_sk_store_8888_avx+0xaa>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  180,255                             ; mov           $0xff,%ah
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,196                             ; inc           %esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
+  DB  188,255,255,255,245                 ; mov           $0xf5ffffff,%esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  232,255,255,255,218                 ; callq         ffffffffdb00ccf8 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdafe1cf4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,204                             ; dec           %esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -12037,12 +12125,12 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           cb87 <_sk_load_bgra_avx+0xa7>
+  DB  15,133,135,0,0,0                    ; jne           cda7 <_sk_load_bgra_avx+0xa7>
   DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,82,232,1,0            ; vmovapd       0x1e852(%rip),%ymm10        # 2b360 <_sk_srcover_rgba_8888_sse2_lowp+0x6b8>
+  DB  197,125,40,21,146,233,1,0           ; vmovapd       0x1e992(%rip),%ymm10        # 2b6c0 <_sk_srcover_rgba_8888_sse2_lowp+0x6bc>
   DB  196,193,53,84,202                   ; vandpd        %ymm10,%ymm9,%ymm1
   DB  197,252,91,201                      ; vcvtdq2ps     %ymm1,%ymm1
-  DB  196,98,125,24,5,60,234,1,0          ; vbroadcastss  0x1ea3c(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,124,235,1,0         ; vbroadcastss  0x1eb7c(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,116,89,208                  ; vmulps        %ymm8,%ymm1,%ymm2
   DB  196,193,113,114,209,8               ; vpsrld        $0x8,%xmm9,%xmm1
   DB  196,99,125,25,203,1                 ; vextractf128  $0x1,%ymm9,%xmm3
@@ -12069,21 +12157,21 @@
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            cb06 <_sk_load_bgra_avx+0x26>
+  DB  15,135,102,255,255,255              ; ja            cd26 <_sk_load_bgra_avx+0x26>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # cc3c <_sk_load_bgra_avx+0x15c>
+  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # ce5c <_sk_load_bgra_avx+0x15c>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          cb06 <_sk_load_bgra_avx+0x26>
+  DB  233,71,255,255,255                  ; jmpq          cd26 <_sk_load_bgra_avx+0x26>
   DB  196,129,121,110,68,152,8            ; vmovd         0x8(%r8,%r11,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,99,117,12,200,4                 ; vblendps      $0x4,%ymm0,%ymm1,%ymm9
   DB  196,129,123,16,4,152                ; vmovsd        (%r8,%r11,4),%xmm0
   DB  196,99,53,13,200,1                  ; vblendpd      $0x1,%ymm0,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          cb06 <_sk_load_bgra_avx+0x26>
+  DB  233,32,255,255,255                  ; jmpq          cd26 <_sk_load_bgra_avx+0x26>
   DB  196,129,121,110,68,152,24           ; vmovd         0x18(%r8,%r11,4),%xmm0
   DB  197,249,112,192,68                  ; vpshufd       $0x44,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
@@ -12097,9 +12185,9 @@
   DB  196,99,53,24,200,1                  ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm9
   DB  196,129,121,16,4,152                ; vmovupd       (%r8,%r11,4),%xmm0
   DB  196,67,125,13,201,12                ; vblendpd      $0xc,%ymm9,%ymm0,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          cb06 <_sk_load_bgra_avx+0x26>
+  DB  233,203,254,255,255                 ; jmpq          cd26 <_sk_load_bgra_avx+0x26>
   DB  144                                 ; nop
-  DB  120,255                             ; js            cc3d <_sk_load_bgra_avx+0x15d>
+  DB  120,255                             ; js            ce5d <_sk_load_bgra_avx+0x15d>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
   DB  255                                 ; (bad)
@@ -12130,12 +12218,12 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,135,0,0,0                    ; jne           ccff <_sk_load_bgra_dst_avx+0xa7>
+  DB  15,133,135,0,0,0                    ; jne           cf1f <_sk_load_bgra_dst_avx+0xa7>
   DB  196,1,125,16,12,152                 ; vmovupd       (%r8,%r11,4),%ymm9
-  DB  197,125,40,21,250,230,1,0           ; vmovapd       0x1e6fa(%rip),%ymm10        # 2b380 <_sk_srcover_rgba_8888_sse2_lowp+0x6d8>
+  DB  197,125,40,21,58,232,1,0            ; vmovapd       0x1e83a(%rip),%ymm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0x6dc>
   DB  196,193,53,84,234                   ; vandpd        %ymm10,%ymm9,%ymm5
   DB  197,252,91,237                      ; vcvtdq2ps     %ymm5,%ymm5
-  DB  196,98,125,24,5,196,232,1,0         ; vbroadcastss  0x1e8c4(%rip),%ymm8        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,5,4,234,1,0           ; vbroadcastss  0x1ea04(%rip),%ymm8        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,84,89,240                   ; vmulps        %ymm8,%ymm5,%ymm6
   DB  196,193,81,114,209,8                ; vpsrld        $0x8,%xmm9,%xmm5
   DB  196,99,125,25,207,1                 ; vextractf128  $0x1,%ymm9,%xmm7
@@ -12162,21 +12250,21 @@
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  15,135,102,255,255,255              ; ja            cc7e <_sk_load_bgra_dst_avx+0x26>
+  DB  15,135,102,255,255,255              ; ja            ce9e <_sk_load_bgra_dst_avx+0x26>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # cdb4 <_sk_load_bgra_dst_avx+0x15c>
+  DB  76,141,21,145,0,0,0                 ; lea           0x91(%rip),%r10        # cfd4 <_sk_load_bgra_dst_avx+0x15c>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,122,16,12,152                 ; vmovss        (%r8,%r11,4),%xmm9
-  DB  233,71,255,255,255                  ; jmpq          cc7e <_sk_load_bgra_dst_avx+0x26>
+  DB  233,71,255,255,255                  ; jmpq          ce9e <_sk_load_bgra_dst_avx+0x26>
   DB  196,129,121,110,100,152,8           ; vmovd         0x8(%r8,%r11,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  197,212,87,237                      ; vxorps        %ymm5,%ymm5,%ymm5
   DB  196,99,85,12,204,4                  ; vblendps      $0x4,%ymm4,%ymm5,%ymm9
   DB  196,129,123,16,36,152               ; vmovsd        (%r8,%r11,4),%xmm4
   DB  196,99,53,13,204,1                  ; vblendpd      $0x1,%ymm4,%ymm9,%ymm9
-  DB  233,32,255,255,255                  ; jmpq          cc7e <_sk_load_bgra_dst_avx+0x26>
+  DB  233,32,255,255,255                  ; jmpq          ce9e <_sk_load_bgra_dst_avx+0x26>
   DB  196,129,121,110,100,152,24          ; vmovd         0x18(%r8,%r11,4),%xmm4
   DB  197,249,112,228,68                  ; vpshufd       $0x44,%xmm4,%xmm4
   DB  196,227,125,24,228,1                ; vinsertf128   $0x1,%xmm4,%ymm0,%ymm4
@@ -12190,9 +12278,9 @@
   DB  196,99,53,24,204,1                  ; vinsertf128   $0x1,%xmm4,%ymm9,%ymm9
   DB  196,129,121,16,36,152               ; vmovupd       (%r8,%r11,4),%xmm4
   DB  196,67,93,13,201,12                 ; vblendpd      $0xc,%ymm9,%ymm4,%ymm9
-  DB  233,203,254,255,255                 ; jmpq          cc7e <_sk_load_bgra_dst_avx+0x26>
+  DB  233,203,254,255,255                 ; jmpq          ce9e <_sk_load_bgra_dst_avx+0x26>
   DB  144                                 ; nop
-  DB  120,255                             ; js            cdb5 <_sk_load_bgra_dst_avx+0x15d>
+  DB  120,255                             ; js            cfd5 <_sk_load_bgra_dst_avx+0x15d>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,131             ; lcall         *-0x7c000001(%rcx)
   DB  255                                 ; (bad)
@@ -12220,6 +12308,22 @@
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,57,118,192                   ; vpcmpeqd      %xmm8,%xmm8,%xmm8
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
+  DB  197,180,95,192                      ; vmaxps        %ymm0,%ymm9,%ymm0
+  DB  197,252,93,194                      ; vminps        %ymm2,%ymm0,%ymm0
+  DB  196,226,125,24,80,16                ; vbroadcastss  0x10(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,193,97,254,216                  ; vpaddd        %xmm8,%xmm3,%xmm3
+  DB  196,193,105,254,208                 ; vpaddd        %xmm8,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  197,180,95,201                      ; vmaxps        %ymm1,%ymm9,%ymm1
+  DB  197,244,93,202                      ; vminps        %ymm2,%ymm1,%ymm1
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,254,91,201                      ; vcvttps2dq    %ymm1,%ymm1
   DB  197,249,110,80,8                    ; vmovd         0x8(%rax),%xmm2
@@ -12252,10 +12356,10 @@
   DB  196,131,121,34,4,176,2              ; vpinsrd       $0x2,(%r8,%r14,4),%xmm0,%xmm0
   DB  196,195,121,34,28,152,3             ; vpinsrd       $0x3,(%r8,%rbx,4),%xmm0,%xmm3
   DB  196,227,61,24,195,1                 ; vinsertf128   $0x1,%xmm3,%ymm8,%ymm0
-  DB  197,124,40,13,30,229,1,0            ; vmovaps       0x1e51e(%rip),%ymm9        # 2b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0x6f8>
+  DB  197,124,40,13,12,230,1,0            ; vmovaps       0x1e60c(%rip),%ymm9        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0x6fc>
   DB  196,193,124,84,193                  ; vandps        %ymm9,%ymm0,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,21,200,230,1,0        ; vbroadcastss  0x1e6c8(%rip),%ymm10        # 2b55c <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
+  DB  196,98,125,24,21,182,231,1,0        ; vbroadcastss  0x1e7b6(%rip),%ymm10        # 2b8bc <_sk_srcover_rgba_8888_sse2_lowp+0x8b8>
   DB  196,193,124,89,210                  ; vmulps        %ymm10,%ymm0,%ymm2
   DB  196,193,121,114,208,8               ; vpsrld        $0x8,%xmm8,%xmm0
   DB  197,241,114,211,8                   ; vpsrld        $0x8,%xmm3,%xmm1
@@ -12290,7 +12394,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,218                           ; movslq        %edx,%r11
-  DB  196,98,125,24,5,248,229,1,0         ; vbroadcastss  0x1e5f8(%rip),%ymm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  196,98,125,24,5,230,230,1,0         ; vbroadcastss  0x1e6e6(%rip),%ymm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  196,65,108,89,200                   ; vmulps        %ymm8,%ymm2,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,65,116,89,208                   ; vmulps        %ymm8,%ymm1,%ymm10
@@ -12315,7 +12419,7 @@
   DB  196,65,45,86,192                    ; vorpd         %ymm8,%ymm10,%ymm8
   DB  196,65,53,86,192                    ; vorpd         %ymm8,%ymm9,%ymm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           cfaa <_sk_store_bgra_avx+0xae>
+  DB  117,10                              ; jne           d21c <_sk_store_bgra_avx+0xae>
   DB  196,1,124,17,4,152                  ; vmovups       %ymm8,(%r8,%r11,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -12323,17 +12427,17 @@
   DB  65,128,225,7                        ; and           $0x7,%r9b
   DB  65,254,201                          ; dec           %r9b
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,236                             ; ja            cfa6 <_sk_store_bgra_avx+0xaa>
+  DB  119,236                             ; ja            d218 <_sk_store_bgra_avx+0xaa>
   DB  69,15,182,201                       ; movzbl        %r9b,%r9d
-  DB  76,141,21,83,0,0,0                  ; lea           0x53(%rip),%r10        # d018 <_sk_store_bgra_avx+0x11c>
+  DB  76,141,21,85,0,0,0                  ; lea           0x55(%rip),%r10        # d28c <_sk_store_bgra_avx+0x11e>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,1,121,126,4,152                 ; vmovd         %xmm8,(%r8,%r11,4)
-  DB  235,208                             ; jmp           cfa6 <_sk_store_bgra_avx+0xaa>
+  DB  235,208                             ; jmp           d218 <_sk_store_bgra_avx+0xaa>
   DB  196,3,121,22,68,152,8,2             ; vpextrd       $0x2,%xmm8,0x8(%r8,%r11,4)
   DB  196,1,121,214,4,152                 ; vmovq         %xmm8,(%r8,%r11,4)
-  DB  235,192                             ; jmp           cfa6 <_sk_store_bgra_avx+0xaa>
+  DB  235,192                             ; jmp           d218 <_sk_store_bgra_avx+0xaa>
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,3,121,22,76,152,24,2            ; vpextrd       $0x2,%xmm9,0x18(%r8,%r11,4)
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
@@ -12341,25 +12445,22 @@
   DB  196,67,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm9
   DB  196,1,122,17,76,152,16              ; vmovss        %xmm9,0x10(%r8,%r11,4)
   DB  196,1,121,17,4,152                  ; vmovupd       %xmm8,(%r8,%r11,4)
-  DB  235,143                             ; jmp           cfa6 <_sk_store_bgra_avx+0xaa>
-  DB  144                                 ; nop
-  DB  182,255                             ; mov           $0xff,%dh
+  DB  235,143                             ; jmp           d218 <_sk_store_bgra_avx+0xaa>
+  DB  15,31,0                             ; nopl          (%rax)
+  DB  180,255                             ; mov           $0xff,%ah
   DB  255                                 ; (bad)
-  DB  255,198                             ; inc           %esi
+  DB  255,196                             ; inc           %esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  190,255,255,255,247                 ; mov           $0xf7ffffff,%esi
+  DB  188,255,255,255,245                 ; mov           $0xf5ffffff,%esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  234                                 ; (bad)
+  DB  232,255,255,255,218                 ; callq         ffffffffdb00d2a0 <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffdafe229c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; (bad)
-  DB  220,255                             ; fdivr         %st,%st(7)
-  DB  255                                 ; (bad)
-  DB  255,206                             ; dec           %esi
+  DB  255,204                             ; dec           %esp
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -12379,7 +12480,7 @@
   DB  197,252,17,116,36,64                ; vmovups       %ymm6,0x40(%rsp)
   DB  197,252,17,108,36,32                ; vmovups       %ymm5,0x20(%rsp)
   DB  197,252,17,36,36                    ; vmovups       %ymm4,(%rsp)
-  DB  15,133,33,2,0,0                     ; jne           d293 <_sk_load_f16_avx+0x25f>
+  DB  15,133,33,2,0,0                     ; jne           d507 <_sk_load_f16_avx+0x25f>
   DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
   DB  196,193,121,16,84,192,16            ; vmovupd       0x10(%r8,%rax,8),%xmm2
   DB  196,193,121,16,92,192,32            ; vmovupd       0x20(%r8,%rax,8),%xmm3
@@ -12396,14 +12497,14 @@
   DB  196,226,121,51,200                  ; vpmovzxwd     %xmm0,%xmm1
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
-  DB  197,123,18,21,13,238,1,0            ; vmovddup      0x1ee0d(%rip),%xmm10        # 2bed8 <_sk_srcover_rgba_8888_sse2_lowp+0x1230>
+  DB  197,123,18,21,249,238,1,0           ; vmovddup      0x1eef9(%rip),%xmm10        # 2c238 <_sk_srcover_rgba_8888_sse2_lowp+0x1234>
   DB  196,193,121,219,218                 ; vpand         %xmm10,%xmm0,%xmm3
-  DB  196,98,121,24,29,139,229,1,0        ; vbroadcastss  0x1e58b(%rip),%xmm11        # 2b664 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  DB  196,98,121,24,29,119,230,1,0        ; vbroadcastss  0x1e677(%rip),%xmm11        # 2b9c4 <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
   DB  197,33,102,227                      ; vpcmpgtd      %xmm3,%xmm11,%xmm12
   DB  196,193,113,219,210                 ; vpand         %xmm10,%xmm1,%xmm2
   DB  197,33,102,234                      ; vpcmpgtd      %xmm2,%xmm11,%xmm13
   DB  196,195,21,24,252,1                 ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm7
-  DB  197,123,18,37,236,237,1,0           ; vmovddup      0x1edec(%rip),%xmm12        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0x1238>
+  DB  197,123,18,37,216,238,1,0           ; vmovddup      0x1eed8(%rip),%xmm12        # 2c240 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
   DB  196,193,113,219,204                 ; vpand         %xmm12,%xmm1,%xmm1
   DB  197,241,114,241,16                  ; vpslld        $0x10,%xmm1,%xmm1
   DB  196,193,121,219,196                 ; vpand         %xmm12,%xmm0,%xmm0
@@ -12412,7 +12513,7 @@
   DB  197,241,235,202                     ; vpor          %xmm2,%xmm1,%xmm1
   DB  197,233,114,243,13                  ; vpslld        $0xd,%xmm3,%xmm2
   DB  197,249,235,194                     ; vpor          %xmm2,%xmm0,%xmm0
-  DB  196,226,121,24,29,69,229,1,0        ; vbroadcastss  0x1e545(%rip),%xmm3        # 2b668 <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  DB  196,226,121,24,29,49,230,1,0        ; vbroadcastss  0x1e631(%rip),%xmm3        # 2b9c8 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   DB  197,249,254,195                     ; vpaddd        %xmm3,%xmm0,%xmm0
   DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
@@ -12491,29 +12592,29 @@
   DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            d2f9 <_sk_load_f16_avx+0x2c5>
+  DB  116,85                              ; je            d56d <_sk_load_f16_avx+0x2c5>
   DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            d2f9 <_sk_load_f16_avx+0x2c5>
+  DB  114,72                              ; jb            d56d <_sk_load_f16_avx+0x2c5>
   DB  196,193,123,16,84,192,16            ; vmovsd        0x10(%r8,%rax,8),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            d306 <_sk_load_f16_avx+0x2d2>
+  DB  116,72                              ; je            d57a <_sk_load_f16_avx+0x2d2>
   DB  196,193,105,22,84,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            d306 <_sk_load_f16_avx+0x2d2>
+  DB  114,59                              ; jb            d57a <_sk_load_f16_avx+0x2d2>
   DB  196,193,123,16,92,192,32            ; vmovsd        0x20(%r8,%rax,8),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,177,253,255,255              ; je            d08d <_sk_load_f16_avx+0x59>
+  DB  15,132,177,253,255,255              ; je            d301 <_sk_load_f16_avx+0x59>
   DB  196,193,97,22,92,192,40             ; vmovhpd       0x28(%r8,%rax,8),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,160,253,255,255              ; jb            d08d <_sk_load_f16_avx+0x59>
+  DB  15,130,160,253,255,255              ; jb            d301 <_sk_load_f16_avx+0x59>
   DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,148,253,255,255                 ; jmpq          d08d <_sk_load_f16_avx+0x59>
+  DB  233,148,253,255,255                 ; jmpq          d301 <_sk_load_f16_avx+0x59>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,135,253,255,255                 ; jmpq          d08d <_sk_load_f16_avx+0x59>
+  DB  233,135,253,255,255                 ; jmpq          d301 <_sk_load_f16_avx+0x59>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,126,253,255,255                 ; jmpq          d08d <_sk_load_f16_avx+0x59>
+  DB  233,126,253,255,255                 ; jmpq          d301 <_sk_load_f16_avx+0x59>
 
 PUBLIC _sk_load_f16_dst_avx
 _sk_load_f16_dst_avx LABEL PROC
@@ -12530,7 +12631,7 @@
   DB  197,252,17,84,36,64                 ; vmovups       %ymm2,0x40(%rsp)
   DB  197,252,17,76,36,32                 ; vmovups       %ymm1,0x20(%rsp)
   DB  197,252,17,4,36                     ; vmovups       %ymm0,(%rsp)
-  DB  15,133,33,2,0,0                     ; jne           d56e <_sk_load_f16_dst_avx+0x25f>
+  DB  15,133,33,2,0,0                     ; jne           d7e2 <_sk_load_f16_dst_avx+0x25f>
   DB  196,65,121,16,4,192                 ; vmovupd       (%r8,%rax,8),%xmm8
   DB  196,193,121,16,116,192,16           ; vmovupd       0x10(%r8,%rax,8),%xmm6
   DB  196,193,121,16,124,192,32           ; vmovupd       0x20(%r8,%rax,8),%xmm7
@@ -12547,14 +12648,14 @@
   DB  196,226,121,51,236                  ; vpmovzxwd     %xmm4,%xmm5
   DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
   DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
-  DB  197,123,18,21,50,235,1,0            ; vmovddup      0x1eb32(%rip),%xmm10        # 2bed8 <_sk_srcover_rgba_8888_sse2_lowp+0x1230>
+  DB  197,123,18,21,30,236,1,0            ; vmovddup      0x1ec1e(%rip),%xmm10        # 2c238 <_sk_srcover_rgba_8888_sse2_lowp+0x1234>
   DB  196,193,89,219,250                  ; vpand         %xmm10,%xmm4,%xmm7
-  DB  196,98,121,24,29,176,226,1,0        ; vbroadcastss  0x1e2b0(%rip),%xmm11        # 2b664 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
+  DB  196,98,121,24,29,156,227,1,0        ; vbroadcastss  0x1e39c(%rip),%xmm11        # 2b9c4 <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
   DB  197,33,102,231                      ; vpcmpgtd      %xmm7,%xmm11,%xmm12
   DB  196,193,81,219,242                  ; vpand         %xmm10,%xmm5,%xmm6
   DB  197,33,102,238                      ; vpcmpgtd      %xmm6,%xmm11,%xmm13
   DB  196,195,21,24,220,1                 ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm3
-  DB  197,123,18,37,17,235,1,0            ; vmovddup      0x1eb11(%rip),%xmm12        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0x1238>
+  DB  197,123,18,37,253,235,1,0           ; vmovddup      0x1ebfd(%rip),%xmm12        # 2c240 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
   DB  196,193,81,219,236                  ; vpand         %xmm12,%xmm5,%xmm5
   DB  197,209,114,245,16                  ; vpslld        $0x10,%xmm5,%xmm5
   DB  196,193,89,219,228                  ; vpand         %xmm12,%xmm4,%xmm4
@@ -12563,7 +12664,7 @@
   DB  197,209,235,238                     ; vpor          %xmm6,%xmm5,%xmm5
   DB  197,201,114,247,13                  ; vpslld        $0xd,%xmm7,%xmm6
   DB  197,217,235,230                     ; vpor          %xmm6,%xmm4,%xmm4
-  DB  196,226,121,24,61,106,226,1,0       ; vbroadcastss  0x1e26a(%rip),%xmm7        # 2b668 <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  DB  196,226,121,24,61,86,227,1,0        ; vbroadcastss  0x1e356(%rip),%xmm7        # 2b9c8 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   DB  197,217,254,231                     ; vpaddd        %xmm7,%xmm4,%xmm4
   DB  197,209,254,239                     ; vpaddd        %xmm7,%xmm5,%xmm5
   DB  196,227,85,24,228,1                 ; vinsertf128   $0x1,%xmm4,%ymm5,%ymm4
@@ -12642,29 +12743,29 @@
   DB  196,65,123,16,4,192                 ; vmovsd        (%r8,%rax,8),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            d5d4 <_sk_load_f16_dst_avx+0x2c5>
+  DB  116,85                              ; je            d848 <_sk_load_f16_dst_avx+0x2c5>
   DB  196,65,57,22,68,192,8               ; vmovhpd       0x8(%r8,%rax,8),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            d5d4 <_sk_load_f16_dst_avx+0x2c5>
+  DB  114,72                              ; jb            d848 <_sk_load_f16_dst_avx+0x2c5>
   DB  196,193,123,16,116,192,16           ; vmovsd        0x10(%r8,%rax,8),%xmm6
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            d5e1 <_sk_load_f16_dst_avx+0x2d2>
+  DB  116,72                              ; je            d855 <_sk_load_f16_dst_avx+0x2d2>
   DB  196,193,73,22,116,192,24            ; vmovhpd       0x18(%r8,%rax,8),%xmm6,%xmm6
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            d5e1 <_sk_load_f16_dst_avx+0x2d2>
+  DB  114,59                              ; jb            d855 <_sk_load_f16_dst_avx+0x2d2>
   DB  196,193,123,16,124,192,32           ; vmovsd        0x20(%r8,%rax,8),%xmm7
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,177,253,255,255              ; je            d368 <_sk_load_f16_dst_avx+0x59>
+  DB  15,132,177,253,255,255              ; je            d5dc <_sk_load_f16_dst_avx+0x59>
   DB  196,193,65,22,124,192,40            ; vmovhpd       0x28(%r8,%rax,8),%xmm7,%xmm7
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,160,253,255,255              ; jb            d368 <_sk_load_f16_dst_avx+0x59>
+  DB  15,130,160,253,255,255              ; jb            d5dc <_sk_load_f16_dst_avx+0x59>
   DB  196,65,122,126,76,192,48            ; vmovq         0x30(%r8,%rax,8),%xmm9
-  DB  233,148,253,255,255                 ; jmpq          d368 <_sk_load_f16_dst_avx+0x59>
+  DB  233,148,253,255,255                 ; jmpq          d5dc <_sk_load_f16_dst_avx+0x59>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
   DB  197,201,87,246                      ; vxorpd        %xmm6,%xmm6,%xmm6
-  DB  233,135,253,255,255                 ; jmpq          d368 <_sk_load_f16_dst_avx+0x59>
+  DB  233,135,253,255,255                 ; jmpq          d5dc <_sk_load_f16_dst_avx+0x59>
   DB  197,193,87,255                      ; vxorpd        %xmm7,%xmm7,%xmm7
-  DB  233,126,253,255,255                 ; jmpq          d368 <_sk_load_f16_dst_avx+0x59>
+  DB  233,126,253,255,255                 ; jmpq          d5dc <_sk_load_f16_dst_avx+0x59>
 
 PUBLIC _sk_gather_f16_avx
 _sk_gather_f16_avx LABEL PROC
@@ -12672,29 +12773,45 @@
   DB  65,86                               ; push          %r14
   DB  65,84                               ; push          %r12
   DB  83                                  ; push          %rbx
-  DB  72,131,236,120                      ; sub           $0x78,%rsp
-  DB  197,252,17,124,36,64                ; vmovups       %ymm7,0x40(%rsp)
-  DB  197,252,17,116,36,32                ; vmovups       %ymm6,0x20(%rsp)
-  DB  197,252,17,44,36                    ; vmovups       %ymm5,(%rsp)
-  DB  197,252,40,236                      ; vmovaps       %ymm4,%ymm5
+  DB  72,129,236,152,0,0,0                ; sub           $0x98,%rsp
+  DB  197,252,17,124,36,96                ; vmovups       %ymm7,0x60(%rsp)
+  DB  197,252,17,116,36,64                ; vmovups       %ymm6,0x40(%rsp)
+  DB  197,252,17,108,36,32                ; vmovups       %ymm5,0x20(%rsp)
+  DB  197,252,17,36,36                    ; vmovups       %ymm4,(%rsp)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  76,139,0                            ; mov           (%rax),%r8
-  DB  197,254,91,209                      ; vcvttps2dq    %ymm1,%ymm2
-  DB  197,249,110,72,8                    ; vmovd         0x8(%rax),%xmm1
-  DB  197,249,112,217,0                   ; vpshufd       $0x0,%xmm1,%xmm3
-  DB  196,226,97,64,202                   ; vpmulld       %xmm2,%xmm3,%xmm1
-  DB  196,227,125,25,210,1                ; vextractf128  $0x1,%ymm2,%xmm2
-  DB  196,226,97,64,210                   ; vpmulld       %xmm2,%xmm3,%xmm2
-  DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
+  DB  196,226,125,24,80,12                ; vbroadcastss  0xc(%rax),%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  196,65,49,118,201                   ; vpcmpeqd      %xmm9,%xmm9,%xmm9
+  DB  196,193,97,254,217                  ; vpaddd        %xmm9,%xmm3,%xmm3
+  DB  196,193,105,254,209                 ; vpaddd        %xmm9,%xmm2,%xmm2
+  DB  196,227,109,24,211,1                ; vinsertf128   $0x1,%xmm3,%ymm2,%ymm2
+  DB  197,220,87,228                      ; vxorps        %ymm4,%ymm4,%ymm4
+  DB  197,220,95,192                      ; vmaxps        %ymm0,%ymm4,%ymm0
+  DB  197,252,93,210                      ; vminps        %ymm2,%ymm0,%ymm2
+  DB  196,226,125,24,64,16                ; vbroadcastss  0x10(%rax),%ymm0
   DB  196,227,125,25,195,1                ; vextractf128  $0x1,%ymm0,%xmm3
-  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
-  DB  196,227,249,22,208,1                ; vpextrq       $0x1,%xmm2,%rax
+  DB  196,193,97,254,217                  ; vpaddd        %xmm9,%xmm3,%xmm3
+  DB  196,193,121,254,193                 ; vpaddd        %xmm9,%xmm0,%xmm0
+  DB  196,227,125,24,195,1                ; vinsertf128   $0x1,%xmm3,%ymm0,%ymm0
+  DB  197,220,95,201                      ; vmaxps        %ymm1,%ymm4,%ymm1
+  DB  197,244,93,192                      ; vminps        %ymm0,%ymm1,%ymm0
+  DB  76,139,0                            ; mov           (%rax),%r8
+  DB  197,254,91,200                      ; vcvttps2dq    %ymm0,%ymm1
+  DB  197,249,110,64,8                    ; vmovd         0x8(%rax),%xmm0
+  DB  197,249,112,216,0                   ; vpshufd       $0x0,%xmm0,%xmm3
+  DB  196,226,97,64,193                   ; vpmulld       %xmm1,%xmm3,%xmm0
+  DB  196,227,125,25,201,1                ; vextractf128  $0x1,%ymm1,%xmm1
+  DB  196,226,97,64,201                   ; vpmulld       %xmm1,%xmm3,%xmm1
+  DB  197,254,91,210                      ; vcvttps2dq    %ymm2,%ymm2
+  DB  196,227,125,25,211,1                ; vextractf128  $0x1,%ymm2,%xmm3
+  DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
+  DB  196,227,249,22,200,1                ; vpextrq       $0x1,%xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  196,193,249,126,210                 ; vmovq         %xmm2,%r10
+  DB  196,193,249,126,202                 ; vmovq         %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
-  DB  197,241,254,192                     ; vpaddd        %xmm0,%xmm1,%xmm0
+  DB  197,249,254,194                     ; vpaddd        %xmm2,%xmm0,%xmm0
   DB  196,227,249,22,195,1                ; vpextrq       $0x1,%xmm0,%rbx
   DB  65,137,222                          ; mov           %ebx,%r14d
   DB  72,193,235,32                       ; shr           $0x20,%rbx
@@ -12703,119 +12820,118 @@
   DB  73,193,239,32                       ; shr           $0x20,%r15
   DB  196,129,122,126,4,248               ; vmovq         (%r8,%r15,8),%xmm0
   DB  196,129,122,126,12,224              ; vmovq         (%r8,%r12,8),%xmm1
-  DB  197,113,108,200                     ; vpunpcklqdq   %xmm0,%xmm1,%xmm9
+  DB  197,113,108,208                     ; vpunpcklqdq   %xmm0,%xmm1,%xmm10
   DB  196,193,122,126,12,216              ; vmovq         (%r8,%rbx,8),%xmm1
   DB  196,129,122,126,20,240              ; vmovq         (%r8,%r14,8),%xmm2
   DB  197,233,108,201                     ; vpunpcklqdq   %xmm1,%xmm2,%xmm1
   DB  196,129,122,126,20,208              ; vmovq         (%r8,%r10,8),%xmm2
   DB  196,129,122,126,28,216              ; vmovq         (%r8,%r11,8),%xmm3
   DB  197,225,108,210                     ; vpunpcklqdq   %xmm2,%xmm3,%xmm2
-  DB  196,65,122,126,4,192                ; vmovq         (%r8,%rax,8),%xmm8
+  DB  196,65,122,126,12,192               ; vmovq         (%r8,%rax,8),%xmm9
   DB  196,129,122,126,28,200              ; vmovq         (%r8,%r9,8),%xmm3
-  DB  196,193,97,108,216                  ; vpunpcklqdq   %xmm8,%xmm3,%xmm3
-  DB  197,177,97,193                      ; vpunpcklwd    %xmm1,%xmm9,%xmm0
-  DB  197,177,105,201                     ; vpunpckhwd    %xmm1,%xmm9,%xmm1
-  DB  197,105,97,203                      ; vpunpcklwd    %xmm3,%xmm2,%xmm9
+  DB  196,193,97,108,217                  ; vpunpcklqdq   %xmm9,%xmm3,%xmm3
+  DB  197,169,97,193                      ; vpunpcklwd    %xmm1,%xmm10,%xmm0
+  DB  197,169,105,201                     ; vpunpckhwd    %xmm1,%xmm10,%xmm1
+  DB  197,105,97,211                      ; vpunpcklwd    %xmm3,%xmm2,%xmm10
   DB  197,233,105,211                     ; vpunpckhwd    %xmm3,%xmm2,%xmm2
   DB  197,121,97,241                      ; vpunpcklwd    %xmm1,%xmm0,%xmm14
-  DB  197,121,105,193                     ; vpunpckhwd    %xmm1,%xmm0,%xmm8
-  DB  197,49,97,250                       ; vpunpcklwd    %xmm2,%xmm9,%xmm15
-  DB  197,49,105,202                      ; vpunpckhwd    %xmm2,%xmm9,%xmm9
+  DB  197,121,105,201                     ; vpunpckhwd    %xmm1,%xmm0,%xmm9
+  DB  197,41,97,250                       ; vpunpcklwd    %xmm2,%xmm10,%xmm15
+  DB  197,41,105,210                      ; vpunpckhwd    %xmm2,%xmm10,%xmm10
   DB  196,193,9,108,199                   ; vpunpcklqdq   %xmm15,%xmm14,%xmm0
   DB  196,226,121,51,208                  ; vpmovzxwd     %xmm0,%xmm2
   DB  197,249,112,192,78                  ; vpshufd       $0x4e,%xmm0,%xmm0
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
-  DB  197,123,18,21,234,231,1,0           ; vmovddup      0x1e7ea(%rip),%xmm10        # 2bed8 <_sk_srcover_rgba_8888_sse2_lowp+0x1230>
-  DB  196,193,121,219,218                 ; vpand         %xmm10,%xmm0,%xmm3
-  DB  196,98,121,24,29,104,223,1,0        ; vbroadcastss  0x1df68(%rip),%xmm11        # 2b664 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
-  DB  197,33,102,227                      ; vpcmpgtd      %xmm3,%xmm11,%xmm12
-  DB  196,193,105,219,202                 ; vpand         %xmm10,%xmm2,%xmm1
-  DB  197,33,102,233                      ; vpcmpgtd      %xmm1,%xmm11,%xmm13
-  DB  196,195,21,24,228,1                 ; vinsertf128   $0x1,%xmm12,%ymm13,%ymm4
-  DB  197,123,18,37,201,231,1,0           ; vmovddup      0x1e7c9(%rip),%xmm12        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0x1238>
-  DB  196,193,105,219,212                 ; vpand         %xmm12,%xmm2,%xmm2
+  DB  197,123,18,29,128,232,1,0           ; vmovddup      0x1e880(%rip),%xmm11        # 2c238 <_sk_srcover_rgba_8888_sse2_lowp+0x1234>
+  DB  196,193,121,219,219                 ; vpand         %xmm11,%xmm0,%xmm3
+  DB  196,98,121,24,37,254,223,1,0        ; vbroadcastss  0x1dffe(%rip),%xmm12        # 2b9c4 <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  DB  197,25,102,235                      ; vpcmpgtd      %xmm3,%xmm12,%xmm13
+  DB  196,193,105,219,203                 ; vpand         %xmm11,%xmm2,%xmm1
+  DB  197,25,102,193                      ; vpcmpgtd      %xmm1,%xmm12,%xmm8
+  DB  196,67,61,24,197,1                  ; vinsertf128   $0x1,%xmm13,%ymm8,%ymm8
+  DB  197,123,18,45,95,232,1,0            ; vmovddup      0x1e85f(%rip),%xmm13        # 2c240 <_sk_srcover_rgba_8888_sse2_lowp+0x123c>
+  DB  196,193,105,219,213                 ; vpand         %xmm13,%xmm2,%xmm2
   DB  197,233,114,242,16                  ; vpslld        $0x10,%xmm2,%xmm2
-  DB  196,193,121,219,196                 ; vpand         %xmm12,%xmm0,%xmm0
-  DB  197,249,114,240,16                  ; vpslld        $0x10,%xmm0,%xmm0
   DB  197,241,114,241,13                  ; vpslld        $0xd,%xmm1,%xmm1
   DB  197,233,235,201                     ; vpor          %xmm1,%xmm2,%xmm1
+  DB  196,193,121,219,197                 ; vpand         %xmm13,%xmm0,%xmm0
+  DB  197,249,114,240,16                  ; vpslld        $0x10,%xmm0,%xmm0
   DB  197,233,114,243,13                  ; vpslld        $0xd,%xmm3,%xmm2
   DB  197,249,235,194                     ; vpor          %xmm2,%xmm0,%xmm0
-  DB  196,226,121,24,29,34,223,1,0        ; vbroadcastss  0x1df22(%rip),%xmm3        # 2b668 <_sk_srcover_rgba_8888_sse2_lowp+0x9c0>
+  DB  196,226,121,24,29,184,223,1,0       ; vbroadcastss  0x1dfb8(%rip),%xmm3        # 2b9c8 <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
   DB  197,249,254,195                     ; vpaddd        %xmm3,%xmm0,%xmm0
   DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
-  DB  196,65,20,87,237                    ; vxorps        %ymm13,%ymm13,%ymm13
-  DB  196,195,125,74,197,64               ; vblendvps     %ymm4,%ymm13,%ymm0,%ymm0
+  DB  196,227,125,74,196,128              ; vblendvps     %ymm8,%ymm4,%ymm0,%ymm0
   DB  196,193,9,109,207                   ; vpunpckhqdq   %xmm15,%xmm14,%xmm1
   DB  196,226,121,51,209                  ; vpmovzxwd     %xmm1,%xmm2
   DB  197,249,112,201,78                  ; vpshufd       $0x4e,%xmm1,%xmm1
-  DB  196,98,121,51,249                   ; vpmovzxwd     %xmm1,%xmm15
-  DB  196,193,1,219,226                   ; vpand         %xmm10,%xmm15,%xmm4
-  DB  197,33,102,244                      ; vpcmpgtd      %xmm4,%xmm11,%xmm14
-  DB  196,193,105,219,202                 ; vpand         %xmm10,%xmm2,%xmm1
-  DB  197,161,102,249                     ; vpcmpgtd      %xmm1,%xmm11,%xmm7
+  DB  196,98,121,51,193                   ; vpmovzxwd     %xmm1,%xmm8
+  DB  196,65,57,219,251                   ; vpand         %xmm11,%xmm8,%xmm15
+  DB  196,65,25,102,247                   ; vpcmpgtd      %xmm15,%xmm12,%xmm14
+  DB  196,193,105,219,203                 ; vpand         %xmm11,%xmm2,%xmm1
+  DB  197,153,102,249                     ; vpcmpgtd      %xmm1,%xmm12,%xmm7
   DB  196,195,69,24,254,1                 ; vinsertf128   $0x1,%xmm14,%ymm7,%ymm7
-  DB  196,193,105,219,212                 ; vpand         %xmm12,%xmm2,%xmm2
+  DB  196,193,105,219,213                 ; vpand         %xmm13,%xmm2,%xmm2
   DB  197,233,114,242,16                  ; vpslld        $0x10,%xmm2,%xmm2
   DB  197,241,114,241,13                  ; vpslld        $0xd,%xmm1,%xmm1
   DB  197,233,235,201                     ; vpor          %xmm1,%xmm2,%xmm1
-  DB  196,193,1,219,212                   ; vpand         %xmm12,%xmm15,%xmm2
+  DB  196,193,57,219,213                  ; vpand         %xmm13,%xmm8,%xmm2
   DB  197,233,114,242,16                  ; vpslld        $0x10,%xmm2,%xmm2
-  DB  197,217,114,244,13                  ; vpslld        $0xd,%xmm4,%xmm4
-  DB  197,233,235,212                     ; vpor          %xmm4,%xmm2,%xmm2
+  DB  196,193,73,114,247,13               ; vpslld        $0xd,%xmm15,%xmm6
+  DB  197,233,235,214                     ; vpor          %xmm6,%xmm2,%xmm2
   DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
   DB  197,241,254,203                     ; vpaddd        %xmm3,%xmm1,%xmm1
   DB  196,227,117,24,202,1                ; vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
-  DB  196,195,117,74,205,112              ; vblendvps     %ymm7,%ymm13,%ymm1,%ymm1
-  DB  196,193,57,108,209                  ; vpunpcklqdq   %xmm9,%xmm8,%xmm2
-  DB  196,226,121,51,226                  ; vpmovzxwd     %xmm2,%xmm4
+  DB  196,227,117,74,204,112              ; vblendvps     %ymm7,%ymm4,%ymm1,%ymm1
+  DB  196,193,49,108,210                  ; vpunpcklqdq   %xmm10,%xmm9,%xmm2
+  DB  196,226,121,51,242                  ; vpmovzxwd     %xmm2,%xmm6
   DB  197,249,112,210,78                  ; vpshufd       $0x4e,%xmm2,%xmm2
-  DB  196,98,121,51,250                   ; vpmovzxwd     %xmm2,%xmm15
-  DB  196,193,1,219,250                   ; vpand         %xmm10,%xmm15,%xmm7
-  DB  197,33,102,247                      ; vpcmpgtd      %xmm7,%xmm11,%xmm14
-  DB  196,193,89,219,210                  ; vpand         %xmm10,%xmm4,%xmm2
-  DB  197,161,102,242                     ; vpcmpgtd      %xmm2,%xmm11,%xmm6
-  DB  196,195,77,24,246,1                 ; vinsertf128   $0x1,%xmm14,%ymm6,%ymm6
-  DB  196,193,89,219,228                  ; vpand         %xmm12,%xmm4,%xmm4
-  DB  197,217,114,244,16                  ; vpslld        $0x10,%xmm4,%xmm4
+  DB  196,98,121,51,242                   ; vpmovzxwd     %xmm2,%xmm14
+  DB  196,193,9,219,251                   ; vpand         %xmm11,%xmm14,%xmm7
+  DB  197,25,102,199                      ; vpcmpgtd      %xmm7,%xmm12,%xmm8
+  DB  196,193,73,219,211                  ; vpand         %xmm11,%xmm6,%xmm2
+  DB  197,25,102,250                      ; vpcmpgtd      %xmm2,%xmm12,%xmm15
+  DB  196,67,5,24,192,1                   ; vinsertf128   $0x1,%xmm8,%ymm15,%ymm8
+  DB  196,193,73,219,245                  ; vpand         %xmm13,%xmm6,%xmm6
+  DB  197,201,114,246,16                  ; vpslld        $0x10,%xmm6,%xmm6
   DB  197,233,114,242,13                  ; vpslld        $0xd,%xmm2,%xmm2
-  DB  197,217,235,210                     ; vpor          %xmm2,%xmm4,%xmm2
-  DB  196,193,1,219,228                   ; vpand         %xmm12,%xmm15,%xmm4
-  DB  197,217,114,244,16                  ; vpslld        $0x10,%xmm4,%xmm4
-  DB  197,193,114,247,13                  ; vpslld        $0xd,%xmm7,%xmm7
-  DB  197,217,235,231                     ; vpor          %xmm7,%xmm4,%xmm4
-  DB  197,217,254,227                     ; vpaddd        %xmm3,%xmm4,%xmm4
-  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
-  DB  196,227,109,24,212,1                ; vinsertf128   $0x1,%xmm4,%ymm2,%ymm2
-  DB  196,195,109,74,213,96               ; vblendvps     %ymm6,%ymm13,%ymm2,%ymm2
-  DB  196,193,57,109,225                  ; vpunpckhqdq   %xmm9,%xmm8,%xmm4
-  DB  196,226,121,51,244                  ; vpmovzxwd     %xmm4,%xmm6
-  DB  197,249,112,228,78                  ; vpshufd       $0x4e,%xmm4,%xmm4
-  DB  196,226,121,51,228                  ; vpmovzxwd     %xmm4,%xmm4
-  DB  196,65,89,219,202                   ; vpand         %xmm10,%xmm4,%xmm9
-  DB  196,65,33,102,193                   ; vpcmpgtd      %xmm9,%xmm11,%xmm8
-  DB  196,193,73,219,250                  ; vpand         %xmm10,%xmm6,%xmm7
-  DB  197,33,102,215                      ; vpcmpgtd      %xmm7,%xmm11,%xmm10
-  DB  196,67,45,24,192,1                  ; vinsertf128   $0x1,%xmm8,%ymm10,%ymm8
-  DB  196,193,73,219,244                  ; vpand         %xmm12,%xmm6,%xmm6
-  DB  196,193,89,219,228                  ; vpand         %xmm12,%xmm4,%xmm4
+  DB  197,201,235,210                     ; vpor          %xmm2,%xmm6,%xmm2
+  DB  196,193,9,219,245                   ; vpand         %xmm13,%xmm14,%xmm6
   DB  197,201,114,246,16                  ; vpslld        $0x10,%xmm6,%xmm6
   DB  197,193,114,247,13                  ; vpslld        $0xd,%xmm7,%xmm7
   DB  197,201,235,247                     ; vpor          %xmm7,%xmm6,%xmm6
-  DB  197,217,114,244,16                  ; vpslld        $0x10,%xmm4,%xmm4
-  DB  196,193,65,114,241,13               ; vpslld        $0xd,%xmm9,%xmm7
-  DB  197,217,235,231                     ; vpor          %xmm7,%xmm4,%xmm4
-  DB  197,217,254,227                     ; vpaddd        %xmm3,%xmm4,%xmm4
+  DB  197,201,254,243                     ; vpaddd        %xmm3,%xmm6,%xmm6
+  DB  197,233,254,211                     ; vpaddd        %xmm3,%xmm2,%xmm2
+  DB  196,227,109,24,214,1                ; vinsertf128   $0x1,%xmm6,%ymm2,%ymm2
+  DB  196,227,109,74,212,128              ; vblendvps     %ymm8,%ymm4,%ymm2,%ymm2
+  DB  196,193,49,109,242                  ; vpunpckhqdq   %xmm10,%xmm9,%xmm6
+  DB  196,226,121,51,254                  ; vpmovzxwd     %xmm6,%xmm7
+  DB  197,249,112,246,78                  ; vpshufd       $0x4e,%xmm6,%xmm6
+  DB  196,98,121,51,214                   ; vpmovzxwd     %xmm6,%xmm10
+  DB  196,65,41,219,195                   ; vpand         %xmm11,%xmm10,%xmm8
+  DB  196,65,25,102,200                   ; vpcmpgtd      %xmm8,%xmm12,%xmm9
+  DB  196,193,65,219,243                  ; vpand         %xmm11,%xmm7,%xmm6
+  DB  197,25,102,222                      ; vpcmpgtd      %xmm6,%xmm12,%xmm11
+  DB  196,67,37,24,201,1                  ; vinsertf128   $0x1,%xmm9,%ymm11,%ymm9
+  DB  196,193,65,219,253                  ; vpand         %xmm13,%xmm7,%xmm7
+  DB  196,65,41,219,213                   ; vpand         %xmm13,%xmm10,%xmm10
+  DB  197,193,114,247,16                  ; vpslld        $0x10,%xmm7,%xmm7
+  DB  197,201,114,246,13                  ; vpslld        $0xd,%xmm6,%xmm6
+  DB  197,193,235,246                     ; vpor          %xmm6,%xmm7,%xmm6
+  DB  196,193,65,114,242,16               ; vpslld        $0x10,%xmm10,%xmm7
+  DB  196,193,81,114,240,13               ; vpslld        $0xd,%xmm8,%xmm5
+  DB  197,193,235,237                     ; vpor          %xmm5,%xmm7,%xmm5
+  DB  197,209,254,235                     ; vpaddd        %xmm3,%xmm5,%xmm5
   DB  197,201,254,219                     ; vpaddd        %xmm3,%xmm6,%xmm3
-  DB  196,227,101,24,220,1                ; vinsertf128   $0x1,%xmm4,%ymm3,%ymm3
-  DB  196,195,101,74,221,128              ; vblendvps     %ymm8,%ymm13,%ymm3,%ymm3
+  DB  196,227,101,24,221,1                ; vinsertf128   $0x1,%xmm5,%ymm3,%ymm3
+  DB  196,227,101,74,220,144              ; vblendvps     %ymm9,%ymm4,%ymm3,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  197,252,40,229                      ; vmovaps       %ymm5,%ymm4
-  DB  197,252,16,44,36                    ; vmovups       (%rsp),%ymm5
-  DB  197,252,16,116,36,32                ; vmovups       0x20(%rsp),%ymm6
-  DB  197,252,16,124,36,64                ; vmovups       0x40(%rsp),%ymm7
-  DB  72,131,196,120                      ; add           $0x78,%rsp
+  DB  197,252,16,36,36                    ; vmovups       (%rsp),%ymm4
+  DB  197,252,16,108,36,32                ; vmovups       0x20(%rsp),%ymm5
+  DB  197,252,16,116,36,64                ; vmovups       0x40(%rsp),%ymm6
+  DB  197,252,16,124,36,96                ; vmovups       0x60(%rsp),%ymm7
+  DB  72,129,196,152,0,0,0                ; add           $0x98,%rsp
   DB  91                                  ; pop           %rbx
   DB  65,92                               ; pop           %r12
   DB  65,94                               ; pop           %r14
@@ -12830,12 +12946,12 @@
   DB  197,252,17,108,36,64                ; vmovups       %ymm5,0x40(%rsp)
   DB  197,252,17,100,36,32                ; vmovups       %ymm4,0x20(%rsp)
   DB  197,252,40,225                      ; vmovaps       %ymm1,%ymm4
-  DB  196,98,125,24,5,90,221,1,0          ; vbroadcastss  0x1dd5a(%rip),%ymm8        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,5,237,221,1,0         ; vbroadcastss  0x1dded(%rip),%ymm8        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,65,124,84,216                   ; vandps        %ymm8,%ymm0,%ymm11
-  DB  196,98,125,24,21,120,221,1,0        ; vbroadcastss  0x1dd78(%rip),%ymm10        # 2b66c <_sk_srcover_rgba_8888_sse2_lowp+0x9c4>
+  DB  196,98,125,24,21,11,222,1,0         ; vbroadcastss  0x1de0b(%rip),%ymm10        # 2b9cc <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
   DB  196,65,124,84,226                   ; vandps        %ymm10,%ymm0,%ymm12
   DB  196,67,125,25,229,1                 ; vextractf128  $0x1,%ymm12,%xmm13
-  DB  196,98,121,24,13,104,221,1,0        ; vbroadcastss  0x1dd68(%rip),%xmm9        # 2b670 <_sk_srcover_rgba_8888_sse2_lowp+0x9c8>
+  DB  196,98,121,24,13,251,221,1,0        ; vbroadcastss  0x1ddfb(%rip),%xmm9        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
   DB  196,65,49,102,245                   ; vpcmpgtd      %xmm13,%xmm9,%xmm14
   DB  196,65,49,102,252                   ; vpcmpgtd      %xmm12,%xmm9,%xmm15
   DB  196,67,5,24,246,1                   ; vinsertf128   $0x1,%xmm14,%ymm15,%ymm14
@@ -12846,7 +12962,7 @@
   DB  196,65,17,254,239                   ; vpaddd        %xmm15,%xmm13,%xmm13
   DB  196,193,25,114,212,13               ; vpsrld        $0xd,%xmm12,%xmm12
   DB  196,65,25,254,227                   ; vpaddd        %xmm11,%xmm12,%xmm12
-  DB  196,98,121,24,29,43,221,1,0         ; vbroadcastss  0x1dd2b(%rip),%xmm11        # 2b674 <_sk_srcover_rgba_8888_sse2_lowp+0x9cc>
+  DB  196,98,121,24,29,190,221,1,0        ; vbroadcastss  0x1ddbe(%rip),%xmm11        # 2b9d4 <_sk_srcover_rgba_8888_sse2_lowp+0x9d0>
   DB  196,65,17,254,235                   ; vpaddd        %xmm11,%xmm13,%xmm13
   DB  196,65,25,254,227                   ; vpaddd        %xmm11,%xmm12,%xmm12
   DB  196,67,29,24,237,1                  ; vinsertf128   $0x1,%xmm13,%ymm12,%ymm13
@@ -12929,7 +13045,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,74                              ; jne           db25 <_sk_store_f16_avx+0x26e>
+  DB  117,74                              ; jne           ddf2 <_sk_store_f16_avx+0x26e>
   DB  196,65,122,127,28,192               ; vmovdqu       %xmm11,(%r8,%rax,8)
   DB  196,65,122,127,84,192,16            ; vmovdqu       %xmm10,0x10(%r8,%rax,8)
   DB  196,65,122,127,76,192,32            ; vmovdqu       %xmm9,0x20(%r8,%rax,8)
@@ -12945,22 +13061,22 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,214,28,192               ; vmovq         %xmm11,(%r8,%rax,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,197                             ; je            daf6 <_sk_store_f16_avx+0x23f>
+  DB  116,197                             ; je            ddc3 <_sk_store_f16_avx+0x23f>
   DB  196,65,121,23,92,192,8              ; vmovhpd       %xmm11,0x8(%r8,%rax,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,184                             ; jb            daf6 <_sk_store_f16_avx+0x23f>
+  DB  114,184                             ; jb            ddc3 <_sk_store_f16_avx+0x23f>
   DB  196,65,121,214,84,192,16            ; vmovq         %xmm10,0x10(%r8,%rax,8)
-  DB  116,175                             ; je            daf6 <_sk_store_f16_avx+0x23f>
+  DB  116,175                             ; je            ddc3 <_sk_store_f16_avx+0x23f>
   DB  196,65,121,23,84,192,24             ; vmovhpd       %xmm10,0x18(%r8,%rax,8)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,162                             ; jb            daf6 <_sk_store_f16_avx+0x23f>
+  DB  114,162                             ; jb            ddc3 <_sk_store_f16_avx+0x23f>
   DB  196,65,121,214,76,192,32            ; vmovq         %xmm9,0x20(%r8,%rax,8)
-  DB  116,153                             ; je            daf6 <_sk_store_f16_avx+0x23f>
+  DB  116,153                             ; je            ddc3 <_sk_store_f16_avx+0x23f>
   DB  196,65,121,23,76,192,40             ; vmovhpd       %xmm9,0x28(%r8,%rax,8)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,140                             ; jb            daf6 <_sk_store_f16_avx+0x23f>
+  DB  114,140                             ; jb            ddc3 <_sk_store_f16_avx+0x23f>
   DB  196,65,121,214,68,192,48            ; vmovq         %xmm8,0x30(%r8,%rax,8)
-  DB  235,131                             ; jmp           daf6 <_sk_store_f16_avx+0x23f>
+  DB  235,131                             ; jmp           ddc3 <_sk_store_f16_avx+0x23f>
 
 PUBLIC _sk_load_u16_be_avx
 _sk_load_u16_be_avx LABEL PROC
@@ -12973,7 +13089,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,12,1,0,0                     ; jne           dca6 <_sk_load_u16_be_avx+0x133>
+  DB  15,133,12,1,0,0                     ; jne           df73 <_sk_load_u16_be_avx+0x133>
   DB  196,65,121,16,4,64                  ; vmovupd       (%r8,%rax,2),%xmm8
   DB  196,193,121,16,84,64,16             ; vmovupd       0x10(%r8,%rax,2),%xmm2
   DB  196,193,121,16,92,64,32             ; vmovupd       0x20(%r8,%rax,2),%xmm3
@@ -12995,7 +13111,7 @@
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,109,217,1,0        ; vbroadcastss  0x1d96d(%rip),%ymm9        # 2b578 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  DB  196,98,125,24,13,0,218,1,0          ; vbroadcastss  0x1da00(%rip),%ymm9        # 2b8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,169,109,202                     ; vpunpckhqdq   %xmm2,%xmm10,%xmm1
   DB  197,233,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm2
@@ -13032,29 +13148,29 @@
   DB  196,65,123,16,4,64                  ; vmovsd        (%r8,%rax,2),%xmm8
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,85                              ; je            dd0c <_sk_load_u16_be_avx+0x199>
+  DB  116,85                              ; je            dfd9 <_sk_load_u16_be_avx+0x199>
   DB  196,65,57,22,68,64,8                ; vmovhpd       0x8(%r8,%rax,2),%xmm8,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,72                              ; jb            dd0c <_sk_load_u16_be_avx+0x199>
+  DB  114,72                              ; jb            dfd9 <_sk_load_u16_be_avx+0x199>
   DB  196,193,123,16,84,64,16             ; vmovsd        0x10(%r8,%rax,2),%xmm2
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  116,72                              ; je            dd19 <_sk_load_u16_be_avx+0x1a6>
+  DB  116,72                              ; je            dfe6 <_sk_load_u16_be_avx+0x1a6>
   DB  196,193,105,22,84,64,24             ; vmovhpd       0x18(%r8,%rax,2),%xmm2,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,59                              ; jb            dd19 <_sk_load_u16_be_avx+0x1a6>
+  DB  114,59                              ; jb            dfe6 <_sk_load_u16_be_avx+0x1a6>
   DB  196,193,123,16,92,64,32             ; vmovsd        0x20(%r8,%rax,2),%xmm3
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  15,132,198,254,255,255              ; je            dbb5 <_sk_load_u16_be_avx+0x42>
+  DB  15,132,198,254,255,255              ; je            de82 <_sk_load_u16_be_avx+0x42>
   DB  196,193,97,22,92,64,40              ; vmovhpd       0x28(%r8,%rax,2),%xmm3,%xmm3
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,130,181,254,255,255              ; jb            dbb5 <_sk_load_u16_be_avx+0x42>
+  DB  15,130,181,254,255,255              ; jb            de82 <_sk_load_u16_be_avx+0x42>
   DB  196,65,122,126,76,64,48             ; vmovq         0x30(%r8,%rax,2),%xmm9
-  DB  233,169,254,255,255                 ; jmpq          dbb5 <_sk_load_u16_be_avx+0x42>
+  DB  233,169,254,255,255                 ; jmpq          de82 <_sk_load_u16_be_avx+0x42>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
   DB  197,233,87,210                      ; vxorpd        %xmm2,%xmm2,%xmm2
-  DB  233,156,254,255,255                 ; jmpq          dbb5 <_sk_load_u16_be_avx+0x42>
+  DB  233,156,254,255,255                 ; jmpq          de82 <_sk_load_u16_be_avx+0x42>
   DB  197,225,87,219                      ; vxorpd        %xmm3,%xmm3,%xmm3
-  DB  233,147,254,255,255                 ; jmpq          dbb5 <_sk_load_u16_be_avx+0x42>
+  DB  233,147,254,255,255                 ; jmpq          de82 <_sk_load_u16_be_avx+0x42>
 
 PUBLIC _sk_load_rgb_u16_be_avx
 _sk_load_rgb_u16_be_avx LABEL PROC
@@ -13069,7 +13185,7 @@
   DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
   DB  72,193,248,32                       ; sar           $0x20,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,253,0,0,0                    ; jne           de4a <_sk_load_rgb_u16_be_avx+0x128>
+  DB  15,133,253,0,0,0                    ; jne           e117 <_sk_load_rgb_u16_be_avx+0x128>
   DB  196,65,122,111,28,64                ; vmovdqu       (%r8,%rax,2),%xmm11
   DB  196,193,122,111,92,64,12            ; vmovdqu       0xc(%r8,%rax,2),%xmm3
   DB  196,193,122,111,84,64,24            ; vmovdqu       0x18(%r8,%rax,2),%xmm2
@@ -13097,7 +13213,7 @@
   DB  196,226,121,51,192                  ; vpmovzxwd     %xmm0,%xmm0
   DB  196,227,117,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm1,%ymm0
   DB  197,252,91,192                      ; vcvtdq2ps     %ymm0,%ymm0
-  DB  196,98,125,24,13,156,215,1,0        ; vbroadcastss  0x1d79c(%rip),%ymm9        # 2b578 <_sk_srcover_rgba_8888_sse2_lowp+0x8d0>
+  DB  196,98,125,24,13,47,216,1,0         ; vbroadcastss  0x1d82f(%rip),%ymm9        # 2b8d8 <_sk_srcover_rgba_8888_sse2_lowp+0x8d4>
   DB  196,193,124,89,193                  ; vmulps        %ymm9,%ymm0,%ymm0
   DB  197,185,109,203                     ; vpunpckhqdq   %xmm3,%xmm8,%xmm1
   DB  197,225,113,241,8                   ; vpsllw        $0x8,%xmm1,%xmm3
@@ -13119,69 +13235,69 @@
   DB  197,252,91,210                      ; vcvtdq2ps     %ymm2,%ymm2
   DB  196,193,108,89,209                  ; vmulps        %ymm9,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,160,214,1,0       ; vbroadcastss  0x1d6a0(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,51,215,1,0        ; vbroadcastss  0x1d733(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,4,64                ; vmovd         (%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,65,121,196,92,64,4,2            ; vpinsrw       $0x2,0x4(%r8,%rax,2),%xmm0,%xmm11
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,31                              ; jne           de82 <_sk_load_rgb_u16_be_avx+0x160>
+  DB  117,31                              ; jne           e14f <_sk_load_rgb_u16_be_avx+0x160>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
-  DB  233,0,255,255,255                   ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,0,255,255,255                   ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
   DB  196,193,121,110,68,64,6             ; vmovd         0x6(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,65,121,196,68,64,10,2           ; vpinsrw       $0x2,0xa(%r8,%rax,2),%xmm0,%xmm8
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,48                              ; jb            decc <_sk_load_rgb_u16_be_avx+0x1aa>
+  DB  114,48                              ; jb            e199 <_sk_load_rgb_u16_be_avx+0x1aa>
   DB  196,193,121,110,68,64,12            ; vmovd         0xc(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,92,64,16,2          ; vpinsrw       $0x2,0x10(%r8,%rax,2),%xmm0,%xmm3
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  117,48                              ; jne           dee6 <_sk_load_rgb_u16_be_avx+0x1c4>
+  DB  117,48                              ; jne           e1b3 <_sk_load_rgb_u16_be_avx+0x1c4>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
-  DB  233,182,254,255,255                 ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,182,254,255,255                 ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
   DB  196,65,41,239,210                   ; vpxor         %xmm10,%xmm10,%xmm10
   DB  197,225,239,219                     ; vpxor         %xmm3,%xmm3,%xmm3
-  DB  233,156,254,255,255                 ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,156,254,255,255                 ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
   DB  196,193,121,110,68,64,18            ; vmovd         0x12(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,65,121,196,84,64,22,2           ; vpinsrw       $0x2,0x16(%r8,%rax,2),%xmm0,%xmm10
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,39                              ; jb            df27 <_sk_load_rgb_u16_be_avx+0x205>
+  DB  114,39                              ; jb            e1f4 <_sk_load_rgb_u16_be_avx+0x205>
   DB  196,193,121,110,68,64,24            ; vmovd         0x18(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,84,64,28,2          ; vpinsrw       $0x2,0x1c(%r8,%rax,2),%xmm0,%xmm2
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  117,30                              ; jne           df38 <_sk_load_rgb_u16_be_avx+0x216>
+  DB  117,30                              ; jne           e205 <_sk_load_rgb_u16_be_avx+0x216>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
-  DB  233,91,254,255,255                  ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,91,254,255,255                  ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  197,241,239,201                     ; vpxor         %xmm1,%xmm1,%xmm1
   DB  197,233,239,210                     ; vpxor         %xmm2,%xmm2,%xmm2
-  DB  233,74,254,255,255                  ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,74,254,255,255                  ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
   DB  196,193,121,110,68,64,30            ; vmovd         0x1e(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,76,64,34,2          ; vpinsrw       $0x2,0x22(%r8,%rax,2),%xmm0,%xmm1
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,25                              ; jb            df6b <_sk_load_rgb_u16_be_avx+0x249>
+  DB  114,25                              ; jb            e238 <_sk_load_rgb_u16_be_avx+0x249>
   DB  196,193,121,110,68,64,36            ; vmovd         0x24(%r8,%rax,2),%xmm0
   DB  196,65,49,239,201                   ; vpxor         %xmm9,%xmm9,%xmm9
   DB  196,193,121,196,68,64,40,2          ; vpinsrw       $0x2,0x28(%r8,%rax,2),%xmm0,%xmm0
-  DB  233,23,254,255,255                  ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,23,254,255,255                  ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
-  DB  233,14,254,255,255                  ; jmpq          dd82 <_sk_load_rgb_u16_be_avx+0x60>
+  DB  233,14,254,255,255                  ; jmpq          e04f <_sk_load_rgb_u16_be_avx+0x60>
 
 PUBLIC _sk_store_u16_be_avx
 _sk_store_u16_be_avx LABEL PROC
@@ -13193,7 +13309,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  196,98,125,24,5,101,214,1,0         ; vbroadcastss  0x1d665(%rip),%ymm8        # 2b600 <_sk_srcover_rgba_8888_sse2_lowp+0x958>
+  DB  196,98,125,24,5,248,214,1,0         ; vbroadcastss  0x1d6f8(%rip),%ymm8        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
   DB  196,65,124,89,200                   ; vmulps        %ymm8,%ymm0,%ymm9
   DB  196,65,125,91,201                   ; vcvtps2dq     %ymm9,%ymm9
   DB  196,67,125,25,202,1                 ; vextractf128  $0x1,%ymm9,%xmm10
@@ -13231,7 +13347,7 @@
   DB  196,65,17,98,200                    ; vpunpckldq    %xmm8,%xmm13,%xmm9
   DB  196,65,17,106,192                   ; vpunpckhdq    %xmm8,%xmm13,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,31                              ; jne           e07f <_sk_store_u16_be_avx+0x10b>
+  DB  117,31                              ; jne           e34c <_sk_store_u16_be_avx+0x10b>
   DB  196,65,122,127,28,64                ; vmovdqu       %xmm11,(%r8,%rax,2)
   DB  196,65,122,127,84,64,16             ; vmovdqu       %xmm10,0x10(%r8,%rax,2)
   DB  196,65,122,127,76,64,32             ; vmovdqu       %xmm9,0x20(%r8,%rax,2)
@@ -13240,22 +13356,22 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,214,28,64                ; vmovq         %xmm11,(%r8,%rax,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            e07b <_sk_store_u16_be_avx+0x107>
+  DB  116,240                             ; je            e348 <_sk_store_u16_be_avx+0x107>
   DB  196,65,121,23,92,64,8               ; vmovhpd       %xmm11,0x8(%r8,%rax,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            e07b <_sk_store_u16_be_avx+0x107>
+  DB  114,227                             ; jb            e348 <_sk_store_u16_be_avx+0x107>
   DB  196,65,121,214,84,64,16             ; vmovq         %xmm10,0x10(%r8,%rax,2)
-  DB  116,218                             ; je            e07b <_sk_store_u16_be_avx+0x107>
+  DB  116,218                             ; je            e348 <_sk_store_u16_be_avx+0x107>
   DB  196,65,121,23,84,64,24              ; vmovhpd       %xmm10,0x18(%r8,%rax,2)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            e07b <_sk_store_u16_be_avx+0x107>
+  DB  114,205                             ; jb            e348 <_sk_store_u16_be_avx+0x107>
   DB  196,65,121,214,76,64,32             ; vmovq         %xmm9,0x20(%r8,%rax,2)
-  DB  116,196                             ; je            e07b <_sk_store_u16_be_avx+0x107>
+  DB  116,196                             ; je            e348 <_sk_store_u16_be_avx+0x107>
   DB  196,65,121,23,76,64,40              ; vmovhpd       %xmm9,0x28(%r8,%rax,2)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,183                             ; jb            e07b <_sk_store_u16_be_avx+0x107>
+  DB  114,183                             ; jb            e348 <_sk_store_u16_be_avx+0x107>
   DB  196,65,121,214,68,64,48             ; vmovq         %xmm8,0x30(%r8,%rax,2)
-  DB  235,174                             ; jmp           e07b <_sk_store_u16_be_avx+0x107>
+  DB  235,174                             ; jmp           e348 <_sk_store_u16_be_avx+0x107>
 
 PUBLIC _sk_load_f32_avx
 _sk_load_f32_avx LABEL PROC
@@ -13263,7 +13379,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            e242 <_sk_load_f32_avx+0x175>
+  DB  15,135,94,1,0,0                     ; ja            e50f <_sk_load_f32_avx+0x175>
   DB  197,253,17,36,36                    ; vmovupd       %ymm4,(%rsp)
   DB  197,253,17,108,36,32                ; vmovupd       %ymm5,0x20(%rsp)
   DB  197,253,17,116,36,64                ; vmovupd       %ymm6,0x40(%rsp)
@@ -13275,7 +13391,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,53,1,0,0                  ; lea           0x135(%rip),%r10        # e254 <_sk_load_f32_avx+0x187>
+  DB  76,141,21,52,1,0,0                  ; lea           0x134(%rip),%r10        # e520 <_sk_load_f32_avx+0x186>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
@@ -13338,23 +13454,22 @@
   DB  197,229,87,219                      ; vxorpd        %ymm3,%ymm3,%ymm3
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,245,87,201                      ; vxorpd        %ymm1,%ymm1,%ymm1
-  DB  235,196                             ; jmp           e215 <_sk_load_f32_avx+0x148>
-  DB  15,31,0                             ; nopl          (%rax)
-  DB  24,255                              ; sbb           %bh,%bh
+  DB  235,196                             ; jmp           e4e2 <_sk_load_f32_avx+0x148>
+  DB  102,144                             ; xchg          %ax,%ax
+  DB  25,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,158,255,255,255,137             ; lcall         *-0x76000001(%rsi)
+  DB  255,159,255,255,255,138             ; lcall         *-0x75000001(%rdi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,116,255,255                     ; pushq         -0x1(%rdi,%rdi,8)
-  DB  255,89,255                          ; lcall         *-0x1(%rcx)
+  DB  255,117,255                         ; pushq         -0x1(%rbp)
   DB  255                                 ; (bad)
-  DB  255,67,255                          ; incl          -0x1(%rbx)
+  DB  255,90,255                          ; lcall         *-0x1(%rdx)
   DB  255                                 ; (bad)
-  DB  255,50                              ; pushq         (%rdx)
+  DB  255,68,255,255                      ; incl          -0x1(%rdi,%rdi,8)
+  DB  255,51                              ; pushq         (%rbx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255                                 ; .byte         0xff
-  DB  37                                  ; .byte         0x25
+  DB  255,38                              ; jmpq          *(%rsi)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -13365,7 +13480,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,221,87,228                      ; vxorpd        %ymm4,%ymm4,%ymm4
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  15,135,94,1,0,0                     ; ja            e3e9 <_sk_load_f32_dst_avx+0x175>
+  DB  15,135,94,1,0,0                     ; ja            e6b5 <_sk_load_f32_dst_avx+0x175>
   DB  197,253,17,4,36                     ; vmovupd       %ymm0,(%rsp)
   DB  197,253,17,76,36,32                 ; vmovupd       %ymm1,0x20(%rsp)
   DB  197,253,17,84,36,64                 ; vmovupd       %ymm2,0x40(%rsp)
@@ -13377,7 +13492,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  77,99,201                           ; movslq        %r9d,%r9
-  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # e3f8 <_sk_load_f32_dst_avx+0x184>
+  DB  76,141,21,50,1,0,0                  ; lea           0x132(%rip),%r10        # e6c4 <_sk_load_f32_dst_avx+0x184>
   DB  73,99,4,186                         ; movslq        (%r10,%rdi,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  197,253,87,192                      ; vxorpd        %ymm0,%ymm0,%ymm0
@@ -13440,7 +13555,7 @@
   DB  197,197,87,255                      ; vxorpd        %ymm7,%ymm7,%ymm7
   DB  196,65,45,87,210                    ; vxorpd        %ymm10,%ymm10,%ymm10
   DB  197,213,87,237                      ; vxorpd        %ymm5,%ymm5,%ymm5
-  DB  235,196                             ; jmp           e3bc <_sk_load_f32_dst_avx+0x148>
+  DB  235,196                             ; jmp           e688 <_sk_load_f32_dst_avx+0x148>
   DB  27,255                              ; sbb           %edi,%edi
   DB  255                                 ; (bad)
   DB  255,161,255,255,255,140             ; jmpq          *-0x73000001(%rcx)
@@ -13451,7 +13566,7 @@
   DB  255,92,255,255                      ; lcall         *-0x1(%rdi,%rdi,8)
   DB  255,70,255                          ; incl          -0x1(%rsi)
   DB  255                                 ; (bad)
-  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 2900e414 <_sk_srcover_rgba_8888_sse2_lowp+0x28fe376c>
+  DB  255,53,255,255,255,40               ; pushq         0x28ffffff(%rip)        # 2900e6e0 <_sk_srcover_rgba_8888_sse2_lowp+0x28fe36dc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; .byte         0xff
@@ -13475,7 +13590,7 @@
   DB  196,65,37,20,196                    ; vunpcklpd     %ymm12,%ymm11,%ymm8
   DB  196,65,37,21,220                    ; vunpckhpd     %ymm12,%ymm11,%ymm11
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,55                              ; jne           e497 <_sk_store_f32_avx+0x7f>
+  DB  117,55                              ; jne           e763 <_sk_store_f32_avx+0x7f>
   DB  196,67,45,24,225,1                  ; vinsertf128   $0x1,%xmm9,%ymm10,%ymm12
   DB  196,67,61,24,235,1                  ; vinsertf128   $0x1,%xmm11,%ymm8,%ymm13
   DB  196,67,45,6,201,49                  ; vperm2f128    $0x31,%ymm9,%ymm10,%ymm9
@@ -13488,52 +13603,22 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,17,20,128                ; vmovupd       %xmm10,(%r8,%rax,4)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            e493 <_sk_store_f32_avx+0x7b>
+  DB  116,240                             ; je            e75f <_sk_store_f32_avx+0x7b>
   DB  196,65,121,17,76,128,16             ; vmovupd       %xmm9,0x10(%r8,%rax,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            e493 <_sk_store_f32_avx+0x7b>
+  DB  114,227                             ; jb            e75f <_sk_store_f32_avx+0x7b>
   DB  196,65,121,17,68,128,32             ; vmovupd       %xmm8,0x20(%r8,%rax,4)
-  DB  116,218                             ; je            e493 <_sk_store_f32_avx+0x7b>
+  DB  116,218                             ; je            e75f <_sk_store_f32_avx+0x7b>
   DB  196,65,121,17,92,128,48             ; vmovupd       %xmm11,0x30(%r8,%rax,4)
   DB  72,131,255,5                        ; cmp           $0x5,%rdi
-  DB  114,205                             ; jb            e493 <_sk_store_f32_avx+0x7b>
+  DB  114,205                             ; jb            e75f <_sk_store_f32_avx+0x7b>
   DB  196,67,125,25,84,128,64,1           ; vextractf128  $0x1,%ymm10,0x40(%r8,%rax,4)
-  DB  116,195                             ; je            e493 <_sk_store_f32_avx+0x7b>
+  DB  116,195                             ; je            e75f <_sk_store_f32_avx+0x7b>
   DB  196,67,125,25,76,128,80,1           ; vextractf128  $0x1,%ymm9,0x50(%r8,%rax,4)
   DB  72,131,255,7                        ; cmp           $0x7,%rdi
-  DB  114,181                             ; jb            e493 <_sk_store_f32_avx+0x7b>
+  DB  114,181                             ; jb            e75f <_sk_store_f32_avx+0x7b>
   DB  196,67,125,25,68,128,96,1           ; vextractf128  $0x1,%ymm8,0x60(%r8,%rax,4)
-  DB  235,171                             ; jmp           e493 <_sk_store_f32_avx+0x7b>
-
-PUBLIC _sk_clamp_x_avx
-_sk_clamp_x_avx LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,95,200                       ; vmaxps        %ymm0,%ymm8,%ymm9
-  DB  196,98,125,24,0                     ; vbroadcastss  (%rax),%ymm8
-  DB  196,99,125,25,192,1                 ; vextractf128  $0x1,%ymm8,%xmm0
-  DB  196,65,41,118,210                   ; vpcmpeqd      %xmm10,%xmm10,%xmm10
-  DB  196,193,121,254,194                 ; vpaddd        %xmm10,%xmm0,%xmm0
-  DB  196,65,57,254,194                   ; vpaddd        %xmm10,%xmm8,%xmm8
-  DB  196,227,61,24,192,1                 ; vinsertf128   $0x1,%xmm0,%ymm8,%ymm0
-  DB  197,180,93,192                      ; vminps        %ymm0,%ymm9,%ymm0
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  255,224                             ; jmpq          *%rax
-
-PUBLIC _sk_clamp_y_avx
-_sk_clamp_y_avx LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,95,201                       ; vmaxps        %ymm1,%ymm8,%ymm9
-  DB  196,98,125,24,0                     ; vbroadcastss  (%rax),%ymm8
-  DB  196,99,125,25,193,1                 ; vextractf128  $0x1,%ymm8,%xmm1
-  DB  196,65,41,118,210                   ; vpcmpeqd      %xmm10,%xmm10,%xmm10
-  DB  196,193,113,254,202                 ; vpaddd        %xmm10,%xmm1,%xmm1
-  DB  196,65,57,254,194                   ; vpaddd        %xmm10,%xmm8,%xmm8
-  DB  196,227,61,24,201,1                 ; vinsertf128   $0x1,%xmm1,%ymm8,%ymm1
-  DB  197,180,93,201                      ; vminps        %ymm1,%ymm9,%ymm1
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  255,224                             ; jmpq          *%rax
+  DB  235,171                             ; jmp           e75f <_sk_store_f32_avx+0x7b>
 
 PUBLIC _sk_repeat_x_avx
 _sk_repeat_x_avx LABEL PROC
@@ -13544,14 +13629,6 @@
   DB  196,98,125,24,8                     ; vbroadcastss  (%rax),%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  196,193,124,92,192                  ; vsubps        %ymm8,%ymm0,%ymm0
-  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,95,192                       ; vmaxps        %ymm0,%ymm8,%ymm8
-  DB  196,99,125,25,200,1                 ; vextractf128  $0x1,%ymm9,%xmm0
-  DB  196,65,41,118,210                   ; vpcmpeqd      %xmm10,%xmm10,%xmm10
-  DB  196,193,121,254,194                 ; vpaddd        %xmm10,%xmm0,%xmm0
-  DB  196,65,49,254,202                   ; vpaddd        %xmm10,%xmm9,%xmm9
-  DB  196,227,53,24,192,1                 ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm0
-  DB  197,188,93,192                      ; vminps        %ymm0,%ymm8,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -13564,14 +13641,6 @@
   DB  196,98,125,24,8                     ; vbroadcastss  (%rax),%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  196,193,116,92,200                  ; vsubps        %ymm8,%ymm1,%ymm1
-  DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,95,193                       ; vmaxps        %ymm1,%ymm8,%ymm8
-  DB  196,99,125,25,201,1                 ; vextractf128  $0x1,%ymm9,%xmm1
-  DB  196,65,41,118,210                   ; vpcmpeqd      %xmm10,%xmm10,%xmm10
-  DB  196,193,113,254,202                 ; vpaddd        %xmm10,%xmm1,%xmm1
-  DB  196,65,49,254,202                   ; vpaddd        %xmm10,%xmm9,%xmm9
-  DB  196,227,53,24,201,1                 ; vinsertf128   $0x1,%xmm1,%ymm9,%ymm1
-  DB  197,188,93,201                      ; vminps        %ymm1,%ymm8,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -13586,7 +13655,7 @@
   DB  196,193,58,88,192                   ; vaddss        %xmm8,%xmm8,%xmm0
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,99,125,24,192,1                 ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm8
-  DB  197,178,89,5,199,206,1,0            ; vmulss        0x1cec7(%rip),%xmm9,%xmm0        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  197,178,89,5,17,208,1,0             ; vmulss        0x1d011(%rip),%xmm9,%xmm0        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,164,89,192                      ; vmulps        %ymm0,%ymm11,%ymm0
@@ -13595,15 +13664,8 @@
   DB  197,164,92,192                      ; vsubps        %ymm0,%ymm11,%ymm0
   DB  196,193,124,92,194                  ; vsubps        %ymm10,%ymm0,%ymm0
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,92,200                       ; vsubps        %ymm0,%ymm8,%ymm9
-  DB  197,180,84,192                      ; vandps        %ymm0,%ymm9,%ymm0
-  DB  197,60,95,192                       ; vmaxps        %ymm0,%ymm8,%ymm8
-  DB  196,99,125,25,208,1                 ; vextractf128  $0x1,%ymm10,%xmm0
-  DB  196,65,49,118,201                   ; vpcmpeqd      %xmm9,%xmm9,%xmm9
-  DB  196,193,121,254,193                 ; vpaddd        %xmm9,%xmm0,%xmm0
-  DB  196,65,41,254,201                   ; vpaddd        %xmm9,%xmm10,%xmm9
-  DB  196,227,53,24,192,1                 ; vinsertf128   $0x1,%xmm0,%ymm9,%ymm0
-  DB  197,188,93,192                      ; vminps        %ymm0,%ymm8,%ymm0
+  DB  197,60,92,192                       ; vsubps        %ymm0,%ymm8,%ymm8
+  DB  197,188,84,192                      ; vandps        %ymm0,%ymm8,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -13618,7 +13680,7 @@
   DB  196,193,58,88,200                   ; vaddss        %xmm8,%xmm8,%xmm1
   DB  196,227,121,4,201,0                 ; vpermilps     $0x0,%xmm1,%xmm1
   DB  196,99,117,24,193,1                 ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm8
-  DB  197,178,89,13,58,206,1,0            ; vmulss        0x1ce3a(%rip),%xmm9,%xmm1        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  197,178,89,13,167,207,1,0           ; vmulss        0x1cfa7(%rip),%xmm9,%xmm1        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,227,121,4,201,0                 ; vpermilps     $0x0,%xmm1,%xmm1
   DB  196,227,117,24,201,1                ; vinsertf128   $0x1,%xmm1,%ymm1,%ymm1
   DB  197,164,89,201                      ; vmulps        %ymm1,%ymm11,%ymm1
@@ -13627,15 +13689,8 @@
   DB  197,164,92,201                      ; vsubps        %ymm1,%ymm11,%ymm1
   DB  196,193,116,92,202                  ; vsubps        %ymm10,%ymm1,%ymm1
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
-  DB  197,60,92,201                       ; vsubps        %ymm1,%ymm8,%ymm9
-  DB  197,180,84,201                      ; vandps        %ymm1,%ymm9,%ymm1
-  DB  197,60,95,193                       ; vmaxps        %ymm1,%ymm8,%ymm8
-  DB  196,99,125,25,209,1                 ; vextractf128  $0x1,%ymm10,%xmm1
-  DB  196,65,49,118,201                   ; vpcmpeqd      %xmm9,%xmm9,%xmm9
-  DB  196,193,113,254,201                 ; vpaddd        %xmm9,%xmm1,%xmm1
-  DB  196,65,41,254,201                   ; vpaddd        %xmm9,%xmm10,%xmm9
-  DB  196,227,53,24,201,1                 ; vinsertf128   $0x1,%xmm1,%ymm9,%ymm1
-  DB  197,188,93,201                      ; vminps        %ymm1,%ymm8,%ymm1
+  DB  197,60,92,193                       ; vsubps        %ymm1,%ymm8,%ymm8
+  DB  197,188,84,201                      ; vandps        %ymm1,%ymm8,%ymm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -13643,7 +13698,7 @@
 _sk_clamp_x_1_avx LABEL PROC
   DB  196,65,60,87,192                    ; vxorps        %ymm8,%ymm8,%ymm8
   DB  197,188,95,192                      ; vmaxps        %ymm0,%ymm8,%ymm0
-  DB  196,98,125,24,5,212,205,1,0         ; vbroadcastss  0x1cdd4(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,100,207,1,0         ; vbroadcastss  0x1cf64(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  196,193,124,93,192                  ; vminps        %ymm8,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -13657,9 +13712,9 @@
 
 PUBLIC _sk_mirror_x_1_avx
 _sk_mirror_x_1_avx LABEL PROC
-  DB  196,98,125,24,5,203,205,1,0         ; vbroadcastss  0x1cdcb(%rip),%ymm8        # 2b500 <_sk_srcover_rgba_8888_sse2_lowp+0x858>
+  DB  196,98,125,24,5,91,207,1,0          ; vbroadcastss  0x1cf5b(%rip),%ymm8        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0x85c>
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,13,161,205,1,0        ; vbroadcastss  0x1cda1(%rip),%ymm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,13,49,207,1,0         ; vbroadcastss  0x1cf31(%rip),%ymm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,124,89,201                   ; vmulps        %ymm9,%ymm0,%ymm9
   DB  196,67,125,8,201,1                  ; vroundps      $0x1,%ymm9,%ymm9
   DB  196,65,52,88,201                    ; vaddps        %ymm9,%ymm9,%ymm9
@@ -13673,12 +13728,12 @@
 
 PUBLIC _sk_luminance_to_alpha_avx
 _sk_luminance_to_alpha_avx LABEL PROC
-  DB  196,226,125,24,29,141,206,1,0       ; vbroadcastss  0x1ce8d(%rip),%ymm3        # 2b604 <_sk_srcover_rgba_8888_sse2_lowp+0x95c>
+  DB  196,226,125,24,29,29,208,1,0        ; vbroadcastss  0x1d01d(%rip),%ymm3        # 2b964 <_sk_srcover_rgba_8888_sse2_lowp+0x960>
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,29,132,206,1,0       ; vbroadcastss  0x1ce84(%rip),%ymm3        # 2b608 <_sk_srcover_rgba_8888_sse2_lowp+0x960>
+  DB  196,226,125,24,29,20,208,1,0        ; vbroadcastss  0x1d014(%rip),%ymm3        # 2b968 <_sk_srcover_rgba_8888_sse2_lowp+0x964>
   DB  197,244,89,203                      ; vmulps        %ymm3,%ymm1,%ymm1
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
-  DB  196,226,125,24,13,119,206,1,0       ; vbroadcastss  0x1ce77(%rip),%ymm1        # 2b60c <_sk_srcover_rgba_8888_sse2_lowp+0x964>
+  DB  196,226,125,24,13,7,208,1,0         ; vbroadcastss  0x1d007(%rip),%ymm1        # 2b96c <_sk_srcover_rgba_8888_sse2_lowp+0x968>
   DB  197,236,89,201                      ; vmulps        %ymm1,%ymm2,%ymm1
   DB  197,252,88,217                      ; vaddps        %ymm1,%ymm0,%ymm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -13911,9 +13966,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  72,139,104,8                        ; mov           0x8(%rax),%rbp
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            eb3c <_sk_evenly_spaced_gradient_avx+0x28>
+  DB  120,7                               ; js            ed0c <_sk_evenly_spaced_gradient_avx+0x28>
   DB  196,225,242,42,203                  ; vcvtsi2ss     %rbx,%xmm1,%xmm1
-  DB  235,21                              ; jmp           eb51 <_sk_evenly_spaced_gradient_avx+0x3d>
+  DB  235,21                              ; jmp           ed21 <_sk_evenly_spaced_gradient_avx+0x3d>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -14070,18 +14125,18 @@
 
 PUBLIC _sk_gauss_a_to_rgba_avx
 _sk_gauss_a_to_rgba_avx LABEL PROC
-  DB  196,226,125,24,5,140,199,1,0        ; vbroadcastss  0x1c78c(%rip),%ymm0        # 2b614 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
+  DB  196,226,125,24,5,28,201,1,0         ; vbroadcastss  0x1c91c(%rip),%ymm0        # 2b974 <_sk_srcover_rgba_8888_sse2_lowp+0x970>
   DB  197,228,89,192                      ; vmulps        %ymm0,%ymm3,%ymm0
-  DB  196,226,125,24,13,123,199,1,0       ; vbroadcastss  0x1c77b(%rip),%ymm1        # 2b610 <_sk_srcover_rgba_8888_sse2_lowp+0x968>
+  DB  196,226,125,24,13,11,201,1,0        ; vbroadcastss  0x1c90b(%rip),%ymm1        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0x96c>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,114,199,1,0       ; vbroadcastss  0x1c772(%rip),%ymm1        # 2b618 <_sk_srcover_rgba_8888_sse2_lowp+0x970>
+  DB  196,226,125,24,13,2,201,1,0         ; vbroadcastss  0x1c902(%rip),%ymm1        # 2b978 <_sk_srcover_rgba_8888_sse2_lowp+0x974>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,101,199,1,0       ; vbroadcastss  0x1c765(%rip),%ymm1        # 2b61c <_sk_srcover_rgba_8888_sse2_lowp+0x974>
+  DB  196,226,125,24,13,245,200,1,0       ; vbroadcastss  0x1c8f5(%rip),%ymm1        # 2b97c <_sk_srcover_rgba_8888_sse2_lowp+0x978>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  197,252,89,195                      ; vmulps        %ymm3,%ymm0,%ymm0
-  DB  196,226,125,24,13,88,199,1,0        ; vbroadcastss  0x1c758(%rip),%ymm1        # 2b620 <_sk_srcover_rgba_8888_sse2_lowp+0x978>
+  DB  196,226,125,24,13,232,200,1,0       ; vbroadcastss  0x1c8e8(%rip),%ymm1        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
   DB  197,252,88,193                      ; vaddps        %ymm1,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,252,40,200                      ; vmovaps       %ymm0,%ymm1
@@ -14102,12 +14157,12 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,81                              ; jb            ef4e <_sk_gradient_avx+0x72>
+  DB  114,81                              ; jb            f11e <_sk_gradient_avx+0x72>
   DB  72,139,88,72                        ; mov           0x48(%rax),%rbx
   DB  73,255,200                          ; dec           %r8
   DB  72,131,195,4                        ; add           $0x4,%rbx
   DB  196,65,52,87,201                    ; vxorps        %ymm9,%ymm9,%ymm9
-  DB  196,98,125,24,21,214,197,1,0        ; vbroadcastss  0x1c5d6(%rip),%ymm10        # 2b4ec <_sk_srcover_rgba_8888_sse2_lowp+0x844>
+  DB  196,98,125,24,21,102,199,1,0        ; vbroadcastss  0x1c766(%rip),%ymm10        # 2b84c <_sk_srcover_rgba_8888_sse2_lowp+0x848>
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  196,98,125,24,3                     ; vbroadcastss  (%rbx),%ymm8
   DB  197,60,194,192,2                    ; vcmpleps      %ymm0,%ymm8,%ymm8
@@ -14119,7 +14174,7 @@
   DB  196,227,117,24,202,1                ; vinsertf128   $0x1,%xmm2,%ymm1,%ymm1
   DB  72,131,195,4                        ; add           $0x4,%rbx
   DB  73,255,200                          ; dec           %r8
-  DB  117,204                             ; jne           ef1a <_sk_gradient_avx+0x3e>
+  DB  117,204                             ; jne           f0ea <_sk_gradient_avx+0x3e>
   DB  196,195,249,22,200,1                ; vpextrq       $0x1,%xmm1,%r8
   DB  69,137,193                          ; mov           %r8d,%r9d
   DB  73,193,232,32                       ; shr           $0x20,%r8
@@ -14298,27 +14353,27 @@
   DB  196,65,52,95,226                    ; vmaxps        %ymm10,%ymm9,%ymm12
   DB  196,65,36,94,220                    ; vdivps        %ymm12,%ymm11,%ymm11
   DB  196,65,36,89,227                    ; vmulps        %ymm11,%ymm11,%ymm12
-  DB  196,98,125,24,45,253,194,1,0        ; vbroadcastss  0x1c2fd(%rip),%ymm13        # 2b624 <_sk_srcover_rgba_8888_sse2_lowp+0x97c>
+  DB  196,98,125,24,45,141,196,1,0        ; vbroadcastss  0x1c48d(%rip),%ymm13        # 2b984 <_sk_srcover_rgba_8888_sse2_lowp+0x980>
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
-  DB  196,98,125,24,53,243,194,1,0        ; vbroadcastss  0x1c2f3(%rip),%ymm14        # 2b628 <_sk_srcover_rgba_8888_sse2_lowp+0x980>
+  DB  196,98,125,24,53,131,196,1,0        ; vbroadcastss  0x1c483(%rip),%ymm14        # 2b988 <_sk_srcover_rgba_8888_sse2_lowp+0x984>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
   DB  196,65,28,89,237                    ; vmulps        %ymm13,%ymm12,%ymm13
-  DB  196,98,125,24,53,228,194,1,0        ; vbroadcastss  0x1c2e4(%rip),%ymm14        # 2b62c <_sk_srcover_rgba_8888_sse2_lowp+0x984>
+  DB  196,98,125,24,53,116,196,1,0        ; vbroadcastss  0x1c474(%rip),%ymm14        # 2b98c <_sk_srcover_rgba_8888_sse2_lowp+0x988>
   DB  196,65,20,88,238                    ; vaddps        %ymm14,%ymm13,%ymm13
   DB  196,65,28,89,229                    ; vmulps        %ymm13,%ymm12,%ymm12
-  DB  196,98,125,24,45,213,194,1,0        ; vbroadcastss  0x1c2d5(%rip),%ymm13        # 2b630 <_sk_srcover_rgba_8888_sse2_lowp+0x988>
+  DB  196,98,125,24,45,101,196,1,0        ; vbroadcastss  0x1c465(%rip),%ymm13        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
   DB  196,65,28,88,229                    ; vaddps        %ymm13,%ymm12,%ymm12
   DB  196,65,36,89,220                    ; vmulps        %ymm12,%ymm11,%ymm11
   DB  196,65,52,194,202,1                 ; vcmpltps      %ymm10,%ymm9,%ymm9
-  DB  196,98,125,24,21,192,194,1,0        ; vbroadcastss  0x1c2c0(%rip),%ymm10        # 2b634 <_sk_srcover_rgba_8888_sse2_lowp+0x98c>
+  DB  196,98,125,24,21,80,196,1,0         ; vbroadcastss  0x1c450(%rip),%ymm10        # 2b994 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
   DB  196,65,44,92,211                    ; vsubps        %ymm11,%ymm10,%ymm10
   DB  196,67,37,74,202,144                ; vblendvps     %ymm9,%ymm10,%ymm11,%ymm9
   DB  196,193,124,194,192,1               ; vcmpltps      %ymm8,%ymm0,%ymm0
-  DB  196,98,125,24,21,86,193,1,0         ; vbroadcastss  0x1c156(%rip),%ymm10        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,21,230,194,1,0        ; vbroadcastss  0x1c2e6(%rip),%ymm10        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,44,92,209                    ; vsubps        %ymm9,%ymm10,%ymm10
   DB  196,195,53,74,194,0                 ; vblendvps     %ymm0,%ymm10,%ymm9,%ymm0
   DB  196,65,116,194,200,1                ; vcmpltps      %ymm8,%ymm1,%ymm9
-  DB  196,98,125,24,21,64,193,1,0         ; vbroadcastss  0x1c140(%rip),%ymm10        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,21,208,194,1,0        ; vbroadcastss  0x1c2d0(%rip),%ymm10        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,44,92,208                       ; vsubps        %ymm0,%ymm10,%ymm10
   DB  196,195,125,74,194,144              ; vblendvps     %ymm9,%ymm10,%ymm0,%ymm0
   DB  196,65,124,194,200,3                ; vcmpunordps   %ymm8,%ymm0,%ymm9
@@ -14344,7 +14399,7 @@
   DB  196,67,121,4,210,0                  ; vpermilps     $0x0,%xmm10,%xmm10
   DB  196,67,45,24,210,1                  ; vinsertf128   $0x1,%xmm10,%ymm10,%ymm10
   DB  197,44,88,208                       ; vaddps        %ymm0,%ymm10,%ymm10
-  DB  196,98,125,24,29,54,194,1,0         ; vbroadcastss  0x1c236(%rip),%ymm11        # 2b638 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  DB  196,98,125,24,29,198,195,1,0        ; vbroadcastss  0x1c3c6(%rip),%ymm11        # 2b998 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
   DB  197,252,89,192                      ; vmulps        %ymm0,%ymm0,%ymm0
   DB  197,116,89,217                      ; vmulps        %ymm1,%ymm1,%ymm11
@@ -14353,17 +14408,17 @@
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,164,92,192                      ; vsubps        %ymm0,%ymm11,%ymm0
-  DB  196,98,125,24,13,10,194,1,0         ; vbroadcastss  0x1c20a(%rip),%ymm9        # 2b63c <_sk_srcover_rgba_8888_sse2_lowp+0x994>
+  DB  196,98,125,24,13,154,195,1,0        ; vbroadcastss  0x1c39a(%rip),%ymm9        # 2b99c <_sk_srcover_rgba_8888_sse2_lowp+0x998>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  196,65,44,89,194                    ; vmulps        %ymm10,%ymm10,%ymm8
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
   DB  197,252,81,192                      ; vsqrtps       %ymm0,%ymm0
   DB  196,98,125,24,64,36                 ; vbroadcastss  0x24(%rax),%ymm8
-  DB  196,98,125,24,13,232,193,1,0        ; vbroadcastss  0x1c1e8(%rip),%ymm9        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,13,120,195,1,0        ; vbroadcastss  0x1c378(%rip),%ymm9        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,65,44,87,201                    ; vxorps        %ymm9,%ymm10,%ymm9
   DB  196,65,124,92,210                   ; vsubps        %ymm10,%ymm0,%ymm10
-  DB  196,98,125,24,29,121,192,1,0        ; vbroadcastss  0x1c079(%rip),%ymm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,29,9,194,1,0          ; vbroadcastss  0x1c209(%rip),%ymm11        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  196,65,60,89,210                    ; vmulps        %ymm10,%ymm8,%ymm10
   DB  197,180,92,192                      ; vsubps        %ymm0,%ymm9,%ymm0
@@ -14381,7 +14436,7 @@
   DB  196,67,121,4,210,0                  ; vpermilps     $0x0,%xmm10,%xmm10
   DB  196,67,45,24,210,1                  ; vinsertf128   $0x1,%xmm10,%ymm10,%ymm10
   DB  197,44,88,208                       ; vaddps        %ymm0,%ymm10,%ymm10
-  DB  196,98,125,24,29,136,193,1,0        ; vbroadcastss  0x1c188(%rip),%ymm11        # 2b638 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  DB  196,98,125,24,29,24,195,1,0         ; vbroadcastss  0x1c318(%rip),%ymm11        # 2b998 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   DB  196,65,44,89,211                    ; vmulps        %ymm11,%ymm10,%ymm10
   DB  197,252,89,192                      ; vmulps        %ymm0,%ymm0,%ymm0
   DB  197,116,89,217                      ; vmulps        %ymm1,%ymm1,%ymm11
@@ -14390,17 +14445,17 @@
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,164,92,192                      ; vsubps        %ymm0,%ymm11,%ymm0
-  DB  196,98,125,24,13,92,193,1,0         ; vbroadcastss  0x1c15c(%rip),%ymm9        # 2b63c <_sk_srcover_rgba_8888_sse2_lowp+0x994>
+  DB  196,98,125,24,13,236,194,1,0        ; vbroadcastss  0x1c2ec(%rip),%ymm9        # 2b99c <_sk_srcover_rgba_8888_sse2_lowp+0x998>
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
   DB  197,188,89,192                      ; vmulps        %ymm0,%ymm8,%ymm0
   DB  196,65,44,89,194                    ; vmulps        %ymm10,%ymm10,%ymm8
   DB  196,193,124,88,192                  ; vaddps        %ymm8,%ymm0,%ymm0
   DB  197,252,81,192                      ; vsqrtps       %ymm0,%ymm0
   DB  196,98,125,24,64,36                 ; vbroadcastss  0x24(%rax),%ymm8
-  DB  196,98,125,24,13,58,193,1,0         ; vbroadcastss  0x1c13a(%rip),%ymm9        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,13,202,194,1,0        ; vbroadcastss  0x1c2ca(%rip),%ymm9        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,65,44,87,201                    ; vxorps        %ymm9,%ymm10,%ymm9
   DB  196,65,124,92,210                   ; vsubps        %ymm10,%ymm0,%ymm10
-  DB  196,98,125,24,29,203,191,1,0        ; vbroadcastss  0x1bfcb(%rip),%ymm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,29,91,193,1,0         ; vbroadcastss  0x1c15b(%rip),%ymm11        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,60,89,195                    ; vmulps        %ymm11,%ymm8,%ymm8
   DB  196,65,60,89,210                    ; vmulps        %ymm10,%ymm8,%ymm10
   DB  197,180,92,192                      ; vsubps        %ymm0,%ymm9,%ymm0
@@ -14417,7 +14472,7 @@
   DB  196,67,121,4,201,0                  ; vpermilps     $0x0,%xmm9,%xmm9
   DB  196,67,53,24,201,1                  ; vinsertf128   $0x1,%xmm9,%ymm9,%ymm9
   DB  197,52,88,200                       ; vaddps        %ymm0,%ymm9,%ymm9
-  DB  196,98,125,24,21,224,192,1,0        ; vbroadcastss  0x1c0e0(%rip),%ymm10        # 2b638 <_sk_srcover_rgba_8888_sse2_lowp+0x990>
+  DB  196,98,125,24,21,112,194,1,0        ; vbroadcastss  0x1c270(%rip),%ymm10        # 2b998 <_sk_srcover_rgba_8888_sse2_lowp+0x994>
   DB  196,65,52,89,202                    ; vmulps        %ymm10,%ymm9,%ymm9
   DB  197,252,89,192                      ; vmulps        %ymm0,%ymm0,%ymm0
   DB  197,116,89,209                      ; vmulps        %ymm1,%ymm1,%ymm10
@@ -14426,7 +14481,7 @@
   DB  196,227,121,4,192,0                 ; vpermilps     $0x0,%xmm0,%xmm0
   DB  196,227,125,24,192,1                ; vinsertf128   $0x1,%xmm0,%ymm0,%ymm0
   DB  197,172,92,192                      ; vsubps        %ymm0,%ymm10,%ymm0
-  DB  196,98,125,24,5,184,192,1,0         ; vbroadcastss  0x1c0b8(%rip),%ymm8        # 2b640 <_sk_srcover_rgba_8888_sse2_lowp+0x998>
+  DB  196,98,125,24,5,72,194,1,0          ; vbroadcastss  0x1c248(%rip),%ymm8        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
   DB  196,193,124,87,192                  ; vxorps        %ymm8,%ymm0,%ymm0
   DB  196,193,124,94,193                  ; vdivps        %ymm9,%ymm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14461,7 +14516,7 @@
 PUBLIC _sk_save_xy_avx
 _sk_save_xy_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,244,190,1,0         ; vbroadcastss  0x1bef4(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,132,192,1,0         ; vbroadcastss  0x1c084(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,124,88,200                   ; vaddps        %ymm8,%ymm0,%ymm9
   DB  196,67,125,8,209,1                  ; vroundps      $0x1,%ymm9,%ymm10
   DB  196,65,52,92,202                    ; vsubps        %ymm10,%ymm9,%ymm9
@@ -14494,9 +14549,9 @@
 PUBLIC _sk_bilinear_nx_avx
 _sk_bilinear_nx_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,220,191,1,0        ; vbroadcastss  0x1bfdc(%rip),%ymm0        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,5,108,193,1,0        ; vbroadcastss  0x1c16c(%rip),%ymm0        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,115,190,1,0         ; vbroadcastss  0x1be73(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,3,192,1,0           ; vbroadcastss  0x1c003(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,64                     ; vsubps        0x40(%rax),%ymm8,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14505,7 +14560,7 @@
 PUBLIC _sk_bilinear_px_avx
 _sk_bilinear_px_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,83,190,1,0         ; vbroadcastss  0x1be53(%rip),%ymm0        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,5,227,191,1,0        ; vbroadcastss  0x1bfe3(%rip),%ymm0        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,64,64                    ; vmovups       0x40(%rax),%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
@@ -14515,9 +14570,9 @@
 PUBLIC _sk_bilinear_ny_avx
 _sk_bilinear_ny_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,147,191,1,0       ; vbroadcastss  0x1bf93(%rip),%ymm1        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,13,35,193,1,0        ; vbroadcastss  0x1c123(%rip),%ymm1        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,41,190,1,0          ; vbroadcastss  0x1be29(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,185,191,1,0         ; vbroadcastss  0x1bfb9(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,96                     ; vsubps        0x60(%rax),%ymm8,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14526,7 +14581,7 @@
 PUBLIC _sk_bilinear_py_avx
 _sk_bilinear_py_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,9,190,1,0         ; vbroadcastss  0x1be09(%rip),%ymm1        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,226,125,24,13,153,191,1,0       ; vbroadcastss  0x1bf99(%rip),%ymm1        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
   DB  197,124,16,64,96                    ; vmovups       0x60(%rax),%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
@@ -14536,14 +14591,14 @@
 PUBLIC _sk_bicubic_n3x_avx
 _sk_bicubic_n3x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,76,191,1,0         ; vbroadcastss  0x1bf4c(%rip),%ymm0        # 2b648 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  DB  196,226,125,24,5,220,192,1,0        ; vbroadcastss  0x1c0dc(%rip),%ymm0        # 2b9a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,223,189,1,0         ; vbroadcastss  0x1bddf(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,111,191,1,0         ; vbroadcastss  0x1bf6f(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,64                     ; vsubps        0x40(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,48,191,1,0         ; vbroadcastss  0x1bf30(%rip),%ymm10        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,192,192,1,0        ; vbroadcastss  0x1c0c0(%rip),%ymm10        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,46,190,1,0         ; vbroadcastss  0x1be2e(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  DB  196,98,125,24,21,190,191,1,0        ; vbroadcastss  0x1bfbe(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
@@ -14553,19 +14608,19 @@
 PUBLIC _sk_bicubic_n1x_avx
 _sk_bicubic_n1x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,249,190,1,0        ; vbroadcastss  0x1bef9(%rip),%ymm0        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,5,137,192,1,0        ; vbroadcastss  0x1c089(%rip),%ymm0        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
-  DB  196,98,125,24,5,144,189,1,0         ; vbroadcastss  0x1bd90(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,32,191,1,0          ; vbroadcastss  0x1bf20(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,64                     ; vsubps        0x40(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,238,190,1,0        ; vbroadcastss  0x1beee(%rip),%ymm9        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,13,126,192,1,0        ; vbroadcastss  0x1c07e(%rip),%ymm9        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,220,190,1,0        ; vbroadcastss  0x1bedc(%rip),%ymm10        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,98,125,24,21,108,192,1,0        ; vbroadcastss  0x1c06c(%rip),%ymm10        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,93,189,1,0         ; vbroadcastss  0x1bd5d(%rip),%ymm10        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,21,237,190,1,0        ; vbroadcastss  0x1beed(%rip),%ymm10        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,190,190,1,0        ; vbroadcastss  0x1bebe(%rip),%ymm9        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,13,78,192,1,0         ; vbroadcastss  0x1c04e(%rip),%ymm9        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14574,17 +14629,17 @@
 PUBLIC _sk_bicubic_p1x_avx
 _sk_bicubic_p1x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,46,189,1,0          ; vbroadcastss  0x1bd2e(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,190,190,1,0         ; vbroadcastss  0x1bebe(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,188,88,0                        ; vaddps        (%rax),%ymm8,%ymm0
   DB  197,124,16,72,64                    ; vmovups       0x40(%rax),%ymm9
-  DB  196,98,125,24,21,140,190,1,0        ; vbroadcastss  0x1be8c(%rip),%ymm10        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,21,28,192,1,0         ; vbroadcastss  0x1c01c(%rip),%ymm10        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
-  DB  196,98,125,24,29,122,190,1,0        ; vbroadcastss  0x1be7a(%rip),%ymm11        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,98,125,24,29,10,192,1,0         ; vbroadcastss  0x1c00a(%rip),%ymm11        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
   DB  196,65,44,88,192                    ; vaddps        %ymm8,%ymm10,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,101,190,1,0        ; vbroadcastss  0x1be65(%rip),%ymm9        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,13,245,191,1,0        ; vbroadcastss  0x1bff5(%rip),%ymm9        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14593,13 +14648,13 @@
 PUBLIC _sk_bicubic_p3x_avx
 _sk_bicubic_p3x_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,5,65,190,1,0         ; vbroadcastss  0x1be41(%rip),%ymm0        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,226,125,24,5,209,191,1,0        ; vbroadcastss  0x1bfd1(%rip),%ymm0        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  197,252,88,0                        ; vaddps        (%rax),%ymm0,%ymm0
   DB  197,124,16,64,64                    ; vmovups       0x40(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,38,190,1,0         ; vbroadcastss  0x1be26(%rip),%ymm10        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,182,191,1,0        ; vbroadcastss  0x1bfb6(%rip),%ymm10        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,36,189,1,0         ; vbroadcastss  0x1bd24(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  DB  196,98,125,24,21,180,190,1,0        ; vbroadcastss  0x1beb4(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,128,0,0,0            ; vmovups       %ymm8,0x80(%rax)
@@ -14609,14 +14664,14 @@
 PUBLIC _sk_bicubic_n3y_avx
 _sk_bicubic_n3y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,243,189,1,0       ; vbroadcastss  0x1bdf3(%rip),%ymm1        # 2b648 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
+  DB  196,226,125,24,13,131,191,1,0       ; vbroadcastss  0x1bf83(%rip),%ymm1        # 2b9a8 <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,133,188,1,0         ; vbroadcastss  0x1bc85(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,21,190,1,0          ; vbroadcastss  0x1be15(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,96                     ; vsubps        0x60(%rax),%ymm8,%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,214,189,1,0        ; vbroadcastss  0x1bdd6(%rip),%ymm10        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,102,191,1,0        ; vbroadcastss  0x1bf66(%rip),%ymm10        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,212,188,1,0        ; vbroadcastss  0x1bcd4(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  DB  196,98,125,24,21,100,190,1,0        ; vbroadcastss  0x1be64(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
@@ -14626,19 +14681,19 @@
 PUBLIC _sk_bicubic_n1y_avx
 _sk_bicubic_n1y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,159,189,1,0       ; vbroadcastss  0x1bd9f(%rip),%ymm1        # 2b644 <_sk_srcover_rgba_8888_sse2_lowp+0x99c>
+  DB  196,226,125,24,13,47,191,1,0        ; vbroadcastss  0x1bf2f(%rip),%ymm1        # 2b9a4 <_sk_srcover_rgba_8888_sse2_lowp+0x9a0>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
-  DB  196,98,125,24,5,53,188,1,0          ; vbroadcastss  0x1bc35(%rip),%ymm8        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,98,125,24,5,197,189,1,0         ; vbroadcastss  0x1bdc5(%rip),%ymm8        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,60,92,64,96                     ; vsubps        0x60(%rax),%ymm8,%ymm8
-  DB  196,98,125,24,13,147,189,1,0        ; vbroadcastss  0x1bd93(%rip),%ymm9        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,13,35,191,1,0         ; vbroadcastss  0x1bf23(%rip),%ymm9        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,129,189,1,0        ; vbroadcastss  0x1bd81(%rip),%ymm10        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,98,125,24,21,17,191,1,0         ; vbroadcastss  0x1bf11(%rip),%ymm10        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,201                    ; vmulps        %ymm9,%ymm8,%ymm9
-  DB  196,98,125,24,21,2,188,1,0          ; vbroadcastss  0x1bc02(%rip),%ymm10        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,21,146,189,1,0        ; vbroadcastss  0x1bd92(%rip),%ymm10        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,65,52,88,202                    ; vaddps        %ymm10,%ymm9,%ymm9
   DB  196,65,60,89,193                    ; vmulps        %ymm9,%ymm8,%ymm8
-  DB  196,98,125,24,13,99,189,1,0         ; vbroadcastss  0x1bd63(%rip),%ymm9        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,13,243,190,1,0        ; vbroadcastss  0x1bef3(%rip),%ymm9        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14647,17 +14702,17 @@
 PUBLIC _sk_bicubic_p1y_avx
 _sk_bicubic_p1y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,98,125,24,5,211,187,1,0         ; vbroadcastss  0x1bbd3(%rip),%ymm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  196,98,125,24,5,99,189,1,0          ; vbroadcastss  0x1bd63(%rip),%ymm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  197,188,88,72,32                    ; vaddps        0x20(%rax),%ymm8,%ymm1
   DB  197,124,16,72,96                    ; vmovups       0x60(%rax),%ymm9
-  DB  196,98,125,24,21,48,189,1,0         ; vbroadcastss  0x1bd30(%rip),%ymm10        # 2b654 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
+  DB  196,98,125,24,21,192,190,1,0        ; vbroadcastss  0x1bec0(%rip),%ymm10        # 2b9b4 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
-  DB  196,98,125,24,29,30,189,1,0         ; vbroadcastss  0x1bd1e(%rip),%ymm11        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,98,125,24,29,174,190,1,0        ; vbroadcastss  0x1beae(%rip),%ymm11        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  196,65,44,88,211                    ; vaddps        %ymm11,%ymm10,%ymm10
   DB  196,65,52,89,210                    ; vmulps        %ymm10,%ymm9,%ymm10
   DB  196,65,44,88,192                    ; vaddps        %ymm8,%ymm10,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
-  DB  196,98,125,24,13,9,189,1,0          ; vbroadcastss  0x1bd09(%rip),%ymm9        # 2b658 <_sk_srcover_rgba_8888_sse2_lowp+0x9b0>
+  DB  196,98,125,24,13,153,190,1,0        ; vbroadcastss  0x1be99(%rip),%ymm9        # 2b9b8 <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
   DB  196,65,60,88,193                    ; vaddps        %ymm9,%ymm8,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -14666,13 +14721,13 @@
 PUBLIC _sk_bicubic_p3y_avx
 _sk_bicubic_p3y_avx LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,13,229,188,1,0       ; vbroadcastss  0x1bce5(%rip),%ymm1        # 2b650 <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
+  DB  196,226,125,24,13,117,190,1,0       ; vbroadcastss  0x1be75(%rip),%ymm1        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ac>
   DB  197,244,88,72,32                    ; vaddps        0x20(%rax),%ymm1,%ymm1
   DB  197,124,16,64,96                    ; vmovups       0x60(%rax),%ymm8
   DB  196,65,60,89,200                    ; vmulps        %ymm8,%ymm8,%ymm9
-  DB  196,98,125,24,21,201,188,1,0        ; vbroadcastss  0x1bcc9(%rip),%ymm10        # 2b64c <_sk_srcover_rgba_8888_sse2_lowp+0x9a4>
+  DB  196,98,125,24,21,89,190,1,0         ; vbroadcastss  0x1be59(%rip),%ymm10        # 2b9ac <_sk_srcover_rgba_8888_sse2_lowp+0x9a8>
   DB  196,65,60,89,194                    ; vmulps        %ymm10,%ymm8,%ymm8
-  DB  196,98,125,24,21,199,187,1,0        ; vbroadcastss  0x1bbc7(%rip),%ymm10        # 2b558 <_sk_srcover_rgba_8888_sse2_lowp+0x8b0>
+  DB  196,98,125,24,21,87,189,1,0         ; vbroadcastss  0x1bd57(%rip),%ymm10        # 2b8b8 <_sk_srcover_rgba_8888_sse2_lowp+0x8b4>
   DB  196,65,60,88,194                    ; vaddps        %ymm10,%ymm8,%ymm8
   DB  196,65,52,89,192                    ; vmulps        %ymm8,%ymm9,%ymm8
   DB  197,124,17,128,160,0,0,0            ; vmovups       %ymm8,0xa0(%rax)
@@ -14808,7 +14863,7 @@
   DB  72,139,0                            ; mov           (%rax),%rax
   DB  197,217,254,207                     ; vpaddd        %xmm7,%xmm4,%xmm1
   DB  197,249,254,193                     ; vpaddd        %xmm1,%xmm0,%xmm0
-  DB  196,226,121,24,37,107,186,1,0       ; vbroadcastss  0x1ba6b(%rip),%xmm4        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  DB  196,226,121,24,37,251,187,1,0       ; vbroadcastss  0x1bbfb(%rip),%xmm4        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   DB  196,98,121,64,228                   ; vpmulld       %xmm4,%xmm0,%xmm12
   DB  196,226,49,64,198                   ; vpmulld       %xmm6,%xmm9,%xmm0
   DB  197,249,127,132,36,0,1,0,0          ; vmovdqa       %xmm0,0x100(%rsp)
@@ -14862,7 +14917,7 @@
   DB  196,161,122,16,60,128               ; vmovss        (%rax,%r8,4),%xmm7
   DB  196,227,73,33,247,48                ; vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   DB  196,227,77,24,237,1                 ; vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  DB  196,98,121,24,21,212,183,1,0        ; vbroadcastss  0x1b7d4(%rip),%xmm10        # 2b4f4 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,98,121,24,21,100,185,1,0        ; vbroadcastss  0x1b964(%rip),%xmm10        # 2b854 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   DB  196,193,105,254,210                 ; vpaddd        %xmm10,%xmm2,%xmm2
   DB  196,195,249,22,208,1                ; vpextrq       $0x1,%xmm2,%r8
   DB  196,193,249,126,209                 ; vmovq         %xmm2,%r9
@@ -14890,7 +14945,7 @@
   DB  196,161,122,16,60,128               ; vmovss        (%rax,%r8,4),%xmm7
   DB  196,227,73,33,247,48                ; vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   DB  196,227,77,24,210,1                 ; vinsertf128   $0x1,%xmm2,%ymm6,%ymm2
-  DB  196,226,125,24,61,168,184,1,0       ; vbroadcastss  0x1b8a8(%rip),%ymm7        # 2b65c <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  DB  196,226,125,24,61,56,186,1,0        ; vbroadcastss  0x1ba38(%rip),%ymm7        # 2b9bc <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   DB  197,148,88,247                      ; vaddps        %ymm7,%ymm13,%ymm6
   DB  197,124,40,231                      ; vmovaps       %ymm7,%ymm12
   DB  197,124,17,164,36,128,0,0,0         ; vmovups       %ymm12,0x80(%rsp)
@@ -15631,7 +15686,7 @@
   DB  197,249,127,132,36,160,0,0,0        ; vmovdqa       %xmm0,0xa0(%rsp)
   DB  197,225,254,216                     ; vpaddd        %xmm0,%xmm3,%xmm3
   DB  197,233,254,195                     ; vpaddd        %xmm3,%xmm2,%xmm0
-  DB  196,98,121,24,13,57,169,1,0         ; vbroadcastss  0x1a939(%rip),%xmm9        # 2b660 <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
+  DB  196,98,121,24,13,201,170,1,0        ; vbroadcastss  0x1aac9(%rip),%xmm9        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0x9bc>
   DB  196,194,121,64,209                  ; vpmulld       %xmm9,%xmm0,%xmm2
   DB  196,226,81,64,199                   ; vpmulld       %xmm7,%xmm5,%xmm0
   DB  197,249,127,132,36,224,1,0,0        ; vmovdqa       %xmm0,0x1e0(%rsp)
@@ -15688,7 +15743,7 @@
   DB  196,161,122,16,60,128               ; vmovss        (%rax,%r8,4),%xmm7
   DB  196,227,73,33,247,48                ; vinsertps     $0x30,%xmm7,%xmm6,%xmm6
   DB  196,227,77,24,237,1                 ; vinsertf128   $0x1,%xmm5,%ymm6,%ymm5
-  DB  196,98,121,24,21,146,166,1,0        ; vbroadcastss  0x1a692(%rip),%xmm10        # 2b4f4 <_sk_srcover_rgba_8888_sse2_lowp+0x84c>
+  DB  196,98,121,24,21,34,168,1,0         ; vbroadcastss  0x1a822(%rip),%xmm10        # 2b854 <_sk_srcover_rgba_8888_sse2_lowp+0x850>
   DB  196,193,121,254,194                 ; vpaddd        %xmm10,%xmm0,%xmm0
   DB  196,195,249,22,192,1                ; vpextrq       $0x1,%xmm0,%r8
   DB  196,193,249,126,193                 ; vmovq         %xmm0,%r9
@@ -15716,7 +15771,7 @@
   DB  196,161,122,16,52,128               ; vmovss        (%rax,%r8,4),%xmm6
   DB  196,227,105,33,214,48               ; vinsertps     $0x30,%xmm6,%xmm2,%xmm2
   DB  196,227,109,24,208,1                ; vinsertf128   $0x1,%xmm0,%ymm2,%ymm2
-  DB  196,98,125,24,37,102,167,1,0        ; vbroadcastss  0x1a766(%rip),%ymm12        # 2b65c <_sk_srcover_rgba_8888_sse2_lowp+0x9b4>
+  DB  196,98,125,24,37,246,168,1,0        ; vbroadcastss  0x1a8f6(%rip),%ymm12        # 2b9bc <_sk_srcover_rgba_8888_sse2_lowp+0x9b8>
   DB  196,193,4,88,196                    ; vaddps        %ymm12,%ymm15,%ymm0
   DB  197,124,17,164,36,128,0,0,0         ; vmovups       %ymm12,0x80(%rsp)
   DB  197,254,91,192                      ; vcvttps2dq    %ymm0,%ymm0
@@ -17114,7 +17169,7 @@
   DB  197,228,89,210                      ; vmulps        %ymm2,%ymm3,%ymm2
   DB  197,220,88,210                      ; vaddps        %ymm2,%ymm4,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,24,29,108,136,1,0       ; vbroadcastss  0x1886c(%rip),%ymm3        # 2b4e8 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  196,226,125,24,29,252,137,1,0       ; vbroadcastss  0x189fc(%rip),%ymm3        # 2b848 <_sk_srcover_rgba_8888_sse2_lowp+0x844>
   DB  197,252,16,164,36,192,2,0,0         ; vmovups       0x2c0(%rsp),%ymm4
   DB  197,252,16,172,36,224,2,0,0         ; vmovups       0x2e0(%rsp),%ymm5
   DB  197,252,16,180,36,0,3,0,0           ; vmovups       0x300(%rsp),%ymm6
@@ -17157,13 +17212,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  115,101                             ; jae           12d92 <_sk_start_pipeline_sse41+0xe2>
+  DB  115,101                             ; jae           12f62 <_sk_start_pipeline_sse41+0xe2>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,4                         ; lea           0x4(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,38                              ; ja            12d75 <_sk_start_pipeline_sse41+0xc5>
+  DB  119,38                              ; ja            12f45 <_sk_start_pipeline_sse41+0xc5>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  76,137,246                          ; mov           %r14,%rsi
@@ -17174,16 +17229,16 @@
   DB  73,131,196,8                        ; add           $0x8,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,225                             ; jbe           12d56 <_sk_start_pipeline_sse41+0xa6>
+  DB  118,225                             ; jbe           12f26 <_sk_start_pipeline_sse41+0xa6>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,9                               ; je            12d86 <_sk_start_pipeline_sse41+0xd6>
+  DB  116,9                               ; je            12f56 <_sk_start_pipeline_sse41+0xd6>
   DB  76,137,246                          ; mov           %r14,%rsi
   DB  72,137,217                          ; mov           %rbx,%rcx
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  117,173                             ; jne           12d3f <_sk_start_pipeline_sse41+0x8f>
+  DB  117,173                             ; jne           12f0f <_sk_start_pipeline_sse41+0x8f>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -17214,13 +17269,13 @@
   DB  102,15,110,194                      ; movd          %edx,%xmm0
   DB  102,15,112,192,0                    ; pshufd        $0x0,%xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,88,5,212,136,1,0                 ; addps         0x188d4(%rip),%xmm0        # 2b6d0 <_sk_srcover_rgba_8888_sse2_lowp+0xa28>
+  DB  15,88,5,100,138,1,0                 ; addps         0x18a64(%rip),%xmm0        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xa2c>
   DB  102,15,110,201                      ; movd          %ecx,%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,88,13,209,136,1,0                ; addps         0x188d1(%rip),%xmm1        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,88,13,97,138,1,0                 ; addps         0x18a61(%rip),%xmm1        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,21,216,136,1,0                ; movaps        0x188d8(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,104,138,1,0                ; movaps        0x18a68(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
@@ -17233,18 +17288,18 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,68,15,110,194                   ; movd          %edx,%xmm8
   DB  102,69,15,112,192,0                 ; pshufd        $0x0,%xmm8,%xmm8
-  DB  102,68,15,254,5,113,136,1,0         ; paddd         0x18871(%rip),%xmm8        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0xa08>
+  DB  102,68,15,254,5,1,138,1,0           ; paddd         0x18a01(%rip),%xmm8        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xa0c>
   DB  102,68,15,110,201                   ; movd          %ecx,%xmm9
   DB  102,69,15,112,201,0                 ; pshufd        $0x0,%xmm9,%xmm9
   DB  102,69,15,239,200                   ; pxor          %xmm8,%xmm9
-  DB  102,68,15,111,21,168,136,1,0        ; movdqa        0x188a8(%rip),%xmm10        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0xa58>
+  DB  102,68,15,111,21,56,138,1,0         ; movdqa        0x18a38(%rip),%xmm10        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0xa5c>
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
   DB  102,69,15,219,218                   ; pand          %xmm10,%xmm11
   DB  102,65,15,114,243,5                 ; pslld         $0x5,%xmm11
   DB  102,69,15,219,208                   ; pand          %xmm8,%xmm10
   DB  102,65,15,114,242,4                 ; pslld         $0x4,%xmm10
-  DB  102,68,15,111,37,148,136,1,0        ; movdqa        0x18894(%rip),%xmm12        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0xa68>
-  DB  102,68,15,111,45,155,136,1,0        ; movdqa        0x1889b(%rip),%xmm13        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,37,36,138,1,0         ; movdqa        0x18a24(%rip),%xmm12        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0xa6c>
+  DB  102,68,15,111,45,43,138,1,0         ; movdqa        0x18a2b(%rip),%xmm13        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,69,15,111,241                   ; movdqa        %xmm9,%xmm14
   DB  102,69,15,219,245                   ; pand          %xmm13,%xmm14
   DB  102,65,15,114,246,2                 ; pslld         $0x2,%xmm14
@@ -17260,8 +17315,8 @@
   DB  102,69,15,235,198                   ; por           %xmm14,%xmm8
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,86,136,1,0               ; mulps         0x18856(%rip),%xmm8        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0xa88>
-  DB  68,15,88,5,94,136,1,0               ; addps         0x1885e(%rip),%xmm8        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0xa98>
+  DB  68,15,89,5,230,137,1,0              ; mulps         0x189e6(%rip),%xmm8        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0xa8c>
+  DB  68,15,88,5,238,137,1,0              ; addps         0x189ee(%rip),%xmm8        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0xa9c>
   DB  243,68,15,16,16                     ; movss         (%rax),%xmm10
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,89,208                        ; mulps         %xmm8,%xmm10
@@ -17299,7 +17354,7 @@
 PUBLIC _sk_black_color_sse41
 _sk_black_color_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,148,135,1,0                ; movaps        0x18794(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,36,137,1,0                 ; movaps        0x18924(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -17308,7 +17363,7 @@
 PUBLIC _sk_white_color_sse41
 _sk_white_color_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,128,135,1,0                 ; movaps        0x18780(%rip),%xmm0        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,5,16,137,1,0                  ; movaps        0x18910(%rip),%xmm0        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -17346,7 +17401,7 @@
 PUBLIC _sk_srcatop_sse41
 _sk_srcatop_sse41 LABEL PROC
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  68,15,40,5,48,135,1,0               ; movaps        0x18730(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,192,136,1,0              ; movaps        0x188c0(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -17369,7 +17424,7 @@
 _sk_dstatop_sse41 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
   DB  68,15,89,196                        ; mulps         %xmm4,%xmm8
-  DB  68,15,40,13,227,134,1,0             ; movaps        0x186e3(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,115,136,1,0             ; movaps        0x18873(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
@@ -17410,7 +17465,7 @@
 
 PUBLIC _sk_srcout_sse41
 _sk_srcout_sse41 LABEL PROC
-  DB  68,15,40,5,119,134,1,0              ; movaps        0x18677(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,7,136,1,0                ; movaps        0x18807(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
@@ -17421,7 +17476,7 @@
 
 PUBLIC _sk_dstout_sse41
 _sk_dstout_sse41 LABEL PROC
-  DB  68,15,40,5,87,134,1,0               ; movaps        0x18657(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,231,135,1,0              ; movaps        0x187e7(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -17436,7 +17491,7 @@
 
 PUBLIC _sk_srcover_sse41
 _sk_srcover_sse41 LABEL PROC
-  DB  68,15,40,5,42,134,1,0               ; movaps        0x1862a(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,186,135,1,0              ; movaps        0x187ba(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -17454,7 +17509,7 @@
 
 PUBLIC _sk_dstover_sse41
 _sk_dstover_sse41 LABEL PROC
-  DB  68,15,40,5,238,133,1,0              ; movaps        0x185ee(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,126,135,1,0              ; movaps        0x1877e(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -17478,7 +17533,7 @@
 
 PUBLIC _sk_multiply_sse41
 _sk_multiply_sse41 LABEL PROC
-  DB  68,15,40,5,178,133,1,0              ; movaps        0x185b2(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,66,135,1,0               ; movaps        0x18742(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
@@ -17514,7 +17569,7 @@
 PUBLIC _sk_plus__sse41
 _sk_plus__sse41 LABEL PROC
   DB  15,88,196                           ; addps         %xmm4,%xmm0
-  DB  68,15,40,5,51,133,1,0               ; movaps        0x18533(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,195,134,1,0              ; movaps        0x186c3(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  15,88,205                           ; addps         %xmm5,%xmm1
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
@@ -17552,7 +17607,7 @@
 PUBLIC _sk_xor__sse41
 _sk_xor__sse41 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
-  DB  15,40,29,191,132,1,0                ; movaps        0x184bf(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,79,134,1,0                 ; movaps        0x1864f(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
@@ -17598,7 +17653,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,95,209                        ; maxps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,26,132,1,0                 ; movaps        0x1841a(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,170,133,1,0                ; movaps        0x185aa(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -17630,7 +17685,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,175,131,1,0                ; movaps        0x183af(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,63,133,1,0                 ; movaps        0x1853f(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -17665,7 +17720,7 @@
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,57,131,1,0                 ; movaps        0x18339(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,201,132,1,0                ; movaps        0x184c9(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -17691,7 +17746,7 @@
   DB  15,89,214                           ; mulps         %xmm6,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,233,130,1,0                ; movaps        0x182e9(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,121,132,1,0                ; movaps        0x18479(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -17701,7 +17756,7 @@
 
 PUBLIC _sk_colorburn_sse41
 _sk_colorburn_sse41 LABEL PROC
-  DB  68,15,40,29,208,130,1,0             ; movaps        0x182d0(%rip),%xmm11        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,29,96,132,1,0              ; movaps        0x18460(%rip),%xmm11        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
   DB  68,15,92,231                        ; subps         %xmm7,%xmm12
   DB  69,15,40,204                        ; movaps        %xmm12,%xmm9
@@ -17783,7 +17838,7 @@
 PUBLIC _sk_colordodge_sse41
 _sk_colordodge_sse41 LABEL PROC
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,40,21,154,129,1,0             ; movaps        0x1819a(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,42,131,1,0              ; movaps        0x1832a(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
   DB  68,15,92,223                        ; subps         %xmm7,%xmm11
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
@@ -17864,7 +17919,7 @@
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
-  DB  68,15,40,21,98,128,1,0              ; movaps        0x18062(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,242,129,1,0             ; movaps        0x181f2(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,40,234                        ; movaps        %xmm10,%xmm5
   DB  15,92,239                           ; subps         %xmm7,%xmm5
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
@@ -17946,7 +18001,7 @@
 _sk_overlay_sse41 LABEL PROC
   DB  68,15,40,201                        ; movaps        %xmm1,%xmm9
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
-  DB  68,15,40,21,52,127,1,0              ; movaps        0x17f34(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,196,128,1,0             ; movaps        0x180c4(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
   DB  68,15,92,223                        ; subps         %xmm7,%xmm11
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
@@ -18030,7 +18085,7 @@
   DB  15,40,198                           ; movaps        %xmm6,%xmm0
   DB  15,94,199                           ; divps         %xmm7,%xmm0
   DB  65,15,84,193                        ; andps         %xmm9,%xmm0
-  DB  15,40,13,247,125,1,0                ; movaps        0x17df7(%rip),%xmm1        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,13,135,127,1,0                ; movaps        0x17f87(%rip),%xmm1        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  68,15,92,208                        ; subps         %xmm0,%xmm10
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
@@ -18043,10 +18098,10 @@
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,89,210                           ; mulps         %xmm2,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
-  DB  68,15,40,45,37,126,1,0              ; movaps        0x17e25(%rip),%xmm13        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0xaa8>
+  DB  68,15,40,45,181,127,1,0             ; movaps        0x17fb5(%rip),%xmm13        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0xaac>
   DB  69,15,88,245                        ; addps         %xmm13,%xmm14
   DB  68,15,89,242                        ; mulps         %xmm2,%xmm14
-  DB  68,15,40,37,37,126,1,0              ; movaps        0x17e25(%rip),%xmm12        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0xab8>
+  DB  68,15,40,37,181,127,1,0             ; movaps        0x17fb5(%rip),%xmm12        # 2bac0 <_sk_srcover_rgba_8888_sse2_lowp+0xabc>
   DB  69,15,89,252                        ; mulps         %xmm12,%xmm15
   DB  69,15,88,254                        ; addps         %xmm14,%xmm15
   DB  15,40,198                           ; movaps        %xmm6,%xmm0
@@ -18232,12 +18287,12 @@
   DB  68,15,84,208                        ; andps         %xmm0,%xmm10
   DB  15,84,200                           ; andps         %xmm0,%xmm1
   DB  68,15,84,232                        ; andps         %xmm0,%xmm13
-  DB  15,40,5,139,123,1,0                 ; movaps        0x17b8b(%rip),%xmm0        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  15,40,5,27,125,1,0                  ; movaps        0x17d1b(%rip),%xmm0        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  68,15,89,224                        ; mulps         %xmm0,%xmm12
-  DB  15,40,21,144,123,1,0                ; movaps        0x17b90(%rip),%xmm2        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  15,40,21,32,125,1,0                 ; movaps        0x17d20(%rip),%xmm2        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  15,89,250                           ; mulps         %xmm2,%xmm7
   DB  65,15,88,252                        ; addps         %xmm12,%xmm7
-  DB  68,15,40,53,145,123,1,0             ; movaps        0x17b91(%rip),%xmm14        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,53,33,125,1,0              ; movaps        0x17d21(%rip),%xmm14        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  68,15,40,252                        ; movaps        %xmm4,%xmm15
   DB  69,15,89,254                        ; mulps         %xmm14,%xmm15
   DB  68,15,88,255                        ; addps         %xmm7,%xmm15
@@ -18320,7 +18375,7 @@
   DB  65,15,88,214                        ; addps         %xmm14,%xmm2
   DB  15,40,196                           ; movaps        %xmm4,%xmm0
   DB  102,15,56,20,202                    ; blendvps      %xmm0,%xmm2,%xmm1
-  DB  68,15,40,13,166,121,1,0             ; movaps        0x179a6(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,54,123,1,0              ; movaps        0x17b36(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,40,225                        ; movaps        %xmm9,%xmm4
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  15,40,68,36,48                      ; movaps        0x30(%rsp),%xmm0
@@ -18414,14 +18469,14 @@
   DB  68,15,84,215                        ; andps         %xmm7,%xmm10
   DB  68,15,84,223                        ; andps         %xmm7,%xmm11
   DB  68,15,84,199                        ; andps         %xmm7,%xmm8
-  DB  15,40,21,201,120,1,0                ; movaps        0x178c9(%rip),%xmm2        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  15,40,21,89,122,1,0                 ; movaps        0x17a59(%rip),%xmm2        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  15,40,221                           ; movaps        %xmm5,%xmm3
   DB  15,89,218                           ; mulps         %xmm2,%xmm3
-  DB  15,40,13,204,120,1,0                ; movaps        0x178cc(%rip),%xmm1        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  15,40,13,92,122,1,0                 ; movaps        0x17a5c(%rip),%xmm1        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  15,40,254                           ; movaps        %xmm6,%xmm7
   DB  15,89,249                           ; mulps         %xmm1,%xmm7
   DB  15,88,251                           ; addps         %xmm3,%xmm7
-  DB  68,15,40,45,203,120,1,0             ; movaps        0x178cb(%rip),%xmm13        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,45,91,122,1,0              ; movaps        0x17a5b(%rip),%xmm13        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  68,15,88,247                        ; addps         %xmm7,%xmm14
   DB  65,15,40,218                        ; movaps        %xmm10,%xmm3
@@ -18502,7 +18557,7 @@
   DB  65,15,88,253                        ; addps         %xmm13,%xmm7
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  102,68,15,56,20,223                 ; blendvps      %xmm0,%xmm7,%xmm11
-  DB  68,15,40,13,225,118,1,0             ; movaps        0x176e1(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,113,120,1,0             ; movaps        0x17871(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  68,15,92,204                        ; subps         %xmm4,%xmm9
   DB  15,40,60,36                         ; movaps        (%rsp),%xmm7
@@ -18557,14 +18612,14 @@
   DB  15,40,231                           ; movaps        %xmm7,%xmm4
   DB  68,15,89,244                        ; mulps         %xmm4,%xmm14
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
-  DB  68,15,40,13,150,118,1,0             ; movaps        0x17696(%rip),%xmm9        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,13,38,120,1,0              ; movaps        0x17826(%rip),%xmm9        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  65,15,40,250                        ; movaps        %xmm10,%xmm7
   DB  65,15,89,249                        ; mulps         %xmm9,%xmm7
-  DB  68,15,40,21,150,118,1,0             ; movaps        0x17696(%rip),%xmm10        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  68,15,40,21,38,120,1,0              ; movaps        0x17826(%rip),%xmm10        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  65,15,40,219                        ; movaps        %xmm11,%xmm3
   DB  65,15,89,218                        ; mulps         %xmm10,%xmm3
   DB  15,88,223                           ; addps         %xmm7,%xmm3
-  DB  68,15,40,29,147,118,1,0             ; movaps        0x17693(%rip),%xmm11        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,29,35,120,1,0              ; movaps        0x17823(%rip),%xmm11        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  69,15,40,236                        ; movaps        %xmm12,%xmm13
   DB  69,15,89,235                        ; mulps         %xmm11,%xmm13
   DB  68,15,88,235                        ; addps         %xmm3,%xmm13
@@ -18649,7 +18704,7 @@
   DB  65,15,88,251                        ; addps         %xmm11,%xmm7
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  102,15,56,20,207                    ; blendvps      %xmm0,%xmm7,%xmm1
-  DB  68,15,40,13,159,116,1,0             ; movaps        0x1749f(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,47,118,1,0              ; movaps        0x1762f(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  68,15,89,192                        ; mulps         %xmm0,%xmm8
@@ -18701,13 +18756,13 @@
   DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,89,205                        ; mulps         %xmm5,%xmm9
-  DB  68,15,40,5,97,116,1,0               ; movaps        0x17461(%rip),%xmm8        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,5,241,117,1,0              ; movaps        0x175f1(%rip),%xmm8        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
-  DB  68,15,40,21,101,116,1,0             ; movaps        0x17465(%rip),%xmm10        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  68,15,40,21,245,117,1,0             ; movaps        0x175f5(%rip),%xmm10        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  15,40,233                           ; movaps        %xmm1,%xmm5
   DB  65,15,89,234                        ; mulps         %xmm10,%xmm5
   DB  15,88,232                           ; addps         %xmm0,%xmm5
-  DB  68,15,40,37,99,116,1,0              ; movaps        0x17463(%rip),%xmm12        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,37,243,117,1,0             ; movaps        0x175f3(%rip),%xmm12        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  68,15,40,242                        ; movaps        %xmm2,%xmm14
   DB  69,15,89,244                        ; mulps         %xmm12,%xmm14
   DB  68,15,88,245                        ; addps         %xmm5,%xmm14
@@ -18792,7 +18847,7 @@
   DB  65,15,88,244                        ; addps         %xmm12,%xmm6
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  102,68,15,56,20,206                 ; blendvps      %xmm0,%xmm6,%xmm9
-  DB  15,40,5,105,114,1,0                 ; movaps        0x17269(%rip),%xmm0        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,5,249,115,1,0                 ; movaps        0x173f9(%rip),%xmm0        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,92,215                           ; subps         %xmm7,%xmm2
   DB  15,89,226                           ; mulps         %xmm2,%xmm4
@@ -18836,23 +18891,23 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,219,0,0,0                    ; jne           145f2 <_sk_srcover_rgba_8888_sse41+0xfb>
+  DB  15,133,219,0,0,0                    ; jne           147c2 <_sk_srcover_rgba_8888_sse41+0xfb>
   DB  243,65,15,111,60,128                ; movdqu        (%r8,%rax,4),%xmm7
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  102,15,111,37,120,114,1,0           ; movdqa        0x17278(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,37,8,116,1,0             ; movdqa        0x17408(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
   DB  102,15,111,239                      ; movdqa        %xmm7,%xmm5
-  DB  102,15,56,0,45,116,114,1,0          ; pshufb        0x17274(%rip),%xmm5        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,45,4,116,1,0            ; pshufb        0x17404(%rip),%xmm5        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
   DB  102,15,111,247                      ; movdqa        %xmm7,%xmm6
-  DB  102,15,56,0,53,116,114,1,0          ; pshufb        0x17274(%rip),%xmm6        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,53,4,116,1,0            ; pshufb        0x17404(%rip),%xmm6        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  102,15,114,215,24                   ; psrld         $0x18,%xmm7
   DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  68,15,40,5,145,113,1,0              ; movaps        0x17191(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,33,115,1,0               ; movaps        0x17321(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
-  DB  68,15,40,37,101,114,1,0             ; movaps        0x17265(%rip),%xmm12        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,37,245,115,1,0             ; movaps        0x173f5(%rip),%xmm12        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  65,15,89,196                        ; mulps         %xmm12,%xmm0
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -18878,7 +18933,7 @@
   DB  102,15,114,240,24                   ; pslld         $0x18,%xmm0
   DB  102,15,235,194                      ; por           %xmm2,%xmm0
   DB  102,15,235,193                      ; por           %xmm1,%xmm0
-  DB  117,88                              ; jne           14630 <_sk_srcover_rgba_8888_sse41+0x139>
+  DB  117,88                              ; jne           14800 <_sk_srcover_rgba_8888_sse41+0x139>
   DB  243,65,15,127,4,128                 ; movdqu        %xmm0,(%r8,%rax,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
@@ -18889,32 +18944,32 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,91                              ; je            1465a <_sk_srcover_rgba_8888_sse41+0x163>
+  DB  116,91                              ; je            1482a <_sk_srcover_rgba_8888_sse41+0x163>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,22                              ; je            1461f <_sk_srcover_rgba_8888_sse41+0x128>
+  DB  116,22                              ; je            147ef <_sk_srcover_rgba_8888_sse41+0x128>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,10,255,255,255               ; jne           1451d <_sk_srcover_rgba_8888_sse41+0x26>
+  DB  15,133,10,255,255,255               ; jne           146ed <_sk_srcover_rgba_8888_sse41+0x26>
   DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
   DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,237,254,255,255                 ; jmpq          1451d <_sk_srcover_rgba_8888_sse41+0x26>
+  DB  233,237,254,255,255                 ; jmpq          146ed <_sk_srcover_rgba_8888_sse41+0x26>
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,40                              ; je            14665 <_sk_srcover_rgba_8888_sse41+0x16e>
+  DB  116,40                              ; je            14835 <_sk_srcover_rgba_8888_sse41+0x16e>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            14652 <_sk_srcover_rgba_8888_sse41+0x15b>
+  DB  116,15                              ; je            14822 <_sk_srcover_rgba_8888_sse41+0x15b>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,149                             ; jne           145de <_sk_srcover_rgba_8888_sse41+0xe7>
+  DB  117,149                             ; jne           147ae <_sk_srcover_rgba_8888_sse41+0xe7>
   DB  102,65,15,58,22,68,128,8,2          ; pextrd        $0x2,%xmm0,0x8(%r8,%rax,4)
   DB  102,65,15,214,4,128                 ; movq          %xmm0,(%r8,%rax,4)
-  DB  235,132                             ; jmp           145de <_sk_srcover_rgba_8888_sse41+0xe7>
+  DB  235,132                             ; jmp           147ae <_sk_srcover_rgba_8888_sse41+0xe7>
   DB  102,65,15,110,60,128                ; movd          (%r8,%rax,4),%xmm7
-  DB  233,184,254,255,255                 ; jmpq          1451d <_sk_srcover_rgba_8888_sse41+0x26>
+  DB  233,184,254,255,255                 ; jmpq          146ed <_sk_srcover_rgba_8888_sse41+0x26>
   DB  102,65,15,126,4,128                 ; movd          %xmm0,(%r8,%rax,4)
-  DB  233,110,255,255,255                 ; jmpq          145de <_sk_srcover_rgba_8888_sse41+0xe7>
+  DB  233,110,255,255,255                 ; jmpq          147ae <_sk_srcover_rgba_8888_sse41+0xe7>
 
 PUBLIC _sk_clamp_0_sse41
 _sk_clamp_0_sse41 LABEL PROC
@@ -18928,7 +18983,7 @@
 
 PUBLIC _sk_clamp_1_sse41
 _sk_clamp_1_sse41 LABEL PROC
-  DB  68,15,40,5,96,112,1,0               ; movaps        0x17060(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,240,113,1,0              ; movaps        0x171f0(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  65,15,93,208                        ; minps         %xmm8,%xmm2
@@ -18938,7 +18993,7 @@
 
 PUBLIC _sk_clamp_a_sse41
 _sk_clamp_a_sse41 LABEL PROC
-  DB  15,93,29,69,112,1,0                 ; minps         0x17045(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,29,213,113,1,0                ; minps         0x171d5(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,93,195                           ; minps         %xmm3,%xmm0
   DB  15,93,203                           ; minps         %xmm3,%xmm1
   DB  15,93,211                           ; minps         %xmm3,%xmm2
@@ -18947,7 +19002,7 @@
 
 PUBLIC _sk_clamp_a_dst_sse41
 _sk_clamp_a_dst_sse41 LABEL PROC
-  DB  15,93,61,49,112,1,0                 ; minps         0x17031(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,61,193,113,1,0                ; minps         0x171c1(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,93,231                           ; minps         %xmm7,%xmm4
   DB  15,93,239                           ; minps         %xmm7,%xmm5
   DB  15,93,247                           ; minps         %xmm7,%xmm6
@@ -18976,7 +19031,7 @@
 
 PUBLIC _sk_invert_sse41
 _sk_invert_sse41 LABEL PROC
-  DB  68,15,40,5,237,111,1,0              ; movaps        0x16fed(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,125,113,1,0              ; movaps        0x1717d(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,200                        ; subps         %xmm0,%xmm9
   DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
@@ -19028,7 +19083,7 @@
 PUBLIC _sk_unpremul_sse41
 _sk_unpremul_sse41 LABEL PROC
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,40,13,119,111,1,0             ; movaps        0x16f77(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,7,113,1,0               ; movaps        0x17107(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,94,203                        ; divps         %xmm3,%xmm9
   DB  68,15,194,195,4                     ; cmpneqps      %xmm3,%xmm8
   DB  69,15,84,193                        ; andps         %xmm9,%xmm8
@@ -19040,20 +19095,20 @@
 
 PUBLIC _sk_from_srgb_sse41
 _sk_from_srgb_sse41 LABEL PROC
-  DB  68,15,40,29,66,112,1,0              ; movaps        0x17042(%rip),%xmm11        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb38>
+  DB  68,15,40,29,210,113,1,0             ; movaps        0x171d2(%rip),%xmm11        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xb3c>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
   DB  68,15,40,208                        ; movaps        %xmm0,%xmm10
   DB  69,15,89,210                        ; mulps         %xmm10,%xmm10
-  DB  68,15,40,37,186,111,1,0             ; movaps        0x16fba(%rip),%xmm12        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,37,74,113,1,0              ; movaps        0x1714a(%rip),%xmm12        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
   DB  69,15,89,196                        ; mulps         %xmm12,%xmm8
-  DB  68,15,40,45,42,112,1,0              ; movaps        0x1702a(%rip),%xmm13        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb48>
+  DB  68,15,40,45,186,113,1,0             ; movaps        0x171ba(%rip),%xmm13        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xb4c>
   DB  69,15,88,197                        ; addps         %xmm13,%xmm8
   DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
-  DB  68,15,40,53,42,112,1,0              ; movaps        0x1702a(%rip),%xmm14        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0xb58>
+  DB  68,15,40,53,186,113,1,0             ; movaps        0x171ba(%rip),%xmm14        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xb5c>
   DB  69,15,88,198                        ; addps         %xmm14,%xmm8
-  DB  68,15,40,61,46,112,1,0              ; movaps        0x1702e(%rip),%xmm15        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xb68>
+  DB  68,15,40,61,190,113,1,0             ; movaps        0x171be(%rip),%xmm15        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xb6c>
   DB  65,15,194,199,1                     ; cmpltps       %xmm15,%xmm0
   DB  102,69,15,56,20,193                 ; blendvps      %xmm0,%xmm9,%xmm8
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
@@ -19088,19 +19143,19 @@
 _sk_from_srgb_dst_sse41 LABEL PROC
   DB  68,15,40,204                        ; movaps        %xmm4,%xmm9
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,40,29,121,111,1,0             ; movaps        0x16f79(%rip),%xmm11        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb38>
+  DB  68,15,40,29,9,113,1,0               ; movaps        0x17109(%rip),%xmm11        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xb3c>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  69,15,89,211                        ; mulps         %xmm11,%xmm10
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
-  DB  68,15,40,37,242,110,1,0             ; movaps        0x16ef2(%rip),%xmm12        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,37,130,112,1,0             ; movaps        0x17082(%rip),%xmm12        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  65,15,89,228                        ; mulps         %xmm12,%xmm4
-  DB  68,15,40,45,102,111,1,0             ; movaps        0x16f66(%rip),%xmm13        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb48>
+  DB  68,15,40,45,246,112,1,0             ; movaps        0x170f6(%rip),%xmm13        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xb4c>
   DB  65,15,88,229                        ; addps         %xmm13,%xmm4
   DB  15,89,224                           ; mulps         %xmm0,%xmm4
-  DB  68,15,40,53,103,111,1,0             ; movaps        0x16f67(%rip),%xmm14        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0xb58>
+  DB  68,15,40,53,247,112,1,0             ; movaps        0x170f7(%rip),%xmm14        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xb5c>
   DB  65,15,88,230                        ; addps         %xmm14,%xmm4
-  DB  68,15,40,61,107,111,1,0             ; movaps        0x16f6b(%rip),%xmm15        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xb68>
+  DB  68,15,40,61,251,112,1,0             ; movaps        0x170fb(%rip),%xmm15        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xb6c>
   DB  69,15,194,207,1                     ; cmpltps       %xmm15,%xmm9
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  102,65,15,56,20,226                 ; blendvps      %xmm0,%xmm10,%xmm4
@@ -19143,22 +19198,22 @@
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  68,15,82,192                        ; rsqrtps       %xmm0,%xmm8
-  DB  68,15,40,29,220,110,1,0             ; movaps        0x16edc(%rip),%xmm11        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xb78>
+  DB  68,15,40,29,108,112,1,0             ; movaps        0x1706c(%rip),%xmm11        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xb7c>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
-  DB  68,15,40,37,220,110,1,0             ; movaps        0x16edc(%rip),%xmm12        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xb88>
+  DB  68,15,40,37,108,112,1,0             ; movaps        0x1706c(%rip),%xmm12        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xb8c>
   DB  69,15,40,248                        ; movaps        %xmm8,%xmm15
   DB  69,15,89,252                        ; mulps         %xmm12,%xmm15
-  DB  68,15,40,21,220,110,1,0             ; movaps        0x16edc(%rip),%xmm10        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xb98>
+  DB  68,15,40,21,108,112,1,0             ; movaps        0x1706c(%rip),%xmm10        # 2bba0 <_sk_srcover_rgba_8888_sse2_lowp+0xb9c>
   DB  69,15,88,250                        ; addps         %xmm10,%xmm15
   DB  69,15,89,248                        ; mulps         %xmm8,%xmm15
-  DB  68,15,40,45,220,110,1,0             ; movaps        0x16edc(%rip),%xmm13        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xba8>
+  DB  68,15,40,45,108,112,1,0             ; movaps        0x1706c(%rip),%xmm13        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xbac>
   DB  69,15,88,253                        ; addps         %xmm13,%xmm15
-  DB  68,15,40,53,224,110,1,0             ; movaps        0x16ee0(%rip),%xmm14        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0xbb8>
+  DB  68,15,40,53,112,112,1,0             ; movaps        0x17070(%rip),%xmm14        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xbbc>
   DB  69,15,88,198                        ; addps         %xmm14,%xmm8
   DB  69,15,83,192                        ; rcpps         %xmm8,%xmm8
   DB  69,15,89,199                        ; mulps         %xmm15,%xmm8
-  DB  68,15,40,61,220,110,1,0             ; movaps        0x16edc(%rip),%xmm15        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0xbc8>
+  DB  68,15,40,61,108,112,1,0             ; movaps        0x1706c(%rip),%xmm15        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xbcc>
   DB  65,15,194,199,1                     ; cmpltps       %xmm15,%xmm0
   DB  102,69,15,56,20,193                 ; blendvps      %xmm0,%xmm9,%xmm8
   DB  68,15,82,202                        ; rsqrtps       %xmm2,%xmm9
@@ -19212,7 +19267,7 @@
   DB  68,15,93,224                        ; minps         %xmm0,%xmm12
   DB  65,15,40,203                        ; movaps        %xmm11,%xmm1
   DB  65,15,92,204                        ; subps         %xmm12,%xmm1
-  DB  68,15,40,53,144,108,1,0             ; movaps        0x16c90(%rip),%xmm14        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,53,32,110,1,0              ; movaps        0x16e20(%rip),%xmm14        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,94,241                        ; divps         %xmm1,%xmm14
   DB  69,15,40,211                        ; movaps        %xmm11,%xmm10
   DB  69,15,194,208,0                     ; cmpeqps       %xmm8,%xmm10
@@ -19221,27 +19276,27 @@
   DB  65,15,89,198                        ; mulps         %xmm14,%xmm0
   DB  69,15,40,249                        ; movaps        %xmm9,%xmm15
   DB  68,15,194,250,1                     ; cmpltps       %xmm2,%xmm15
-  DB  68,15,84,61,247,109,1,0             ; andps         0x16df7(%rip),%xmm15        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0xbd8>
+  DB  68,15,84,61,135,111,1,0             ; andps         0x16f87(%rip),%xmm15        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xbdc>
   DB  68,15,88,248                        ; addps         %xmm0,%xmm15
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  65,15,194,193,0                     ; cmpeqps       %xmm9,%xmm0
   DB  65,15,92,208                        ; subps         %xmm8,%xmm2
   DB  65,15,89,214                        ; mulps         %xmm14,%xmm2
-  DB  68,15,40,45,234,109,1,0             ; movaps        0x16dea(%rip),%xmm13        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0xbe8>
+  DB  68,15,40,45,122,111,1,0             ; movaps        0x16f7a(%rip),%xmm13        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xbec>
   DB  65,15,88,213                        ; addps         %xmm13,%xmm2
   DB  69,15,92,193                        ; subps         %xmm9,%xmm8
   DB  69,15,89,198                        ; mulps         %xmm14,%xmm8
-  DB  68,15,88,5,230,109,1,0              ; addps         0x16de6(%rip),%xmm8        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf8>
+  DB  68,15,88,5,118,111,1,0              ; addps         0x16f76(%rip),%xmm8        # 2bc00 <_sk_srcover_rgba_8888_sse2_lowp+0xbfc>
   DB  102,68,15,56,20,194                 ; blendvps      %xmm0,%xmm2,%xmm8
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  102,69,15,56,20,199                 ; blendvps      %xmm0,%xmm15,%xmm8
-  DB  68,15,89,5,222,109,1,0              ; mulps         0x16dde(%rip),%xmm8        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc08>
+  DB  68,15,89,5,110,111,1,0              ; mulps         0x16f6e(%rip),%xmm8        # 2bc10 <_sk_srcover_rgba_8888_sse2_lowp+0xc0c>
   DB  69,15,40,203                        ; movaps        %xmm11,%xmm9
   DB  69,15,194,204,4                     ; cmpneqps      %xmm12,%xmm9
   DB  69,15,84,193                        ; andps         %xmm9,%xmm8
   DB  69,15,92,235                        ; subps         %xmm11,%xmm13
   DB  69,15,88,220                        ; addps         %xmm12,%xmm11
-  DB  15,40,5,242,107,1,0                 ; movaps        0x16bf2(%rip),%xmm0        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,40,5,130,109,1,0                 ; movaps        0x16d82(%rip),%xmm0        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,40,211                        ; movaps        %xmm11,%xmm2
   DB  15,89,208                           ; mulps         %xmm0,%xmm2
   DB  15,194,194,1                        ; cmpltps       %xmm2,%xmm0
@@ -19262,7 +19317,7 @@
   DB  15,41,100,36,32                     ; movaps        %xmm4,0x20(%rsp)
   DB  15,41,92,36,16                      ; movaps        %xmm3,0x10(%rsp)
   DB  68,15,40,208                        ; movaps        %xmm0,%xmm10
-  DB  68,15,40,13,164,107,1,0             ; movaps        0x16ba4(%rip),%xmm9        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,13,52,109,1,0              ; movaps        0x16d34(%rip),%xmm9        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,194,194,2                        ; cmpleps       %xmm2,%xmm0
   DB  15,40,217                           ; movaps        %xmm1,%xmm3
@@ -19275,19 +19330,19 @@
   DB  15,41,20,36                         ; movaps        %xmm2,(%rsp)
   DB  69,15,88,192                        ; addps         %xmm8,%xmm8
   DB  68,15,92,197                        ; subps         %xmm5,%xmm8
-  DB  68,15,40,53,80,109,1,0              ; movaps        0x16d50(%rip),%xmm14        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0xc18>
+  DB  68,15,40,53,224,110,1,0             ; movaps        0x16ee0(%rip),%xmm14        # 2bc20 <_sk_srcover_rgba_8888_sse2_lowp+0xc1c>
   DB  69,15,88,242                        ; addps         %xmm10,%xmm14
   DB  102,65,15,58,8,198,1                ; roundps       $0x1,%xmm14,%xmm0
   DB  68,15,92,240                        ; subps         %xmm0,%xmm14
-  DB  68,15,40,29,73,109,1,0              ; movaps        0x16d49(%rip),%xmm11        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0xc28>
+  DB  68,15,40,29,217,110,1,0             ; movaps        0x16ed9(%rip),%xmm11        # 2bc30 <_sk_srcover_rgba_8888_sse2_lowp+0xc2c>
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  65,15,194,198,2                     ; cmpleps       %xmm14,%xmm0
   DB  15,40,245                           ; movaps        %xmm5,%xmm6
   DB  65,15,92,240                        ; subps         %xmm8,%xmm6
-  DB  15,40,61,226,108,1,0                ; movaps        0x16ce2(%rip),%xmm7        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0xbd8>
+  DB  15,40,61,114,110,1,0                ; movaps        0x16e72(%rip),%xmm7        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xbdc>
   DB  69,15,40,238                        ; movaps        %xmm14,%xmm13
   DB  68,15,89,239                        ; mulps         %xmm7,%xmm13
-  DB  15,40,29,243,108,1,0                ; movaps        0x16cf3(%rip),%xmm3        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf8>
+  DB  15,40,29,131,110,1,0                ; movaps        0x16e83(%rip),%xmm3        # 2bc00 <_sk_srcover_rgba_8888_sse2_lowp+0xbfc>
   DB  68,15,40,227                        ; movaps        %xmm3,%xmm12
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
   DB  68,15,89,230                        ; mulps         %xmm6,%xmm12
@@ -19297,7 +19352,7 @@
   DB  65,15,194,198,2                     ; cmpleps       %xmm14,%xmm0
   DB  68,15,40,253                        ; movaps        %xmm5,%xmm15
   DB  102,69,15,56,20,252                 ; blendvps      %xmm0,%xmm12,%xmm15
-  DB  68,15,40,37,210,108,1,0             ; movaps        0x16cd2(%rip),%xmm12        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc08>
+  DB  68,15,40,37,98,110,1,0              ; movaps        0x16e62(%rip),%xmm12        # 2bc10 <_sk_srcover_rgba_8888_sse2_lowp+0xc0c>
   DB  65,15,40,196                        ; movaps        %xmm12,%xmm0
   DB  65,15,194,198,2                     ; cmpleps       %xmm14,%xmm0
   DB  68,15,89,238                        ; mulps         %xmm6,%xmm13
@@ -19331,7 +19386,7 @@
   DB  65,15,40,198                        ; movaps        %xmm14,%xmm0
   DB  15,40,20,36                         ; movaps        (%rsp),%xmm2
   DB  102,15,56,20,202                    ; blendvps      %xmm0,%xmm2,%xmm1
-  DB  68,15,88,21,107,108,1,0             ; addps         0x16c6b(%rip),%xmm10        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,88,21,251,109,1,0             ; addps         0x16dfb(%rip),%xmm10        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  102,65,15,58,8,194,1                ; roundps       $0x1,%xmm10,%xmm0
   DB  68,15,92,208                        ; subps         %xmm0,%xmm10
   DB  69,15,194,218,2                     ; cmpleps       %xmm10,%xmm11
@@ -19383,11 +19438,11 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,52                              ; jne           14d60 <_sk_scale_u8_sse41+0x4c>
+  DB  117,52                              ; jne           14f30 <_sk_scale_u8_sse41+0x4c>
   DB  102,71,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm8
-  DB  102,68,15,219,5,100,106,1,0         ; pand          0x16a64(%rip),%xmm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,68,15,219,5,244,107,1,0         ; pand          0x16bf4(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,168,107,1,0              ; mulps         0x16ba8(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,89,5,56,109,1,0               ; mulps         0x16d38(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
@@ -19398,12 +19453,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,59                              ; je            14da8 <_sk_scale_u8_sse41+0x94>
+  DB  116,59                              ; je            14f78 <_sk_scale_u8_sse41+0x94>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            14d8f <_sk_scale_u8_sse41+0x7b>
+  DB  116,23                              ; je            14f5f <_sk_scale_u8_sse41+0x7b>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,181                             ; jne           14d33 <_sk_scale_u8_sse41+0x1f>
+  DB  117,181                             ; jne           14f03 <_sk_scale_u8_sse41+0x1f>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
@@ -19411,10 +19466,10 @@
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,69,15,56,49,201                 ; pmovzxbd      %xmm9,%xmm9
   DB  102,69,15,58,14,193,15              ; pblendw       $0xf,%xmm9,%xmm8
-  DB  235,139                             ; jmp           14d33 <_sk_scale_u8_sse41+0x1f>
+  DB  235,139                             ; jmp           14f03 <_sk_scale_u8_sse41+0x1f>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,124,255,255,255                 ; jmpq          14d33 <_sk_scale_u8_sse41+0x1f>
+  DB  233,124,255,255,255                 ; jmpq          14f03 <_sk_scale_u8_sse41+0x1f>
 
 PUBLIC _sk_scale_565_sse41
 _sk_scale_565_sse41 LABEL PROC
@@ -19427,19 +19482,19 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,159,0,0,0                    ; jne           14e7a <_sk_scale_565_sse41+0xc3>
+  DB  15,133,159,0,0,0                    ; jne           1504a <_sk_scale_565_sse41+0xc3>
   DB  102,71,15,56,51,28,80               ; pmovzxwd      (%r8,%r10,2),%xmm11
-  DB  102,15,111,5,22,107,1,0             ; movdqa        0x16b16(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,5,166,108,1,0            ; movdqa        0x16ca6(%rip),%xmm0        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,65,15,219,195                   ; pand          %xmm11,%xmm0
   DB  68,15,91,200                        ; cvtdq2ps      %xmm0,%xmm9
-  DB  68,15,89,13,21,107,1,0              ; mulps         0x16b15(%rip),%xmm9        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,5,29,107,1,0             ; movdqa        0x16b1d(%rip),%xmm0        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  68,15,89,13,165,108,1,0             ; mulps         0x16ca5(%rip),%xmm9        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,5,173,108,1,0            ; movdqa        0x16cad(%rip),%xmm0        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,65,15,219,195                   ; pand          %xmm11,%xmm0
   DB  68,15,91,208                        ; cvtdq2ps      %xmm0,%xmm10
-  DB  68,15,89,21,28,107,1,0              ; mulps         0x16b1c(%rip),%xmm10        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,68,15,219,29,35,107,1,0         ; pand          0x16b23(%rip),%xmm11        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  68,15,89,21,172,108,1,0             ; mulps         0x16cac(%rip),%xmm10        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,68,15,219,29,179,108,1,0        ; pand          0x16cb3(%rip),%xmm11        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  69,15,91,219                        ; cvtdq2ps      %xmm11,%xmm11
-  DB  68,15,89,29,39,107,1,0              ; mulps         0x16b27(%rip),%xmm11        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  68,15,89,29,183,108,1,0             ; mulps         0x16cb7(%rip),%xmm11        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  15,40,195                           ; movaps        %xmm3,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
   DB  69,15,40,226                        ; movaps        %xmm10,%xmm12
@@ -19464,22 +19519,22 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            14ec3 <_sk_scale_565_sse41+0x10c>
+  DB  116,60                              ; je            15093 <_sk_scale_565_sse41+0x10c>
   DB  102,69,15,239,219                   ; pxor          %xmm11,%xmm11
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,26                              ; je            14eac <_sk_scale_565_sse41+0xf5>
+  DB  116,26                              ; je            1507c <_sk_scale_565_sse41+0xf5>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,70,255,255,255               ; jne           14de2 <_sk_scale_565_sse41+0x2b>
+  DB  15,133,70,255,255,255               ; jne           14fb2 <_sk_scale_565_sse41+0x2b>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,68,15,112,216,69                ; pshufd        $0x45,%xmm0,%xmm11
   DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,68,15,58,14,216,15              ; pblendw       $0xf,%xmm0,%xmm11
-  DB  233,31,255,255,255                  ; jmpq          14de2 <_sk_scale_565_sse41+0x2b>
+  DB  233,31,255,255,255                  ; jmpq          14fb2 <_sk_scale_565_sse41+0x2b>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,68,15,110,216                   ; movd          %eax,%xmm11
-  DB  233,16,255,255,255                  ; jmpq          14de2 <_sk_scale_565_sse41+0x2b>
+  DB  233,16,255,255,255                  ; jmpq          14fb2 <_sk_scale_565_sse41+0x2b>
 
 PUBLIC _sk_lerp_1_float_sse41
 _sk_lerp_1_float_sse41 LABEL PROC
@@ -19510,11 +19565,11 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,72                              ; jne           14f6a <_sk_lerp_u8_sse41+0x60>
+  DB  117,72                              ; jne           1513a <_sk_lerp_u8_sse41+0x60>
   DB  102,71,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm8
-  DB  102,68,15,219,5,110,104,1,0         ; pand          0x1686e(%rip),%xmm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,68,15,219,5,254,105,1,0         ; pand          0x169fe(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,178,105,1,0              ; mulps         0x169b2(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,89,5,66,107,1,0               ; mulps         0x16b42(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -19532,12 +19587,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,62                              ; je            14fb5 <_sk_lerp_u8_sse41+0xab>
+  DB  116,62                              ; je            15185 <_sk_lerp_u8_sse41+0xab>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            14f99 <_sk_lerp_u8_sse41+0x8f>
+  DB  116,23                              ; je            15169 <_sk_lerp_u8_sse41+0x8f>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,161                             ; jne           14f29 <_sk_lerp_u8_sse41+0x1f>
+  DB  117,161                             ; jne           150f9 <_sk_lerp_u8_sse41+0x1f>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
@@ -19545,10 +19600,10 @@
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,69,15,56,49,201                 ; pmovzxbd      %xmm9,%xmm9
   DB  102,69,15,58,14,193,15              ; pblendw       $0xf,%xmm9,%xmm8
-  DB  233,116,255,255,255                 ; jmpq          14f29 <_sk_lerp_u8_sse41+0x1f>
+  DB  233,116,255,255,255                 ; jmpq          150f9 <_sk_lerp_u8_sse41+0x1f>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,101,255,255,255                 ; jmpq          14f29 <_sk_lerp_u8_sse41+0x1f>
+  DB  233,101,255,255,255                 ; jmpq          150f9 <_sk_lerp_u8_sse41+0x1f>
 
 PUBLIC _sk_lerp_565_sse41
 _sk_lerp_565_sse41 LABEL PROC
@@ -19561,19 +19616,19 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,165,0,0,0                    ; jne           1508d <_sk_lerp_565_sse41+0xc9>
+  DB  15,133,165,0,0,0                    ; jne           1525d <_sk_lerp_565_sse41+0xc9>
   DB  102,71,15,56,51,20,80               ; pmovzxwd      (%r8,%r10,2),%xmm10
-  DB  102,15,111,5,9,105,1,0              ; movdqa        0x16909(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,5,153,106,1,0            ; movdqa        0x16a99(%rip),%xmm0        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,65,15,219,194                   ; pand          %xmm10,%xmm0
   DB  68,15,91,200                        ; cvtdq2ps      %xmm0,%xmm9
-  DB  68,15,89,13,8,105,1,0               ; mulps         0x16908(%rip),%xmm9        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,5,16,105,1,0             ; movdqa        0x16910(%rip),%xmm0        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  68,15,89,13,152,106,1,0             ; mulps         0x16a98(%rip),%xmm9        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,5,160,106,1,0            ; movdqa        0x16aa0(%rip),%xmm0        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,65,15,219,194                   ; pand          %xmm10,%xmm0
   DB  68,15,91,216                        ; cvtdq2ps      %xmm0,%xmm11
-  DB  68,15,89,29,15,105,1,0              ; mulps         0x1690f(%rip),%xmm11        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,68,15,219,21,22,105,1,0         ; pand          0x16916(%rip),%xmm10        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  68,15,89,29,159,106,1,0             ; mulps         0x16a9f(%rip),%xmm11        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,68,15,219,21,166,106,1,0        ; pand          0x16aa6(%rip),%xmm10        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
-  DB  68,15,89,21,26,105,1,0              ; mulps         0x1691a(%rip),%xmm10        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  68,15,89,21,170,106,1,0             ; mulps         0x16aaa(%rip),%xmm10        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  15,40,195                           ; movaps        %xmm3,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
@@ -19601,22 +19656,22 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            150d6 <_sk_lerp_565_sse41+0x112>
+  DB  116,60                              ; je            152a6 <_sk_lerp_565_sse41+0x112>
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,26                              ; je            150bf <_sk_lerp_565_sse41+0xfb>
+  DB  116,26                              ; je            1528f <_sk_lerp_565_sse41+0xfb>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,64,255,255,255               ; jne           14fef <_sk_lerp_565_sse41+0x2b>
+  DB  15,133,64,255,255,255               ; jne           151bf <_sk_lerp_565_sse41+0x2b>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,68,15,112,208,69                ; pshufd        $0x45,%xmm0,%xmm10
   DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,68,15,58,14,208,15              ; pblendw       $0xf,%xmm0,%xmm10
-  DB  233,25,255,255,255                  ; jmpq          14fef <_sk_lerp_565_sse41+0x2b>
+  DB  233,25,255,255,255                  ; jmpq          151bf <_sk_lerp_565_sse41+0x2b>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,68,15,110,208                   ; movd          %eax,%xmm10
-  DB  233,10,255,255,255                  ; jmpq          14fef <_sk_lerp_565_sse41+0x2b>
+  DB  233,10,255,255,255                  ; jmpq          151bf <_sk_lerp_565_sse41+0x2b>
 
 PUBLIC _sk_load_tables_sse41
 _sk_load_tables_sse41 LABEL PROC
@@ -19625,9 +19680,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,17,1,0,0                     ; jne           15207 <_sk_load_tables_sse41+0x122>
+  DB  15,133,17,1,0,0                     ; jne           153d7 <_sk_load_tables_sse41+0x122>
   DB  243,69,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm8
-  DB  102,15,111,5,156,102,1,0            ; movdqa        0x1669c(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,44,104,1,0             ; movdqa        0x1682c(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,73,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%r8
   DB  102,73,15,126,193                   ; movq          %xmm0,%r9
@@ -19642,7 +19697,7 @@
   DB  102,66,15,58,33,4,155,32            ; insertps      $0x20,(%rbx,%r11,4),%xmm0
   DB  102,66,15,58,33,4,3,48              ; insertps      $0x30,(%rbx,%r8,1),%xmm0
   DB  102,65,15,111,200                   ; movdqa        %xmm8,%xmm1
-  DB  102,15,56,0,13,87,102,1,0           ; pshufb        0x16657(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,13,231,103,1,0          ; pshufb        0x167e7(%rip),%xmm1        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
   DB  68,15,182,203                       ; movzbl        %bl,%r9d
@@ -19657,7 +19712,7 @@
   DB  102,15,58,33,202,48                 ; insertps      $0x30,%xmm2,%xmm1
   DB  76,139,64,24                        ; mov           0x18(%rax),%r8
   DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
-  DB  102,15,56,0,21,19,102,1,0           ; pshufb        0x16613(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,21,163,103,1,0          ; pshufb        0x167a3(%rip),%xmm2        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  102,72,15,58,22,211,1               ; pextrq        $0x1,%xmm2,%rbx
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
   DB  68,15,182,200                       ; movzbl        %al,%r9d
@@ -19672,7 +19727,7 @@
   DB  102,15,58,33,211,48                 ; insertps      $0x30,%xmm3,%xmm2
   DB  102,65,15,114,208,24                ; psrld         $0x18,%xmm8
   DB  65,15,91,216                        ; cvtdq2ps      %xmm8,%xmm3
-  DB  15,89,29,240,102,1,0                ; mulps         0x166f0(%rip),%xmm3        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,29,128,104,1,0                ; mulps         0x16880(%rip),%xmm3        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
@@ -19680,19 +19735,19 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,52                              ; je            15248 <_sk_load_tables_sse41+0x163>
+  DB  116,52                              ; je            15418 <_sk_load_tables_sse41+0x163>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            15236 <_sk_load_tables_sse41+0x151>
+  DB  116,23                              ; je            15406 <_sk_load_tables_sse41+0x151>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,211,254,255,255              ; jne           150fc <_sk_load_tables_sse41+0x17>
+  DB  15,133,211,254,255,255              ; jne           152cc <_sk_load_tables_sse41+0x17>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  243,65,15,126,4,144                 ; movq          (%r8,%rdx,4),%xmm0
   DB  102,68,15,58,14,192,15              ; pblendw       $0xf,%xmm0,%xmm8
-  DB  233,180,254,255,255                 ; jmpq          150fc <_sk_load_tables_sse41+0x17>
+  DB  233,180,254,255,255                 ; jmpq          152cc <_sk_load_tables_sse41+0x17>
   DB  102,69,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm8
-  DB  233,169,254,255,255                 ; jmpq          150fc <_sk_load_tables_sse41+0x17>
+  DB  233,169,254,255,255                 ; jmpq          152cc <_sk_load_tables_sse41+0x17>
 
 PUBLIC _sk_load_tables_u16_be_sse41
 _sk_load_tables_u16_be_sse41 LABEL PROC
@@ -19702,7 +19757,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,92,1,0,0                     ; jne           153c8 <_sk_load_tables_u16_be_sse41+0x175>
+  DB  15,133,92,1,0,0                     ; jne           15598 <_sk_load_tables_u16_be_sse41+0x175>
   DB  102,67,15,16,4,72                   ; movupd        (%r8,%r9,2),%xmm0
   DB  243,67,15,111,76,72,16              ; movdqu        0x10(%r8,%r9,2),%xmm1
   DB  102,68,15,40,200                    ; movapd        %xmm0,%xmm9
@@ -19711,7 +19766,7 @@
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  102,68,15,105,200                   ; punpckhwd     %xmm0,%xmm9
-  DB  102,68,15,111,5,194,102,1,0         ; movdqa        0x166c2(%rip),%xmm8        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0xcb8>
+  DB  102,68,15,111,5,82,104,1,0          ; movdqa        0x16852(%rip),%xmm8        # 2bcc0 <_sk_srcover_rgba_8888_sse2_lowp+0xcbc>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
@@ -19729,7 +19784,7 @@
   DB  102,15,58,33,194,32                 ; insertps      $0x20,%xmm2,%xmm0
   DB  243,66,15,16,20,3                   ; movss         (%rbx,%r8,1),%xmm2
   DB  102,15,58,33,194,48                 ; insertps      $0x30,%xmm2,%xmm0
-  DB  102,15,56,0,13,113,102,1,0          ; pshufb        0x16671(%rip),%xmm1        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0xcc8>
+  DB  102,15,56,0,13,1,104,1,0            ; pshufb        0x16801(%rip),%xmm1        # 2bcd0 <_sk_srcover_rgba_8888_sse2_lowp+0xccc>
   DB  102,15,56,51,201                    ; pmovzxwd      %xmm1,%xmm1
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -19765,23 +19820,23 @@
   DB  102,65,15,235,216                   ; por           %xmm8,%xmm3
   DB  102,15,56,51,219                    ; pmovzxwd      %xmm3,%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,191,101,1,0                ; mulps         0x165bf(%rip),%xmm3        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0xcd8>
+  DB  15,89,29,79,103,1,0                 ; mulps         0x1674f(%rip),%xmm3        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0xcdc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
   DB  242,67,15,16,4,72                   ; movsd         (%r8,%r9,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           153e1 <_sk_load_tables_u16_be_sse41+0x18e>
+  DB  117,13                              ; jne           155b1 <_sk_load_tables_u16_be_sse41+0x18e>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,152,254,255,255                 ; jmpq          15279 <_sk_load_tables_u16_be_sse41+0x26>
+  DB  233,152,254,255,255                 ; jmpq          15449 <_sk_load_tables_u16_be_sse41+0x26>
   DB  102,67,15,22,68,72,8                ; movhpd        0x8(%r8,%r9,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,131,254,255,255              ; jb            15279 <_sk_load_tables_u16_be_sse41+0x26>
+  DB  15,130,131,254,255,255              ; jb            15449 <_sk_load_tables_u16_be_sse41+0x26>
   DB  243,67,15,126,76,72,16              ; movq          0x10(%r8,%r9,2),%xmm1
-  DB  233,119,254,255,255                 ; jmpq          15279 <_sk_load_tables_u16_be_sse41+0x26>
+  DB  233,119,254,255,255                 ; jmpq          15449 <_sk_load_tables_u16_be_sse41+0x26>
 
 PUBLIC _sk_load_tables_rgb_u16_be_sse41
 _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -19791,7 +19846,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,82                        ; lea           (%rdx,%rdx,2),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,76,1,0,0                     ; jne           15563 <_sk_load_tables_rgb_u16_be_sse41+0x161>
+  DB  15,133,76,1,0,0                     ; jne           15733 <_sk_load_tables_rgb_u16_be_sse41+0x161>
   DB  243,67,15,111,20,72                 ; movdqu        (%r8,%r9,2),%xmm2
   DB  243,67,15,111,76,72,8               ; movdqu        0x8(%r8,%r9,2),%xmm1
   DB  102,15,115,217,4                    ; psrldq        $0x4,%xmm1
@@ -19803,7 +19858,7 @@
   DB  102,15,97,209                       ; punpcklwd     %xmm1,%xmm2
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,97,201                    ; punpcklwd     %xmm9,%xmm1
-  DB  102,68,15,111,5,8,101,1,0           ; movdqa        0x16508(%rip),%xmm8        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0xcb8>
+  DB  102,68,15,111,5,152,102,1,0         ; movdqa        0x16698(%rip),%xmm8        # 2bcc0 <_sk_srcover_rgba_8888_sse2_lowp+0xcbc>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
@@ -19821,7 +19876,7 @@
   DB  102,15,58,33,195,32                 ; insertps      $0x20,%xmm3,%xmm0
   DB  243,66,15,16,28,3                   ; movss         (%rbx,%r8,1),%xmm3
   DB  102,15,58,33,195,48                 ; insertps      $0x30,%xmm3,%xmm0
-  DB  102,15,56,0,13,183,100,1,0          ; pshufb        0x164b7(%rip),%xmm1        # 2b970 <_sk_srcover_rgba_8888_sse2_lowp+0xcc8>
+  DB  102,15,56,0,13,71,102,1,0           ; pshufb        0x16647(%rip),%xmm1        # 2bcd0 <_sk_srcover_rgba_8888_sse2_lowp+0xccc>
   DB  102,15,56,51,201                    ; pmovzxwd      %xmm1,%xmm1
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -19852,7 +19907,7 @@
   DB  243,65,15,16,28,24                  ; movss         (%r8,%rbx,1),%xmm3
   DB  102,15,58,33,211,48                 ; insertps      $0x30,%xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,146,97,1,0                 ; movaps        0x16192(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,34,99,1,0                  ; movaps        0x16322(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
@@ -19860,21 +19915,21 @@
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,84,72,4,2             ; pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,14                              ; jne           15589 <_sk_load_tables_rgb_u16_be_sse41+0x187>
+  DB  117,14                              ; jne           15759 <_sk_load_tables_rgb_u16_be_sse41+0x187>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
-  DB  233,180,254,255,255                 ; jmpq          1543d <_sk_load_tables_rgb_u16_be_sse41+0x3b>
+  DB  233,180,254,255,255                 ; jmpq          1560d <_sk_load_tables_rgb_u16_be_sse41+0x3b>
   DB  102,71,15,110,76,72,6               ; movd          0x6(%r8,%r9,2),%xmm9
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,71,15,196,76,72,10,2            ; pinsrw        $0x2,0xa(%r8,%r9,2),%xmm9
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            155ba <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
+  DB  114,24                              ; jb            1578a <_sk_load_tables_rgb_u16_be_sse41+0x1b8>
   DB  102,67,15,110,76,72,12              ; movd          0xc(%r8,%r9,2),%xmm1
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,76,72,16,2            ; pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  DB  233,131,254,255,255                 ; jmpq          1543d <_sk_load_tables_rgb_u16_be_sse41+0x3b>
+  DB  233,131,254,255,255                 ; jmpq          1560d <_sk_load_tables_rgb_u16_be_sse41+0x3b>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,122,254,255,255                 ; jmpq          1543d <_sk_load_tables_rgb_u16_be_sse41+0x3b>
+  DB  233,122,254,255,255                 ; jmpq          1560d <_sk_load_tables_rgb_u16_be_sse41+0x3b>
 
 PUBLIC _sk_byte_tables_sse41
 _sk_byte_tables_sse41 LABEL PROC
@@ -19882,7 +19937,7 @@
   DB  65,86                               ; push          %r14
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,255,97,1,0               ; movaps        0x161ff(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,143,99,1,0               ; movaps        0x1638f(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  102,73,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%r8
@@ -19905,7 +19960,7 @@
   DB  102,15,58,32,197,3                  ; pinsrb        $0x3,%ebp,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,13,181,98,1,0              ; movaps        0x162b5(%rip),%xmm9        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,13,69,100,1,0              ; movaps        0x16445(%rip),%xmm9        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
@@ -20005,7 +20060,7 @@
   DB  102,15,58,32,197,3                  ; pinsrb        $0x3,%ebp,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,13,17,97,1,0               ; movaps        0x16111(%rip),%xmm9        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,13,161,98,1,0              ; movaps        0x162a1(%rip),%xmm9        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
@@ -20177,31 +20232,31 @@
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,91,194                        ; cvtdq2ps      %xmm10,%xmm8
-  DB  68,15,89,5,236,94,1,0               ; mulps         0x15eec(%rip),%xmm8        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,21,244,94,1,0              ; andps         0x15ef4(%rip),%xmm10        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,21,44,92,1,0               ; orps          0x15c2c(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,5,244,94,1,0               ; addps         0x15ef4(%rip),%xmm8        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  68,15,40,37,252,94,1,0              ; movaps        0x15efc(%rip),%xmm12        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,5,124,96,1,0               ; mulps         0x1607c(%rip),%xmm8        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,21,132,96,1,0              ; andps         0x16084(%rip),%xmm10        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,21,188,93,1,0              ; orps          0x15dbc(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,5,132,96,1,0               ; addps         0x16084(%rip),%xmm8        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  68,15,40,37,140,96,1,0              ; movaps        0x1608c(%rip),%xmm12        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  69,15,92,196                        ; subps         %xmm12,%xmm8
-  DB  68,15,88,21,252,94,1,0              ; addps         0x15efc(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  68,15,40,37,4,95,1,0                ; movaps        0x15f04(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,21,140,96,1,0              ; addps         0x1608c(%rip),%xmm10        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  68,15,40,37,148,96,1,0              ; movaps        0x16094(%rip),%xmm12        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,92,196                        ; subps         %xmm12,%xmm8
   DB  69,15,89,195                        ; mulps         %xmm11,%xmm8
   DB  102,69,15,58,8,208,1                ; roundps       $0x1,%xmm8,%xmm10
   DB  69,15,40,216                        ; movaps        %xmm8,%xmm11
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
-  DB  68,15,88,5,241,94,1,0               ; addps         0x15ef1(%rip),%xmm8        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  68,15,40,21,249,94,1,0              ; movaps        0x15ef9(%rip),%xmm10        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,5,129,96,1,0               ; addps         0x16081(%rip),%xmm8        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  68,15,40,21,137,96,1,0              ; movaps        0x16089(%rip),%xmm10        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  69,15,89,211                        ; mulps         %xmm11,%xmm10
   DB  69,15,92,194                        ; subps         %xmm10,%xmm8
-  DB  68,15,40,21,249,94,1,0              ; movaps        0x15ef9(%rip),%xmm10        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,21,137,96,1,0              ; movaps        0x16089(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,211                        ; subps         %xmm11,%xmm10
-  DB  68,15,40,29,253,94,1,0              ; movaps        0x15efd(%rip),%xmm11        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,29,141,96,1,0              ; movaps        0x1608d(%rip),%xmm11        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  69,15,94,218                        ; divps         %xmm10,%xmm11
   DB  69,15,88,216                        ; addps         %xmm8,%xmm11
-  DB  68,15,89,29,253,94,1,0              ; mulps         0x15efd(%rip),%xmm11        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  68,15,89,29,141,96,1,0              ; mulps         0x1608d(%rip),%xmm11        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,69,15,91,211                    ; cvtps2dq      %xmm11,%xmm10
   DB  243,68,15,16,64,20                  ; movss         0x14(%rax),%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
@@ -20209,7 +20264,7 @@
   DB  102,69,15,56,20,193                 ; blendvps      %xmm0,%xmm9,%xmm8
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,93,5,148,91,1,0               ; minps         0x15b94(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,93,5,36,93,1,0                ; minps         0x15d24(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -20237,31 +20292,31 @@
   DB  68,15,88,217                        ; addps         %xmm1,%xmm11
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,91,227                        ; cvtdq2ps      %xmm11,%xmm12
-  DB  68,15,89,37,197,93,1,0              ; mulps         0x15dc5(%rip),%xmm12        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,29,205,93,1,0              ; andps         0x15dcd(%rip),%xmm11        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,29,5,91,1,0                ; orps          0x15b05(%rip),%xmm11        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,37,205,93,1,0              ; addps         0x15dcd(%rip),%xmm12        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  15,40,13,214,93,1,0                 ; movaps        0x15dd6(%rip),%xmm1        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,37,85,95,1,0               ; mulps         0x15f55(%rip),%xmm12        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,29,93,95,1,0               ; andps         0x15f5d(%rip),%xmm11        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,29,149,92,1,0              ; orps          0x15c95(%rip),%xmm11        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,37,93,95,1,0               ; addps         0x15f5d(%rip),%xmm12        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  15,40,13,102,95,1,0                 ; movaps        0x15f66(%rip),%xmm1        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  68,15,92,225                        ; subps         %xmm1,%xmm12
-  DB  68,15,88,29,214,93,1,0              ; addps         0x15dd6(%rip),%xmm11        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  15,40,13,223,93,1,0                 ; movaps        0x15ddf(%rip),%xmm1        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,29,102,95,1,0              ; addps         0x15f66(%rip),%xmm11        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  15,40,13,111,95,1,0                 ; movaps        0x15f6f(%rip),%xmm1        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  65,15,94,203                        ; divps         %xmm11,%xmm1
   DB  68,15,92,225                        ; subps         %xmm1,%xmm12
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  102,69,15,58,8,212,1                ; roundps       $0x1,%xmm12,%xmm10
   DB  69,15,40,220                        ; movaps        %xmm12,%xmm11
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
-  DB  68,15,88,37,204,93,1,0              ; addps         0x15dcc(%rip),%xmm12        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  15,40,13,213,93,1,0                 ; movaps        0x15dd5(%rip),%xmm1        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,37,92,95,1,0               ; addps         0x15f5c(%rip),%xmm12        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  15,40,13,101,95,1,0                 ; movaps        0x15f65(%rip),%xmm1        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  68,15,92,225                        ; subps         %xmm1,%xmm12
-  DB  68,15,40,21,213,93,1,0              ; movaps        0x15dd5(%rip),%xmm10        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,21,101,95,1,0              ; movaps        0x15f65(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,211                        ; subps         %xmm11,%xmm10
-  DB  15,40,13,218,93,1,0                 ; movaps        0x15dda(%rip),%xmm1        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  15,40,13,106,95,1,0                 ; movaps        0x15f6a(%rip),%xmm1        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  65,15,94,202                        ; divps         %xmm10,%xmm1
   DB  65,15,88,204                        ; addps         %xmm12,%xmm1
-  DB  15,89,13,219,93,1,0                 ; mulps         0x15ddb(%rip),%xmm1        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  15,89,13,107,95,1,0                 ; mulps         0x15f6b(%rip),%xmm1        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,68,15,91,209                    ; cvtps2dq      %xmm1,%xmm10
   DB  243,15,16,72,20                     ; movss         0x14(%rax),%xmm1
   DB  15,198,201,0                        ; shufps        $0x0,%xmm1,%xmm1
@@ -20269,7 +20324,7 @@
   DB  102,65,15,56,20,201                 ; blendvps      %xmm0,%xmm9,%xmm1
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,95,200                           ; maxps         %xmm0,%xmm1
-  DB  15,93,13,118,90,1,0                 ; minps         0x15a76(%rip),%xmm1        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,13,6,92,1,0                   ; minps         0x15c06(%rip),%xmm1        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -20297,31 +20352,31 @@
   DB  68,15,88,218                        ; addps         %xmm2,%xmm11
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,91,227                        ; cvtdq2ps      %xmm11,%xmm12
-  DB  68,15,89,37,167,92,1,0              ; mulps         0x15ca7(%rip),%xmm12        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,29,175,92,1,0              ; andps         0x15caf(%rip),%xmm11        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,29,231,89,1,0              ; orps          0x159e7(%rip),%xmm11        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,37,175,92,1,0              ; addps         0x15caf(%rip),%xmm12        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  15,40,21,184,92,1,0                 ; movaps        0x15cb8(%rip),%xmm2        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,37,55,94,1,0               ; mulps         0x15e37(%rip),%xmm12        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,29,63,94,1,0               ; andps         0x15e3f(%rip),%xmm11        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,29,119,91,1,0              ; orps          0x15b77(%rip),%xmm11        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,37,63,94,1,0               ; addps         0x15e3f(%rip),%xmm12        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  15,40,21,72,94,1,0                  ; movaps        0x15e48(%rip),%xmm2        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  65,15,89,211                        ; mulps         %xmm11,%xmm2
   DB  68,15,92,226                        ; subps         %xmm2,%xmm12
-  DB  68,15,88,29,184,92,1,0              ; addps         0x15cb8(%rip),%xmm11        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  15,40,21,193,92,1,0                 ; movaps        0x15cc1(%rip),%xmm2        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,29,72,94,1,0               ; addps         0x15e48(%rip),%xmm11        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  15,40,21,81,94,1,0                  ; movaps        0x15e51(%rip),%xmm2        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  65,15,94,211                        ; divps         %xmm11,%xmm2
   DB  68,15,92,226                        ; subps         %xmm2,%xmm12
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  102,69,15,58,8,212,1                ; roundps       $0x1,%xmm12,%xmm10
   DB  69,15,40,220                        ; movaps        %xmm12,%xmm11
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
-  DB  68,15,88,37,174,92,1,0              ; addps         0x15cae(%rip),%xmm12        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  15,40,21,183,92,1,0                 ; movaps        0x15cb7(%rip),%xmm2        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,37,62,94,1,0               ; addps         0x15e3e(%rip),%xmm12        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  15,40,21,71,94,1,0                  ; movaps        0x15e47(%rip),%xmm2        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  65,15,89,211                        ; mulps         %xmm11,%xmm2
   DB  68,15,92,226                        ; subps         %xmm2,%xmm12
-  DB  68,15,40,21,183,92,1,0              ; movaps        0x15cb7(%rip),%xmm10        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,21,71,94,1,0               ; movaps        0x15e47(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,211                        ; subps         %xmm11,%xmm10
-  DB  15,40,21,188,92,1,0                 ; movaps        0x15cbc(%rip),%xmm2        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  15,40,21,76,94,1,0                  ; movaps        0x15e4c(%rip),%xmm2        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  65,15,94,210                        ; divps         %xmm10,%xmm2
   DB  65,15,88,212                        ; addps         %xmm12,%xmm2
-  DB  15,89,21,189,92,1,0                 ; mulps         0x15cbd(%rip),%xmm2        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  15,89,21,77,94,1,0                  ; mulps         0x15e4d(%rip),%xmm2        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,68,15,91,210                    ; cvtps2dq      %xmm2,%xmm10
   DB  243,15,16,80,20                     ; movss         0x14(%rax),%xmm2
   DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
@@ -20329,7 +20384,7 @@
   DB  102,65,15,56,20,209                 ; blendvps      %xmm0,%xmm9,%xmm2
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,95,208                           ; maxps         %xmm0,%xmm2
-  DB  15,93,21,88,89,1,0                  ; minps         0x15958(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,21,232,90,1,0                 ; minps         0x15ae8(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -20357,31 +20412,31 @@
   DB  68,15,88,219                        ; addps         %xmm3,%xmm11
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,91,227                        ; cvtdq2ps      %xmm11,%xmm12
-  DB  68,15,89,37,137,91,1,0              ; mulps         0x15b89(%rip),%xmm12        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,29,145,91,1,0              ; andps         0x15b91(%rip),%xmm11        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,29,201,88,1,0              ; orps          0x158c9(%rip),%xmm11        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,37,145,91,1,0              ; addps         0x15b91(%rip),%xmm12        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  15,40,29,154,91,1,0                 ; movaps        0x15b9a(%rip),%xmm3        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,37,25,93,1,0               ; mulps         0x15d19(%rip),%xmm12        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,29,33,93,1,0               ; andps         0x15d21(%rip),%xmm11        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,29,89,90,1,0               ; orps          0x15a59(%rip),%xmm11        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,37,33,93,1,0               ; addps         0x15d21(%rip),%xmm12        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  15,40,29,42,93,1,0                  ; movaps        0x15d2a(%rip),%xmm3        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  65,15,89,219                        ; mulps         %xmm11,%xmm3
   DB  68,15,92,227                        ; subps         %xmm3,%xmm12
-  DB  68,15,88,29,154,91,1,0              ; addps         0x15b9a(%rip),%xmm11        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  15,40,29,163,91,1,0                 ; movaps        0x15ba3(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,29,42,93,1,0               ; addps         0x15d2a(%rip),%xmm11        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  15,40,29,51,93,1,0                  ; movaps        0x15d33(%rip),%xmm3        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  65,15,94,219                        ; divps         %xmm11,%xmm3
   DB  68,15,92,227                        ; subps         %xmm3,%xmm12
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  102,69,15,58,8,212,1                ; roundps       $0x1,%xmm12,%xmm10
   DB  69,15,40,220                        ; movaps        %xmm12,%xmm11
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
-  DB  68,15,88,37,144,91,1,0              ; addps         0x15b90(%rip),%xmm12        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  15,40,29,153,91,1,0                 ; movaps        0x15b99(%rip),%xmm3        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,37,32,93,1,0               ; addps         0x15d20(%rip),%xmm12        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  15,40,29,41,93,1,0                  ; movaps        0x15d29(%rip),%xmm3        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  65,15,89,219                        ; mulps         %xmm11,%xmm3
   DB  68,15,92,227                        ; subps         %xmm3,%xmm12
-  DB  68,15,40,21,153,91,1,0              ; movaps        0x15b99(%rip),%xmm10        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,21,41,93,1,0               ; movaps        0x15d29(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,211                        ; subps         %xmm11,%xmm10
-  DB  15,40,29,158,91,1,0                 ; movaps        0x15b9e(%rip),%xmm3        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  15,40,29,46,93,1,0                  ; movaps        0x15d2e(%rip),%xmm3        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  65,15,94,218                        ; divps         %xmm10,%xmm3
   DB  65,15,88,220                        ; addps         %xmm12,%xmm3
-  DB  15,89,29,159,91,1,0                 ; mulps         0x15b9f(%rip),%xmm3        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  15,89,29,47,93,1,0                  ; mulps         0x15d2f(%rip),%xmm3        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,68,15,91,211                    ; cvtps2dq      %xmm3,%xmm10
   DB  243,15,16,88,20                     ; movss         0x14(%rax),%xmm3
   DB  15,198,219,0                        ; shufps        $0x0,%xmm3,%xmm3
@@ -20389,7 +20444,7 @@
   DB  102,65,15,56,20,217                 ; blendvps      %xmm0,%xmm9,%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,95,216                           ; maxps         %xmm0,%xmm3
-  DB  15,93,29,58,88,1,0                  ; minps         0x1583a(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,29,202,89,1,0                 ; minps         0x159ca(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -20405,20 +20460,20 @@
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,91,194                           ; cvtdq2ps      %xmm2,%xmm0
-  DB  15,89,5,166,90,1,0                  ; mulps         0x15aa6(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,40,53,174,90,1,0              ; movaps        0x15aae(%rip),%xmm14        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
+  DB  15,89,5,54,92,1,0                   ; mulps         0x15c36(%rip),%xmm0        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,40,53,62,92,1,0               ; movaps        0x15c3e(%rip),%xmm14        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
   DB  65,15,84,214                        ; andps         %xmm14,%xmm2
-  DB  68,15,40,37,226,87,1,0              ; movaps        0x157e2(%rip),%xmm12        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,37,114,89,1,0              ; movaps        0x15972(%rip),%xmm12        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,86,212                        ; orps          %xmm12,%xmm2
-  DB  68,15,40,21,166,90,1,0              ; movaps        0x15aa6(%rip),%xmm10        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
+  DB  68,15,40,21,54,92,1,0               ; movaps        0x15c36(%rip),%xmm10        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
   DB  65,15,88,194                        ; addps         %xmm10,%xmm0
-  DB  68,15,40,29,170,90,1,0              ; movaps        0x15aaa(%rip),%xmm11        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,40,29,58,92,1,0               ; movaps        0x15c3a(%rip),%xmm11        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  15,40,226                           ; movaps        %xmm2,%xmm4
   DB  65,15,89,227                        ; mulps         %xmm11,%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  68,15,40,13,168,90,1,0              ; movaps        0x15aa8(%rip),%xmm9        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
+  DB  68,15,40,13,56,92,1,0               ; movaps        0x15c38(%rip),%xmm9        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
   DB  65,15,88,209                        ; addps         %xmm9,%xmm2
-  DB  68,15,40,45,172,90,1,0              ; movaps        0x15aac(%rip),%xmm13        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,40,45,60,92,1,0               ; movaps        0x15c3c(%rip),%xmm13        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  65,15,40,229                        ; movaps        %xmm13,%xmm4
   DB  15,94,226                           ; divps         %xmm2,%xmm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -20429,21 +20484,21 @@
   DB  102,15,58,8,208,1                   ; roundps       $0x1,%xmm0,%xmm2
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,92,226                           ; subps         %xmm2,%xmm4
-  DB  15,40,53,143,90,1,0                 ; movaps        0x15a8f(%rip),%xmm6        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
+  DB  15,40,53,31,92,1,0                  ; movaps        0x15c1f(%rip),%xmm6        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
   DB  15,88,198                           ; addps         %xmm6,%xmm0
-  DB  15,40,61,165,90,1,0                 ; movaps        0x15aa5(%rip),%xmm7        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  15,40,61,53,92,1,0                  ; movaps        0x15c35(%rip),%xmm7        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
   DB  15,40,212                           ; movaps        %xmm4,%xmm2
-  DB  15,40,37,133,90,1,0                 ; movaps        0x15a85(%rip),%xmm4        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  15,40,37,21,92,1,0                  ; movaps        0x15c15(%rip),%xmm4        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  15,92,194                           ; subps         %xmm2,%xmm0
-  DB  68,15,40,61,151,90,1,0              ; movaps        0x15a97(%rip),%xmm15        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,61,39,92,1,0               ; movaps        0x15c27(%rip),%xmm15        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  65,15,40,215                        ; movaps        %xmm15,%xmm2
   DB  15,94,213                           ; divps         %xmm5,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  15,89,5,243,89,1,0                  ; mulps         0x159f3(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
+  DB  15,89,5,131,91,1,0                  ; mulps         0x15b83(%rip),%xmm0        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
   DB  65,15,84,206                        ; andps         %xmm14,%xmm1
   DB  65,15,86,204                        ; orps          %xmm12,%xmm1
   DB  65,15,88,194                        ; addps         %xmm10,%xmm0
@@ -20469,8 +20524,8 @@
   DB  15,94,206                           ; divps         %xmm6,%xmm1
   DB  15,88,200                           ; addps         %xmm0,%xmm1
   DB  15,91,195                           ; cvtdq2ps      %xmm3,%xmm0
-  DB  15,89,5,148,89,1,0                  ; mulps         0x15994(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  15,84,29,157,89,1,0                 ; andps         0x1599d(%rip),%xmm3        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
+  DB  15,89,5,36,91,1,0                   ; mulps         0x15b24(%rip),%xmm0        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  15,84,29,45,91,1,0                  ; andps         0x15b2d(%rip),%xmm3        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
   DB  65,15,86,220                        ; orps          %xmm12,%xmm3
   DB  65,15,88,194                        ; addps         %xmm10,%xmm0
   DB  68,15,89,219                        ; mulps         %xmm3,%xmm11
@@ -20488,7 +20543,7 @@
   DB  15,92,253                           ; subps         %xmm5,%xmm7
   DB  68,15,94,255                        ; divps         %xmm7,%xmm15
   DB  68,15,88,248                        ; addps         %xmm0,%xmm15
-  DB  15,40,5,229,89,1,0                  ; movaps        0x159e5(%rip),%xmm0        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  15,40,5,117,91,1,0                  ; movaps        0x15b75(%rip),%xmm0        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  15,89,208                           ; mulps         %xmm0,%xmm2
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
   DB  68,15,89,248                        ; mulps         %xmm0,%xmm15
@@ -20507,29 +20562,29 @@
 PUBLIC _sk_lab_to_xyz_sse41
 _sk_lab_to_xyz_sse41 LABEL PROC
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,89,5,178,89,1,0               ; mulps         0x159b2(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xd98>
-  DB  68,15,40,13,58,87,1,0               ; movaps        0x1573a(%rip),%xmm9        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,89,5,66,91,1,0                ; mulps         0x15b42(%rip),%xmm8        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0xd9c>
+  DB  68,15,40,13,202,88,1,0              ; movaps        0x158ca(%rip),%xmm9        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  65,15,89,201                        ; mulps         %xmm9,%xmm1
-  DB  15,40,5,175,89,1,0                  ; movaps        0x159af(%rip),%xmm0        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xda8>
+  DB  15,40,5,63,91,1,0                   ; movaps        0x15b3f(%rip),%xmm0        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0xdac>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
   DB  65,15,89,209                        ; mulps         %xmm9,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
-  DB  68,15,88,5,173,89,1,0               ; addps         0x159ad(%rip),%xmm8        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0xdb8>
-  DB  68,15,89,5,181,89,1,0               ; mulps         0x159b5(%rip),%xmm8        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0xdc8>
-  DB  15,89,13,190,89,1,0                 ; mulps         0x159be(%rip),%xmm1        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xdd8>
+  DB  68,15,88,5,61,91,1,0                ; addps         0x15b3d(%rip),%xmm8        # 2bdc0 <_sk_srcover_rgba_8888_sse2_lowp+0xdbc>
+  DB  68,15,89,5,69,91,1,0                ; mulps         0x15b45(%rip),%xmm8        # 2bdd0 <_sk_srcover_rgba_8888_sse2_lowp+0xdcc>
+  DB  15,89,13,78,91,1,0                  ; mulps         0x15b4e(%rip),%xmm1        # 2bde0 <_sk_srcover_rgba_8888_sse2_lowp+0xddc>
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  15,89,21,195,89,1,0                 ; mulps         0x159c3(%rip),%xmm2        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0xde8>
+  DB  15,89,21,83,91,1,0                  ; mulps         0x15b53(%rip),%xmm2        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0xdec>
   DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
   DB  68,15,92,210                        ; subps         %xmm2,%xmm10
   DB  68,15,40,217                        ; movaps        %xmm1,%xmm11
   DB  69,15,89,219                        ; mulps         %xmm11,%xmm11
   DB  68,15,89,217                        ; mulps         %xmm1,%xmm11
-  DB  68,15,40,13,183,89,1,0              ; movaps        0x159b7(%rip),%xmm9        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0xdf8>
+  DB  68,15,40,13,71,91,1,0               ; movaps        0x15b47(%rip),%xmm9        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0xdfc>
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  65,15,194,195,1                     ; cmpltps       %xmm11,%xmm0
-  DB  15,40,21,183,89,1,0                 ; movaps        0x159b7(%rip),%xmm2        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0xe08>
+  DB  15,40,21,71,91,1,0                  ; movaps        0x15b47(%rip),%xmm2        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0xe0c>
   DB  15,88,202                           ; addps         %xmm2,%xmm1
-  DB  68,15,40,37,188,89,1,0              ; movaps        0x159bc(%rip),%xmm12        # 2bac0 <_sk_srcover_rgba_8888_sse2_lowp+0xe18>
+  DB  68,15,40,37,76,91,1,0               ; movaps        0x15b4c(%rip),%xmm12        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0xe1c>
   DB  65,15,89,204                        ; mulps         %xmm12,%xmm1
   DB  102,65,15,56,20,203                 ; blendvps      %xmm0,%xmm11,%xmm1
   DB  69,15,40,216                        ; movaps        %xmm8,%xmm11
@@ -20548,8 +20603,8 @@
   DB  65,15,89,212                        ; mulps         %xmm12,%xmm2
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  102,65,15,56,20,211                 ; blendvps      %xmm0,%xmm11,%xmm2
-  DB  15,89,13,117,89,1,0                 ; mulps         0x15975(%rip),%xmm1        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xe28>
-  DB  15,89,21,126,89,1,0                 ; mulps         0x1597e(%rip),%xmm2        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xe38>
+  DB  15,89,13,5,91,1,0                   ; mulps         0x15b05(%rip),%xmm1        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0xe2c>
+  DB  15,89,21,14,91,1,0                  ; mulps         0x15b0e(%rip),%xmm2        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0xe3c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
@@ -20564,11 +20619,11 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,39                              ; jne           161ac <_sk_load_a8_sse41+0x3f>
+  DB  117,39                              ; jne           1637c <_sk_load_a8_sse41+0x3f>
   DB  102,67,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm0
-  DB  102,15,219,5,12,86,1,0              ; pand          0x1560c(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,5,156,87,1,0             ; pand          0x1579c(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,82,87,1,0                  ; mulps         0x15752(%rip),%xmm3        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,29,226,88,1,0                 ; mulps         0x158e2(%rip),%xmm3        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
@@ -20577,12 +20632,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            161ee <_sk_load_a8_sse41+0x81>
+  DB  116,53                              ; je            163be <_sk_load_a8_sse41+0x81>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            161d8 <_sk_load_a8_sse41+0x6b>
+  DB  116,21                              ; je            163a8 <_sk_load_a8_sse41+0x6b>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           1618c <_sk_load_a8_sse41+0x1f>
+  DB  117,195                             ; jne           1635c <_sk_load_a8_sse41+0x1f>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
@@ -20590,10 +20645,10 @@
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,56,49,201                    ; pmovzxbd      %xmm1,%xmm1
   DB  102,15,58,14,193,15                 ; pblendw       $0xf,%xmm1,%xmm0
-  DB  235,158                             ; jmp           1618c <_sk_load_a8_sse41+0x1f>
+  DB  235,158                             ; jmp           1635c <_sk_load_a8_sse41+0x1f>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,147                             ; jmp           1618c <_sk_load_a8_sse41+0x1f>
+  DB  235,147                             ; jmp           1635c <_sk_load_a8_sse41+0x1f>
 
 PUBLIC _sk_load_a8_dst_sse41
 _sk_load_a8_dst_sse41 LABEL PROC
@@ -20604,11 +20659,11 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,39                              ; jne           16238 <_sk_load_a8_dst_sse41+0x3f>
+  DB  117,39                              ; jne           16408 <_sk_load_a8_dst_sse41+0x3f>
   DB  102,67,15,56,49,36,16               ; pmovzxbd      (%r8,%r10,1),%xmm4
-  DB  102,15,219,37,128,85,1,0            ; pand          0x15580(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,37,16,87,1,0             ; pand          0x15710(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,252                           ; cvtdq2ps      %xmm4,%xmm7
-  DB  15,89,61,198,86,1,0                 ; mulps         0x156c6(%rip),%xmm7        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,61,86,88,1,0                  ; mulps         0x15856(%rip),%xmm7        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
@@ -20617,12 +20672,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            1627a <_sk_load_a8_dst_sse41+0x81>
+  DB  116,53                              ; je            1644a <_sk_load_a8_dst_sse41+0x81>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            16264 <_sk_load_a8_dst_sse41+0x6b>
+  DB  116,21                              ; je            16434 <_sk_load_a8_dst_sse41+0x6b>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           16218 <_sk_load_a8_dst_sse41+0x1f>
+  DB  117,195                             ; jne           163e8 <_sk_load_a8_dst_sse41+0x1f>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
@@ -20630,21 +20685,34 @@
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,56,49,237                    ; pmovzxbd      %xmm5,%xmm5
   DB  102,15,58,14,229,15                 ; pblendw       $0xf,%xmm5,%xmm4
-  DB  235,158                             ; jmp           16218 <_sk_load_a8_dst_sse41+0x1f>
+  DB  235,158                             ; jmp           163e8 <_sk_load_a8_dst_sse41+0x1f>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,147                             ; jmp           16218 <_sk_load_a8_dst_sse41+0x1f>
+  DB  235,147                             ; jmp           163e8 <_sk_load_a8_dst_sse41+0x1f>
 
 PUBLIC _sk_gather_a8_sse41
 _sk_gather_a8_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -20661,11 +20729,11 @@
   DB  102,15,58,32,192,3                  ; pinsrb        $0x3,%eax,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,245,85,1,0                 ; mulps         0x155f5(%rip),%xmm3        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,29,78,87,1,0                  ; mulps         0x1574e(%rip),%xmm3        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_a8_sse41
@@ -20677,13 +20745,13 @@
   DB  77,15,175,193                       ; imul          %r9,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
-  DB  68,15,40,5,167,84,1,0               ; movaps        0x154a7(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,1,86,1,0                 ; movaps        0x15601(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  68,15,89,195                        ; mulps         %xmm3,%xmm8
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
   DB  102,68,15,103,192                   ; packuswb      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,17                              ; jne           16353 <_sk_store_a8_sse41+0x49>
+  DB  117,17                              ; jne           16559 <_sk_store_a8_sse41+0x49>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  67,137,4,16                         ; mov           %eax,(%r8,%r10,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -20693,17 +20761,17 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            1638f <_sk_store_a8_sse41+0x85>
+  DB  116,41                              ; je            16595 <_sk_store_a8_sse41+0x85>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            1637b <_sk_store_a8_sse41+0x71>
+  DB  116,15                              ; je            16581 <_sk_store_a8_sse41+0x71>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,217                             ; jne           1634b <_sk_store_a8_sse41+0x41>
+  DB  117,217                             ; jne           16551 <_sk_store_a8_sse41+0x41>
   DB  102,71,15,58,20,68,16,2,8           ; pextrb        $0x8,%xmm8,0x2(%r8,%r10,1)
-  DB  102,68,15,56,0,5,107,87,1,0         ; pshufb        0x1576b(%rip),%xmm8        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xe48>
+  DB  102,68,15,56,0,5,197,88,1,0         ; pshufb        0x158c5(%rip),%xmm8        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0xe4c>
   DB  102,71,15,58,21,4,16,0              ; pextrw        $0x0,%xmm8,(%r8,%r10,1)
-  DB  235,188                             ; jmp           1634b <_sk_store_a8_sse41+0x41>
+  DB  235,188                             ; jmp           16551 <_sk_store_a8_sse41+0x41>
   DB  102,71,15,58,20,4,16,0              ; pextrb        $0x0,%xmm8,(%r8,%r10,1)
-  DB  235,178                             ; jmp           1634b <_sk_store_a8_sse41+0x41>
+  DB  235,178                             ; jmp           16551 <_sk_store_a8_sse41+0x41>
 
 PUBLIC _sk_load_g8_sse41
 _sk_load_g8_sse41 LABEL PROC
@@ -20714,25 +20782,25 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,42                              ; jne           163db <_sk_load_g8_sse41+0x42>
+  DB  117,42                              ; jne           165e1 <_sk_load_g8_sse41+0x42>
   DB  102,67,15,56,49,4,16                ; pmovzxbd      (%r8,%r10,1),%xmm0
-  DB  102,15,219,5,224,83,1,0             ; pand          0x153e0(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,5,58,85,1,0              ; pand          0x1553a(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,38,85,1,0                   ; mulps         0x15526(%rip),%xmm0        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,5,128,86,1,0                  ; mulps         0x15680(%rip),%xmm0        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,29,83,1,0                  ; movaps        0x1531d(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,119,84,1,0                 ; movaps        0x15477(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            1641d <_sk_load_g8_sse41+0x84>
+  DB  116,53                              ; je            16623 <_sk_load_g8_sse41+0x84>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            16407 <_sk_load_g8_sse41+0x6e>
+  DB  116,21                              ; je            1660d <_sk_load_g8_sse41+0x6e>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           163b8 <_sk_load_g8_sse41+0x1f>
+  DB  117,192                             ; jne           165be <_sk_load_g8_sse41+0x1f>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
@@ -20740,10 +20808,10 @@
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,56,49,201                    ; pmovzxbd      %xmm1,%xmm1
   DB  102,15,58,14,193,15                 ; pblendw       $0xf,%xmm1,%xmm0
-  DB  235,155                             ; jmp           163b8 <_sk_load_g8_sse41+0x1f>
+  DB  235,155                             ; jmp           165be <_sk_load_g8_sse41+0x1f>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,144                             ; jmp           163b8 <_sk_load_g8_sse41+0x1f>
+  DB  235,144                             ; jmp           165be <_sk_load_g8_sse41+0x1f>
 
 PUBLIC _sk_load_g8_dst_sse41
 _sk_load_g8_dst_sse41 LABEL PROC
@@ -20754,25 +20822,25 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,42                              ; jne           1646a <_sk_load_g8_dst_sse41+0x42>
+  DB  117,42                              ; jne           16670 <_sk_load_g8_dst_sse41+0x42>
   DB  102,67,15,56,49,36,16               ; pmovzxbd      (%r8,%r10,1),%xmm4
-  DB  102,15,219,37,81,83,1,0             ; pand          0x15351(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,37,171,84,1,0            ; pand          0x154ab(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,151,84,1,0                 ; mulps         0x15497(%rip),%xmm4        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,37,241,85,1,0                 ; mulps         0x155f1(%rip),%xmm4        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,142,82,1,0                 ; movaps        0x1528e(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,61,232,83,1,0                 ; movaps        0x153e8(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            164ac <_sk_load_g8_dst_sse41+0x84>
+  DB  116,53                              ; je            166b2 <_sk_load_g8_dst_sse41+0x84>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            16496 <_sk_load_g8_dst_sse41+0x6e>
+  DB  116,21                              ; je            1669c <_sk_load_g8_dst_sse41+0x6e>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           16447 <_sk_load_g8_dst_sse41+0x1f>
+  DB  117,192                             ; jne           1664d <_sk_load_g8_dst_sse41+0x1f>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
@@ -20780,21 +20848,34 @@
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,56,49,237                    ; pmovzxbd      %xmm5,%xmm5
   DB  102,15,58,14,229,15                 ; pblendw       $0xf,%xmm5,%xmm4
-  DB  235,155                             ; jmp           16447 <_sk_load_g8_dst_sse41+0x1f>
+  DB  235,155                             ; jmp           1664d <_sk_load_g8_dst_sse41+0x1f>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,144                             ; jmp           16447 <_sk_load_g8_dst_sse41+0x1f>
+  DB  235,144                             ; jmp           1664d <_sk_load_g8_dst_sse41+0x1f>
 
 PUBLIC _sk_gather_g8_sse41
 _sk_gather_g8_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -20811,9 +20892,9 @@
   DB  102,15,58,32,192,3                  ; pinsrb        $0x3,%eax,%xmm0
   DB  102,15,56,49,192                    ; pmovzxbd      %xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,195,83,1,0                  ; mulps         0x153c3(%rip),%xmm0        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,5,230,84,1,0                  ; mulps         0x154e6(%rip),%xmm0        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,186,81,1,0                 ; movaps        0x151ba(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,221,82,1,0                 ; movaps        0x152dd(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
@@ -20828,41 +20909,41 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,80                              ; jne           165a9 <_sk_load_565_sse41+0x6b>
+  DB  117,80                              ; jne           167e6 <_sk_load_565_sse41+0x6b>
   DB  102,67,15,56,51,20,80               ; pmovzxwd      (%r8,%r10,2),%xmm2
-  DB  102,15,111,5,152,83,1,0             ; movdqa        0x15398(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,5,187,84,1,0             ; movdqa        0x154bb(%rip),%xmm0        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,154,83,1,0                  ; mulps         0x1539a(%rip),%xmm0        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,13,162,83,1,0            ; movdqa        0x153a2(%rip),%xmm1        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  15,89,5,189,84,1,0                  ; mulps         0x154bd(%rip),%xmm0        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,13,197,84,1,0            ; movdqa        0x154c5(%rip),%xmm1        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,164,83,1,0                 ; mulps         0x153a4(%rip),%xmm1        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,15,219,21,172,83,1,0            ; pand          0x153ac(%rip),%xmm2        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  15,89,13,199,84,1,0                 ; mulps         0x154c7(%rip),%xmm1        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,15,219,21,207,84,1,0            ; pand          0x154cf(%rip),%xmm2        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,178,83,1,0                 ; mulps         0x153b2(%rip),%xmm2        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  15,89,21,213,84,1,0                 ; mulps         0x154d5(%rip),%xmm2        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,73,81,1,0                  ; movaps        0x15149(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,108,82,1,0                 ; movaps        0x1526c(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            165eb <_sk_load_565_sse41+0xad>
+  DB  116,53                              ; je            16828 <_sk_load_565_sse41+0xad>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            165d5 <_sk_load_565_sse41+0x97>
+  DB  116,21                              ; je            16812 <_sk_load_565_sse41+0x97>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           16560 <_sk_load_565_sse41+0x22>
+  DB  117,154                             ; jne           1679d <_sk_load_565_sse41+0x22>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,208,69                   ; pshufd        $0x45,%xmm0,%xmm2
   DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,15,58,14,208,15                 ; pblendw       $0xf,%xmm0,%xmm2
-  DB  233,117,255,255,255                 ; jmpq          16560 <_sk_load_565_sse41+0x22>
+  DB  233,117,255,255,255                 ; jmpq          1679d <_sk_load_565_sse41+0x22>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,208                      ; movd          %eax,%xmm2
-  DB  233,103,255,255,255                 ; jmpq          16560 <_sk_load_565_sse41+0x22>
+  DB  233,103,255,255,255                 ; jmpq          1679d <_sk_load_565_sse41+0x22>
 
 PUBLIC _sk_load_565_dst_sse41
 _sk_load_565_dst_sse41 LABEL PROC
@@ -20874,52 +20955,65 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,80                              ; jne           16664 <_sk_load_565_dst_sse41+0x6b>
+  DB  117,80                              ; jne           168a1 <_sk_load_565_dst_sse41+0x6b>
   DB  102,67,15,56,51,52,80               ; pmovzxwd      (%r8,%r10,2),%xmm6
-  DB  102,15,111,37,221,82,1,0            ; movdqa        0x152dd(%rip),%xmm4        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,37,0,84,1,0              ; movdqa        0x15400(%rip),%xmm4        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,223,82,1,0                 ; mulps         0x152df(%rip),%xmm4        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,45,231,82,1,0            ; movdqa        0x152e7(%rip),%xmm5        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  15,89,37,2,84,1,0                   ; mulps         0x15402(%rip),%xmm4        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,45,10,84,1,0             ; movdqa        0x1540a(%rip),%xmm5        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,15,219,238                      ; pand          %xmm6,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,233,82,1,0                 ; mulps         0x152e9(%rip),%xmm5        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,15,219,53,241,82,1,0            ; pand          0x152f1(%rip),%xmm6        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  15,89,45,12,84,1,0                  ; mulps         0x1540c(%rip),%xmm5        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,15,219,53,20,84,1,0             ; pand          0x15414(%rip),%xmm6        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,247,82,1,0                 ; mulps         0x152f7(%rip),%xmm6        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  15,89,53,26,84,1,0                  ; mulps         0x1541a(%rip),%xmm6        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,142,80,1,0                 ; movaps        0x1508e(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,61,177,81,1,0                 ; movaps        0x151b1(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            166a6 <_sk_load_565_dst_sse41+0xad>
+  DB  116,53                              ; je            168e3 <_sk_load_565_dst_sse41+0xad>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            16690 <_sk_load_565_dst_sse41+0x97>
+  DB  116,21                              ; je            168cd <_sk_load_565_dst_sse41+0x97>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           1661b <_sk_load_565_dst_sse41+0x22>
+  DB  117,154                             ; jne           16858 <_sk_load_565_dst_sse41+0x22>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,244,69                   ; pshufd        $0x45,%xmm4,%xmm6
   DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
   DB  102,15,56,51,228                    ; pmovzxwd      %xmm4,%xmm4
   DB  102,15,58,14,244,15                 ; pblendw       $0xf,%xmm4,%xmm6
-  DB  233,117,255,255,255                 ; jmpq          1661b <_sk_load_565_dst_sse41+0x22>
+  DB  233,117,255,255,255                 ; jmpq          16858 <_sk_load_565_dst_sse41+0x22>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,240                      ; movd          %eax,%xmm6
-  DB  233,103,255,255,255                 ; jmpq          1661b <_sk_load_565_dst_sse41+0x22>
+  DB  233,103,255,255,255                 ; jmpq          16858 <_sk_load_565_dst_sse41+0x22>
 
 PUBLIC _sk_gather_565_sse41
 _sk_gather_565_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -20935,19 +21029,19 @@
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,192,3                    ; pinsrw        $0x3,%eax,%xmm0
   DB  102,15,56,51,208                    ; pmovzxwd      %xmm0,%xmm2
-  DB  102,15,111,5,219,81,1,0             ; movdqa        0x151db(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,5,199,82,1,0             ; movdqa        0x152c7(%rip),%xmm0        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,221,81,1,0                  ; mulps         0x151dd(%rip),%xmm0        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,13,229,81,1,0            ; movdqa        0x151e5(%rip),%xmm1        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  15,89,5,201,82,1,0                  ; mulps         0x152c9(%rip),%xmm0        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,13,209,82,1,0            ; movdqa        0x152d1(%rip),%xmm1        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,231,81,1,0                 ; mulps         0x151e7(%rip),%xmm1        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,15,219,21,239,81,1,0            ; pand          0x151ef(%rip),%xmm2        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  15,89,13,211,82,1,0                 ; mulps         0x152d3(%rip),%xmm1        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,15,219,21,219,82,1,0            ; pand          0x152db(%rip),%xmm2        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,245,81,1,0                 ; mulps         0x151f5(%rip),%xmm2        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  15,89,21,225,82,1,0                 ; mulps         0x152e1(%rip),%xmm2        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,140,79,1,0                 ; movaps        0x14f8c(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,120,80,1,0                 ; movaps        0x15078(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_565_sse41
@@ -20959,12 +21053,12 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  68,15,40,5,124,83,1,0               ; movaps        0x1537c(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xe58>
+  DB  68,15,40,5,104,84,1,0               ; movaps        0x15468(%rip),%xmm8        # 2be60 <_sk_srcover_rgba_8888_sse2_lowp+0xe5c>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  102,65,15,114,241,11                ; pslld         $0xb,%xmm9
-  DB  68,15,40,21,113,83,1,0              ; movaps        0x15371(%rip),%xmm10        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xe68>
+  DB  68,15,40,21,93,84,1,0               ; movaps        0x1545d(%rip),%xmm10        # 2be70 <_sk_srcover_rgba_8888_sse2_lowp+0xe6c>
   DB  68,15,89,209                        ; mulps         %xmm1,%xmm10
   DB  102,69,15,91,210                    ; cvtps2dq      %xmm10,%xmm10
   DB  102,65,15,114,242,5                 ; pslld         $0x5,%xmm10
@@ -20974,7 +21068,7 @@
   DB  102,69,15,86,194                    ; orpd          %xmm10,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           167d6 <_sk_store_565_sse41+0x70>
+  DB  117,10                              ; jne           16a4a <_sk_store_565_sse41+0x70>
   DB  102,69,15,214,4,64                  ; movq          %xmm8,(%r8,%rax,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -20982,17 +21076,17 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,35                              ; je            1680c <_sk_store_565_sse41+0xa6>
+  DB  116,35                              ; je            16a80 <_sk_store_565_sse41+0xa6>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            167fe <_sk_store_565_sse41+0x98>
+  DB  116,15                              ; je            16a72 <_sk_store_565_sse41+0x98>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,221                             ; jne           167d2 <_sk_store_565_sse41+0x6c>
+  DB  117,221                             ; jne           16a46 <_sk_store_565_sse41+0x6c>
   DB  102,69,15,58,21,68,64,4,4           ; pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
   DB  102,69,15,126,4,64                  ; movd          %xmm8,(%r8,%rax,2)
-  DB  235,198                             ; jmp           167d2 <_sk_store_565_sse41+0x6c>
+  DB  235,198                             ; jmp           16a46 <_sk_store_565_sse41+0x6c>
   DB  102,69,15,58,21,4,64,0              ; pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  DB  235,188                             ; jmp           167d2 <_sk_store_565_sse41+0x6c>
+  DB  235,188                             ; jmp           16a46 <_sk_store_565_sse41+0x6c>
 
 PUBLIC _sk_load_4444_sse41
 _sk_load_4444_sse41 LABEL PROC
@@ -21004,44 +21098,44 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,95                              ; jne           16890 <_sk_load_4444_sse41+0x7a>
+  DB  117,95                              ; jne           16b04 <_sk_load_4444_sse41+0x7a>
   DB  102,67,15,56,51,28,80               ; pmovzxwd      (%r8,%r10,2),%xmm3
-  DB  102,15,111,5,224,82,1,0             ; movdqa        0x152e0(%rip),%xmm0        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xe78>
+  DB  102,15,111,5,204,83,1,0             ; movdqa        0x153cc(%rip),%xmm0        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0xe7c>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,226,82,1,0                  ; mulps         0x152e2(%rip),%xmm0        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xe88>
-  DB  102,15,111,13,234,82,1,0            ; movdqa        0x152ea(%rip),%xmm1        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xe98>
+  DB  15,89,5,206,83,1,0                  ; mulps         0x153ce(%rip),%xmm0        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0xe8c>
+  DB  102,15,111,13,214,83,1,0            ; movdqa        0x153d6(%rip),%xmm1        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0xe9c>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,236,82,1,0                 ; mulps         0x152ec(%rip),%xmm1        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xea8>
-  DB  102,15,111,21,244,82,1,0            ; movdqa        0x152f4(%rip),%xmm2        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xeb8>
+  DB  15,89,13,216,83,1,0                 ; mulps         0x153d8(%rip),%xmm1        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0xeac>
+  DB  102,15,111,21,224,83,1,0            ; movdqa        0x153e0(%rip),%xmm2        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0xebc>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,246,82,1,0                 ; mulps         0x152f6(%rip),%xmm2        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xec8>
-  DB  102,15,219,29,254,82,1,0            ; pand          0x152fe(%rip),%xmm3        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xed8>
+  DB  15,89,21,226,83,1,0                 ; mulps         0x153e2(%rip),%xmm2        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0xecc>
+  DB  102,15,219,29,234,83,1,0            ; pand          0x153ea(%rip),%xmm3        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0xedc>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,4,83,1,0                   ; mulps         0x15304(%rip),%xmm3        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xee8>
+  DB  15,89,29,240,83,1,0                 ; mulps         0x153f0(%rip),%xmm3        # 2bef0 <_sk_srcover_rgba_8888_sse2_lowp+0xeec>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            168d2 <_sk_load_4444_sse41+0xbc>
+  DB  116,53                              ; je            16b46 <_sk_load_4444_sse41+0xbc>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            168bc <_sk_load_4444_sse41+0xa6>
+  DB  116,21                              ; je            16b30 <_sk_load_4444_sse41+0xa6>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           16838 <_sk_load_4444_sse41+0x22>
+  DB  117,139                             ; jne           16aac <_sk_load_4444_sse41+0x22>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
   DB  102,15,56,51,192                    ; pmovzxwd      %xmm0,%xmm0
   DB  102,15,58,14,216,15                 ; pblendw       $0xf,%xmm0,%xmm3
-  DB  233,102,255,255,255                 ; jmpq          16838 <_sk_load_4444_sse41+0x22>
+  DB  233,102,255,255,255                 ; jmpq          16aac <_sk_load_4444_sse41+0x22>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  233,88,255,255,255                  ; jmpq          16838 <_sk_load_4444_sse41+0x22>
+  DB  233,88,255,255,255                  ; jmpq          16aac <_sk_load_4444_sse41+0x22>
 
 PUBLIC _sk_load_4444_dst_sse41
 _sk_load_4444_dst_sse41 LABEL PROC
@@ -21053,55 +21147,68 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,95                              ; jne           1695a <_sk_load_4444_dst_sse41+0x7a>
+  DB  117,95                              ; jne           16bce <_sk_load_4444_dst_sse41+0x7a>
   DB  102,67,15,56,51,60,80               ; pmovzxwd      (%r8,%r10,2),%xmm7
-  DB  102,15,111,37,22,82,1,0             ; movdqa        0x15216(%rip),%xmm4        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xe78>
+  DB  102,15,111,37,2,83,1,0              ; movdqa        0x15302(%rip),%xmm4        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0xe7c>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,24,82,1,0                  ; mulps         0x15218(%rip),%xmm4        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xe88>
-  DB  102,15,111,45,32,82,1,0             ; movdqa        0x15220(%rip),%xmm5        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xe98>
+  DB  15,89,37,4,83,1,0                   ; mulps         0x15304(%rip),%xmm4        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0xe8c>
+  DB  102,15,111,45,12,83,1,0             ; movdqa        0x1530c(%rip),%xmm5        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0xe9c>
   DB  102,15,219,239                      ; pand          %xmm7,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,34,82,1,0                  ; mulps         0x15222(%rip),%xmm5        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xea8>
-  DB  102,15,111,53,42,82,1,0             ; movdqa        0x1522a(%rip),%xmm6        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xeb8>
+  DB  15,89,45,14,83,1,0                  ; mulps         0x1530e(%rip),%xmm5        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0xeac>
+  DB  102,15,111,53,22,83,1,0             ; movdqa        0x15316(%rip),%xmm6        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0xebc>
   DB  102,15,219,247                      ; pand          %xmm7,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,44,82,1,0                  ; mulps         0x1522c(%rip),%xmm6        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xec8>
-  DB  102,15,219,61,52,82,1,0             ; pand          0x15234(%rip),%xmm7        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xed8>
+  DB  15,89,53,24,83,1,0                  ; mulps         0x15318(%rip),%xmm6        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0xecc>
+  DB  102,15,219,61,32,83,1,0             ; pand          0x15320(%rip),%xmm7        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0xedc>
   DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  15,89,61,58,82,1,0                  ; mulps         0x1523a(%rip),%xmm7        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xee8>
+  DB  15,89,61,38,83,1,0                  ; mulps         0x15326(%rip),%xmm7        # 2bef0 <_sk_srcover_rgba_8888_sse2_lowp+0xeec>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,53                              ; je            1699c <_sk_load_4444_dst_sse41+0xbc>
+  DB  116,53                              ; je            16c10 <_sk_load_4444_dst_sse41+0xbc>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            16986 <_sk_load_4444_dst_sse41+0xa6>
+  DB  116,21                              ; je            16bfa <_sk_load_4444_dst_sse41+0xa6>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           16902 <_sk_load_4444_dst_sse41+0x22>
+  DB  117,139                             ; jne           16b76 <_sk_load_4444_dst_sse41+0x22>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
   DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
   DB  102,15,56,51,228                    ; pmovzxwd      %xmm4,%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,102,255,255,255                 ; jmpq          16902 <_sk_load_4444_dst_sse41+0x22>
+  DB  233,102,255,255,255                 ; jmpq          16b76 <_sk_load_4444_dst_sse41+0x22>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  233,88,255,255,255                  ; jmpq          16902 <_sk_load_4444_dst_sse41+0x22>
+  DB  233,88,255,255,255                  ; jmpq          16b76 <_sk_load_4444_dst_sse41+0x22>
 
 PUBLIC _sk_gather_4444_sse41
 _sk_gather_4444_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,58,22,192,1               ; pextrq        $0x1,%xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -21117,21 +21224,21 @@
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,192,3                    ; pinsrw        $0x3,%eax,%xmm0
   DB  102,15,56,51,216                    ; pmovzxwd      %xmm0,%xmm3
-  DB  102,15,111,5,5,81,1,0               ; movdqa        0x15105(%rip),%xmm0        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xe78>
+  DB  102,15,111,5,186,81,1,0             ; movdqa        0x151ba(%rip),%xmm0        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0xe7c>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,7,81,1,0                    ; mulps         0x15107(%rip),%xmm0        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xe88>
-  DB  102,15,111,13,15,81,1,0             ; movdqa        0x1510f(%rip),%xmm1        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xe98>
+  DB  15,89,5,188,81,1,0                  ; mulps         0x151bc(%rip),%xmm0        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0xe8c>
+  DB  102,15,111,13,196,81,1,0            ; movdqa        0x151c4(%rip),%xmm1        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0xe9c>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,17,81,1,0                  ; mulps         0x15111(%rip),%xmm1        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xea8>
-  DB  102,15,111,21,25,81,1,0             ; movdqa        0x15119(%rip),%xmm2        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xeb8>
+  DB  15,89,13,198,81,1,0                 ; mulps         0x151c6(%rip),%xmm1        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0xeac>
+  DB  102,15,111,21,206,81,1,0            ; movdqa        0x151ce(%rip),%xmm2        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0xebc>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,27,81,1,0                  ; mulps         0x1511b(%rip),%xmm2        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xec8>
-  DB  102,15,219,29,35,81,1,0             ; pand          0x15123(%rip),%xmm3        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xed8>
+  DB  15,89,21,208,81,1,0                 ; mulps         0x151d0(%rip),%xmm2        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0xecc>
+  DB  102,15,219,29,216,81,1,0            ; pand          0x151d8(%rip),%xmm3        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0xedc>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,41,81,1,0                  ; mulps         0x15129(%rip),%xmm3        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xee8>
+  DB  15,89,29,222,81,1,0                 ; mulps         0x151de(%rip),%xmm3        # 2bef0 <_sk_srcover_rgba_8888_sse2_lowp+0xeec>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -21144,7 +21251,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  68,15,40,5,23,81,1,0                ; movaps        0x15117(%rip),%xmm8        # 2bba0 <_sk_srcover_rgba_8888_sse2_lowp+0xef8>
+  DB  68,15,40,5,204,81,1,0               ; movaps        0x151cc(%rip),%xmm8        # 2bf00 <_sk_srcover_rgba_8888_sse2_lowp+0xefc>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
@@ -21164,7 +21271,7 @@
   DB  102,69,15,86,194                    ; orpd          %xmm10,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           16aef <_sk_store_4444_sse41+0x84>
+  DB  117,10                              ; jne           16d9a <_sk_store_4444_sse41+0x84>
   DB  102,69,15,214,4,64                  ; movq          %xmm8,(%r8,%rax,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -21172,17 +21279,17 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,35                              ; je            16b25 <_sk_store_4444_sse41+0xba>
+  DB  116,35                              ; je            16dd0 <_sk_store_4444_sse41+0xba>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            16b17 <_sk_store_4444_sse41+0xac>
+  DB  116,15                              ; je            16dc2 <_sk_store_4444_sse41+0xac>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,221                             ; jne           16aeb <_sk_store_4444_sse41+0x80>
+  DB  117,221                             ; jne           16d96 <_sk_store_4444_sse41+0x80>
   DB  102,69,15,58,21,68,64,4,4           ; pextrw        $0x4,%xmm8,0x4(%r8,%rax,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
   DB  102,69,15,126,4,64                  ; movd          %xmm8,(%r8,%rax,2)
-  DB  235,198                             ; jmp           16aeb <_sk_store_4444_sse41+0x80>
+  DB  235,198                             ; jmp           16d96 <_sk_store_4444_sse41+0x80>
   DB  102,69,15,58,21,4,64,0              ; pextrw        $0x0,%xmm8,(%r8,%rax,2)
-  DB  235,188                             ; jmp           16aeb <_sk_store_4444_sse41+0x80>
+  DB  235,188                             ; jmp           16d96 <_sk_store_4444_sse41+0x80>
 
 PUBLIC _sk_load_8888_sse41
 _sk_load_8888_sse41 LABEL PROC
@@ -21194,19 +21301,19 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           16ba4 <_sk_load_8888_sse41+0x75>
+  DB  117,89                              ; jne           16e4f <_sk_load_8888_sse41+0x75>
   DB  243,65,15,111,28,128                ; movdqu        (%r8,%rax,4),%xmm3
-  DB  102,15,111,5,71,76,1,0              ; movdqa        0x14c47(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,252,76,1,0             ; movdqa        0x14cfc(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,136,77,1,0               ; movaps        0x14d88(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,61,78,1,0                ; movaps        0x14e3d(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
-  DB  102,15,56,0,13,55,76,1,0            ; pshufb        0x14c37(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,13,236,76,1,0           ; pshufb        0x14cec(%rip),%xmm1        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
-  DB  102,15,56,0,21,51,76,1,0            ; pshufb        0x14c33(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,21,232,76,1,0           ; pshufb        0x14ce8(%rip),%xmm2        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -21217,19 +21324,19 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            16bde <_sk_load_8888_sse41+0xaf>
+  DB  116,45                              ; je            16e89 <_sk_load_8888_sse41+0xaf>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            16bcd <_sk_load_8888_sse41+0x9e>
+  DB  116,18                              ; je            16e78 <_sk_load_8888_sse41+0x9e>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           16b51 <_sk_load_8888_sse41+0x22>
+  DB  117,144                             ; jne           16dfc <_sk_load_8888_sse41+0x22>
   DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  243,65,15,126,4,128                 ; movq          (%r8,%rax,4),%xmm0
   DB  102,15,58,14,216,15                 ; pblendw       $0xf,%xmm0,%xmm3
-  DB  233,115,255,255,255                 ; jmpq          16b51 <_sk_load_8888_sse41+0x22>
+  DB  233,115,255,255,255                 ; jmpq          16dfc <_sk_load_8888_sse41+0x22>
   DB  102,65,15,110,28,128                ; movd          (%r8,%rax,4),%xmm3
-  DB  233,104,255,255,255                 ; jmpq          16b51 <_sk_load_8888_sse41+0x22>
+  DB  233,104,255,255,255                 ; jmpq          16dfc <_sk_load_8888_sse41+0x22>
 
 PUBLIC _sk_load_8888_dst_sse41
 _sk_load_8888_dst_sse41 LABEL PROC
@@ -21241,19 +21348,19 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           16c5e <_sk_load_8888_dst_sse41+0x75>
+  DB  117,89                              ; jne           16f09 <_sk_load_8888_dst_sse41+0x75>
   DB  243,65,15,111,60,128                ; movdqu        (%r8,%rax,4),%xmm7
-  DB  102,15,111,37,141,75,1,0            ; movdqa        0x14b8d(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,37,66,76,1,0             ; movdqa        0x14c42(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  68,15,40,5,206,76,1,0               ; movaps        0x14cce(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,131,77,1,0               ; movaps        0x14d83(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,224                        ; mulps         %xmm8,%xmm4
   DB  102,15,111,239                      ; movdqa        %xmm7,%xmm5
-  DB  102,15,56,0,45,125,75,1,0           ; pshufb        0x14b7d(%rip),%xmm5        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,45,50,76,1,0            ; pshufb        0x14c32(%rip),%xmm5        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
   DB  65,15,89,232                        ; mulps         %xmm8,%xmm5
   DB  102,15,111,247                      ; movdqa        %xmm7,%xmm6
-  DB  102,15,56,0,53,121,75,1,0           ; pshufb        0x14b79(%rip),%xmm6        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,53,46,76,1,0            ; pshufb        0x14c2e(%rip),%xmm6        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  65,15,89,240                        ; mulps         %xmm8,%xmm6
   DB  102,15,114,215,24                   ; psrld         $0x18,%xmm7
@@ -21264,30 +21371,43 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            16c98 <_sk_load_8888_dst_sse41+0xaf>
+  DB  116,45                              ; je            16f43 <_sk_load_8888_dst_sse41+0xaf>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            16c87 <_sk_load_8888_dst_sse41+0x9e>
+  DB  116,18                              ; je            16f32 <_sk_load_8888_dst_sse41+0x9e>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           16c0b <_sk_load_8888_dst_sse41+0x22>
+  DB  117,144                             ; jne           16eb6 <_sk_load_8888_dst_sse41+0x22>
   DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
   DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,115,255,255,255                 ; jmpq          16c0b <_sk_load_8888_dst_sse41+0x22>
+  DB  233,115,255,255,255                 ; jmpq          16eb6 <_sk_load_8888_dst_sse41+0x22>
   DB  102,65,15,110,60,128                ; movd          (%r8,%rax,4),%xmm7
-  DB  233,104,255,255,255                 ; jmpq          16c0b <_sk_load_8888_dst_sse41+0x22>
+  DB  233,104,255,255,255                 ; jmpq          16eb6 <_sk_load_8888_dst_sse41+0x22>
 
 PUBLIC _sk_gather_8888_sse41
 _sk_gather_8888_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -21298,17 +21418,17 @@
   DB  102,65,15,58,34,28,128,1            ; pinsrd        $0x1,(%r8,%rax,4),%xmm3
   DB  102,67,15,58,34,28,152,2            ; pinsrd        $0x2,(%r8,%r11,4),%xmm3
   DB  102,67,15,58,34,28,144,3            ; pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  DB  102,15,111,5,157,74,1,0             ; movdqa        0x14a9d(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,27,75,1,0              ; movdqa        0x14b1b(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,222,75,1,0               ; movaps        0x14bde(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,92,76,1,0                ; movaps        0x14c5c(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
-  DB  102,15,56,0,13,141,74,1,0           ; pshufb        0x14a8d(%rip),%xmm1        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,13,11,75,1,0            ; pshufb        0x14b0b(%rip),%xmm1        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
-  DB  102,15,56,0,21,137,74,1,0           ; pshufb        0x14a89(%rip),%xmm2        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,21,7,75,1,0             ; pshufb        0x14b07(%rip),%xmm2        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -21326,7 +21446,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  68,15,40,5,99,74,1,0                ; movaps        0x14a63(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,225,74,1,0               ; movaps        0x14ae1(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
@@ -21345,23 +21465,23 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,194                   ; por           %xmm10,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           16dcd <_sk_store_8888_sse41+0x7f>
+  DB  117,10                              ; jne           170af <_sk_store_8888_sse41+0x7f>
   DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,29                              ; je            16df7 <_sk_store_8888_sse41+0xa9>
+  DB  116,29                              ; je            170d9 <_sk_store_8888_sse41+0xa9>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            16def <_sk_store_8888_sse41+0xa1>
+  DB  116,15                              ; je            170d1 <_sk_store_8888_sse41+0xa1>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           16dc9 <_sk_store_8888_sse41+0x7b>
+  DB  117,227                             ; jne           170ab <_sk_store_8888_sse41+0x7b>
   DB  102,69,15,58,22,68,128,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
   DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,210                             ; jmp           16dc9 <_sk_store_8888_sse41+0x7b>
+  DB  235,210                             ; jmp           170ab <_sk_store_8888_sse41+0x7b>
   DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,202                             ; jmp           16dc9 <_sk_store_8888_sse41+0x7b>
+  DB  235,202                             ; jmp           170ab <_sk_store_8888_sse41+0x7b>
 
 PUBLIC _sk_load_bgra_sse41
 _sk_load_bgra_sse41 LABEL PROC
@@ -21373,19 +21493,19 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           16e74 <_sk_load_bgra_sse41+0x75>
+  DB  117,89                              ; jne           17156 <_sk_load_bgra_sse41+0x75>
   DB  243,65,15,111,28,128                ; movdqu        (%r8,%rax,4),%xmm3
-  DB  102,15,111,5,119,73,1,0             ; movdqa        0x14977(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,245,73,1,0             ; movdqa        0x149f5(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,208                           ; cvtdq2ps      %xmm0,%xmm2
-  DB  68,15,40,5,184,74,1,0               ; movaps        0x14ab8(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,54,75,1,0                ; movaps        0x14b36(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,103,73,1,0            ; pshufb        0x14967(%rip),%xmm0        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,5,229,73,1,0            ; pshufb        0x149e5(%rip),%xmm0        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,200                           ; cvtdq2ps      %xmm0,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,99,73,1,0             ; pshufb        0x14963(%rip),%xmm0        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,5,225,73,1,0            ; pshufb        0x149e1(%rip),%xmm0        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -21396,19 +21516,19 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            16eae <_sk_load_bgra_sse41+0xaf>
+  DB  116,45                              ; je            17190 <_sk_load_bgra_sse41+0xaf>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            16e9d <_sk_load_bgra_sse41+0x9e>
+  DB  116,18                              ; je            1717f <_sk_load_bgra_sse41+0x9e>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           16e21 <_sk_load_bgra_sse41+0x22>
+  DB  117,144                             ; jne           17103 <_sk_load_bgra_sse41+0x22>
   DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  243,65,15,126,4,128                 ; movq          (%r8,%rax,4),%xmm0
   DB  102,15,58,14,216,15                 ; pblendw       $0xf,%xmm0,%xmm3
-  DB  233,115,255,255,255                 ; jmpq          16e21 <_sk_load_bgra_sse41+0x22>
+  DB  233,115,255,255,255                 ; jmpq          17103 <_sk_load_bgra_sse41+0x22>
   DB  102,65,15,110,28,128                ; movd          (%r8,%rax,4),%xmm3
-  DB  233,104,255,255,255                 ; jmpq          16e21 <_sk_load_bgra_sse41+0x22>
+  DB  233,104,255,255,255                 ; jmpq          17103 <_sk_load_bgra_sse41+0x22>
 
 PUBLIC _sk_load_bgra_dst_sse41
 _sk_load_bgra_dst_sse41 LABEL PROC
@@ -21420,19 +21540,19 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,89                              ; jne           16f2e <_sk_load_bgra_dst_sse41+0x75>
+  DB  117,89                              ; jne           17210 <_sk_load_bgra_dst_sse41+0x75>
   DB  243,65,15,111,60,128                ; movdqu        (%r8,%rax,4),%xmm7
-  DB  102,15,111,37,189,72,1,0            ; movdqa        0x148bd(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,37,59,73,1,0             ; movdqa        0x1493b(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,244                           ; cvtdq2ps      %xmm4,%xmm6
-  DB  68,15,40,5,254,73,1,0               ; movaps        0x149fe(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,124,74,1,0               ; movaps        0x14a7c(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,240                        ; mulps         %xmm8,%xmm6
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
-  DB  102,15,56,0,37,173,72,1,0           ; pshufb        0x148ad(%rip),%xmm4        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,37,43,73,1,0            ; pshufb        0x1492b(%rip),%xmm4        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,236                           ; cvtdq2ps      %xmm4,%xmm5
   DB  65,15,89,232                        ; mulps         %xmm8,%xmm5
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
-  DB  102,15,56,0,37,169,72,1,0           ; pshufb        0x148a9(%rip),%xmm4        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,37,39,73,1,0            ; pshufb        0x14927(%rip),%xmm4        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
   DB  65,15,89,224                        ; mulps         %xmm8,%xmm4
   DB  102,15,114,215,24                   ; psrld         $0x18,%xmm7
@@ -21443,30 +21563,43 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            16f68 <_sk_load_bgra_dst_sse41+0xaf>
+  DB  116,45                              ; je            1724a <_sk_load_bgra_dst_sse41+0xaf>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            16f57 <_sk_load_bgra_dst_sse41+0x9e>
+  DB  116,18                              ; je            17239 <_sk_load_bgra_dst_sse41+0x9e>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,144                             ; jne           16edb <_sk_load_bgra_dst_sse41+0x22>
+  DB  117,144                             ; jne           171bd <_sk_load_bgra_dst_sse41+0x22>
   DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
   DB  243,65,15,126,36,128                ; movq          (%r8,%rax,4),%xmm4
   DB  102,15,58,14,252,15                 ; pblendw       $0xf,%xmm4,%xmm7
-  DB  233,115,255,255,255                 ; jmpq          16edb <_sk_load_bgra_dst_sse41+0x22>
+  DB  233,115,255,255,255                 ; jmpq          171bd <_sk_load_bgra_dst_sse41+0x22>
   DB  102,65,15,110,60,128                ; movd          (%r8,%rax,4),%xmm7
-  DB  233,104,255,255,255                 ; jmpq          16edb <_sk_load_bgra_dst_sse41+0x22>
+  DB  233,104,255,255,255                 ; jmpq          171bd <_sk_load_bgra_dst_sse41+0x22>
 
 PUBLIC _sk_gather_bgra_sse41
 _sk_gather_bgra_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -21477,17 +21610,17 @@
   DB  102,65,15,58,34,28,128,1            ; pinsrd        $0x1,(%r8,%rax,4),%xmm3
   DB  102,67,15,58,34,28,152,2            ; pinsrd        $0x2,(%r8,%r11,4),%xmm3
   DB  102,67,15,58,34,28,144,3            ; pinsrd        $0x3,(%r8,%r10,4),%xmm3
-  DB  102,15,111,5,205,71,1,0             ; movdqa        0x147cd(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,20,72,1,0              ; movdqa        0x14814(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,208                           ; cvtdq2ps      %xmm0,%xmm2
-  DB  68,15,40,5,14,73,1,0                ; movaps        0x1490e(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,85,73,1,0                ; movaps        0x14955(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,189,71,1,0            ; pshufb        0x147bd(%rip),%xmm0        # 2b7b0 <_sk_srcover_rgba_8888_sse2_lowp+0xb08>
+  DB  102,15,56,0,5,4,72,1,0              ; pshufb        0x14804(%rip),%xmm0        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xb0c>
   DB  15,91,200                           ; cvtdq2ps      %xmm0,%xmm1
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,56,0,5,185,71,1,0            ; pshufb        0x147b9(%rip),%xmm0        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0xb18>
+  DB  102,15,56,0,5,0,72,1,0              ; pshufb        0x14800(%rip),%xmm0        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xb1c>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
@@ -21505,7 +21638,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  68,15,40,5,147,71,1,0               ; movaps        0x14793(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,218,71,1,0               ; movaps        0x147da(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  68,15,40,202                        ; movaps        %xmm2,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
@@ -21524,23 +21657,23 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,194                   ; por           %xmm10,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1709d <_sk_store_bgra_sse41+0x7f>
+  DB  117,10                              ; jne           173b6 <_sk_store_bgra_sse41+0x7f>
   DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,29                              ; je            170c7 <_sk_store_bgra_sse41+0xa9>
+  DB  116,29                              ; je            173e0 <_sk_store_bgra_sse41+0xa9>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,15                              ; je            170bf <_sk_store_bgra_sse41+0xa1>
+  DB  116,15                              ; je            173d8 <_sk_store_bgra_sse41+0xa1>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           17099 <_sk_store_bgra_sse41+0x7b>
+  DB  117,227                             ; jne           173b2 <_sk_store_bgra_sse41+0x7b>
   DB  102,69,15,58,22,68,128,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rax,4)
   DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,210                             ; jmp           17099 <_sk_store_bgra_sse41+0x7b>
+  DB  235,210                             ; jmp           173b2 <_sk_store_bgra_sse41+0x7b>
   DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,202                             ; jmp           17099 <_sk_store_bgra_sse41+0x7b>
+  DB  235,202                             ; jmp           173b2 <_sk_store_bgra_sse41+0x7b>
 
 PUBLIC _sk_load_f16_sse41
 _sk_load_f16_sse41 LABEL PROC
@@ -21552,7 +21685,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,68,1,0,0                     ; jne           17233 <_sk_load_f16_sse41+0x164>
+  DB  15,133,68,1,0,0                     ; jne           1754c <_sk_load_f16_sse41+0x164>
   DB  102,65,15,16,4,192                  ; movupd        (%r8,%rax,8),%xmm0
   DB  243,65,15,111,76,192,16             ; movdqu        0x10(%r8,%rax,8),%xmm1
   DB  102,68,15,40,200                    ; movapd        %xmm0,%xmm9
@@ -21562,19 +21695,19 @@
   DB  102,68,15,97,224                    ; punpcklwd     %xmm0,%xmm12
   DB  102,68,15,105,200                   ; punpckhwd     %xmm0,%xmm9
   DB  102,65,15,56,51,212                 ; pmovzxwd      %xmm12,%xmm2
-  DB  102,68,15,111,5,136,74,1,0          ; movdqa        0x14a88(%rip),%xmm8        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xf08>
+  DB  102,68,15,111,5,207,74,1,0          ; movdqa        0x14acf(%rip),%xmm8        # 2bf10 <_sk_srcover_rgba_8888_sse2_lowp+0xf0c>
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,219,200                   ; pand          %xmm8,%xmm1
-  DB  102,68,15,111,21,134,74,1,0         ; movdqa        0x14a86(%rip),%xmm10        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xf18>
+  DB  102,68,15,111,21,205,74,1,0         ; movdqa        0x14acd(%rip),%xmm10        # 2bf20 <_sk_srcover_rgba_8888_sse2_lowp+0xf1c>
   DB  102,65,15,219,210                   ; pand          %xmm10,%xmm2
-  DB  102,15,111,29,137,74,1,0            ; movdqa        0x14a89(%rip),%xmm3        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xf28>
+  DB  102,15,111,29,208,74,1,0            ; movdqa        0x14ad0(%rip),%xmm3        # 2bf30 <_sk_srcover_rgba_8888_sse2_lowp+0xf2c>
   DB  102,15,114,241,16                   ; pslld         $0x10,%xmm1
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,56,63,195                    ; pmaxud        %xmm3,%xmm0
   DB  102,15,118,194                      ; pcmpeqd       %xmm2,%xmm0
   DB  102,15,114,242,13                   ; pslld         $0xd,%xmm2
   DB  102,15,235,209                      ; por           %xmm1,%xmm2
-  DB  102,68,15,111,29,117,74,1,0         ; movdqa        0x14a75(%rip),%xmm11        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xf38>
+  DB  102,68,15,111,29,188,74,1,0         ; movdqa        0x14abc(%rip),%xmm11        # 2bf40 <_sk_srcover_rgba_8888_sse2_lowp+0xf3c>
   DB  102,65,15,254,211                   ; paddd         %xmm11,%xmm2
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,65,15,112,204,238               ; pshufd        $0xee,%xmm12,%xmm1
@@ -21617,16 +21750,16 @@
   DB  255,224                             ; jmpq          *%rax
   DB  242,65,15,16,4,192                  ; movsd         (%r8,%rax,8),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1724c <_sk_load_f16_sse41+0x17d>
+  DB  117,13                              ; jne           17565 <_sk_load_f16_sse41+0x17d>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,176,254,255,255                 ; jmpq          170fc <_sk_load_f16_sse41+0x2d>
+  DB  233,176,254,255,255                 ; jmpq          17415 <_sk_load_f16_sse41+0x2d>
   DB  102,65,15,22,68,192,8               ; movhpd        0x8(%r8,%rax,8),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,155,254,255,255              ; jb            170fc <_sk_load_f16_sse41+0x2d>
+  DB  15,130,155,254,255,255              ; jb            17415 <_sk_load_f16_sse41+0x2d>
   DB  243,65,15,126,76,192,16             ; movq          0x10(%r8,%rax,8),%xmm1
-  DB  233,143,254,255,255                 ; jmpq          170fc <_sk_load_f16_sse41+0x2d>
+  DB  233,143,254,255,255                 ; jmpq          17415 <_sk_load_f16_sse41+0x2d>
 
 PUBLIC _sk_load_f16_dst_sse41
 _sk_load_f16_dst_sse41 LABEL PROC
@@ -21638,7 +21771,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,68,1,0,0                     ; jne           173d1 <_sk_load_f16_dst_sse41+0x164>
+  DB  15,133,68,1,0,0                     ; jne           176ea <_sk_load_f16_dst_sse41+0x164>
   DB  102,65,15,16,36,192                 ; movupd        (%r8,%rax,8),%xmm4
   DB  243,65,15,111,108,192,16            ; movdqu        0x10(%r8,%rax,8),%xmm5
   DB  102,68,15,40,204                    ; movapd        %xmm4,%xmm9
@@ -21648,19 +21781,19 @@
   DB  102,68,15,97,228                    ; punpcklwd     %xmm4,%xmm12
   DB  102,68,15,105,204                   ; punpckhwd     %xmm4,%xmm9
   DB  102,65,15,56,51,244                 ; pmovzxwd      %xmm12,%xmm6
-  DB  102,68,15,111,5,234,72,1,0          ; movdqa        0x148ea(%rip),%xmm8        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xf08>
+  DB  102,68,15,111,5,49,73,1,0           ; movdqa        0x14931(%rip),%xmm8        # 2bf10 <_sk_srcover_rgba_8888_sse2_lowp+0xf0c>
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,65,15,219,232                   ; pand          %xmm8,%xmm5
-  DB  102,68,15,111,21,232,72,1,0         ; movdqa        0x148e8(%rip),%xmm10        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xf18>
+  DB  102,68,15,111,21,47,73,1,0          ; movdqa        0x1492f(%rip),%xmm10        # 2bf20 <_sk_srcover_rgba_8888_sse2_lowp+0xf1c>
   DB  102,65,15,219,242                   ; pand          %xmm10,%xmm6
-  DB  102,15,111,61,235,72,1,0            ; movdqa        0x148eb(%rip),%xmm7        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xf28>
+  DB  102,15,111,61,50,73,1,0             ; movdqa        0x14932(%rip),%xmm7        # 2bf30 <_sk_srcover_rgba_8888_sse2_lowp+0xf2c>
   DB  102,15,114,245,16                   ; pslld         $0x10,%xmm5
   DB  102,15,111,230                      ; movdqa        %xmm6,%xmm4
   DB  102,15,56,63,231                    ; pmaxud        %xmm7,%xmm4
   DB  102,15,118,230                      ; pcmpeqd       %xmm6,%xmm4
   DB  102,15,114,246,13                   ; pslld         $0xd,%xmm6
   DB  102,15,235,245                      ; por           %xmm5,%xmm6
-  DB  102,68,15,111,29,215,72,1,0         ; movdqa        0x148d7(%rip),%xmm11        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xf38>
+  DB  102,68,15,111,29,30,73,1,0          ; movdqa        0x1491e(%rip),%xmm11        # 2bf40 <_sk_srcover_rgba_8888_sse2_lowp+0xf3c>
   DB  102,65,15,254,243                   ; paddd         %xmm11,%xmm6
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  102,65,15,112,236,238               ; pshufd        $0xee,%xmm12,%xmm5
@@ -21703,27 +21836,40 @@
   DB  255,224                             ; jmpq          *%rax
   DB  242,65,15,16,36,192                 ; movsd         (%r8,%rax,8),%xmm4
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           173ea <_sk_load_f16_dst_sse41+0x17d>
+  DB  117,13                              ; jne           17703 <_sk_load_f16_dst_sse41+0x17d>
   DB  243,15,126,228                      ; movq          %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
-  DB  233,176,254,255,255                 ; jmpq          1729a <_sk_load_f16_dst_sse41+0x2d>
+  DB  233,176,254,255,255                 ; jmpq          175b3 <_sk_load_f16_dst_sse41+0x2d>
   DB  102,65,15,22,100,192,8              ; movhpd        0x8(%r8,%rax,8),%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,155,254,255,255              ; jb            1729a <_sk_load_f16_dst_sse41+0x2d>
+  DB  15,130,155,254,255,255              ; jb            175b3 <_sk_load_f16_dst_sse41+0x2d>
   DB  243,65,15,126,108,192,16            ; movq          0x10(%r8,%rax,8),%xmm5
-  DB  233,143,254,255,255                 ; jmpq          1729a <_sk_load_f16_dst_sse41+0x2d>
+  DB  233,143,254,255,255                 ; jmpq          175b3 <_sk_load_f16_dst_sse41+0x2d>
 
 PUBLIC _sk_gather_f16_sse41
 _sk_gather_f16_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,56,64,209                    ; pmulld        %xmm1,%xmm2
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,194                      ; paddd         %xmm2,%xmm0
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,56,64,200                    ; pmulld        %xmm0,%xmm1
+  DB  243,65,15,91,193                    ; cvttps2dq     %xmm9,%xmm0
+  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
@@ -21743,19 +21889,19 @@
   DB  102,68,15,97,226                    ; punpcklwd     %xmm2,%xmm12
   DB  102,68,15,105,202                   ; punpckhwd     %xmm2,%xmm9
   DB  102,65,15,56,51,212                 ; pmovzxwd      %xmm12,%xmm2
-  DB  102,68,15,111,5,31,71,1,0           ; movdqa        0x1471f(%rip),%xmm8        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xf08>
+  DB  102,68,15,111,5,47,71,1,0           ; movdqa        0x1472f(%rip),%xmm8        # 2bf10 <_sk_srcover_rgba_8888_sse2_lowp+0xf0c>
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,219,200                   ; pand          %xmm8,%xmm1
-  DB  102,68,15,111,21,29,71,1,0          ; movdqa        0x1471d(%rip),%xmm10        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xf18>
+  DB  102,68,15,111,21,45,71,1,0          ; movdqa        0x1472d(%rip),%xmm10        # 2bf20 <_sk_srcover_rgba_8888_sse2_lowp+0xf1c>
   DB  102,65,15,219,210                   ; pand          %xmm10,%xmm2
-  DB  102,15,111,29,32,71,1,0             ; movdqa        0x14720(%rip),%xmm3        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xf28>
+  DB  102,15,111,29,48,71,1,0             ; movdqa        0x14730(%rip),%xmm3        # 2bf30 <_sk_srcover_rgba_8888_sse2_lowp+0xf2c>
   DB  102,15,114,241,16                   ; pslld         $0x10,%xmm1
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,56,63,195                    ; pmaxud        %xmm3,%xmm0
   DB  102,15,118,194                      ; pcmpeqd       %xmm2,%xmm0
   DB  102,15,114,242,13                   ; pslld         $0xd,%xmm2
   DB  102,15,235,209                      ; por           %xmm1,%xmm2
-  DB  102,68,15,111,29,12,71,1,0          ; movdqa        0x1470c(%rip),%xmm11        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xf38>
+  DB  102,68,15,111,29,28,71,1,0          ; movdqa        0x1471c(%rip),%xmm11        # 2bf40 <_sk_srcover_rgba_8888_sse2_lowp+0xf3c>
   DB  102,65,15,254,211                   ; paddd         %xmm11,%xmm2
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,65,15,112,204,238               ; pshufd        $0xee,%xmm12,%xmm1
@@ -21806,20 +21952,20 @@
   DB  73,193,224,3                        ; shl           $0x3,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  102,68,15,111,13,52,70,1,0          ; movdqa        0x14634(%rip),%xmm9        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
+  DB  102,68,15,111,13,68,70,1,0          ; movdqa        0x14644(%rip),%xmm9        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
   DB  102,68,15,111,224                   ; movdqa        %xmm0,%xmm12
   DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,49,70,1,0          ; movdqa        0x14631(%rip),%xmm11        # 2bc00 <_sk_srcover_rgba_8888_sse2_lowp+0xf58>
+  DB  102,68,15,111,29,65,70,1,0          ; movdqa        0x14641(%rip),%xmm11        # 2bf60 <_sk_srcover_rgba_8888_sse2_lowp+0xf5c>
   DB  102,68,15,111,232                   ; movdqa        %xmm0,%xmm13
   DB  102,69,15,219,235                   ; pand          %xmm11,%xmm13
-  DB  102,68,15,111,21,46,70,1,0          ; movdqa        0x1462e(%rip),%xmm10        # 2bc10 <_sk_srcover_rgba_8888_sse2_lowp+0xf68>
+  DB  102,68,15,111,21,62,70,1,0          ; movdqa        0x1463e(%rip),%xmm10        # 2bf70 <_sk_srcover_rgba_8888_sse2_lowp+0xf6c>
   DB  102,65,15,114,212,16                ; psrld         $0x10,%xmm12
   DB  102,69,15,111,197                   ; movdqa        %xmm13,%xmm8
   DB  102,69,15,56,63,194                 ; pmaxud        %xmm10,%xmm8
   DB  102,69,15,118,197                   ; pcmpeqd       %xmm13,%xmm8
   DB  102,65,15,114,213,13                ; psrld         $0xd,%xmm13
   DB  102,69,15,254,236                   ; paddd         %xmm12,%xmm13
-  DB  102,68,15,111,37,20,70,1,0          ; movdqa        0x14614(%rip),%xmm12        # 2bc20 <_sk_srcover_rgba_8888_sse2_lowp+0xf78>
+  DB  102,68,15,111,37,36,70,1,0          ; movdqa        0x14624(%rip),%xmm12        # 2bf80 <_sk_srcover_rgba_8888_sse2_lowp+0xf7c>
   DB  102,69,15,254,236                   ; paddd         %xmm12,%xmm13
   DB  102,69,15,219,197                   ; pand          %xmm13,%xmm8
   DB  102,68,15,56,43,192                 ; packusdw      %xmm0,%xmm8
@@ -21864,7 +22010,7 @@
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,98,205                    ; punpckldq     %xmm13,%xmm9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,21                              ; jne           1770a <_sk_store_f16_sse41+0x16e>
+  DB  117,21                              ; jne           17a5a <_sk_store_f16_sse41+0x16e>
   DB  69,15,17,12,192                     ; movups        %xmm9,(%r8,%rax,8)
   DB  102,69,15,106,197                   ; punpckhdq     %xmm13,%xmm8
   DB  243,69,15,127,68,192,16             ; movdqu        %xmm8,0x10(%r8,%rax,8)
@@ -21872,13 +22018,13 @@
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,214,12,192                ; movq          %xmm9,(%r8,%rax,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            17706 <_sk_store_f16_sse41+0x16a>
+  DB  116,240                             ; je            17a56 <_sk_store_f16_sse41+0x16a>
   DB  102,69,15,23,76,192,8               ; movhpd        %xmm9,0x8(%r8,%rax,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            17706 <_sk_store_f16_sse41+0x16a>
+  DB  114,227                             ; jb            17a56 <_sk_store_f16_sse41+0x16a>
   DB  102,69,15,106,197                   ; punpckhdq     %xmm13,%xmm8
   DB  102,69,15,214,68,192,16             ; movq          %xmm8,0x10(%r8,%rax,8)
-  DB  235,213                             ; jmp           17706 <_sk_store_f16_sse41+0x16a>
+  DB  235,213                             ; jmp           17a56 <_sk_store_f16_sse41+0x16a>
 
 PUBLIC _sk_load_u16_be_sse41
 _sk_load_u16_be_sse41 LABEL PROC
@@ -21891,7 +22037,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,185,0,0,0                    ; jne           17811 <_sk_load_u16_be_sse41+0xe0>
+  DB  15,133,185,0,0,0                    ; jne           17b61 <_sk_load_u16_be_sse41+0xe0>
   DB  102,65,15,16,4,64                   ; movupd        (%r8,%rax,2),%xmm0
   DB  243,65,15,111,76,64,16              ; movdqu        0x10(%r8,%rax,2),%xmm1
   DB  102,15,40,208                       ; movapd        %xmm0,%xmm2
@@ -21907,7 +22053,7 @@
   DB  102,15,235,200                      ; por           %xmm0,%xmm1
   DB  102,15,56,51,193                    ; pmovzxwd      %xmm1,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,220,65,1,0               ; movaps        0x141dc(%rip),%xmm8        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0xcd8>
+  DB  68,15,40,5,236,65,1,0               ; movaps        0x141ec(%rip),%xmm8        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0xcdc>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -21935,16 +22081,16 @@
   DB  255,224                             ; jmpq          *%rax
   DB  242,65,15,16,4,64                   ; movsd         (%r8,%rax,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1782a <_sk_load_u16_be_sse41+0xf9>
+  DB  117,13                              ; jne           17b7a <_sk_load_u16_be_sse41+0xf9>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,59,255,255,255                  ; jmpq          17765 <_sk_load_u16_be_sse41+0x34>
+  DB  233,59,255,255,255                  ; jmpq          17ab5 <_sk_load_u16_be_sse41+0x34>
   DB  102,65,15,22,68,64,8                ; movhpd        0x8(%r8,%rax,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,38,255,255,255               ; jb            17765 <_sk_load_u16_be_sse41+0x34>
+  DB  15,130,38,255,255,255               ; jb            17ab5 <_sk_load_u16_be_sse41+0x34>
   DB  243,65,15,126,76,64,16              ; movq          0x10(%r8,%rax,2),%xmm1
-  DB  233,26,255,255,255                  ; jmpq          17765 <_sk_load_u16_be_sse41+0x34>
+  DB  233,26,255,255,255                  ; jmpq          17ab5 <_sk_load_u16_be_sse41+0x34>
 
 PUBLIC _sk_load_rgb_u16_be_sse41
 _sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -21959,7 +22105,7 @@
   DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
   DB  72,193,248,32                       ; sar           $0x20,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,170,0,0,0                    ; jne           17920 <_sk_load_rgb_u16_be_sse41+0xd5>
+  DB  15,133,170,0,0,0                    ; jne           17c70 <_sk_load_rgb_u16_be_sse41+0xd5>
   DB  243,65,15,111,20,64                 ; movdqu        (%r8,%rax,2),%xmm2
   DB  243,65,15,111,92,64,8               ; movdqu        0x8(%r8,%rax,2),%xmm3
   DB  102,15,115,219,4                    ; psrldq        $0x4,%xmm3
@@ -21979,7 +22125,7 @@
   DB  102,15,235,200                      ; por           %xmm0,%xmm1
   DB  102,15,56,51,193                    ; pmovzxwd      %xmm1,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,171,64,1,0               ; movaps        0x140ab(%rip),%xmm8        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0xcd8>
+  DB  68,15,40,5,187,64,1,0               ; movaps        0x140bb(%rip),%xmm8        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0xcdc>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -21996,27 +22142,27 @@
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,210,61,1,0                 ; movaps        0x13dd2(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,226,61,1,0                 ; movaps        0x13de2(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,20,64                 ; movd          (%r8,%rax,2),%xmm2
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,84,64,4,2             ; pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           17945 <_sk_load_rgb_u16_be_sse41+0xfa>
+  DB  117,13                              ; jne           17c95 <_sk_load_rgb_u16_be_sse41+0xfa>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  233,85,255,255,255                  ; jmpq          1789a <_sk_load_rgb_u16_be_sse41+0x4f>
+  DB  233,85,255,255,255                  ; jmpq          17bea <_sk_load_rgb_u16_be_sse41+0x4f>
   DB  102,65,15,110,68,64,6               ; movd          0x6(%r8,%rax,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,68,64,10,2            ; pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            17976 <_sk_load_rgb_u16_be_sse41+0x12b>
+  DB  114,24                              ; jb            17cc6 <_sk_load_rgb_u16_be_sse41+0x12b>
   DB  102,65,15,110,92,64,12              ; movd          0xc(%r8,%rax,2),%xmm3
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,92,64,16,2            ; pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  DB  233,36,255,255,255                  ; jmpq          1789a <_sk_load_rgb_u16_be_sse41+0x4f>
+  DB  233,36,255,255,255                  ; jmpq          17bea <_sk_load_rgb_u16_be_sse41+0x4f>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  233,27,255,255,255                  ; jmpq          1789a <_sk_load_rgb_u16_be_sse41+0x4f>
+  DB  233,27,255,255,255                  ; jmpq          17bea <_sk_load_rgb_u16_be_sse41+0x4f>
 
 PUBLIC _sk_store_u16_be_sse41
 _sk_store_u16_be_sse41 LABEL PROC
@@ -22028,7 +22174,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  68,15,40,21,139,66,1,0              ; movaps        0x1428b(%rip),%xmm10        # 2bc30 <_sk_srcover_rgba_8888_sse2_lowp+0xf88>
+  DB  68,15,40,21,155,66,1,0              ; movaps        0x1429b(%rip),%xmm10        # 2bf90 <_sk_srcover_rgba_8888_sse2_lowp+0xf8c>
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
   DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
@@ -22065,7 +22211,7 @@
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
   DB  102,69,15,98,209                    ; punpckldq     %xmm9,%xmm10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,21                              ; jne           17a73 <_sk_store_u16_be_sse41+0xf4>
+  DB  117,21                              ; jne           17dc3 <_sk_store_u16_be_sse41+0xf4>
   DB  69,15,17,20,64                      ; movups        %xmm10,(%r8,%rax,2)
   DB  102,69,15,106,193                   ; punpckhdq     %xmm9,%xmm8
   DB  243,69,15,127,68,64,16              ; movdqu        %xmm8,0x10(%r8,%rax,2)
@@ -22073,13 +22219,13 @@
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,214,20,64                 ; movq          %xmm10,(%r8,%rax,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            17a6f <_sk_store_u16_be_sse41+0xf0>
+  DB  116,240                             ; je            17dbf <_sk_store_u16_be_sse41+0xf0>
   DB  102,69,15,23,84,64,8                ; movhpd        %xmm10,0x8(%r8,%rax,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            17a6f <_sk_store_u16_be_sse41+0xf0>
+  DB  114,227                             ; jb            17dbf <_sk_store_u16_be_sse41+0xf0>
   DB  102,69,15,106,193                   ; punpckhdq     %xmm9,%xmm8
   DB  102,69,15,214,68,64,16              ; movq          %xmm8,0x10(%r8,%rax,2)
-  DB  235,213                             ; jmp           17a6f <_sk_store_u16_be_sse41+0xf0>
+  DB  235,213                             ; jmp           17dbf <_sk_store_u16_be_sse41+0xf0>
 
 PUBLIC _sk_load_f32_sse41
 _sk_load_f32_sse41 LABEL PROC
@@ -22093,7 +22239,7 @@
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           17b05 <_sk_load_f32_sse41+0x6b>
+  DB  117,66                              ; jne           17e55 <_sk_load_f32_sse41+0x6b>
   DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
   DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
   DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
@@ -22113,17 +22259,17 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           17b17 <_sk_load_f32_sse41+0x7d>
+  DB  117,8                               ; jne           17e67 <_sk_load_f32_sse41+0x7d>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
-  DB  235,190                             ; jmp           17ad5 <_sk_load_f32_sse41+0x3b>
+  DB  235,190                             ; jmp           17e25 <_sk_load_f32_sse41+0x3b>
   DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            17b2b <_sk_load_f32_sse41+0x91>
+  DB  114,8                               ; jb            17e7b <_sk_load_f32_sse41+0x91>
   DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
-  DB  235,170                             ; jmp           17ad5 <_sk_load_f32_sse41+0x3b>
+  DB  235,170                             ; jmp           17e25 <_sk_load_f32_sse41+0x3b>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,165                             ; jmp           17ad5 <_sk_load_f32_sse41+0x3b>
+  DB  235,165                             ; jmp           17e25 <_sk_load_f32_sse41+0x3b>
 
 PUBLIC _sk_load_f32_dst_sse41
 _sk_load_f32_dst_sse41 LABEL PROC
@@ -22137,7 +22283,7 @@
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           17b9b <_sk_load_f32_dst_sse41+0x6b>
+  DB  117,66                              ; jne           17eeb <_sk_load_f32_dst_sse41+0x6b>
   DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
   DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
   DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
@@ -22157,17 +22303,17 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           17bad <_sk_load_f32_dst_sse41+0x7d>
+  DB  117,8                               ; jne           17efd <_sk_load_f32_dst_sse41+0x7d>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  235,190                             ; jmp           17b6b <_sk_load_f32_dst_sse41+0x3b>
+  DB  235,190                             ; jmp           17ebb <_sk_load_f32_dst_sse41+0x3b>
   DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            17bc1 <_sk_load_f32_dst_sse41+0x91>
+  DB  114,8                               ; jb            17f11 <_sk_load_f32_dst_sse41+0x91>
   DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
-  DB  235,170                             ; jmp           17b6b <_sk_load_f32_dst_sse41+0x3b>
+  DB  235,170                             ; jmp           17ebb <_sk_load_f32_dst_sse41+0x3b>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
-  DB  235,165                             ; jmp           17b6b <_sk_load_f32_dst_sse41+0x3b>
+  DB  235,165                             ; jmp           17ebb <_sk_load_f32_dst_sse41+0x3b>
 
 PUBLIC _sk_store_f32_sse41
 _sk_store_f32_sse41 LABEL PROC
@@ -22194,7 +22340,7 @@
   DB  102,69,15,20,203                    ; unpcklpd      %xmm11,%xmm9
   DB  102,69,15,17,36,128                 ; movupd        %xmm12,(%r8,%rax,4)
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,29                              ; jne           17c43 <_sk_store_f32_sse41+0x7d>
+  DB  117,29                              ; jne           17f93 <_sk_store_f32_sse41+0x7d>
   DB  102,69,15,21,211                    ; unpckhpd      %xmm11,%xmm10
   DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
   DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
@@ -22202,79 +22348,39 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,246                             ; je            17c3f <_sk_store_f32_sse41+0x79>
+  DB  116,246                             ; je            17f8f <_sk_store_f32_sse41+0x79>
   DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,234                             ; jb            17c3f <_sk_store_f32_sse41+0x79>
+  DB  114,234                             ; jb            17f8f <_sk_store_f32_sse41+0x79>
   DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
-  DB  235,225                             ; jmp           17c3f <_sk_store_f32_sse41+0x79>
-
-PUBLIC _sk_clamp_x_sse41
-_sk_clamp_x_sse41 LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  68,15,93,192                        ; minps         %xmm0,%xmm8
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
-  DB  255,224                             ; jmpq          *%rax
-
-PUBLIC _sk_clamp_y_sse41
-_sk_clamp_y_sse41 LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,95,193                        ; maxps         %xmm1,%xmm8
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
-  DB  68,15,93,193                        ; minps         %xmm1,%xmm8
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
-  DB  255,224                             ; jmpq          *%rax
+  DB  235,225                             ; jmp           17f8f <_sk_store_f32_sse41+0x79>
 
 PUBLIC _sk_repeat_x_sse41
 _sk_repeat_x_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  243,68,15,16,64,4                   ; movss         0x4(%rax),%xmm8
-  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  68,15,89,192                        ; mulps         %xmm0,%xmm8
-  DB  102,69,15,58,8,192,1                ; roundps       $0x1,%xmm8,%xmm8
+  DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
+  DB  243,68,15,16,72,4                   ; movss         0x4(%rax),%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
+  DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
+  DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
+  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  68,15,93,192                        ; minps         %xmm0,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_repeat_y_sse41
 _sk_repeat_y_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  243,68,15,16,64,4                   ; movss         0x4(%rax),%xmm8
-  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  68,15,89,193                        ; mulps         %xmm1,%xmm8
-  DB  102,69,15,58,8,192,1                ; roundps       $0x1,%xmm8,%xmm8
+  DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
+  DB  243,68,15,16,72,4                   ; movss         0x4(%rax),%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
+  DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
+  DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
+  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  65,15,92,200                        ; subps         %xmm8,%xmm1
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,95,193                        ; maxps         %xmm1,%xmm8
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
-  DB  68,15,93,193                        ; minps         %xmm1,%xmm8
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_x_sse41
@@ -22287,7 +22393,7 @@
   DB  65,15,92,194                        ; subps         %xmm10,%xmm0
   DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  243,68,15,89,13,121,55,1,0          ; mulss         0x13779(%rip),%xmm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,89,13,13,56,1,0           ; mulss         0x1380d(%rip),%xmm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
@@ -22295,15 +22401,9 @@
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
   DB  65,15,92,194                        ; subps         %xmm10,%xmm0
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
-  DB  68,15,92,200                        ; subps         %xmm0,%xmm9
-  DB  68,15,84,200                        ; andps         %xmm0,%xmm9
-  DB  69,15,95,193                        ; maxps         %xmm9,%xmm8
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,65,15,254,194                   ; paddd         %xmm10,%xmm0
-  DB  68,15,93,192                        ; minps         %xmm0,%xmm8
+  DB  68,15,92,192                        ; subps         %xmm0,%xmm8
+  DB  65,15,84,192                        ; andps         %xmm8,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_y_sse41
@@ -22316,7 +22416,7 @@
   DB  65,15,92,202                        ; subps         %xmm10,%xmm1
   DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
-  DB  243,68,15,89,13,7,55,1,0            ; mulss         0x13707(%rip),%xmm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,89,13,180,55,1,0          ; mulss         0x137b4(%rip),%xmm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
   DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
@@ -22324,22 +22424,16 @@
   DB  65,15,92,201                        ; subps         %xmm9,%xmm1
   DB  65,15,92,202                        ; subps         %xmm10,%xmm1
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
-  DB  68,15,92,201                        ; subps         %xmm1,%xmm9
-  DB  68,15,84,201                        ; andps         %xmm1,%xmm9
-  DB  69,15,95,193                        ; maxps         %xmm9,%xmm8
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,65,15,254,202                   ; paddd         %xmm10,%xmm1
-  DB  68,15,93,193                        ; minps         %xmm1,%xmm8
+  DB  68,15,92,193                        ; subps         %xmm1,%xmm8
+  DB  65,15,84,200                        ; andps         %xmm8,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_clamp_x_1_sse41
 _sk_clamp_x_1_sse41 LABEL PROC
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,93,5,190,56,1,0               ; minps         0x138be(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,93,5,132,57,1,0               ; minps         0x13984(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -22353,9 +22447,9 @@
 
 PUBLIC _sk_mirror_x_1_sse41
 _sk_mirror_x_1_sse41 LABEL PROC
-  DB  68,15,40,5,255,56,1,0               ; movaps        0x138ff(%rip),%xmm8        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0xaa8>
+  DB  68,15,40,5,197,57,1,0               ; movaps        0x139c5(%rip),%xmm8        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0xaac>
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,13,131,56,1,0              ; movaps        0x13883(%rip),%xmm9        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,13,73,57,1,0               ; movaps        0x13949(%rip),%xmm9        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  102,69,15,58,8,201,1                ; roundps       $0x1,%xmm9,%xmm9
   DB  69,15,88,201                        ; addps         %xmm9,%xmm9
@@ -22370,10 +22464,10 @@
 PUBLIC _sk_luminance_to_alpha_sse41
 _sk_luminance_to_alpha_sse41 LABEL PROC
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
-  DB  15,89,5,178,61,1,0                  ; mulps         0x13db2(%rip),%xmm0        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xf98>
-  DB  15,89,13,187,61,1,0                 ; mulps         0x13dbb(%rip),%xmm1        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xfa8>
+  DB  15,89,5,120,62,1,0                  ; mulps         0x13e78(%rip),%xmm0        # 2bfa0 <_sk_srcover_rgba_8888_sse2_lowp+0xf9c>
+  DB  15,89,13,129,62,1,0                 ; mulps         0x13e81(%rip),%xmm1        # 2bfb0 <_sk_srcover_rgba_8888_sse2_lowp+0xfac>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,29,193,61,1,0                 ; mulps         0x13dc1(%rip),%xmm3        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xfb8>
+  DB  15,89,29,135,62,1,0                 ; mulps         0x13e87(%rip),%xmm3        # 2bfc0 <_sk_srcover_rgba_8888_sse2_lowp+0xfbc>
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -22669,9 +22763,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  76,139,112,8                        ; mov           0x8(%rax),%r14
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            1833f <_sk_evenly_spaced_gradient_sse41+0x18>
+  DB  120,7                               ; js            185d9 <_sk_evenly_spaced_gradient_sse41+0x18>
   DB  243,72,15,42,203                    ; cvtsi2ss      %rbx,%xmm1
-  DB  235,21                              ; jmp           18354 <_sk_evenly_spaced_gradient_sse41+0x2d>
+  DB  235,21                              ; jmp           185ee <_sk_evenly_spaced_gradient_sse41+0x2d>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -22758,15 +22852,15 @@
 
 PUBLIC _sk_gauss_a_to_rgba_sse41
 _sk_gauss_a_to_rgba_sse41 LABEL PROC
-  DB  15,40,5,112,55,1,0                  ; movaps        0x13770(%rip),%xmm0        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xfc8>
+  DB  15,40,5,54,56,1,0                   ; movaps        0x13836(%rip),%xmm0        # 2bfd0 <_sk_srcover_rgba_8888_sse2_lowp+0xfcc>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,118,55,1,0                  ; addps         0x13776(%rip),%xmm0        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xfd8>
+  DB  15,88,5,60,56,1,0                   ; addps         0x1383c(%rip),%xmm0        # 2bfe0 <_sk_srcover_rgba_8888_sse2_lowp+0xfdc>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,124,55,1,0                  ; addps         0x1377c(%rip),%xmm0        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xfe8>
+  DB  15,88,5,66,56,1,0                   ; addps         0x13842(%rip),%xmm0        # 2bff0 <_sk_srcover_rgba_8888_sse2_lowp+0xfec>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,130,55,1,0                  ; addps         0x13782(%rip),%xmm0        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xff8>
+  DB  15,88,5,72,56,1,0                   ; addps         0x13848(%rip),%xmm0        # 2c000 <_sk_srcover_rgba_8888_sse2_lowp+0xffc>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,136,55,1,0                  ; addps         0x13788(%rip),%xmm0        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1008>
+  DB  15,88,5,78,56,1,0                   ; addps         0x1384e(%rip),%xmm0        # 2c010 <_sk_srcover_rgba_8888_sse2_lowp+0x100c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
@@ -22781,7 +22875,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,41                              ; jb            18570 <_sk_gradient_sse41+0x3b>
+  DB  114,41                              ; jb            1880a <_sk_gradient_sse41+0x3b>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  73,255,200                          ; dec           %r8
   DB  73,131,193,4                        ; add           $0x4,%r9
@@ -22792,7 +22886,7 @@
   DB  102,15,250,202                      ; psubd         %xmm2,%xmm1
   DB  73,131,193,4                        ; add           $0x4,%r9
   DB  73,255,200                          ; dec           %r8
-  DB  117,230                             ; jne           18556 <_sk_gradient_sse41+0x21>
+  DB  117,230                             ; jne           187f0 <_sk_gradient_sse41+0x21>
   DB  102,73,15,58,22,200,1               ; pextrq        $0x1,%xmm1,%r8
   DB  69,137,193                          ; mov           %r8d,%r9d
   DB  73,193,232,32                       ; shr           $0x20,%r8
@@ -22917,26 +23011,26 @@
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,40,236                        ; movaps        %xmm12,%xmm13
   DB  69,15,89,237                        ; mulps         %xmm13,%xmm13
-  DB  68,15,40,21,255,52,1,0              ; movaps        0x134ff(%rip),%xmm10        # 2bcc0 <_sk_srcover_rgba_8888_sse2_lowp+0x1018>
+  DB  68,15,40,21,197,53,1,0              ; movaps        0x135c5(%rip),%xmm10        # 2c020 <_sk_srcover_rgba_8888_sse2_lowp+0x101c>
   DB  69,15,89,213                        ; mulps         %xmm13,%xmm10
-  DB  68,15,88,21,3,53,1,0                ; addps         0x13503(%rip),%xmm10        # 2bcd0 <_sk_srcover_rgba_8888_sse2_lowp+0x1028>
+  DB  68,15,88,21,201,53,1,0              ; addps         0x135c9(%rip),%xmm10        # 2c030 <_sk_srcover_rgba_8888_sse2_lowp+0x102c>
   DB  69,15,89,213                        ; mulps         %xmm13,%xmm10
-  DB  68,15,88,21,7,53,1,0                ; addps         0x13507(%rip),%xmm10        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0x1038>
+  DB  68,15,88,21,205,53,1,0              ; addps         0x135cd(%rip),%xmm10        # 2c040 <_sk_srcover_rgba_8888_sse2_lowp+0x103c>
   DB  69,15,89,213                        ; mulps         %xmm13,%xmm10
-  DB  68,15,88,21,11,53,1,0               ; addps         0x1350b(%rip),%xmm10        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1048>
+  DB  68,15,88,21,209,53,1,0              ; addps         0x135d1(%rip),%xmm10        # 2c050 <_sk_srcover_rgba_8888_sse2_lowp+0x104c>
   DB  69,15,89,212                        ; mulps         %xmm12,%xmm10
   DB  65,15,194,195,1                     ; cmpltps       %xmm11,%xmm0
-  DB  68,15,40,29,10,53,1,0               ; movaps        0x1350a(%rip),%xmm11        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0x1058>
+  DB  68,15,40,29,208,53,1,0              ; movaps        0x135d0(%rip),%xmm11        # 2c060 <_sk_srcover_rgba_8888_sse2_lowp+0x105c>
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
   DB  102,69,15,56,20,211                 ; blendvps      %xmm0,%xmm11,%xmm10
   DB  69,15,194,200,1                     ; cmpltps       %xmm8,%xmm9
-  DB  68,15,40,29,211,46,1,0              ; movaps        0x12ed3(%rip),%xmm11        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,29,153,47,1,0              ; movaps        0x12f99(%rip),%xmm11        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  102,69,15,56,20,211                 ; blendvps      %xmm0,%xmm11,%xmm10
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  65,15,194,192,1                     ; cmpltps       %xmm8,%xmm0
-  DB  68,15,40,13,197,46,1,0              ; movaps        0x12ec5(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,139,47,1,0              ; movaps        0x12f8b(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
   DB  102,69,15,56,20,209                 ; blendvps      %xmm0,%xmm9,%xmm10
   DB  69,15,194,194,7                     ; cmpordps      %xmm10,%xmm8
@@ -22966,7 +23060,7 @@
   DB  243,69,15,89,203                    ; mulss         %xmm11,%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,88,200                        ; addps         %xmm0,%xmm9
-  DB  68,15,89,13,126,52,1,0              ; mulps         0x1347e(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0x1068>
+  DB  68,15,89,13,68,53,1,0               ; mulps         0x13544(%rip),%xmm9        # 2c070 <_sk_srcover_rgba_8888_sse2_lowp+0x106c>
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
@@ -22974,7 +23068,7 @@
   DB  243,69,15,89,219                    ; mulss         %xmm11,%xmm11
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,92,227                        ; subps         %xmm11,%xmm12
-  DB  68,15,89,21,105,52,1,0              ; mulps         0x13469(%rip),%xmm10        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0x1078>
+  DB  68,15,89,21,47,53,1,0               ; mulps         0x1352f(%rip),%xmm10        # 2c080 <_sk_srcover_rgba_8888_sse2_lowp+0x107c>
   DB  69,15,89,212                        ; mulps         %xmm12,%xmm10
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
@@ -22983,8 +23077,8 @@
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
-  DB  68,15,87,13,17,51,1,0               ; xorps         0x13311(%rip),%xmm9        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
-  DB  68,15,89,5,249,45,1,0               ; mulps         0x12df9(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,87,13,215,51,1,0              ; xorps         0x133d7(%rip),%xmm9        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
+  DB  68,15,89,5,191,46,1,0               ; mulps         0x12ebf(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
@@ -23003,7 +23097,7 @@
   DB  243,69,15,89,203                    ; mulss         %xmm11,%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,88,200                        ; addps         %xmm0,%xmm9
-  DB  68,15,89,13,224,51,1,0              ; mulps         0x133e0(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0x1068>
+  DB  68,15,89,13,166,52,1,0              ; mulps         0x134a6(%rip),%xmm9        # 2c070 <_sk_srcover_rgba_8888_sse2_lowp+0x106c>
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
@@ -23011,7 +23105,7 @@
   DB  243,69,15,89,219                    ; mulss         %xmm11,%xmm11
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,92,227                        ; subps         %xmm11,%xmm12
-  DB  68,15,89,21,203,51,1,0              ; mulps         0x133cb(%rip),%xmm10        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0x1078>
+  DB  68,15,89,21,145,52,1,0              ; mulps         0x13491(%rip),%xmm10        # 2c080 <_sk_srcover_rgba_8888_sse2_lowp+0x107c>
   DB  69,15,89,212                        ; mulps         %xmm12,%xmm10
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
@@ -23020,8 +23114,8 @@
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
-  DB  68,15,87,13,115,50,1,0              ; xorps         0x13273(%rip),%xmm9        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
-  DB  68,15,89,5,91,45,1,0                ; mulps         0x12d5b(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,87,13,57,51,1,0               ; xorps         0x13339(%rip),%xmm9        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
+  DB  68,15,89,5,33,46,1,0                ; mulps         0x12e21(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
@@ -23037,7 +23131,7 @@
   DB  243,69,15,89,200                    ; mulss         %xmm8,%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,88,200                        ; addps         %xmm0,%xmm9
-  DB  68,15,89,13,83,51,1,0               ; mulps         0x13353(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0x1068>
+  DB  68,15,89,13,25,52,1,0               ; mulps         0x13419(%rip),%xmm9        # 2c070 <_sk_srcover_rgba_8888_sse2_lowp+0x106c>
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  69,15,89,210                        ; mulps         %xmm10,%xmm10
@@ -23045,7 +23139,7 @@
   DB  243,69,15,89,192                    ; mulss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
-  DB  15,87,5,15,50,1,0                   ; xorps         0x1320f(%rip),%xmm0        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
+  DB  15,87,5,213,50,1,0                  ; xorps         0x132d5(%rip),%xmm0        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
   DB  65,15,94,193                        ; divps         %xmm9,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23082,7 +23176,7 @@
 PUBLIC _sk_save_xy_sse41
 _sk_save_xy_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,149,44,1,0               ; movaps        0x12c95(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,5,91,45,1,0                ; movaps        0x12d5b(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  15,17,0                             ; movups        %xmm0,(%rax)
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,88,200                        ; addps         %xmm8,%xmm9
@@ -23122,8 +23216,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,87,50,1,0                   ; addps         0x13257(%rip),%xmm0        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,15,44,1,0               ; movaps        0x12c0f(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,5,29,51,1,0                   ; addps         0x1331d(%rip),%xmm0        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,213,44,1,0              ; movaps        0x12cd5(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,128,0,0,0              ; movups        %xmm9,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -23134,7 +23228,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,222,43,1,0                  ; addps         0x12bde(%rip),%xmm0        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,88,5,164,44,1,0                  ; addps         0x12ca4(%rip),%xmm0        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  68,15,17,128,128,0,0,0              ; movups        %xmm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23144,8 +23238,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,16,50,1,0                  ; addps         0x13210(%rip),%xmm1        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,200,43,1,0              ; movaps        0x12bc8(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,13,214,50,1,0                 ; addps         0x132d6(%rip),%xmm1        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,142,44,1,0              ; movaps        0x12c8e(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,160,0,0,0              ; movups        %xmm9,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -23156,7 +23250,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,150,43,1,0                 ; addps         0x12b96(%rip),%xmm1        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,88,13,92,44,1,0                  ; addps         0x12c5c(%rip),%xmm1        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  68,15,17,128,160,0,0,0              ; movups        %xmm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23166,13 +23260,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,217,49,1,0                  ; addps         0x131d9(%rip),%xmm0        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0x1098>
-  DB  68,15,40,13,129,43,1,0              ; movaps        0x12b81(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,5,159,50,1,0                  ; addps         0x1329f(%rip),%xmm0        # 2c0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x109c>
+  DB  68,15,40,13,71,44,1,0               ; movaps        0x12c47(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,205,49,1,0              ; mulps         0x131cd(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,13,85,45,1,0               ; addps         0x12d55(%rip),%xmm9        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,13,147,50,1,0              ; mulps         0x13293(%rip),%xmm9        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,13,27,46,1,0               ; addps         0x12e1b(%rip),%xmm9        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,128,0,0,0              ; movups        %xmm9,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -23183,16 +23277,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,132,49,1,0                  ; addps         0x13184(%rip),%xmm0        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,60,43,1,0               ; movaps        0x12b3c(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,5,74,50,1,0                   ; addps         0x1324a(%rip),%xmm0        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,2,44,1,0                ; movaps        0x12c02(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,160,49,1,0               ; movaps        0x131a0(%rip),%xmm8        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,5,102,50,1,0               ; movaps        0x13266(%rip),%xmm8        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,164,49,1,0               ; addps         0x131a4(%rip),%xmm8        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,5,106,50,1,0               ; addps         0x1326a(%rip),%xmm8        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,8,43,1,0                 ; addps         0x12b08(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,88,5,206,43,1,0               ; addps         0x12bce(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,156,49,1,0               ; addps         0x1319c(%rip),%xmm8        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,5,98,50,1,0                ; addps         0x13262(%rip),%xmm8        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,128,128,0,0,0              ; movups        %xmm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23200,17 +23294,17 @@
 PUBLIC _sk_bicubic_p1x_sse41
 _sk_bicubic_p1x_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,230,42,1,0               ; movaps        0x12ae6(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,5,172,43,1,0               ; movaps        0x12bac(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,72,64                      ; movups        0x40(%rax),%xmm9
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,21,82,49,1,0               ; movaps        0x13152(%rip),%xmm10        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,21,24,50,1,0               ; movaps        0x13218(%rip),%xmm10        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,86,49,1,0               ; addps         0x13156(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,21,28,50,1,0               ; addps         0x1321c(%rip),%xmm10        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,82,49,1,0               ; addps         0x13152(%rip),%xmm10        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,21,24,50,1,0               ; addps         0x13218(%rip),%xmm10        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,144,128,0,0,0              ; movups        %xmm10,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23220,11 +23314,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,37,49,1,0                   ; addps         0x13125(%rip),%xmm0        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  15,88,5,235,49,1,0                  ; addps         0x131eb(%rip),%xmm0        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,245,48,1,0               ; mulps         0x130f5(%rip),%xmm8        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,5,125,44,1,0               ; addps         0x12c7d(%rip),%xmm8        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,5,187,49,1,0               ; mulps         0x131bb(%rip),%xmm8        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,5,67,45,1,0                ; addps         0x12d43(%rip),%xmm8        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,128,0,0,0              ; movups        %xmm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -23235,13 +23329,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,187,48,1,0                 ; addps         0x130bb(%rip),%xmm1        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0x1098>
-  DB  68,15,40,13,99,42,1,0               ; movaps        0x12a63(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,13,129,49,1,0                 ; addps         0x13181(%rip),%xmm1        # 2c0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x109c>
+  DB  68,15,40,13,41,43,1,0               ; movaps        0x12b29(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,175,48,1,0              ; mulps         0x130af(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,13,55,44,1,0               ; addps         0x12c37(%rip),%xmm9        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,13,117,49,1,0              ; mulps         0x13175(%rip),%xmm9        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,13,253,44,1,0              ; addps         0x12cfd(%rip),%xmm9        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,160,0,0,0              ; movups        %xmm9,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -23252,16 +23346,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,101,48,1,0                 ; addps         0x13065(%rip),%xmm1        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,29,42,1,0               ; movaps        0x12a1d(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,13,43,49,1,0                  ; addps         0x1312b(%rip),%xmm1        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,227,42,1,0              ; movaps        0x12ae3(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,129,48,1,0               ; movaps        0x13081(%rip),%xmm8        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,5,71,49,1,0                ; movaps        0x13147(%rip),%xmm8        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,133,48,1,0               ; addps         0x13085(%rip),%xmm8        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,5,75,49,1,0                ; addps         0x1314b(%rip),%xmm8        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,233,41,1,0               ; addps         0x129e9(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,88,5,175,42,1,0               ; addps         0x12aaf(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,125,48,1,0               ; addps         0x1307d(%rip),%xmm8        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,5,67,49,1,0                ; addps         0x13143(%rip),%xmm8        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,128,160,0,0,0              ; movups        %xmm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23269,17 +23363,17 @@
 PUBLIC _sk_bicubic_p1y_sse41
 _sk_bicubic_p1y_sse41 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,199,41,1,0               ; movaps        0x129c7(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,5,141,42,1,0               ; movaps        0x12a8d(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,72,96                      ; movups        0x60(%rax),%xmm9
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  68,15,40,21,50,48,1,0               ; movaps        0x13032(%rip),%xmm10        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,21,248,48,1,0              ; movaps        0x130f8(%rip),%xmm10        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,54,48,1,0               ; addps         0x13036(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,21,252,48,1,0              ; addps         0x130fc(%rip),%xmm10        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,50,48,1,0               ; addps         0x13032(%rip),%xmm10        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,21,248,48,1,0              ; addps         0x130f8(%rip),%xmm10        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,144,160,0,0,0              ; movups        %xmm10,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -23289,11 +23383,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,4,48,1,0                   ; addps         0x13004(%rip),%xmm1        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  15,88,13,202,48,1,0                 ; addps         0x130ca(%rip),%xmm1        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,212,47,1,0               ; mulps         0x12fd4(%rip),%xmm8        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,5,92,43,1,0                ; addps         0x12b5c(%rip),%xmm8        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,5,154,48,1,0               ; mulps         0x1309a(%rip),%xmm8        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,5,34,44,1,0                ; addps         0x12c22(%rip),%xmm8        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,160,0,0,0              ; movups        %xmm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -23388,7 +23482,7 @@
   DB  15,89,194                           ; mulps         %xmm2,%xmm0
   DB  15,41,68,36,80                      ; movaps        %xmm0,0x50(%rsp)
   DB  243,15,91,240                       ; cvttps2dq     %xmm0,%xmm6
-  DB  15,40,37,215,46,1,0                 ; movaps        0x12ed7(%rip),%xmm4        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0x10e8>
+  DB  15,40,37,157,47,1,0                 ; movaps        0x12f9d(%rip),%xmm4        # 2c0f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ec>
   DB  15,88,196                           ; addps         %xmm4,%xmm0
   DB  15,41,68,36,48                      ; movaps        %xmm0,0x30(%rsp)
   DB  102,65,15,110,208                   ; movd          %r8d,%xmm2
@@ -23427,7 +23521,7 @@
   DB  102,68,15,56,64,192                 ; pmulld        %xmm0,%xmm8
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,254,218                      ; paddd         %xmm2,%xmm3
-  DB  102,68,15,111,37,46,46,1,0          ; movdqa        0x12e2e(%rip),%xmm12        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,68,15,111,37,244,46,1,0         ; movdqa        0x12ef4(%rip),%xmm12        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,65,15,56,64,220                 ; pmulld        %xmm12,%xmm3
   DB  102,15,118,228                      ; pcmpeqd       %xmm4,%xmm4
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
@@ -23450,7 +23544,7 @@
   DB  102,65,15,58,22,217,1               ; pextrd        $0x1,%xmm3,%r9d
   DB  102,65,15,58,22,218,2               ; pextrd        $0x2,%xmm3,%r10d
   DB  102,65,15,58,22,219,3               ; pextrd        $0x3,%xmm3,%r11d
-  DB  102,15,111,37,50,39,1,0             ; movdqa        0x12732(%rip),%xmm4        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,37,248,39,1,0            ; movdqa        0x127f8(%rip),%xmm4        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,254,220                      ; paddd         %xmm4,%xmm3
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,73,15,58,22,222,1               ; pextrq        $0x1,%xmm3,%r14
@@ -23623,7 +23717,7 @@
   DB  102,68,15,254,202                   ; paddd         %xmm2,%xmm9
   DB  102,65,15,111,192                   ; movdqa        %xmm8,%xmm0
   DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  102,15,111,45,61,42,1,0             ; movdqa        0x12a3d(%rip),%xmm5        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,45,3,43,1,0              ; movdqa        0x12b03(%rip),%xmm5        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,56,64,197                    ; pmulld        %xmm5,%xmm0
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,118,246                      ; pcmpeqd       %xmm6,%xmm6
@@ -23644,7 +23738,7 @@
   DB  102,65,15,58,22,193,1               ; pextrd        $0x1,%xmm0,%r9d
   DB  102,65,15,58,22,194,2               ; pextrd        $0x2,%xmm0,%r10d
   DB  102,65,15,58,22,195,3               ; pextrd        $0x3,%xmm0,%r11d
-  DB  102,15,111,61,78,35,1,0             ; movdqa        0x1234e(%rip),%xmm7        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,61,20,36,1,0             ; movdqa        0x12414(%rip),%xmm7        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,254,199                      ; paddd         %xmm7,%xmm0
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
@@ -23710,7 +23804,7 @@
   DB  15,88,248                           ; addps         %xmm0,%xmm7
   DB  102,68,15,254,210                   ; paddd         %xmm2,%xmm10
   DB  102,69,15,254,194                   ; paddd         %xmm10,%xmm8
-  DB  102,15,111,13,121,40,1,0            ; movdqa        0x12879(%rip),%xmm1        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,13,63,41,1,0             ; movdqa        0x1293f(%rip),%xmm1        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,68,15,56,64,193                 ; pmulld        %xmm1,%xmm8
   DB  102,65,15,111,192                   ; movdqa        %xmm8,%xmm0
   DB  102,15,118,237                      ; pcmpeqd       %xmm5,%xmm5
@@ -23731,7 +23825,7 @@
   DB  102,69,15,58,22,193,1               ; pextrd        $0x1,%xmm8,%r9d
   DB  102,69,15,58,22,194,2               ; pextrd        $0x2,%xmm8,%r10d
   DB  102,69,15,58,22,195,3               ; pextrd        $0x3,%xmm8,%r11d
-  DB  102,15,111,21,132,33,1,0            ; movdqa        0x12184(%rip),%xmm2        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,21,74,34,1,0             ; movdqa        0x1224a(%rip),%xmm2        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,68,15,254,194                   ; paddd         %xmm2,%xmm8
   DB  102,76,15,58,22,193,1               ; pextrq        $0x1,%xmm8,%rcx
   DB  102,76,15,126,195                   ; movq          %xmm8,%rbx
@@ -23856,7 +23950,7 @@
   DB  15,89,203                           ; mulps         %xmm3,%xmm1
   DB  15,41,140,36,176,0,0,0              ; movaps        %xmm1,0xb0(%rsp)
   DB  243,15,91,249                       ; cvttps2dq     %xmm1,%xmm7
-  DB  15,40,29,187,37,1,0                 ; movaps        0x125bb(%rip),%xmm3        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0x10e8>
+  DB  15,40,29,129,38,1,0                 ; movaps        0x12681(%rip),%xmm3        # 2c0f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ec>
   DB  15,88,203                           ; addps         %xmm3,%xmm1
   DB  15,41,76,36,32                      ; movaps        %xmm1,0x20(%rsp)
   DB  102,65,15,110,232                   ; movd          %r8d,%xmm5
@@ -23913,7 +24007,7 @@
   DB  102,68,15,56,64,253                 ; pmulld        %xmm5,%xmm15
   DB  102,65,15,111,223                   ; movdqa        %xmm15,%xmm3
   DB  102,15,254,217                      ; paddd         %xmm1,%xmm3
-  DB  102,68,15,111,29,181,36,1,0         ; movdqa        0x124b5(%rip),%xmm11        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,68,15,111,29,123,37,1,0         ; movdqa        0x1257b(%rip),%xmm11        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,65,15,56,64,219                 ; pmulld        %xmm11,%xmm3
   DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
   DB  102,15,111,243                      ; movdqa        %xmm3,%xmm6
@@ -23935,7 +24029,7 @@
   DB  102,65,15,58,22,217,1               ; pextrd        $0x1,%xmm3,%r9d
   DB  102,65,15,58,22,218,2               ; pextrd        $0x2,%xmm3,%r10d
   DB  102,65,15,58,22,219,3               ; pextrd        $0x3,%xmm3,%r11d
-  DB  102,68,15,111,21,189,29,1,0         ; movdqa        0x11dbd(%rip),%xmm10        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,21,131,30,1,0         ; movdqa        0x11e83(%rip),%xmm10        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,218                   ; paddd         %xmm10,%xmm3
   DB  102,73,15,58,22,222,1               ; pextrq        $0x1,%xmm3,%r14
   DB  102,72,15,126,219                   ; movq          %xmm3,%rbx
@@ -23953,7 +24047,7 @@
   DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
   DB  102,65,15,56,64,203                 ; pmulld        %xmm11,%xmm1
   DB  102,15,111,217                      ; movdqa        %xmm1,%xmm3
-  DB  102,15,250,29,235,35,1,0            ; psubd         0x123eb(%rip),%xmm3        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,29,177,36,1,0            ; psubd         0x124b1(%rip),%xmm3        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,73,15,58,22,222,1               ; pextrq        $0x1,%xmm3,%r14
   DB  102,72,15,126,219                   ; movq          %xmm3,%rbx
   DB  65,137,223                          ; mov           %ebx,%r15d
@@ -24008,7 +24102,7 @@
   DB  102,65,15,254,199                   ; paddd         %xmm15,%xmm0
   DB  102,65,15,56,64,195                 ; pmulld        %xmm11,%xmm0
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
-  DB  102,15,250,45,203,34,1,0            ; psubd         0x122cb(%rip),%xmm5        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,45,145,35,1,0            ; psubd         0x12391(%rip),%xmm5        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
   DB  102,72,15,58,22,233,1               ; pextrq        $0x1,%xmm5,%rcx
   DB  102,72,15,126,237                   ; movq          %xmm5,%rbp
@@ -24133,7 +24227,7 @@
   DB  72,193,233,32                       ; shr           $0x20,%rcx
   DB  243,15,16,36,136                    ; movss         (%rax,%rcx,4),%xmm4
   DB  102,68,15,58,33,220,48              ; insertps      $0x30,%xmm4,%xmm11
-  DB  102,15,111,61,174,25,1,0            ; movdqa        0x119ae(%rip),%xmm7        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,61,116,26,1,0            ; movdqa        0x11a74(%rip),%xmm7        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,254,223                      ; paddd         %xmm7,%xmm3
   DB  102,72,15,58,22,217,1               ; pextrq        $0x1,%xmm3,%rcx
   DB  102,72,15,126,221                   ; movq          %xmm3,%rbp
@@ -24219,7 +24313,7 @@
   DB  102,65,15,58,22,201,1               ; pextrd        $0x1,%xmm1,%r9d
   DB  102,65,15,58,22,202,2               ; pextrd        $0x2,%xmm1,%r10d
   DB  102,65,15,58,22,203,3               ; pextrd        $0x3,%xmm1,%r11d
-  DB  102,68,15,111,21,238,23,1,0         ; movdqa        0x117ee(%rip),%xmm10        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,21,180,24,1,0         ; movdqa        0x118b4(%rip),%xmm10        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,202                   ; paddd         %xmm10,%xmm1
   DB  102,72,15,58,22,201,1               ; pextrq        $0x1,%xmm1,%rcx
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -24315,7 +24409,7 @@
   DB  102,15,111,124,36,64                ; movdqa        0x40(%rsp),%xmm7
   DB  102,15,111,199                      ; movdqa        %xmm7,%xmm0
   DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
-  DB  102,15,111,21,130,28,1,0            ; movdqa        0x11c82(%rip),%xmm2        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,21,72,29,1,0             ; movdqa        0x11d48(%rip),%xmm2        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,56,64,194                    ; pmulld        %xmm2,%xmm0
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
@@ -24336,7 +24430,7 @@
   DB  102,65,15,58,22,193,1               ; pextrd        $0x1,%xmm0,%r9d
   DB  102,65,15,58,22,194,2               ; pextrd        $0x2,%xmm0,%r10d
   DB  102,65,15,58,22,195,3               ; pextrd        $0x3,%xmm0,%r11d
-  DB  102,15,111,37,145,21,1,0            ; movdqa        0x11591(%rip),%xmm4        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,37,87,22,1,0             ; movdqa        0x11657(%rip),%xmm4        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,254,196                      ; paddd         %xmm4,%xmm0
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
@@ -24408,7 +24502,7 @@
   DB  102,68,15,111,226                   ; movdqa        %xmm2,%xmm12
   DB  102,65,15,56,64,204                 ; pmulld        %xmm12,%xmm1
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
-  DB  102,15,250,21,173,26,1,0            ; psubd         0x11aad(%rip),%xmm2        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,21,115,27,1,0            ; psubd         0x11b73(%rip),%xmm2        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,72,15,58,22,209,1               ; pextrq        $0x1,%xmm2,%rcx
   DB  102,72,15,126,213                   ; movq          %xmm2,%rbp
   DB  137,235                             ; mov           %ebp,%ebx
@@ -24442,7 +24536,7 @@
   DB  102,65,15,111,249                   ; movdqa        %xmm9,%xmm7
   DB  102,69,15,56,64,236                 ; pmulld        %xmm12,%xmm13
   DB  102,65,15,111,205                   ; movdqa        %xmm13,%xmm1
-  DB  102,15,250,13,249,25,1,0            ; psubd         0x119f9(%rip),%xmm1        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,13,191,26,1,0            ; psubd         0x11abf(%rip),%xmm1        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,72,15,58,22,201,1               ; pextrq        $0x1,%xmm1,%rcx
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
   DB  137,221                             ; mov           %ebx,%ebp
@@ -24507,7 +24601,7 @@
   DB  102,65,15,111,206                   ; movdqa        %xmm14,%xmm1
   DB  102,15,111,108,36,64                ; movdqa        0x40(%rsp),%xmm5
   DB  102,15,254,205                      ; paddd         %xmm5,%xmm1
-  DB  102,15,111,37,141,24,1,0            ; movdqa        0x1188d(%rip),%xmm4        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,37,83,25,1,0             ; movdqa        0x11953(%rip),%xmm4        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,56,64,204                    ; pmulld        %xmm4,%xmm1
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,118,246                      ; pcmpeqd       %xmm6,%xmm6
@@ -24528,7 +24622,7 @@
   DB  102,65,15,58,22,201,1               ; pextrd        $0x1,%xmm1,%r9d
   DB  102,65,15,58,22,202,2               ; pextrd        $0x2,%xmm1,%r10d
   DB  102,65,15,58,22,203,3               ; pextrd        $0x3,%xmm1,%r11d
-  DB  102,15,111,29,158,17,1,0            ; movdqa        0x1119e(%rip),%xmm3        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,29,100,18,1,0            ; movdqa        0x11264(%rip),%xmm3        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,254,203                      ; paddd         %xmm3,%xmm1
   DB  102,72,15,58,22,201,1               ; pextrq        $0x1,%xmm1,%rcx
   DB  102,72,15,126,203                   ; movq          %xmm1,%rbx
@@ -24600,7 +24694,7 @@
   DB  102,15,56,64,239                    ; pmulld        %xmm7,%xmm5
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
-  DB  102,15,250,5,190,22,1,0             ; psubd         0x116be(%rip),%xmm0        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,5,132,23,1,0             ; psubd         0x11784(%rip),%xmm0        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,197                   ; movq          %xmm0,%rbp
   DB  137,235                             ; mov           %ebp,%ebx
@@ -24618,7 +24712,7 @@
   DB  102,65,15,58,22,193,1               ; pextrd        $0x1,%xmm0,%r9d
   DB  102,65,15,58,22,194,2               ; pextrd        $0x2,%xmm0,%r10d
   DB  102,65,15,58,22,195,3               ; pextrd        $0x3,%xmm0,%r11d
-  DB  102,15,254,5,204,15,1,0             ; paddd         0x10fcc(%rip),%xmm0        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,5,146,16,1,0             ; paddd         0x11092(%rip),%xmm0        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
   DB  137,221                             ; mov           %ebx,%ebp
@@ -24634,7 +24728,7 @@
   DB  102,15,254,84,36,48                 ; paddd         0x30(%rsp),%xmm2
   DB  102,15,56,64,215                    ; pmulld        %xmm7,%xmm2
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
-  DB  102,15,250,5,5,22,1,0               ; psubd         0x11605(%rip),%xmm0        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,5,203,22,1,0             ; psubd         0x116cb(%rip),%xmm0        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,72,15,58,22,193,1               ; pextrq        $0x1,%xmm0,%rcx
   DB  102,72,15,126,195                   ; movq          %xmm0,%rbx
   DB  137,221                             ; mov           %ebx,%ebp
@@ -24652,7 +24746,7 @@
   DB  102,65,15,58,22,199,1               ; pextrd        $0x1,%xmm0,%r15d
   DB  102,65,15,58,22,196,2               ; pextrd        $0x2,%xmm0,%r12d
   DB  102,65,15,58,22,198,3               ; pextrd        $0x3,%xmm0,%r14d
-  DB  102,15,254,5,19,15,1,0              ; paddd         0x10f13(%rip),%xmm0        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,5,217,15,1,0             ; paddd         0x10fd9(%rip),%xmm0        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,72,15,58,22,195,1               ; pextrq        $0x1,%xmm0,%rbx
   DB  102,72,15,126,197                   ; movq          %xmm0,%rbp
   DB  137,233                             ; mov           %ebp,%ecx
@@ -24715,7 +24809,7 @@
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  65,15,88,211                        ; addps         %xmm11,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,203,13,1,0                 ; movaps        0x10dcb(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,145,14,1,0                 ; movaps        0x10e91(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,139,76,36,120                    ; mov           0x78(%rsp),%rcx
   DB  15,40,164,36,192,0,0,0              ; movaps        0xc0(%rsp),%xmm4
   DB  15,40,172,36,208,0,0,0              ; movaps        0xd0(%rsp),%xmm5
@@ -24761,13 +24855,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  115,101                             ; jae           1aa3f <_sk_start_pipeline_sse2+0xe2>
+  DB  115,101                             ; jae           1acd9 <_sk_start_pipeline_sse2+0xe2>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,4                         ; lea           0x4(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,38                              ; ja            1aa22 <_sk_start_pipeline_sse2+0xc5>
+  DB  119,38                              ; ja            1acbc <_sk_start_pipeline_sse2+0xc5>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  76,137,246                          ; mov           %r14,%rsi
@@ -24778,16 +24872,16 @@
   DB  73,131,196,8                        ; add           $0x8,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,225                             ; jbe           1aa03 <_sk_start_pipeline_sse2+0xa6>
+  DB  118,225                             ; jbe           1ac9d <_sk_start_pipeline_sse2+0xa6>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,9                               ; je            1aa33 <_sk_start_pipeline_sse2+0xd6>
+  DB  116,9                               ; je            1accd <_sk_start_pipeline_sse2+0xd6>
   DB  76,137,246                          ; mov           %r14,%rsi
   DB  72,137,217                          ; mov           %rbx,%rcx
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  117,173                             ; jne           1a9ec <_sk_start_pipeline_sse2+0x8f>
+  DB  117,173                             ; jne           1ac86 <_sk_start_pipeline_sse2+0x8f>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -24818,13 +24912,13 @@
   DB  102,15,110,194                      ; movd          %edx,%xmm0
   DB  102,15,112,192,0                    ; pshufd        $0x0,%xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,88,5,39,12,1,0                   ; addps         0x10c27(%rip),%xmm0        # 2b6d0 <_sk_srcover_rgba_8888_sse2_lowp+0xa28>
+  DB  15,88,5,237,12,1,0                  ; addps         0x10ced(%rip),%xmm0        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xa2c>
   DB  102,15,110,201                      ; movd          %ecx,%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,88,13,36,12,1,0                  ; addps         0x10c24(%rip),%xmm1        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,88,13,234,12,1,0                 ; addps         0x10cea(%rip),%xmm1        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,21,43,12,1,0                  ; movaps        0x10c2b(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,241,12,1,0                 ; movaps        0x10cf1(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
@@ -24837,18 +24931,18 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,68,15,110,194                   ; movd          %edx,%xmm8
   DB  102,69,15,112,192,0                 ; pshufd        $0x0,%xmm8,%xmm8
-  DB  102,68,15,254,5,196,11,1,0          ; paddd         0x10bc4(%rip),%xmm8        # 2b6b0 <_sk_srcover_rgba_8888_sse2_lowp+0xa08>
+  DB  102,68,15,254,5,138,12,1,0          ; paddd         0x10c8a(%rip),%xmm8        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xa0c>
   DB  102,68,15,110,201                   ; movd          %ecx,%xmm9
   DB  102,69,15,112,201,0                 ; pshufd        $0x0,%xmm9,%xmm9
   DB  102,69,15,239,200                   ; pxor          %xmm8,%xmm9
-  DB  102,68,15,111,21,251,11,1,0         ; movdqa        0x10bfb(%rip),%xmm10        # 2b700 <_sk_srcover_rgba_8888_sse2_lowp+0xa58>
+  DB  102,68,15,111,21,193,12,1,0         ; movdqa        0x10cc1(%rip),%xmm10        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0xa5c>
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
   DB  102,69,15,219,218                   ; pand          %xmm10,%xmm11
   DB  102,65,15,114,243,5                 ; pslld         $0x5,%xmm11
   DB  102,69,15,219,208                   ; pand          %xmm8,%xmm10
   DB  102,65,15,114,242,4                 ; pslld         $0x4,%xmm10
-  DB  102,68,15,111,37,231,11,1,0         ; movdqa        0x10be7(%rip),%xmm12        # 2b710 <_sk_srcover_rgba_8888_sse2_lowp+0xa68>
-  DB  102,68,15,111,45,238,11,1,0         ; movdqa        0x10bee(%rip),%xmm13        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,37,173,12,1,0         ; movdqa        0x10cad(%rip),%xmm12        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0xa6c>
+  DB  102,68,15,111,45,180,12,1,0         ; movdqa        0x10cb4(%rip),%xmm13        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,69,15,111,241                   ; movdqa        %xmm9,%xmm14
   DB  102,69,15,219,245                   ; pand          %xmm13,%xmm14
   DB  102,65,15,114,246,2                 ; pslld         $0x2,%xmm14
@@ -24864,8 +24958,8 @@
   DB  102,69,15,235,198                   ; por           %xmm14,%xmm8
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,169,11,1,0               ; mulps         0x10ba9(%rip),%xmm8        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0xa88>
-  DB  68,15,88,5,177,11,1,0               ; addps         0x10bb1(%rip),%xmm8        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0xa98>
+  DB  68,15,89,5,111,12,1,0               ; mulps         0x10c6f(%rip),%xmm8        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0xa8c>
+  DB  68,15,88,5,119,12,1,0               ; addps         0x10c77(%rip),%xmm8        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0xa9c>
   DB  243,68,15,16,16                     ; movss         (%rax),%xmm10
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
   DB  69,15,89,208                        ; mulps         %xmm8,%xmm10
@@ -24903,7 +24997,7 @@
 PUBLIC _sk_black_color_sse2
 _sk_black_color_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,231,10,1,0                 ; movaps        0x10ae7(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,173,11,1,0                 ; movaps        0x10bad(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -24912,7 +25006,7 @@
 PUBLIC _sk_white_color_sse2
 _sk_white_color_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,211,10,1,0                  ; movaps        0x10ad3(%rip),%xmm0        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,5,153,11,1,0                  ; movaps        0x10b99(%rip),%xmm0        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -24950,7 +25044,7 @@
 PUBLIC _sk_srcatop_sse2
 _sk_srcatop_sse2 LABEL PROC
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  68,15,40,5,131,10,1,0               ; movaps        0x10a83(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,73,11,1,0                ; movaps        0x10b49(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -24973,7 +25067,7 @@
 _sk_dstatop_sse2 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
   DB  68,15,89,196                        ; mulps         %xmm4,%xmm8
-  DB  68,15,40,13,54,10,1,0               ; movaps        0x10a36(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,252,10,1,0              ; movaps        0x10afc(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
@@ -25014,7 +25108,7 @@
 
 PUBLIC _sk_srcout_sse2
 _sk_srcout_sse2 LABEL PROC
-  DB  68,15,40,5,202,9,1,0                ; movaps        0x109ca(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,144,10,1,0               ; movaps        0x10a90(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
@@ -25025,7 +25119,7 @@
 
 PUBLIC _sk_dstout_sse2
 _sk_dstout_sse2 LABEL PROC
-  DB  68,15,40,5,170,9,1,0                ; movaps        0x109aa(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,112,10,1,0               ; movaps        0x10a70(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -25040,7 +25134,7 @@
 
 PUBLIC _sk_srcover_sse2
 _sk_srcover_sse2 LABEL PROC
-  DB  68,15,40,5,125,9,1,0                ; movaps        0x1097d(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,67,10,1,0                ; movaps        0x10a43(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -25058,7 +25152,7 @@
 
 PUBLIC _sk_dstover_sse2
 _sk_dstover_sse2 LABEL PROC
-  DB  68,15,40,5,65,9,1,0                 ; movaps        0x10941(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,7,10,1,0                 ; movaps        0x10a07(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -25082,7 +25176,7 @@
 
 PUBLIC _sk_multiply_sse2
 _sk_multiply_sse2 LABEL PROC
-  DB  68,15,40,5,5,9,1,0                  ; movaps        0x10905(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,203,9,1,0                ; movaps        0x109cb(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
@@ -25118,7 +25212,7 @@
 PUBLIC _sk_plus__sse2
 _sk_plus__sse2 LABEL PROC
   DB  15,88,196                           ; addps         %xmm4,%xmm0
-  DB  68,15,40,5,134,8,1,0                ; movaps        0x10886(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,76,9,1,0                 ; movaps        0x1094c(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  15,88,205                           ; addps         %xmm5,%xmm1
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
@@ -25156,7 +25250,7 @@
 PUBLIC _sk_xor__sse2
 _sk_xor__sse2 LABEL PROC
   DB  68,15,40,195                        ; movaps        %xmm3,%xmm8
-  DB  15,40,29,18,8,1,0                   ; movaps        0x10812(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,216,8,1,0                  ; movaps        0x108d8(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,40,203                        ; movaps        %xmm3,%xmm9
   DB  68,15,92,207                        ; subps         %xmm7,%xmm9
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
@@ -25202,7 +25296,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,95,209                        ; maxps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,109,7,1,0                  ; movaps        0x1076d(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,51,8,1,0                   ; movaps        0x10833(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -25234,7 +25328,7 @@
   DB  68,15,89,206                        ; mulps         %xmm6,%xmm9
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,2,7,1,0                    ; movaps        0x10702(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,200,7,1,0                  ; movaps        0x107c8(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -25269,7 +25363,7 @@
   DB  65,15,93,209                        ; minps         %xmm9,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,140,6,1,0                  ; movaps        0x1068c(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,82,7,1,0                   ; movaps        0x10752(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -25295,7 +25389,7 @@
   DB  15,89,214                           ; mulps         %xmm6,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  68,15,92,194                        ; subps         %xmm2,%xmm8
-  DB  15,40,21,60,6,1,0                   ; movaps        0x1063c(%rip),%xmm2        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,21,2,7,1,0                    ; movaps        0x10702(%rip),%xmm2        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,215                           ; mulps         %xmm7,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -25306,7 +25400,7 @@
 PUBLIC _sk_colorburn_sse2
 _sk_colorburn_sse2 LABEL PROC
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
-  DB  68,15,40,13,31,6,1,0                ; movaps        0x1061f(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,229,6,1,0               ; movaps        0x106e5(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  68,15,92,215                        ; subps         %xmm7,%xmm10
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
@@ -25399,7 +25493,7 @@
 PUBLIC _sk_colordodge_sse2
 _sk_colordodge_sse2 LABEL PROC
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
-  DB  68,15,40,21,199,4,1,0               ; movaps        0x104c7(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,141,5,1,0               ; movaps        0x1058d(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
   DB  68,15,92,223                        ; subps         %xmm7,%xmm11
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
@@ -25490,7 +25584,7 @@
   DB  15,41,52,36                         ; movaps        %xmm6,(%rsp)
   DB  15,40,245                           ; movaps        %xmm5,%xmm6
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
-  DB  68,15,40,29,109,3,1,0               ; movaps        0x1036d(%rip),%xmm11        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,29,51,4,1,0                ; movaps        0x10433(%rip),%xmm11        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,211                        ; movaps        %xmm11,%xmm10
   DB  68,15,92,215                        ; subps         %xmm7,%xmm10
   DB  69,15,40,194                        ; movaps        %xmm10,%xmm8
@@ -25577,7 +25671,7 @@
 _sk_overlay_sse2 LABEL PROC
   DB  68,15,40,193                        ; movaps        %xmm1,%xmm8
   DB  68,15,40,232                        ; movaps        %xmm0,%xmm13
-  DB  68,15,40,13,40,2,1,0                ; movaps        0x10228(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,238,2,1,0               ; movaps        0x102ee(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  68,15,92,215                        ; subps         %xmm7,%xmm10
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
@@ -25667,7 +25761,7 @@
   DB  68,15,40,213                        ; movaps        %xmm5,%xmm10
   DB  68,15,94,215                        ; divps         %xmm7,%xmm10
   DB  69,15,84,212                        ; andps         %xmm12,%xmm10
-  DB  68,15,40,13,210,0,1,0               ; movaps        0x100d2(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,152,1,1,0               ; movaps        0x10198(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,249                        ; movaps        %xmm9,%xmm15
   DB  69,15,92,250                        ; subps         %xmm10,%xmm15
   DB  69,15,40,218                        ; movaps        %xmm10,%xmm11
@@ -25680,10 +25774,10 @@
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  65,15,88,194                        ; addps         %xmm10,%xmm0
-  DB  68,15,40,53,252,0,1,0               ; movaps        0x100fc(%rip),%xmm14        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0xaa8>
+  DB  68,15,40,53,194,1,1,0               ; movaps        0x101c2(%rip),%xmm14        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0xaac>
   DB  69,15,88,222                        ; addps         %xmm14,%xmm11
   DB  68,15,89,216                        ; mulps         %xmm0,%xmm11
-  DB  68,15,40,21,252,0,1,0               ; movaps        0x100fc(%rip),%xmm10        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0xab8>
+  DB  68,15,40,21,194,1,1,0               ; movaps        0x101c2(%rip),%xmm10        # 2bac0 <_sk_srcover_rgba_8888_sse2_lowp+0xabc>
   DB  69,15,89,234                        ; mulps         %xmm10,%xmm13
   DB  69,15,88,235                        ; addps         %xmm11,%xmm13
   DB  15,88,228                           ; addps         %xmm4,%xmm4
@@ -25828,7 +25922,7 @@
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  68,15,89,211                        ; mulps         %xmm3,%xmm10
-  DB  68,15,40,5,136,254,0,0              ; movaps        0xfe88(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,78,255,0,0               ; movaps        0xff4e(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,216                        ; movaps        %xmm8,%xmm11
   DB  15,40,207                           ; movaps        %xmm7,%xmm1
   DB  68,15,92,217                        ; subps         %xmm1,%xmm11
@@ -25876,12 +25970,12 @@
   DB  69,15,84,206                        ; andps         %xmm14,%xmm9
   DB  69,15,84,214                        ; andps         %xmm14,%xmm10
   DB  65,15,84,214                        ; andps         %xmm14,%xmm2
-  DB  68,15,40,61,69,254,0,0              ; movaps        0xfe45(%rip),%xmm15        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,61,11,255,0,0              ; movaps        0xff0b(%rip),%xmm15        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  65,15,89,231                        ; mulps         %xmm15,%xmm4
-  DB  15,40,5,74,254,0,0                  ; movaps        0xfe4a(%rip),%xmm0        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  15,40,5,16,255,0,0                  ; movaps        0xff10(%rip),%xmm0        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  15,89,240                           ; mulps         %xmm0,%xmm6
   DB  15,88,244                           ; addps         %xmm4,%xmm6
-  DB  68,15,40,53,76,254,0,0              ; movaps        0xfe4c(%rip),%xmm14        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,53,18,255,0,0              ; movaps        0xff12(%rip),%xmm14        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  68,15,40,239                        ; movaps        %xmm7,%xmm13
   DB  69,15,89,238                        ; mulps         %xmm14,%xmm13
   DB  68,15,88,238                        ; addps         %xmm6,%xmm13
@@ -26059,14 +26153,14 @@
   DB  68,15,84,211                        ; andps         %xmm3,%xmm10
   DB  68,15,84,203                        ; andps         %xmm3,%xmm9
   DB  15,84,195                           ; andps         %xmm3,%xmm0
-  DB  68,15,40,5,153,251,0,0              ; movaps        0xfb99(%rip),%xmm8        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,5,95,252,0,0               ; movaps        0xfc5f(%rip),%xmm8        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  15,40,214                           ; movaps        %xmm6,%xmm2
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
-  DB  15,40,13,155,251,0,0                ; movaps        0xfb9b(%rip),%xmm1        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  15,40,13,97,252,0,0                 ; movaps        0xfc61(%rip),%xmm1        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  15,40,221                           ; movaps        %xmm5,%xmm3
   DB  15,89,217                           ; mulps         %xmm1,%xmm3
   DB  15,88,218                           ; addps         %xmm2,%xmm3
-  DB  68,15,40,37,154,251,0,0             ; movaps        0xfb9a(%rip),%xmm12        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,37,96,252,0,0              ; movaps        0xfc60(%rip),%xmm12        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
   DB  68,15,88,235                        ; addps         %xmm3,%xmm13
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
@@ -26111,7 +26205,7 @@
   DB  15,40,223                           ; movaps        %xmm7,%xmm3
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,89,221                           ; mulps         %xmm5,%xmm3
-  DB  68,15,40,5,79,250,0,0               ; movaps        0xfa4f(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,21,251,0,0               ; movaps        0xfb15(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,40,224                        ; movaps        %xmm8,%xmm4
   DB  68,15,92,199                        ; subps         %xmm7,%xmm8
   DB  15,88,253                           ; addps         %xmm5,%xmm7
@@ -26212,14 +26306,14 @@
   DB  68,15,40,213                        ; movaps        %xmm5,%xmm10
   DB  69,15,89,208                        ; mulps         %xmm8,%xmm10
   DB  65,15,40,208                        ; movaps        %xmm8,%xmm2
-  DB  68,15,40,45,87,249,0,0              ; movaps        0xf957(%rip),%xmm13        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,45,29,250,0,0              ; movaps        0xfa1d(%rip),%xmm13        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  68,15,40,198                        ; movaps        %xmm6,%xmm8
   DB  69,15,89,197                        ; mulps         %xmm13,%xmm8
-  DB  68,15,40,53,87,249,0,0              ; movaps        0xf957(%rip),%xmm14        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  68,15,40,53,29,250,0,0              ; movaps        0xfa1d(%rip),%xmm14        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  65,15,40,195                        ; movaps        %xmm11,%xmm0
   DB  65,15,89,198                        ; mulps         %xmm14,%xmm0
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,29,83,249,0,0              ; movaps        0xf953(%rip),%xmm11        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
+  DB  68,15,40,29,25,250,0,0              ; movaps        0xfa19(%rip),%xmm11        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
   DB  69,15,89,227                        ; mulps         %xmm11,%xmm12
   DB  68,15,88,224                        ; addps         %xmm0,%xmm12
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
@@ -26227,7 +26321,7 @@
   DB  69,15,40,250                        ; movaps        %xmm10,%xmm15
   DB  69,15,89,254                        ; mulps         %xmm14,%xmm15
   DB  68,15,88,248                        ; addps         %xmm0,%xmm15
-  DB  68,15,40,5,143,248,0,0              ; movaps        0xf88f(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,85,249,0,0               ; movaps        0xf955(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,40,224                        ; movaps        %xmm8,%xmm4
   DB  15,92,226                           ; subps         %xmm2,%xmm4
   DB  15,89,252                           ; mulps         %xmm4,%xmm7
@@ -26363,15 +26457,15 @@
   DB  68,15,40,205                        ; movaps        %xmm5,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
   DB  15,89,222                           ; mulps         %xmm6,%xmm3
-  DB  68,15,40,37,17,247,0,0              ; movaps        0xf711(%rip),%xmm12        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,37,215,247,0,0             ; movaps        0xf7d7(%rip),%xmm12        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  68,15,40,199                        ; movaps        %xmm7,%xmm8
   DB  69,15,89,196                        ; mulps         %xmm12,%xmm8
-  DB  68,15,40,45,17,247,0,0              ; movaps        0xf711(%rip),%xmm13        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0xad8>
+  DB  68,15,40,45,215,247,0,0             ; movaps        0xf7d7(%rip),%xmm13        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xadc>
   DB  68,15,40,241                        ; movaps        %xmm1,%xmm14
   DB  69,15,89,245                        ; mulps         %xmm13,%xmm14
   DB  69,15,88,240                        ; addps         %xmm8,%xmm14
-  DB  68,15,40,29,13,247,0,0              ; movaps        0xf70d(%rip),%xmm11        # 2b790 <_sk_srcover_rgba_8888_sse2_lowp+0xae8>
-  DB  68,15,40,5,101,246,0,0              ; movaps        0xf665(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,29,211,247,0,0             ; movaps        0xf7d3(%rip),%xmm11        # 2baf0 <_sk_srcover_rgba_8888_sse2_lowp+0xaec>
+  DB  68,15,40,5,43,247,0,0               ; movaps        0xf72b(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,248                        ; movaps        %xmm8,%xmm15
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  68,15,92,248                        ; subps         %xmm0,%xmm15
@@ -26511,10 +26605,10 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,228,0,0,0                    ; jne           1c378 <_sk_srcover_rgba_8888_sse2+0x104>
+  DB  15,133,228,0,0,0                    ; jne           1c612 <_sk_srcover_rgba_8888_sse2+0x104>
   DB  243,69,15,111,4,128                 ; movdqu        (%r8,%rax,4),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  102,15,111,53,251,244,0,0           ; movdqa        0xf4fb(%rip),%xmm6        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,53,193,245,0,0           ; movdqa        0xf5c1(%rip),%xmm6        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,224                   ; movdqa        %xmm8,%xmm4
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
@@ -26528,9 +26622,9 @@
   DB  15,91,247                           ; cvtdq2ps      %xmm7,%xmm6
   DB  102,65,15,114,208,24                ; psrld         $0x18,%xmm8
   DB  65,15,91,248                        ; cvtdq2ps      %xmm8,%xmm7
-  DB  68,15,40,5,11,244,0,0               ; movaps        0xf40b(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,209,244,0,0              ; movaps        0xf4d1(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,92,195                        ; subps         %xmm3,%xmm8
-  DB  68,15,40,37,223,244,0,0             ; movaps        0xf4df(%rip),%xmm12        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,37,165,245,0,0             ; movaps        0xf5a5(%rip),%xmm12        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  65,15,89,196                        ; mulps         %xmm12,%xmm0
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,89,204                        ; mulps         %xmm4,%xmm9
@@ -26556,7 +26650,7 @@
   DB  102,15,114,240,24                   ; pslld         $0x18,%xmm0
   DB  102,15,235,194                      ; por           %xmm2,%xmm0
   DB  102,15,235,193                      ; por           %xmm1,%xmm0
-  DB  117,84                              ; jne           1c3b2 <_sk_srcover_rgba_8888_sse2+0x13e>
+  DB  117,84                              ; jne           1c64c <_sk_srcover_rgba_8888_sse2+0x13e>
   DB  243,65,15,127,4,128                 ; movdqu        %xmm0,(%r8,%rax,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
@@ -26567,32 +26661,32 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,90                              ; je            1c3df <_sk_srcover_rgba_8888_sse2+0x16b>
+  DB  116,90                              ; je            1c679 <_sk_srcover_rgba_8888_sse2+0x16b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1c3a7 <_sk_srcover_rgba_8888_sse2+0x133>
+  DB  116,23                              ; je            1c641 <_sk_srcover_rgba_8888_sse2+0x133>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,0,255,255,255                ; jne           1c29a <_sk_srcover_rgba_8888_sse2+0x26>
+  DB  15,133,0,255,255,255                ; jne           1c534 <_sk_srcover_rgba_8888_sse2+0x26>
   DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,18,4,128                  ; movlpd        (%r8,%rax,4),%xmm8
-  DB  233,232,254,255,255                 ; jmpq          1c29a <_sk_srcover_rgba_8888_sse2+0x26>
+  DB  233,232,254,255,255                 ; jmpq          1c534 <_sk_srcover_rgba_8888_sse2+0x26>
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,43                              ; je            1c3ea <_sk_srcover_rgba_8888_sse2+0x176>
+  DB  116,43                              ; je            1c684 <_sk_srcover_rgba_8888_sse2+0x176>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            1c3d7 <_sk_srcover_rgba_8888_sse2+0x163>
+  DB  116,18                              ; je            1c671 <_sk_srcover_rgba_8888_sse2+0x163>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,153                             ; jne           1c364 <_sk_srcover_rgba_8888_sse2+0xf0>
+  DB  117,153                             ; jne           1c5fe <_sk_srcover_rgba_8888_sse2+0xf0>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,65,15,126,76,128,8              ; movd          %xmm1,0x8(%r8,%rax,4)
   DB  102,65,15,214,4,128                 ; movq          %xmm0,(%r8,%rax,4)
-  DB  235,133                             ; jmp           1c364 <_sk_srcover_rgba_8888_sse2+0xf0>
+  DB  235,133                             ; jmp           1c5fe <_sk_srcover_rgba_8888_sse2+0xf0>
   DB  102,69,15,110,4,128                 ; movd          (%r8,%rax,4),%xmm8
-  DB  233,176,254,255,255                 ; jmpq          1c29a <_sk_srcover_rgba_8888_sse2+0x26>
+  DB  233,176,254,255,255                 ; jmpq          1c534 <_sk_srcover_rgba_8888_sse2+0x26>
   DB  102,65,15,126,4,128                 ; movd          %xmm0,(%r8,%rax,4)
-  DB  233,111,255,255,255                 ; jmpq          1c364 <_sk_srcover_rgba_8888_sse2+0xf0>
+  DB  233,111,255,255,255                 ; jmpq          1c5fe <_sk_srcover_rgba_8888_sse2+0xf0>
 
 PUBLIC _sk_clamp_0_sse2
 _sk_clamp_0_sse2 LABEL PROC
@@ -26606,7 +26700,7 @@
 
 PUBLIC _sk_clamp_1_sse2
 _sk_clamp_1_sse2 LABEL PROC
-  DB  68,15,40,5,219,242,0,0              ; movaps        0xf2db(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,161,243,0,0              ; movaps        0xf3a1(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,93,192                        ; minps         %xmm8,%xmm0
   DB  65,15,93,200                        ; minps         %xmm8,%xmm1
   DB  65,15,93,208                        ; minps         %xmm8,%xmm2
@@ -26616,7 +26710,7 @@
 
 PUBLIC _sk_clamp_a_sse2
 _sk_clamp_a_sse2 LABEL PROC
-  DB  15,93,29,192,242,0,0                ; minps         0xf2c0(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,29,134,243,0,0                ; minps         0xf386(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,93,195                           ; minps         %xmm3,%xmm0
   DB  15,93,203                           ; minps         %xmm3,%xmm1
   DB  15,93,211                           ; minps         %xmm3,%xmm2
@@ -26625,7 +26719,7 @@
 
 PUBLIC _sk_clamp_a_dst_sse2
 _sk_clamp_a_dst_sse2 LABEL PROC
-  DB  15,93,61,172,242,0,0                ; minps         0xf2ac(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,93,61,114,243,0,0                ; minps         0xf372(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,93,231                           ; minps         %xmm7,%xmm4
   DB  15,93,239                           ; minps         %xmm7,%xmm5
   DB  15,93,247                           ; minps         %xmm7,%xmm6
@@ -26654,7 +26748,7 @@
 
 PUBLIC _sk_invert_sse2
 _sk_invert_sse2 LABEL PROC
-  DB  68,15,40,5,104,242,0,0              ; movaps        0xf268(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,5,46,243,0,0               ; movaps        0xf32e(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  68,15,92,200                        ; subps         %xmm0,%xmm9
   DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
@@ -26706,7 +26800,7 @@
 PUBLIC _sk_unpremul_sse2
 _sk_unpremul_sse2 LABEL PROC
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,40,13,242,241,0,0             ; movaps        0xf1f2(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,184,242,0,0             ; movaps        0xf2b8(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,94,203                        ; divps         %xmm3,%xmm9
   DB  68,15,194,195,4                     ; cmpneqps      %xmm3,%xmm8
   DB  69,15,84,193                        ; andps         %xmm9,%xmm8
@@ -26718,20 +26812,20 @@
 
 PUBLIC _sk_from_srgb_sse2
 _sk_from_srgb_sse2 LABEL PROC
-  DB  68,15,40,5,189,242,0,0              ; movaps        0xf2bd(%rip),%xmm8        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb38>
+  DB  68,15,40,5,131,243,0,0              ; movaps        0xf383(%rip),%xmm8        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xb3c>
   DB  68,15,40,232                        ; movaps        %xmm0,%xmm13
   DB  69,15,89,232                        ; mulps         %xmm8,%xmm13
   DB  68,15,40,216                        ; movaps        %xmm0,%xmm11
   DB  69,15,89,219                        ; mulps         %xmm11,%xmm11
-  DB  68,15,40,13,53,242,0,0              ; movaps        0xf235(%rip),%xmm9        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,13,251,242,0,0             ; movaps        0xf2fb(%rip),%xmm9        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
   DB  69,15,89,241                        ; mulps         %xmm9,%xmm14
-  DB  68,15,40,21,165,242,0,0             ; movaps        0xf2a5(%rip),%xmm10        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb48>
+  DB  68,15,40,21,107,243,0,0             ; movaps        0xf36b(%rip),%xmm10        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xb4c>
   DB  69,15,88,242                        ; addps         %xmm10,%xmm14
   DB  69,15,89,243                        ; mulps         %xmm11,%xmm14
-  DB  68,15,40,29,165,242,0,0             ; movaps        0xf2a5(%rip),%xmm11        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0xb58>
+  DB  68,15,40,29,107,243,0,0             ; movaps        0xf36b(%rip),%xmm11        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xb5c>
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,40,37,169,242,0,0             ; movaps        0xf2a9(%rip),%xmm12        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xb68>
+  DB  68,15,40,37,111,243,0,0             ; movaps        0xf36f(%rip),%xmm12        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xb6c>
   DB  65,15,194,196,1                     ; cmpltps       %xmm12,%xmm0
   DB  68,15,84,232                        ; andps         %xmm0,%xmm13
   DB  65,15,85,198                        ; andnps        %xmm14,%xmm0
@@ -26765,20 +26859,20 @@
 
 PUBLIC _sk_from_srgb_dst_sse2
 _sk_from_srgb_dst_sse2 LABEL PROC
-  DB  68,15,40,5,250,241,0,0              ; movaps        0xf1fa(%rip),%xmm8        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0xb38>
+  DB  68,15,40,5,192,242,0,0              ; movaps        0xf2c0(%rip),%xmm8        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xb3c>
   DB  68,15,40,236                        ; movaps        %xmm4,%xmm13
   DB  69,15,89,232                        ; mulps         %xmm8,%xmm13
   DB  68,15,40,220                        ; movaps        %xmm4,%xmm11
   DB  69,15,89,219                        ; mulps         %xmm11,%xmm11
-  DB  68,15,40,13,114,241,0,0             ; movaps        0xf172(%rip),%xmm9        # 2b770 <_sk_srcover_rgba_8888_sse2_lowp+0xac8>
+  DB  68,15,40,13,56,242,0,0              ; movaps        0xf238(%rip),%xmm9        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xacc>
   DB  68,15,40,244                        ; movaps        %xmm4,%xmm14
   DB  69,15,89,241                        ; mulps         %xmm9,%xmm14
-  DB  68,15,40,21,226,241,0,0             ; movaps        0xf1e2(%rip),%xmm10        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0xb48>
+  DB  68,15,40,21,168,242,0,0             ; movaps        0xf2a8(%rip),%xmm10        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xb4c>
   DB  69,15,88,242                        ; addps         %xmm10,%xmm14
   DB  69,15,89,243                        ; mulps         %xmm11,%xmm14
-  DB  68,15,40,29,226,241,0,0             ; movaps        0xf1e2(%rip),%xmm11        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0xb58>
+  DB  68,15,40,29,168,242,0,0             ; movaps        0xf2a8(%rip),%xmm11        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xb5c>
   DB  69,15,88,243                        ; addps         %xmm11,%xmm14
-  DB  68,15,40,37,230,241,0,0             ; movaps        0xf1e6(%rip),%xmm12        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0xb68>
+  DB  68,15,40,37,172,242,0,0             ; movaps        0xf2ac(%rip),%xmm12        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xb6c>
   DB  65,15,194,228,1                     ; cmpltps       %xmm12,%xmm4
   DB  68,15,84,236                        ; andps         %xmm4,%xmm13
   DB  65,15,85,230                        ; andnps        %xmm14,%xmm4
@@ -26813,22 +26907,22 @@
 PUBLIC _sk_to_srgb_sse2
 _sk_to_srgb_sse2 LABEL PROC
   DB  68,15,82,232                        ; rsqrtps       %xmm0,%xmm13
-  DB  68,15,40,5,115,241,0,0              ; movaps        0xf173(%rip),%xmm8        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0xb78>
+  DB  68,15,40,5,57,242,0,0               ; movaps        0xf239(%rip),%xmm8        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xb7c>
   DB  68,15,40,240                        ; movaps        %xmm0,%xmm14
   DB  69,15,89,240                        ; mulps         %xmm8,%xmm14
-  DB  68,15,40,13,115,241,0,0             ; movaps        0xf173(%rip),%xmm9        # 2b830 <_sk_srcover_rgba_8888_sse2_lowp+0xb88>
+  DB  68,15,40,13,57,242,0,0              ; movaps        0xf239(%rip),%xmm9        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xb8c>
   DB  69,15,40,253                        ; movaps        %xmm13,%xmm15
   DB  69,15,89,249                        ; mulps         %xmm9,%xmm15
-  DB  68,15,40,21,115,241,0,0             ; movaps        0xf173(%rip),%xmm10        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0xb98>
+  DB  68,15,40,21,57,242,0,0              ; movaps        0xf239(%rip),%xmm10        # 2bba0 <_sk_srcover_rgba_8888_sse2_lowp+0xb9c>
   DB  69,15,88,250                        ; addps         %xmm10,%xmm15
   DB  69,15,89,253                        ; mulps         %xmm13,%xmm15
-  DB  68,15,40,29,115,241,0,0             ; movaps        0xf173(%rip),%xmm11        # 2b850 <_sk_srcover_rgba_8888_sse2_lowp+0xba8>
+  DB  68,15,40,29,57,242,0,0              ; movaps        0xf239(%rip),%xmm11        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xbac>
   DB  69,15,88,251                        ; addps         %xmm11,%xmm15
-  DB  68,15,40,37,119,241,0,0             ; movaps        0xf177(%rip),%xmm12        # 2b860 <_sk_srcover_rgba_8888_sse2_lowp+0xbb8>
+  DB  68,15,40,37,61,242,0,0              ; movaps        0xf23d(%rip),%xmm12        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xbbc>
   DB  69,15,88,236                        ; addps         %xmm12,%xmm13
   DB  69,15,83,237                        ; rcpps         %xmm13,%xmm13
   DB  69,15,89,239                        ; mulps         %xmm15,%xmm13
-  DB  68,15,40,61,115,241,0,0             ; movaps        0xf173(%rip),%xmm15        # 2b870 <_sk_srcover_rgba_8888_sse2_lowp+0xbc8>
+  DB  68,15,40,61,57,242,0,0              ; movaps        0xf239(%rip),%xmm15        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xbcc>
   DB  65,15,194,199,1                     ; cmpltps       %xmm15,%xmm0
   DB  68,15,84,240                        ; andps         %xmm0,%xmm14
   DB  65,15,85,197                        ; andnps        %xmm13,%xmm0
@@ -26878,7 +26972,7 @@
   DB  68,15,93,216                        ; minps         %xmm0,%xmm11
   DB  65,15,40,202                        ; movaps        %xmm10,%xmm1
   DB  65,15,92,203                        ; subps         %xmm11,%xmm1
-  DB  68,15,40,45,54,239,0,0              ; movaps        0xef36(%rip),%xmm13        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,45,252,239,0,0             ; movaps        0xeffc(%rip),%xmm13        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  68,15,94,233                        ; divps         %xmm1,%xmm13
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  65,15,194,192,0                     ; cmpeqps       %xmm8,%xmm0
@@ -26887,30 +26981,30 @@
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,40,241                        ; movaps        %xmm9,%xmm14
   DB  68,15,194,242,1                     ; cmpltps       %xmm2,%xmm14
-  DB  68,15,84,53,156,240,0,0             ; andps         0xf09c(%rip),%xmm14        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0xbd8>
+  DB  68,15,84,53,98,241,0,0              ; andps         0xf162(%rip),%xmm14        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xbdc>
   DB  69,15,88,244                        ; addps         %xmm12,%xmm14
   DB  69,15,40,250                        ; movaps        %xmm10,%xmm15
   DB  69,15,194,249,0                     ; cmpeqps       %xmm9,%xmm15
   DB  65,15,92,208                        ; subps         %xmm8,%xmm2
   DB  65,15,89,213                        ; mulps         %xmm13,%xmm2
-  DB  68,15,40,37,143,240,0,0             ; movaps        0xf08f(%rip),%xmm12        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0xbe8>
+  DB  68,15,40,37,85,241,0,0              ; movaps        0xf155(%rip),%xmm12        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xbec>
   DB  65,15,88,212                        ; addps         %xmm12,%xmm2
   DB  69,15,92,193                        ; subps         %xmm9,%xmm8
   DB  69,15,89,197                        ; mulps         %xmm13,%xmm8
-  DB  68,15,88,5,139,240,0,0              ; addps         0xf08b(%rip),%xmm8        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf8>
+  DB  68,15,88,5,81,241,0,0               ; addps         0xf151(%rip),%xmm8        # 2bc00 <_sk_srcover_rgba_8888_sse2_lowp+0xbfc>
   DB  65,15,84,215                        ; andps         %xmm15,%xmm2
   DB  69,15,85,248                        ; andnps        %xmm8,%xmm15
   DB  68,15,86,250                        ; orps          %xmm2,%xmm15
   DB  68,15,84,240                        ; andps         %xmm0,%xmm14
   DB  65,15,85,199                        ; andnps        %xmm15,%xmm0
   DB  65,15,86,198                        ; orps          %xmm14,%xmm0
-  DB  15,89,5,124,240,0,0                 ; mulps         0xf07c(%rip),%xmm0        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc08>
+  DB  15,89,5,66,241,0,0                  ; mulps         0xf142(%rip),%xmm0        # 2bc10 <_sk_srcover_rgba_8888_sse2_lowp+0xc0c>
   DB  69,15,40,194                        ; movaps        %xmm10,%xmm8
   DB  69,15,194,195,4                     ; cmpneqps      %xmm11,%xmm8
   DB  65,15,84,192                        ; andps         %xmm8,%xmm0
   DB  69,15,92,226                        ; subps         %xmm10,%xmm12
   DB  69,15,88,211                        ; addps         %xmm11,%xmm10
-  DB  68,15,40,13,143,238,0,0             ; movaps        0xee8f(%rip),%xmm9        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,13,85,239,0,0              ; movaps        0xef55(%rip),%xmm9        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,40,210                        ; movaps        %xmm10,%xmm2
   DB  65,15,89,209                        ; mulps         %xmm9,%xmm2
   DB  68,15,194,202,1                     ; cmpltps       %xmm2,%xmm9
@@ -26933,7 +27027,7 @@
   DB  15,41,92,36,32                      ; movaps        %xmm3,0x20(%rsp)
   DB  68,15,40,218                        ; movaps        %xmm2,%xmm11
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
-  DB  68,15,40,13,58,238,0,0              ; movaps        0xee3a(%rip),%xmm9        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,13,0,239,0,0               ; movaps        0xef00(%rip),%xmm9        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,40,209                        ; movaps        %xmm9,%xmm10
   DB  69,15,194,211,2                     ; cmpleps       %xmm11,%xmm10
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
@@ -26950,28 +27044,28 @@
   DB  69,15,88,211                        ; addps         %xmm11,%xmm10
   DB  69,15,88,219                        ; addps         %xmm11,%xmm11
   DB  69,15,92,218                        ; subps         %xmm10,%xmm11
-  DB  15,40,5,212,239,0,0                 ; movaps        0xefd4(%rip),%xmm0        # 2b8c0 <_sk_srcover_rgba_8888_sse2_lowp+0xc18>
+  DB  15,40,5,154,240,0,0                 ; movaps        0xf09a(%rip),%xmm0        # 2bc20 <_sk_srcover_rgba_8888_sse2_lowp+0xc1c>
   DB  15,88,198                           ; addps         %xmm6,%xmm0
   DB  243,15,91,200                       ; cvttps2dq     %xmm0,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
   DB  15,194,217,1                        ; cmpltps       %xmm1,%xmm3
-  DB  15,84,29,236,237,0,0                ; andps         0xedec(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,84,29,178,238,0,0                ; andps         0xeeb2(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,203                           ; subps         %xmm3,%xmm1
   DB  15,92,193                           ; subps         %xmm1,%xmm0
-  DB  68,15,40,45,190,239,0,0             ; movaps        0xefbe(%rip),%xmm13        # 2b8d0 <_sk_srcover_rgba_8888_sse2_lowp+0xc28>
+  DB  68,15,40,45,132,240,0,0             ; movaps        0xf084(%rip),%xmm13        # 2bc30 <_sk_srcover_rgba_8888_sse2_lowp+0xc2c>
   DB  69,15,40,197                        ; movaps        %xmm13,%xmm8
   DB  68,15,194,192,2                     ; cmpleps       %xmm0,%xmm8
   DB  69,15,40,242                        ; movaps        %xmm10,%xmm14
   DB  69,15,92,243                        ; subps         %xmm11,%xmm14
   DB  65,15,40,217                        ; movaps        %xmm9,%xmm3
   DB  15,194,216,2                        ; cmpleps       %xmm0,%xmm3
-  DB  15,40,21,126,239,0,0                ; movaps        0xef7e(%rip),%xmm2        # 2b8b0 <_sk_srcover_rgba_8888_sse2_lowp+0xc08>
+  DB  15,40,21,68,240,0,0                 ; movaps        0xf044(%rip),%xmm2        # 2bc10 <_sk_srcover_rgba_8888_sse2_lowp+0xc0c>
   DB  68,15,40,250                        ; movaps        %xmm2,%xmm15
   DB  68,15,194,248,2                     ; cmpleps       %xmm0,%xmm15
-  DB  15,40,13,62,239,0,0                 ; movaps        0xef3e(%rip),%xmm1        # 2b880 <_sk_srcover_rgba_8888_sse2_lowp+0xbd8>
+  DB  15,40,13,4,240,0,0                  ; movaps        0xf004(%rip),%xmm1        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xbdc>
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
-  DB  15,40,45,84,239,0,0                 ; movaps        0xef54(%rip),%xmm5        # 2b8a0 <_sk_srcover_rgba_8888_sse2_lowp+0xbf8>
+  DB  15,40,45,26,240,0,0                 ; movaps        0xf01a(%rip),%xmm5        # 2bc00 <_sk_srcover_rgba_8888_sse2_lowp+0xbfc>
   DB  15,40,229                           ; movaps        %xmm5,%xmm4
   DB  15,92,224                           ; subps         %xmm0,%xmm4
   DB  65,15,89,230                        ; mulps         %xmm14,%xmm4
@@ -26994,7 +27088,7 @@
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,222                           ; movaps        %xmm6,%xmm3
   DB  15,194,216,1                        ; cmpltps       %xmm0,%xmm3
-  DB  15,84,29,73,237,0,0                 ; andps         0xed49(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,84,29,15,238,0,0                 ; andps         0xee0f(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,195                           ; subps         %xmm3,%xmm0
   DB  68,15,40,230                        ; movaps        %xmm6,%xmm12
   DB  68,15,92,224                        ; subps         %xmm0,%xmm12
@@ -27024,12 +27118,12 @@
   DB  15,40,60,36                         ; movaps        (%rsp),%xmm7
   DB  15,40,231                           ; movaps        %xmm7,%xmm4
   DB  15,85,227                           ; andnps        %xmm3,%xmm4
-  DB  15,88,53,194,238,0,0                ; addps         0xeec2(%rip),%xmm6        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  15,88,53,136,239,0,0                ; addps         0xef88(%rip),%xmm6        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  243,15,91,198                       ; cvttps2dq     %xmm6,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,222                           ; movaps        %xmm6,%xmm3
   DB  15,194,216,1                        ; cmpltps       %xmm0,%xmm3
-  DB  15,84,29,189,236,0,0                ; andps         0xecbd(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,84,29,131,237,0,0                ; andps         0xed83(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,92,195                           ; subps         %xmm3,%xmm0
   DB  15,92,240                           ; subps         %xmm0,%xmm6
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
@@ -27090,13 +27184,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,61                              ; jne           1cb38 <_sk_scale_u8_sse2+0x55>
+  DB  117,61                              ; jne           1cdd2 <_sk_scale_u8_sse2+0x55>
   DB  102,71,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  102,68,15,219,5,140,236,0,0         ; pand          0xec8c(%rip),%xmm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,68,15,219,5,82,237,0,0          ; pand          0xed52(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,208,237,0,0              ; mulps         0xedd0(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,89,5,150,238,0,0              ; mulps         0xee96(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
@@ -27107,12 +27201,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,61                              ; je            1cb82 <_sk_scale_u8_sse2+0x9f>
+  DB  116,61                              ; je            1ce1c <_sk_scale_u8_sse2+0x9f>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1cb67 <_sk_scale_u8_sse2+0x84>
+  DB  116,23                              ; je            1ce01 <_sk_scale_u8_sse2+0x84>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,181                             ; jne           1cb0b <_sk_scale_u8_sse2+0x28>
+  DB  117,181                             ; jne           1cda5 <_sk_scale_u8_sse2+0x28>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
@@ -27121,10 +27215,10 @@
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  102,68,15,97,200                    ; punpcklwd     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  235,137                             ; jmp           1cb0b <_sk_scale_u8_sse2+0x28>
+  DB  235,137                             ; jmp           1cda5 <_sk_scale_u8_sse2+0x28>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,122,255,255,255                 ; jmpq          1cb0b <_sk_scale_u8_sse2+0x28>
+  DB  233,122,255,255,255                 ; jmpq          1cda5 <_sk_scale_u8_sse2+0x28>
 
 PUBLIC _sk_scale_565_sse2
 _sk_scale_565_sse2 LABEL PROC
@@ -27136,20 +27230,20 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,173,0,0,0                    ; jne           1cc5d <_sk_scale_565_sse2+0xcc>
+  DB  15,133,173,0,0,0                    ; jne           1cef7 <_sk_scale_565_sse2+0xcc>
   DB  243,71,15,126,20,80                 ; movq          (%r8,%r10,2),%xmm10
   DB  102,68,15,97,208                    ; punpcklwd     %xmm0,%xmm10
-  DB  102,68,15,111,5,60,237,0,0          ; movdqa        0xed3c(%rip),%xmm8        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,68,15,111,5,2,238,0,0           ; movdqa        0xee02(%rip),%xmm8        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,69,15,219,194                   ; pand          %xmm10,%xmm8
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,59,237,0,0               ; mulps         0xed3b(%rip),%xmm8        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,68,15,111,13,66,237,0,0         ; movdqa        0xed42(%rip),%xmm9        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  68,15,89,5,1,238,0,0                ; mulps         0xee01(%rip),%xmm8        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,68,15,111,13,8,238,0,0          ; movdqa        0xee08(%rip),%xmm9        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,69,15,219,202                   ; pand          %xmm10,%xmm9
   DB  69,15,91,201                        ; cvtdq2ps      %xmm9,%xmm9
-  DB  68,15,89,13,65,237,0,0              ; mulps         0xed41(%rip),%xmm9        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,68,15,219,21,72,237,0,0         ; pand          0xed48(%rip),%xmm10        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  68,15,89,13,7,238,0,0               ; mulps         0xee07(%rip),%xmm9        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,68,15,219,21,14,238,0,0         ; pand          0xee0e(%rip),%xmm10        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
-  DB  68,15,89,21,76,237,0,0              ; mulps         0xed4c(%rip),%xmm10        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  68,15,89,21,18,238,0,0              ; mulps         0xee12(%rip),%xmm10        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  68,15,40,219                        ; movaps        %xmm3,%xmm11
   DB  68,15,194,223,1                     ; cmpltps       %xmm7,%xmm11
   DB  69,15,40,225                        ; movaps        %xmm9,%xmm12
@@ -27176,22 +27270,22 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            1cca6 <_sk_scale_565_sse2+0x115>
+  DB  116,60                              ; je            1cf40 <_sk_scale_565_sse2+0x115>
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,27                              ; je            1cc90 <_sk_scale_565_sse2+0xff>
+  DB  116,27                              ; je            1cf2a <_sk_scale_565_sse2+0xff>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,60,255,255,255               ; jne           1cbbb <_sk_scale_565_sse2+0x2a>
+  DB  15,133,60,255,255,255               ; jne           1ce55 <_sk_scale_565_sse2+0x2a>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,208,69                ; pshufd        $0x45,%xmm8,%xmm10
   DB  102,71,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm8
   DB  242,69,15,112,192,212               ; pshuflw       $0xd4,%xmm8,%xmm8
   DB  242,69,15,16,208                    ; movsd         %xmm8,%xmm10
-  DB  233,21,255,255,255                  ; jmpq          1cbbb <_sk_scale_565_sse2+0x2a>
+  DB  233,21,255,255,255                  ; jmpq          1ce55 <_sk_scale_565_sse2+0x2a>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,68,15,110,208                   ; movd          %eax,%xmm10
-  DB  233,6,255,255,255                   ; jmpq          1cbbb <_sk_scale_565_sse2+0x2a>
+  DB  233,6,255,255,255                   ; jmpq          1ce55 <_sk_scale_565_sse2+0x2a>
 
 PUBLIC _sk_lerp_1_float_sse2
 _sk_lerp_1_float_sse2 LABEL PROC
@@ -27222,13 +27316,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,81                              ; jne           1cd56 <_sk_lerp_u8_sse2+0x69>
+  DB  117,81                              ; jne           1cff0 <_sk_lerp_u8_sse2+0x69>
   DB  102,71,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  102,68,15,219,5,130,234,0,0         ; pand          0xea82(%rip),%xmm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,68,15,219,5,72,235,0,0          ; pand          0xeb48(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,198,235,0,0              ; mulps         0xebc6(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,89,5,140,236,0,0              ; mulps         0xec8c(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  15,88,196                           ; addps         %xmm4,%xmm0
@@ -27246,12 +27340,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,64                              ; je            1cda3 <_sk_lerp_u8_sse2+0xb6>
+  DB  116,64                              ; je            1d03d <_sk_lerp_u8_sse2+0xb6>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1cd85 <_sk_lerp_u8_sse2+0x98>
+  DB  116,23                              ; je            1d01f <_sk_lerp_u8_sse2+0x98>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,161                             ; jne           1cd15 <_sk_lerp_u8_sse2+0x28>
+  DB  117,161                             ; jne           1cfaf <_sk_lerp_u8_sse2+0x28>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
@@ -27260,10 +27354,10 @@
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  102,68,15,97,200                    ; punpcklwd     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  233,114,255,255,255                 ; jmpq          1cd15 <_sk_lerp_u8_sse2+0x28>
+  DB  233,114,255,255,255                 ; jmpq          1cfaf <_sk_lerp_u8_sse2+0x28>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,99,255,255,255                  ; jmpq          1cd15 <_sk_lerp_u8_sse2+0x28>
+  DB  233,99,255,255,255                  ; jmpq          1cfaf <_sk_lerp_u8_sse2+0x28>
 
 PUBLIC _sk_lerp_565_sse2
 _sk_lerp_565_sse2 LABEL PROC
@@ -27275,20 +27369,20 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,173,0,0,0                    ; jne           1ce7e <_sk_lerp_565_sse2+0xcc>
+  DB  15,133,173,0,0,0                    ; jne           1d118 <_sk_lerp_565_sse2+0xcc>
   DB  243,71,15,126,4,80                  ; movq          (%r8,%r10,2),%xmm8
   DB  102,68,15,97,192                    ; punpcklwd     %xmm0,%xmm8
-  DB  102,68,15,111,13,27,235,0,0         ; movdqa        0xeb1b(%rip),%xmm9        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,68,15,111,13,225,235,0,0        ; movdqa        0xebe1(%rip),%xmm9        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,69,15,219,200                   ; pand          %xmm8,%xmm9
   DB  69,15,91,201                        ; cvtdq2ps      %xmm9,%xmm9
-  DB  68,15,89,13,26,235,0,0              ; mulps         0xeb1a(%rip),%xmm9        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,68,15,111,21,33,235,0,0         ; movdqa        0xeb21(%rip),%xmm10        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  68,15,89,13,224,235,0,0             ; mulps         0xebe0(%rip),%xmm9        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,68,15,111,21,231,235,0,0        ; movdqa        0xebe7(%rip),%xmm10        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,69,15,219,208                   ; pand          %xmm8,%xmm10
   DB  69,15,91,218                        ; cvtdq2ps      %xmm10,%xmm11
-  DB  68,15,89,29,32,235,0,0              ; mulps         0xeb20(%rip),%xmm11        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,68,15,219,5,39,235,0,0          ; pand          0xeb27(%rip),%xmm8        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  68,15,89,29,230,235,0,0             ; mulps         0xebe6(%rip),%xmm11        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,68,15,219,5,237,235,0,0         ; pand          0xebed(%rip),%xmm8        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
-  DB  68,15,89,5,43,235,0,0               ; mulps         0xeb2b(%rip),%xmm8        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  68,15,89,5,241,235,0,0              ; mulps         0xebf1(%rip),%xmm8        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  68,15,40,211                        ; movaps        %xmm3,%xmm10
   DB  68,15,194,215,1                     ; cmpltps       %xmm7,%xmm10
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
@@ -27317,22 +27411,22 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,60                              ; je            1cec7 <_sk_lerp_565_sse2+0x115>
+  DB  116,60                              ; je            1d161 <_sk_lerp_565_sse2+0x115>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,27                              ; je            1ceb1 <_sk_lerp_565_sse2+0xff>
+  DB  116,27                              ; je            1d14b <_sk_lerp_565_sse2+0xff>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,60,255,255,255               ; jne           1cddc <_sk_lerp_565_sse2+0x2a>
+  DB  15,133,60,255,255,255               ; jne           1d076 <_sk_lerp_565_sse2+0x2a>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,112,192,69                ; pshufd        $0x45,%xmm8,%xmm8
   DB  102,71,15,110,12,80                 ; movd          (%r8,%r10,2),%xmm9
   DB  242,69,15,112,201,212               ; pshuflw       $0xd4,%xmm9,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  233,21,255,255,255                  ; jmpq          1cddc <_sk_lerp_565_sse2+0x2a>
+  DB  233,21,255,255,255                  ; jmpq          1d076 <_sk_lerp_565_sse2+0x2a>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  233,6,255,255,255                   ; jmpq          1cddc <_sk_lerp_565_sse2+0x2a>
+  DB  233,6,255,255,255                   ; jmpq          1d076 <_sk_lerp_565_sse2+0x2a>
 
 PUBLIC _sk_load_tables_sse2
 _sk_load_tables_sse2 LABEL PROC
@@ -27341,9 +27435,9 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,31,1,0,0                     ; jne           1d006 <_sk_load_tables_sse2+0x130>
+  DB  15,133,31,1,0,0                     ; jne           1d2a0 <_sk_load_tables_sse2+0x130>
   DB  243,69,15,111,12,144                ; movdqu        (%r8,%rdx,4),%xmm9
-  DB  102,68,15,111,5,170,232,0,0         ; movdqa        0xe8aa(%rip),%xmm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,68,15,111,5,112,233,0,0         ; movdqa        0xe970(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
@@ -27399,7 +27493,7 @@
   DB  102,15,20,211                       ; unpcklpd      %xmm3,%xmm2
   DB  102,65,15,114,209,24                ; psrld         $0x18,%xmm9
   DB  65,15,91,217                        ; cvtdq2ps      %xmm9,%xmm3
-  DB  15,89,29,241,232,0,0                ; mulps         0xe8f1(%rip),%xmm3        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,29,183,233,0,0                ; mulps         0xe9b7(%rip),%xmm3        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
@@ -27407,18 +27501,18 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,45                              ; je            1d040 <_sk_load_tables_sse2+0x16a>
+  DB  116,45                              ; je            1d2da <_sk_load_tables_sse2+0x16a>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,23                              ; je            1d035 <_sk_load_tables_sse2+0x15f>
+  DB  116,23                              ; je            1d2cf <_sk_load_tables_sse2+0x15f>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  15,133,197,254,255,255              ; jne           1ceed <_sk_load_tables_sse2+0x17>
+  DB  15,133,197,254,255,255              ; jne           1d187 <_sk_load_tables_sse2+0x17>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,200,69                ; pshufd        $0x45,%xmm0,%xmm9
   DB  102,69,15,18,12,144                 ; movlpd        (%r8,%rdx,4),%xmm9
-  DB  233,173,254,255,255                 ; jmpq          1ceed <_sk_load_tables_sse2+0x17>
+  DB  233,173,254,255,255                 ; jmpq          1d187 <_sk_load_tables_sse2+0x17>
   DB  102,69,15,110,12,144                ; movd          (%r8,%rdx,4),%xmm9
-  DB  233,162,254,255,255                 ; jmpq          1ceed <_sk_load_tables_sse2+0x17>
+  DB  233,162,254,255,255                 ; jmpq          1d187 <_sk_load_tables_sse2+0x17>
 
 PUBLIC _sk_load_tables_u16_be_sse2
 _sk_load_tables_u16_be_sse2 LABEL PROC
@@ -27428,7 +27522,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,149,0,0,0,0               ; lea           0x0(,%rdx,4),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,90,1,0,0                     ; jne           1d1be <_sk_load_tables_u16_be_sse2+0x173>
+  DB  15,133,90,1,0,0                     ; jne           1d458 <_sk_load_tables_u16_be_sse2+0x173>
   DB  102,67,15,16,4,72                   ; movupd        (%r8,%r9,2),%xmm0
   DB  243,67,15,111,76,72,16              ; movdqu        0x10(%r8,%r9,2),%xmm1
   DB  102,68,15,40,200                    ; movapd        %xmm0,%xmm9
@@ -27437,7 +27531,7 @@
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  102,68,15,105,200                   ; punpckhwd     %xmm0,%xmm9
-  DB  102,15,111,21,203,232,0,0           ; movdqa        0xe8cb(%rip),%xmm2        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0xcb8>
+  DB  102,15,111,21,145,233,0,0           ; movdqa        0xe991(%rip),%xmm2        # 2bcc0 <_sk_srcover_rgba_8888_sse2_lowp+0xcbc>
   DB  102,15,112,217,238                  ; pshufd        $0xee,%xmm1,%xmm3
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
@@ -27498,23 +27592,23 @@
   DB  102,65,15,235,217                   ; por           %xmm9,%xmm3
   DB  102,65,15,97,216                    ; punpcklwd     %xmm8,%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,201,231,0,0                ; mulps         0xe7c9(%rip),%xmm3        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0xcd8>
+  DB  15,89,29,143,232,0,0                ; mulps         0xe88f(%rip),%xmm3        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0xcdc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
   DB  242,67,15,16,4,72                   ; movsd         (%r8,%r9,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1d1d7 <_sk_load_tables_u16_be_sse2+0x18c>
+  DB  117,13                              ; jne           1d471 <_sk_load_tables_u16_be_sse2+0x18c>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,154,254,255,255                 ; jmpq          1d071 <_sk_load_tables_u16_be_sse2+0x26>
+  DB  233,154,254,255,255                 ; jmpq          1d30b <_sk_load_tables_u16_be_sse2+0x26>
   DB  102,67,15,22,68,72,8                ; movhpd        0x8(%r8,%r9,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,133,254,255,255              ; jb            1d071 <_sk_load_tables_u16_be_sse2+0x26>
+  DB  15,130,133,254,255,255              ; jb            1d30b <_sk_load_tables_u16_be_sse2+0x26>
   DB  243,67,15,126,76,72,16              ; movq          0x10(%r8,%r9,2),%xmm1
-  DB  233,121,254,255,255                 ; jmpq          1d071 <_sk_load_tables_u16_be_sse2+0x26>
+  DB  233,121,254,255,255                 ; jmpq          1d30b <_sk_load_tables_u16_be_sse2+0x26>
 
 PUBLIC _sk_load_tables_rgb_u16_be_sse2
 _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -27524,7 +27618,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  76,141,12,82                        ; lea           (%rdx,%rdx,2),%r9
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,78,1,0,0                     ; jne           1d35b <_sk_load_tables_rgb_u16_be_sse2+0x163>
+  DB  15,133,78,1,0,0                     ; jne           1d5f5 <_sk_load_tables_rgb_u16_be_sse2+0x163>
   DB  243,67,15,111,20,72                 ; movdqu        (%r8,%r9,2),%xmm2
   DB  243,67,15,111,76,72,8               ; movdqu        0x8(%r8,%r9,2),%xmm1
   DB  102,15,115,217,4                    ; psrldq        $0x4,%xmm1
@@ -27537,7 +27631,7 @@
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,65,15,97,194                    ; punpcklwd     %xmm10,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,68,15,111,5,13,231,0,0          ; movdqa        0xe70d(%rip),%xmm8        # 2b960 <_sk_srcover_rgba_8888_sse2_lowp+0xcb8>
+  DB  102,68,15,111,5,211,231,0,0         ; movdqa        0xe7d3(%rip),%xmm8        # 2bcc0 <_sk_srcover_rgba_8888_sse2_lowp+0xcbc>
   DB  102,65,15,219,192                   ; pand          %xmm8,%xmm0
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,65,15,97,193                    ; punpcklwd     %xmm9,%xmm0
@@ -27592,7 +27686,7 @@
   DB  65,15,20,216                        ; unpcklps      %xmm8,%xmm3
   DB  102,15,20,211                       ; unpcklpd      %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,154,227,0,0                ; movaps        0xe39a(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,96,228,0,0                 ; movaps        0xe460(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  91                                  ; pop           %rbx
   DB  65,94                               ; pop           %r14
   DB  255,224                             ; jmpq          *%rax
@@ -27600,21 +27694,21 @@
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,84,72,4,2             ; pinsrw        $0x2,0x4(%r8,%r9,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,14                              ; jne           1d381 <_sk_load_tables_rgb_u16_be_sse2+0x189>
+  DB  117,14                              ; jne           1d61b <_sk_load_tables_rgb_u16_be_sse2+0x189>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
-  DB  233,178,254,255,255                 ; jmpq          1d233 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
+  DB  233,178,254,255,255                 ; jmpq          1d4cd <_sk_load_tables_rgb_u16_be_sse2+0x3b>
   DB  102,71,15,110,84,72,6               ; movd          0x6(%r8,%r9,2),%xmm10
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,71,15,196,84,72,10,2            ; pinsrw        $0x2,0xa(%r8,%r9,2),%xmm10
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            1d3b2 <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
+  DB  114,24                              ; jb            1d64c <_sk_load_tables_rgb_u16_be_sse2+0x1ba>
   DB  102,67,15,110,76,72,12              ; movd          0xc(%r8,%r9,2),%xmm1
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,67,15,196,76,72,16,2            ; pinsrw        $0x2,0x10(%r8,%r9,2),%xmm1
-  DB  233,129,254,255,255                 ; jmpq          1d233 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
+  DB  233,129,254,255,255                 ; jmpq          1d4cd <_sk_load_tables_rgb_u16_be_sse2+0x3b>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,120,254,255,255                 ; jmpq          1d233 <_sk_load_tables_rgb_u16_be_sse2+0x3b>
+  DB  233,120,254,255,255                 ; jmpq          1d4cd <_sk_load_tables_rgb_u16_be_sse2+0x3b>
 
 PUBLIC _sk_byte_tables_sse2
 _sk_byte_tables_sse2 LABEL PROC
@@ -27622,7 +27716,7 @@
   DB  65,86                               ; push          %r14
   DB  83                                  ; push          %rbx
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,7,228,0,0                ; movaps        0xe407(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,205,228,0,0              ; movaps        0xe4cd(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  102,73,15,126,192                   ; movq          %xmm0,%r8
@@ -27650,7 +27744,7 @@
   DB  102,65,15,96,193                    ; punpcklbw     %xmm9,%xmm0
   DB  102,65,15,97,193                    ; punpcklwd     %xmm9,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,21,178,228,0,0             ; movaps        0xe4b2(%rip),%xmm10        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,21,120,229,0,0             ; movaps        0xe578(%rip),%xmm10        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,194                        ; mulps         %xmm10,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
@@ -27767,7 +27861,7 @@
   DB  102,65,15,96,193                    ; punpcklbw     %xmm9,%xmm0
   DB  102,65,15,97,193                    ; punpcklwd     %xmm9,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,21,242,226,0,0             ; movaps        0xe2f2(%rip),%xmm10        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,21,184,227,0,0             ; movaps        0xe3b8(%rip),%xmm10        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,194                        ; mulps         %xmm10,%xmm0
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
@@ -27955,15 +28049,15 @@
   DB  69,15,88,209                        ; addps         %xmm9,%xmm10
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,91,202                        ; cvtdq2ps      %xmm10,%xmm9
-  DB  68,15,89,13,190,224,0,0             ; mulps         0xe0be(%rip),%xmm9        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,21,198,224,0,0             ; andps         0xe0c6(%rip),%xmm10        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,21,254,221,0,0             ; orps          0xddfe(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,13,198,224,0,0             ; addps         0xe0c6(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  68,15,40,37,206,224,0,0             ; movaps        0xe0ce(%rip),%xmm12        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,13,132,225,0,0             ; mulps         0xe184(%rip),%xmm9        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,21,140,225,0,0             ; andps         0xe18c(%rip),%xmm10        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,21,196,222,0,0             ; orps          0xdec4(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,13,140,225,0,0             ; addps         0xe18c(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  68,15,40,37,148,225,0,0             ; movaps        0xe194(%rip),%xmm12        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,88,21,206,224,0,0             ; addps         0xe0ce(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  68,15,40,37,214,224,0,0             ; movaps        0xe0d6(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,21,148,225,0,0             ; addps         0xe194(%rip),%xmm10        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  68,15,40,37,156,225,0,0             ; movaps        0xe19c(%rip),%xmm12        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
@@ -27971,22 +28065,22 @@
   DB  69,15,91,226                        ; cvtdq2ps      %xmm10,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,194,236,1                     ; cmpltps       %xmm12,%xmm13
-  DB  68,15,40,21,192,221,0,0             ; movaps        0xddc0(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,134,222,0,0             ; movaps        0xde86(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,13,164,224,0,0             ; addps         0xe0a4(%rip),%xmm9        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  68,15,40,37,172,224,0,0             ; movaps        0xe0ac(%rip),%xmm12        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,13,106,225,0,0             ; addps         0xe16a(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  68,15,40,37,114,225,0,0             ; movaps        0xe172(%rip),%xmm12        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,40,37,172,224,0,0             ; movaps        0xe0ac(%rip),%xmm12        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,37,114,225,0,0             ; movaps        0xe172(%rip),%xmm12        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  68,15,40,45,176,224,0,0             ; movaps        0xe0b0(%rip),%xmm13        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,45,118,225,0,0             ; movaps        0xe176(%rip),%xmm13        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  69,15,94,236                        ; divps         %xmm12,%xmm13
   DB  69,15,88,233                        ; addps         %xmm9,%xmm13
-  DB  68,15,89,45,176,224,0,0             ; mulps         0xe0b0(%rip),%xmm13        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  68,15,89,45,118,225,0,0             ; mulps         0xe176(%rip),%xmm13        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,69,15,91,205                    ; cvtps2dq      %xmm13,%xmm9
   DB  243,68,15,16,96,20                  ; movss         0x14(%rax),%xmm12
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
@@ -28020,15 +28114,15 @@
   DB  69,15,88,209                        ; addps         %xmm9,%xmm10
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,91,202                        ; cvtdq2ps      %xmm10,%xmm9
-  DB  68,15,89,13,128,223,0,0             ; mulps         0xdf80(%rip),%xmm9        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,21,136,223,0,0             ; andps         0xdf88(%rip),%xmm10        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,21,192,220,0,0             ; orps          0xdcc0(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,13,136,223,0,0             ; addps         0xdf88(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  68,15,40,37,144,223,0,0             ; movaps        0xdf90(%rip),%xmm12        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,13,70,224,0,0              ; mulps         0xe046(%rip),%xmm9        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,21,78,224,0,0              ; andps         0xe04e(%rip),%xmm10        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,21,134,221,0,0             ; orps          0xdd86(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,13,78,224,0,0              ; addps         0xe04e(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  68,15,40,37,86,224,0,0              ; movaps        0xe056(%rip),%xmm12        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,88,21,144,223,0,0             ; addps         0xdf90(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  68,15,40,37,152,223,0,0             ; movaps        0xdf98(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,21,86,224,0,0              ; addps         0xe056(%rip),%xmm10        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  68,15,40,37,94,224,0,0              ; movaps        0xe05e(%rip),%xmm12        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
@@ -28036,22 +28130,22 @@
   DB  69,15,91,226                        ; cvtdq2ps      %xmm10,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,194,236,1                     ; cmpltps       %xmm12,%xmm13
-  DB  68,15,40,21,130,220,0,0             ; movaps        0xdc82(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,72,221,0,0              ; movaps        0xdd48(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,13,102,223,0,0             ; addps         0xdf66(%rip),%xmm9        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  68,15,40,37,110,223,0,0             ; movaps        0xdf6e(%rip),%xmm12        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,13,44,224,0,0              ; addps         0xe02c(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  68,15,40,37,52,224,0,0              ; movaps        0xe034(%rip),%xmm12        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,40,37,110,223,0,0             ; movaps        0xdf6e(%rip),%xmm12        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,37,52,224,0,0              ; movaps        0xe034(%rip),%xmm12        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  68,15,40,45,114,223,0,0             ; movaps        0xdf72(%rip),%xmm13        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,45,56,224,0,0              ; movaps        0xe038(%rip),%xmm13        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  69,15,94,236                        ; divps         %xmm12,%xmm13
   DB  69,15,88,233                        ; addps         %xmm9,%xmm13
-  DB  68,15,89,45,114,223,0,0             ; mulps         0xdf72(%rip),%xmm13        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  68,15,89,45,56,224,0,0              ; mulps         0xe038(%rip),%xmm13        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,69,15,91,205                    ; cvtps2dq      %xmm13,%xmm9
   DB  243,68,15,16,96,20                  ; movss         0x14(%rax),%xmm12
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
@@ -28085,15 +28179,15 @@
   DB  69,15,88,209                        ; addps         %xmm9,%xmm10
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,91,202                        ; cvtdq2ps      %xmm10,%xmm9
-  DB  68,15,89,13,66,222,0,0              ; mulps         0xde42(%rip),%xmm9        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,21,74,222,0,0              ; andps         0xde4a(%rip),%xmm10        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,21,130,219,0,0             ; orps          0xdb82(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,13,74,222,0,0              ; addps         0xde4a(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  68,15,40,37,82,222,0,0              ; movaps        0xde52(%rip),%xmm12        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,13,8,223,0,0               ; mulps         0xdf08(%rip),%xmm9        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,21,16,223,0,0              ; andps         0xdf10(%rip),%xmm10        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,21,72,220,0,0              ; orps          0xdc48(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,13,16,223,0,0              ; addps         0xdf10(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  68,15,40,37,24,223,0,0              ; movaps        0xdf18(%rip),%xmm12        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,88,21,82,222,0,0              ; addps         0xde52(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  68,15,40,37,90,222,0,0              ; movaps        0xde5a(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,21,24,223,0,0              ; addps         0xdf18(%rip),%xmm10        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  68,15,40,37,32,223,0,0              ; movaps        0xdf20(%rip),%xmm12        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
@@ -28101,22 +28195,22 @@
   DB  69,15,91,226                        ; cvtdq2ps      %xmm10,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,194,236,1                     ; cmpltps       %xmm12,%xmm13
-  DB  68,15,40,21,68,219,0,0              ; movaps        0xdb44(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,10,220,0,0              ; movaps        0xdc0a(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,13,40,222,0,0              ; addps         0xde28(%rip),%xmm9        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  68,15,40,37,48,222,0,0              ; movaps        0xde30(%rip),%xmm12        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,13,238,222,0,0             ; addps         0xdeee(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  68,15,40,37,246,222,0,0             ; movaps        0xdef6(%rip),%xmm12        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,40,37,48,222,0,0              ; movaps        0xde30(%rip),%xmm12        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,37,246,222,0,0             ; movaps        0xdef6(%rip),%xmm12        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  68,15,40,45,52,222,0,0              ; movaps        0xde34(%rip),%xmm13        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,45,250,222,0,0             ; movaps        0xdefa(%rip),%xmm13        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  69,15,94,236                        ; divps         %xmm12,%xmm13
   DB  69,15,88,233                        ; addps         %xmm9,%xmm13
-  DB  68,15,89,45,52,222,0,0              ; mulps         0xde34(%rip),%xmm13        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  68,15,89,45,250,222,0,0             ; mulps         0xdefa(%rip),%xmm13        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,69,15,91,205                    ; cvtps2dq      %xmm13,%xmm9
   DB  243,68,15,16,96,20                  ; movss         0x14(%rax),%xmm12
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
@@ -28150,15 +28244,15 @@
   DB  69,15,88,209                        ; addps         %xmm9,%xmm10
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,91,202                        ; cvtdq2ps      %xmm10,%xmm9
-  DB  68,15,89,13,4,221,0,0               ; mulps         0xdd04(%rip),%xmm9        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  68,15,84,21,12,221,0,0              ; andps         0xdd0c(%rip),%xmm10        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,86,21,68,218,0,0              ; orps          0xda44(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
-  DB  68,15,88,13,12,221,0,0              ; addps         0xdd0c(%rip),%xmm9        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
-  DB  68,15,40,37,20,221,0,0              ; movaps        0xdd14(%rip),%xmm12        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,89,13,202,221,0,0             ; mulps         0xddca(%rip),%xmm9        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  68,15,84,21,210,221,0,0             ; andps         0xddd2(%rip),%xmm10        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,86,21,10,219,0,0              ; orps          0xdb0a(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
+  DB  68,15,88,13,210,221,0,0             ; addps         0xddd2(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
+  DB  68,15,40,37,218,221,0,0             ; movaps        0xddda(%rip),%xmm12        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,88,21,20,221,0,0              ; addps         0xdd14(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
-  DB  68,15,40,37,28,221,0,0              ; movaps        0xdd1c(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,88,21,218,221,0,0             ; addps         0xddda(%rip),%xmm10        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
+  DB  68,15,40,37,226,221,0,0             ; movaps        0xdde2(%rip),%xmm12        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  69,15,94,226                        ; divps         %xmm10,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
   DB  69,15,89,203                        ; mulps         %xmm11,%xmm9
@@ -28166,22 +28260,22 @@
   DB  69,15,91,226                        ; cvtdq2ps      %xmm10,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,194,236,1                     ; cmpltps       %xmm12,%xmm13
-  DB  68,15,40,21,6,218,0,0               ; movaps        0xda06(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,204,218,0,0             ; movaps        0xdacc(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,84,234                        ; andps         %xmm10,%xmm13
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
   DB  69,15,40,233                        ; movaps        %xmm9,%xmm13
   DB  69,15,92,236                        ; subps         %xmm12,%xmm13
-  DB  68,15,88,13,234,220,0,0             ; addps         0xdcea(%rip),%xmm9        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
-  DB  68,15,40,37,242,220,0,0             ; movaps        0xdcf2(%rip),%xmm12        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  68,15,88,13,176,221,0,0             ; addps         0xddb0(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
+  DB  68,15,40,37,184,221,0,0             ; movaps        0xddb8(%rip),%xmm12        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  69,15,89,229                        ; mulps         %xmm13,%xmm12
   DB  69,15,92,204                        ; subps         %xmm12,%xmm9
-  DB  68,15,40,37,242,220,0,0             ; movaps        0xdcf2(%rip),%xmm12        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  68,15,40,37,184,221,0,0             ; movaps        0xddb8(%rip),%xmm12        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  69,15,92,229                        ; subps         %xmm13,%xmm12
-  DB  68,15,40,45,246,220,0,0             ; movaps        0xdcf6(%rip),%xmm13        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,45,188,221,0,0             ; movaps        0xddbc(%rip),%xmm13        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  69,15,94,236                        ; divps         %xmm12,%xmm13
   DB  69,15,88,233                        ; addps         %xmm9,%xmm13
-  DB  68,15,89,45,246,220,0,0             ; mulps         0xdcf6(%rip),%xmm13        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  68,15,89,45,188,221,0,0             ; mulps         0xddbc(%rip),%xmm13        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  102,69,15,91,205                    ; cvtps2dq      %xmm13,%xmm9
   DB  243,68,15,16,96,20                  ; movss         0x14(%rax),%xmm12
   DB  69,15,198,228,0                     ; shufps        $0x0,%xmm12,%xmm12
@@ -28205,19 +28299,19 @@
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,91,194                           ; cvtdq2ps      %xmm2,%xmm0
-  DB  15,89,5,254,219,0,0                 ; mulps         0xdbfe(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  15,84,21,7,220,0,0                  ; andps         0xdc07(%rip),%xmm2        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  68,15,40,53,63,217,0,0              ; movaps        0xd93f(%rip),%xmm14        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,89,5,196,220,0,0                 ; mulps         0xdcc4(%rip),%xmm0        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  15,84,21,205,220,0,0                ; andps         0xdccd(%rip),%xmm2        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  68,15,40,53,5,218,0,0               ; movaps        0xda05(%rip),%xmm14        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,86,214                        ; orps          %xmm14,%xmm2
-  DB  68,15,40,37,3,220,0,0               ; movaps        0xdc03(%rip),%xmm12        # 2b9b0 <_sk_srcover_rgba_8888_sse2_lowp+0xd08>
+  DB  68,15,40,37,201,220,0,0             ; movaps        0xdcc9(%rip),%xmm12        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0xd0c>
   DB  65,15,88,196                        ; addps         %xmm12,%xmm0
-  DB  68,15,40,29,7,220,0,0               ; movaps        0xdc07(%rip),%xmm11        # 2b9c0 <_sk_srcover_rgba_8888_sse2_lowp+0xd18>
+  DB  68,15,40,29,205,220,0,0             ; movaps        0xdccd(%rip),%xmm11        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0xd1c>
   DB  15,40,226                           ; movaps        %xmm2,%xmm4
   DB  65,15,89,227                        ; mulps         %xmm11,%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  68,15,40,21,5,220,0,0               ; movaps        0xdc05(%rip),%xmm10        # 2b9d0 <_sk_srcover_rgba_8888_sse2_lowp+0xd28>
+  DB  68,15,40,21,203,220,0,0             ; movaps        0xdccb(%rip),%xmm10        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0xd2c>
   DB  65,15,88,210                        ; addps         %xmm10,%xmm2
-  DB  68,15,40,45,9,220,0,0               ; movaps        0xdc09(%rip),%xmm13        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0xd38>
+  DB  68,15,40,45,207,220,0,0             ; movaps        0xdccf(%rip),%xmm13        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0xd3c>
   DB  65,15,40,229                        ; movaps        %xmm13,%xmm4
   DB  15,94,226                           ; divps         %xmm2,%xmm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -28229,27 +28323,27 @@
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,194,226,1                        ; cmpltps       %xmm2,%xmm4
-  DB  68,15,40,13,233,216,0,0             ; movaps        0xd8e9(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,13,175,217,0,0             ; movaps        0xd9af(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  65,15,84,225                        ; andps         %xmm9,%xmm4
   DB  15,92,212                           ; subps         %xmm4,%xmm2
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,92,226                           ; subps         %xmm2,%xmm4
-  DB  15,40,53,213,219,0,0                ; movaps        0xdbd5(%rip),%xmm6        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0xd48>
+  DB  15,40,53,155,220,0,0                ; movaps        0xdc9b(%rip),%xmm6        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0xd4c>
   DB  15,88,198                           ; addps         %xmm6,%xmm0
-  DB  15,40,61,235,219,0,0                ; movaps        0xdbeb(%rip),%xmm7        # 2ba10 <_sk_srcover_rgba_8888_sse2_lowp+0xd68>
+  DB  15,40,61,177,220,0,0                ; movaps        0xdcb1(%rip),%xmm7        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0xd6c>
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
   DB  15,40,212                           ; movaps        %xmm4,%xmm2
-  DB  15,40,37,203,219,0,0                ; movaps        0xdbcb(%rip),%xmm4        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0xd58>
+  DB  15,40,37,145,220,0,0                ; movaps        0xdc91(%rip),%xmm4        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0xd5c>
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  15,92,194                           ; subps         %xmm2,%xmm0
-  DB  68,15,40,61,221,219,0,0             ; movaps        0xdbdd(%rip),%xmm15        # 2ba20 <_sk_srcover_rgba_8888_sse2_lowp+0xd78>
+  DB  68,15,40,61,163,220,0,0             ; movaps        0xdca3(%rip),%xmm15        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0xd7c>
   DB  65,15,40,215                        ; movaps        %xmm15,%xmm2
   DB  15,94,213                           ; divps         %xmm5,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  15,89,5,57,219,0,0                  ; mulps         0xdb39(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  15,84,13,66,219,0,0                 ; andps         0xdb42(%rip),%xmm1        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
+  DB  15,89,5,255,219,0,0                 ; mulps         0xdbff(%rip),%xmm0        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  15,84,13,8,220,0,0                  ; andps         0xdc08(%rip),%xmm1        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
   DB  65,15,86,206                        ; orps          %xmm14,%xmm1
   DB  65,15,88,196                        ; addps         %xmm12,%xmm0
   DB  15,40,233                           ; movaps        %xmm1,%xmm5
@@ -28279,9 +28373,9 @@
   DB  15,94,206                           ; divps         %xmm6,%xmm1
   DB  15,88,200                           ; addps         %xmm0,%xmm1
   DB  15,91,195                           ; cvtdq2ps      %xmm3,%xmm0
-  DB  15,89,5,200,218,0,0                 ; mulps         0xdac8(%rip),%xmm0        # 2b990 <_sk_srcover_rgba_8888_sse2_lowp+0xce8>
-  DB  15,84,29,209,218,0,0                ; andps         0xdad1(%rip),%xmm3        # 2b9a0 <_sk_srcover_rgba_8888_sse2_lowp+0xcf8>
-  DB  15,86,29,10,216,0,0                 ; orps          0xd80a(%rip),%xmm3        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,89,5,142,219,0,0                 ; mulps         0xdb8e(%rip),%xmm0        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0xcec>
+  DB  15,84,29,151,219,0,0                ; andps         0xdb97(%rip),%xmm3        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0xcfc>
+  DB  15,86,29,208,216,0,0                ; orps          0xd8d0(%rip),%xmm3        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,88,196                        ; addps         %xmm12,%xmm0
   DB  68,15,89,219                        ; mulps         %xmm3,%xmm11
   DB  65,15,92,195                        ; subps         %xmm11,%xmm0
@@ -28303,7 +28397,7 @@
   DB  15,92,253                           ; subps         %xmm5,%xmm7
   DB  68,15,94,255                        ; divps         %xmm7,%xmm15
   DB  68,15,88,248                        ; addps         %xmm0,%xmm15
-  DB  15,40,5,7,219,0,0                   ; movaps        0xdb07(%rip),%xmm0        # 2ba30 <_sk_srcover_rgba_8888_sse2_lowp+0xd88>
+  DB  15,40,5,205,219,0,0                 ; movaps        0xdbcd(%rip),%xmm0        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0xd8c>
   DB  15,89,208                           ; mulps         %xmm0,%xmm2
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
   DB  68,15,89,248                        ; mulps         %xmm0,%xmm15
@@ -28321,29 +28415,29 @@
 
 PUBLIC _sk_lab_to_xyz_sse2
 _sk_lab_to_xyz_sse2 LABEL PROC
-  DB  15,89,5,217,218,0,0                 ; mulps         0xdad9(%rip),%xmm0        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xd98>
-  DB  68,15,40,5,97,216,0,0               ; movaps        0xd861(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  15,89,5,159,219,0,0                 ; mulps         0xdb9f(%rip),%xmm0        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0xd9c>
+  DB  68,15,40,5,39,217,0,0               ; movaps        0xd927(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  65,15,89,200                        ; mulps         %xmm8,%xmm1
-  DB  68,15,40,13,213,218,0,0             ; movaps        0xdad5(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xda8>
+  DB  68,15,40,13,155,219,0,0             ; movaps        0xdb9b(%rip),%xmm9        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0xdac>
   DB  65,15,88,201                        ; addps         %xmm9,%xmm1
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  65,15,88,209                        ; addps         %xmm9,%xmm2
-  DB  15,88,5,210,218,0,0                 ; addps         0xdad2(%rip),%xmm0        # 2ba60 <_sk_srcover_rgba_8888_sse2_lowp+0xdb8>
-  DB  15,89,5,219,218,0,0                 ; mulps         0xdadb(%rip),%xmm0        # 2ba70 <_sk_srcover_rgba_8888_sse2_lowp+0xdc8>
-  DB  15,89,13,228,218,0,0                ; mulps         0xdae4(%rip),%xmm1        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xdd8>
+  DB  15,88,5,152,219,0,0                 ; addps         0xdb98(%rip),%xmm0        # 2bdc0 <_sk_srcover_rgba_8888_sse2_lowp+0xdbc>
+  DB  15,89,5,161,219,0,0                 ; mulps         0xdba1(%rip),%xmm0        # 2bdd0 <_sk_srcover_rgba_8888_sse2_lowp+0xdcc>
+  DB  15,89,13,170,219,0,0                ; mulps         0xdbaa(%rip),%xmm1        # 2bde0 <_sk_srcover_rgba_8888_sse2_lowp+0xddc>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,21,234,218,0,0                ; mulps         0xdaea(%rip),%xmm2        # 2ba90 <_sk_srcover_rgba_8888_sse2_lowp+0xde8>
+  DB  15,89,21,176,219,0,0                ; mulps         0xdbb0(%rip),%xmm2        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0xdec>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  68,15,92,202                        ; subps         %xmm2,%xmm9
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
   DB  68,15,89,225                        ; mulps         %xmm1,%xmm12
-  DB  15,40,21,223,218,0,0                ; movaps        0xdadf(%rip),%xmm2        # 2baa0 <_sk_srcover_rgba_8888_sse2_lowp+0xdf8>
+  DB  15,40,21,165,219,0,0                ; movaps        0xdba5(%rip),%xmm2        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0xdfc>
   DB  68,15,40,194                        ; movaps        %xmm2,%xmm8
   DB  69,15,194,196,1                     ; cmpltps       %xmm12,%xmm8
-  DB  68,15,40,21,222,218,0,0             ; movaps        0xdade(%rip),%xmm10        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0xe08>
+  DB  68,15,40,21,164,219,0,0             ; movaps        0xdba4(%rip),%xmm10        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0xe0c>
   DB  65,15,88,202                        ; addps         %xmm10,%xmm1
-  DB  68,15,40,29,226,218,0,0             ; movaps        0xdae2(%rip),%xmm11        # 2bac0 <_sk_srcover_rgba_8888_sse2_lowp+0xe18>
+  DB  68,15,40,29,168,219,0,0             ; movaps        0xdba8(%rip),%xmm11        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0xe1c>
   DB  65,15,89,203                        ; mulps         %xmm11,%xmm1
   DB  69,15,84,224                        ; andps         %xmm8,%xmm12
   DB  68,15,85,193                        ; andnps        %xmm1,%xmm8
@@ -28367,8 +28461,8 @@
   DB  15,84,194                           ; andps         %xmm2,%xmm0
   DB  65,15,85,209                        ; andnps        %xmm9,%xmm2
   DB  15,86,208                           ; orps          %xmm0,%xmm2
-  DB  68,15,89,5,146,218,0,0              ; mulps         0xda92(%rip),%xmm8        # 2bad0 <_sk_srcover_rgba_8888_sse2_lowp+0xe28>
-  DB  15,89,21,155,218,0,0                ; mulps         0xda9b(%rip),%xmm2        # 2bae0 <_sk_srcover_rgba_8888_sse2_lowp+0xe38>
+  DB  68,15,89,5,88,219,0,0               ; mulps         0xdb58(%rip),%xmm8        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0xe2c>
+  DB  15,89,21,97,219,0,0                 ; mulps         0xdb61(%rip),%xmm2        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0xe3c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -28382,13 +28476,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,46                              ; jne           1e093 <_sk_load_a8_sse2+0x46>
+  DB  117,46                              ; jne           1e32d <_sk_load_a8_sse2+0x46>
   DB  102,67,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  102,15,97,192                       ; punpcklwd     %xmm0,%xmm0
-  DB  102,15,219,5,37,215,0,0             ; pand          0xd725(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,5,235,215,0,0            ; pand          0xd7eb(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,107,216,0,0                ; mulps         0xd86b(%rip),%xmm3        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,29,49,217,0,0                 ; mulps         0xd931(%rip),%xmm3        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,87,201                       ; xorpd         %xmm1,%xmm1
@@ -28397,12 +28491,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            1e0d6 <_sk_load_a8_sse2+0x89>
+  DB  116,54                              ; je            1e370 <_sk_load_a8_sse2+0x89>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e0bf <_sk_load_a8_sse2+0x72>
+  DB  116,21                              ; je            1e359 <_sk_load_a8_sse2+0x72>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           1e073 <_sk_load_a8_sse2+0x26>
+  DB  117,195                             ; jne           1e30d <_sk_load_a8_sse2+0x26>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
@@ -28411,10 +28505,10 @@
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  235,157                             ; jmp           1e073 <_sk_load_a8_sse2+0x26>
+  DB  235,157                             ; jmp           1e30d <_sk_load_a8_sse2+0x26>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,146                             ; jmp           1e073 <_sk_load_a8_sse2+0x26>
+  DB  235,146                             ; jmp           1e30d <_sk_load_a8_sse2+0x26>
 
 PUBLIC _sk_load_a8_dst_sse2
 _sk_load_a8_dst_sse2 LABEL PROC
@@ -28425,13 +28519,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,46                              ; jne           1e127 <_sk_load_a8_dst_sse2+0x46>
+  DB  117,46                              ; jne           1e3c1 <_sk_load_a8_dst_sse2+0x46>
   DB  102,67,15,110,36,16                 ; movd          (%r8,%r10,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,37,145,214,0,0           ; pand          0xd691(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,37,87,215,0,0            ; pand          0xd757(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,252                           ; cvtdq2ps      %xmm4,%xmm7
-  DB  15,89,61,215,215,0,0                ; mulps         0xd7d7(%rip),%xmm7        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,61,157,216,0,0                ; mulps         0xd89d(%rip),%xmm7        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  102,15,87,237                       ; xorpd         %xmm5,%xmm5
@@ -28440,12 +28534,12 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            1e16a <_sk_load_a8_dst_sse2+0x89>
+  DB  116,54                              ; je            1e404 <_sk_load_a8_dst_sse2+0x89>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e153 <_sk_load_a8_dst_sse2+0x72>
+  DB  116,21                              ; je            1e3ed <_sk_load_a8_dst_sse2+0x72>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,195                             ; jne           1e107 <_sk_load_a8_dst_sse2+0x26>
+  DB  117,195                             ; jne           1e3a1 <_sk_load_a8_dst_sse2+0x26>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
@@ -28454,30 +28548,44 @@
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  102,15,97,232                       ; punpcklwd     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  235,157                             ; jmp           1e107 <_sk_load_a8_dst_sse2+0x26>
+  DB  235,157                             ; jmp           1e3a1 <_sk_load_a8_dst_sse2+0x26>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,146                             ; jmp           1e107 <_sk_load_a8_dst_sse2+0x26>
+  DB  235,146                             ; jmp           1e3a1 <_sk_load_a8_dst_sse2+0x26>
 
 PUBLIC _sk_gather_a8_sse2
 _sk_gather_a8_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,88,12                     ; movss         0xc(%rax),%xmm3
+  DB  15,198,219,0                        ; shufps        $0x0,%xmm3,%xmm3
+  DB  102,69,15,118,201                   ; pcmpeqd       %xmm9,%xmm9
+  DB  102,65,15,254,217                   ; paddd         %xmm9,%xmm3
+  DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,208                           ; maxps         %xmm0,%xmm2
+  DB  15,93,211                           ; minps         %xmm3,%xmm2
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
-  DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
-  DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,216,245                  ; pshufd        $0xf5,%xmm0,%xmm3
+  DB  102,15,244,217                      ; pmuludq       %xmm1,%xmm3
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
+  DB  102,15,112,203,232                  ; pshufd        $0xe8,%xmm3,%xmm1
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,202                       ; cvttps2dq     %xmm2,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,15,112,192,78                   ; pshufd        $0x4e,%xmm0,%xmm0
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
   DB  102,73,15,126,194                   ; movq          %xmm0,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
@@ -28491,15 +28599,14 @@
   DB  68,9,200                            ; or            %r9d,%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,65,15,196,194,1                 ; pinsrw        $0x1,%r10d,%xmm0
-  DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,15,96,193                       ; punpcklbw     %xmm1,%xmm0
-  DB  102,15,97,193                       ; punpcklwd     %xmm1,%xmm0
+  DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
+  DB  102,65,15,97,192                    ; punpcklwd     %xmm8,%xmm0
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,29,231,214,0,0                ; mulps         0xd6e7(%rip),%xmm3        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,29,119,215,0,0                ; mulps         0xd777(%rip),%xmm3        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_a8_sse2
@@ -28511,7 +28618,7 @@
   DB  77,15,175,193                       ; imul          %r9,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
-  DB  68,15,40,5,153,213,0,0              ; movaps        0xd599(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,42,214,0,0               ; movaps        0xd62a(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  68,15,89,195                        ; mulps         %xmm3,%xmm8
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
   DB  102,65,15,114,240,16                ; pslld         $0x10,%xmm8
@@ -28519,7 +28626,7 @@
   DB  102,68,15,107,192                   ; packssdw      %xmm0,%xmm8
   DB  102,68,15,103,192                   ; packuswb      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,17                              ; jne           1e26c <_sk_store_a8_sse2+0x54>
+  DB  117,17                              ; jne           1e53b <_sk_store_a8_sse2+0x54>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  67,137,4,16                         ; mov           %eax,(%r8,%r10,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -28530,22 +28637,22 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            1e2b9 <_sk_store_a8_sse2+0xa1>
+  DB  116,54                              ; je            1e588 <_sk_store_a8_sse2+0xa1>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,17                              ; je            1e29a <_sk_store_a8_sse2+0x82>
+  DB  116,17                              ; je            1e569 <_sk_store_a8_sse2+0x82>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,213                             ; jne           1e264 <_sk_store_a8_sse2+0x4c>
+  DB  117,213                             ; jne           1e533 <_sk_store_a8_sse2+0x4c>
   DB  102,65,15,197,192,4                 ; pextrw        $0x4,%xmm8,%eax
   DB  67,136,68,16,2                      ; mov           %al,0x2(%r8,%r10,1)
-  DB  102,68,15,219,5,253,212,0,0         ; pand          0xd4fd(%rip),%xmm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,68,15,219,5,142,213,0,0         ; pand          0xd58e(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,67,137,4,16                     ; mov           %ax,(%r8,%r10,1)
-  DB  235,171                             ; jmp           1e264 <_sk_store_a8_sse2+0x4c>
+  DB  235,171                             ; jmp           1e533 <_sk_store_a8_sse2+0x4c>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  67,136,4,16                         ; mov           %al,(%r8,%r10,1)
-  DB  235,160                             ; jmp           1e264 <_sk_store_a8_sse2+0x4c>
+  DB  235,160                             ; jmp           1e533 <_sk_store_a8_sse2+0x4c>
 
 PUBLIC _sk_load_g8_sse2
 _sk_load_g8_sse2 LABEL PROC
@@ -28556,27 +28663,27 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,49                              ; jne           1e30d <_sk_load_g8_sse2+0x49>
+  DB  117,49                              ; jne           1e5dc <_sk_load_g8_sse2+0x49>
   DB  102,67,15,110,4,16                  ; movd          (%r8,%r10,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  102,15,97,192                       ; punpcklwd     %xmm0,%xmm0
-  DB  102,15,219,5,174,212,0,0            ; pand          0xd4ae(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,5,63,213,0,0             ; pand          0xd53f(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,244,213,0,0                 ; mulps         0xd5f4(%rip),%xmm0        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,5,133,214,0,0                 ; mulps         0xd685(%rip),%xmm0        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,235,211,0,0                ; movaps        0xd3eb(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,124,212,0,0                ; movaps        0xd47c(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            1e350 <_sk_load_g8_sse2+0x8c>
+  DB  116,54                              ; je            1e61f <_sk_load_g8_sse2+0x8c>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e339 <_sk_load_g8_sse2+0x75>
+  DB  116,21                              ; je            1e608 <_sk_load_g8_sse2+0x75>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           1e2ea <_sk_load_g8_sse2+0x26>
+  DB  117,192                             ; jne           1e5b9 <_sk_load_g8_sse2+0x26>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
@@ -28585,10 +28692,10 @@
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  235,154                             ; jmp           1e2ea <_sk_load_g8_sse2+0x26>
+  DB  235,154                             ; jmp           1e5b9 <_sk_load_g8_sse2+0x26>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,143                             ; jmp           1e2ea <_sk_load_g8_sse2+0x26>
+  DB  235,143                             ; jmp           1e5b9 <_sk_load_g8_sse2+0x26>
 
 PUBLIC _sk_load_g8_dst_sse2
 _sk_load_g8_dst_sse2 LABEL PROC
@@ -28599,27 +28706,27 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,49                              ; jne           1e3a4 <_sk_load_g8_dst_sse2+0x49>
+  DB  117,49                              ; jne           1e673 <_sk_load_g8_dst_sse2+0x49>
   DB  102,67,15,110,36,16                 ; movd          (%r8,%r10,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,37,23,212,0,0            ; pand          0xd417(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,219,37,168,212,0,0           ; pand          0xd4a8(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,93,213,0,0                 ; mulps         0xd55d(%rip),%xmm4        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,37,238,213,0,0                ; mulps         0xd5ee(%rip),%xmm4        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,84,211,0,0                 ; movaps        0xd354(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,61,229,211,0,0                ; movaps        0xd3e5(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,54                              ; je            1e3e7 <_sk_load_g8_dst_sse2+0x8c>
+  DB  116,54                              ; je            1e6b6 <_sk_load_g8_dst_sse2+0x8c>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e3d0 <_sk_load_g8_dst_sse2+0x75>
+  DB  116,21                              ; je            1e69f <_sk_load_g8_dst_sse2+0x75>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,192                             ; jne           1e381 <_sk_load_g8_dst_sse2+0x26>
+  DB  117,192                             ; jne           1e650 <_sk_load_g8_dst_sse2+0x26>
   DB  67,15,182,68,16,2                   ; movzbl        0x2(%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
@@ -28628,30 +28735,44 @@
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  102,15,97,232                       ; punpcklwd     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  235,154                             ; jmp           1e381 <_sk_load_g8_dst_sse2+0x26>
+  DB  235,154                             ; jmp           1e650 <_sk_load_g8_dst_sse2+0x26>
   DB  67,15,182,4,16                      ; movzbl        (%r8,%r10,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,143                             ; jmp           1e381 <_sk_load_g8_dst_sse2+0x26>
+  DB  235,143                             ; jmp           1e650 <_sk_load_g8_dst_sse2+0x26>
 
 PUBLIC _sk_gather_g8_sse2
 _sk_gather_g8_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,88,12                     ; movss         0xc(%rax),%xmm3
+  DB  15,198,219,0                        ; shufps        $0x0,%xmm3,%xmm3
+  DB  102,69,15,118,201                   ; pcmpeqd       %xmm9,%xmm9
+  DB  102,65,15,254,217                   ; paddd         %xmm9,%xmm3
+  DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,208                           ; maxps         %xmm0,%xmm2
+  DB  15,93,211                           ; minps         %xmm3,%xmm2
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
-  DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
-  DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,216,245                  ; pshufd        $0xf5,%xmm0,%xmm3
+  DB  102,15,244,217                      ; pmuludq       %xmm1,%xmm3
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
+  DB  102,15,112,203,232                  ; pshufd        $0xe8,%xmm3,%xmm1
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,202                       ; cvttps2dq     %xmm2,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,15,112,192,78                   ; pshufd        $0x4e,%xmm0,%xmm0
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
   DB  102,73,15,126,194                   ; movq          %xmm0,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
@@ -28665,13 +28786,12 @@
   DB  68,9,200                            ; or            %r9d,%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,65,15,196,194,1                 ; pinsrw        $0x1,%r10d,%xmm0
-  DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  102,15,96,193                       ; punpcklbw     %xmm1,%xmm0
-  DB  102,15,97,193                       ; punpcklwd     %xmm1,%xmm0
+  DB  102,65,15,96,192                    ; punpcklbw     %xmm8,%xmm0
+  DB  102,65,15,97,192                    ; punpcklwd     %xmm8,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,106,212,0,0                 ; mulps         0xd46a(%rip),%xmm0        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  15,89,5,197,212,0,0                 ; mulps         0xd4c5(%rip),%xmm0        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,97,210,0,0                 ; movaps        0xd261(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,188,210,0,0                ; movaps        0xd2bc(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
@@ -28686,42 +28806,42 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,83                              ; jne           1e505 <_sk_load_565_sse2+0x6e>
+  DB  117,83                              ; jne           1e80a <_sk_load_565_sse2+0x6e>
   DB  243,67,15,126,20,80                 ; movq          (%r8,%r10,2),%xmm2
   DB  102,15,97,208                       ; punpcklwd     %xmm0,%xmm2
-  DB  102,15,111,5,60,212,0,0             ; movdqa        0xd43c(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,5,151,212,0,0            ; movdqa        0xd497(%rip),%xmm0        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,62,212,0,0                  ; mulps         0xd43e(%rip),%xmm0        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,13,70,212,0,0            ; movdqa        0xd446(%rip),%xmm1        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  15,89,5,153,212,0,0                 ; mulps         0xd499(%rip),%xmm0        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,13,161,212,0,0           ; movdqa        0xd4a1(%rip),%xmm1        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,72,212,0,0                 ; mulps         0xd448(%rip),%xmm1        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,15,219,21,80,212,0,0            ; pand          0xd450(%rip),%xmm2        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  15,89,13,163,212,0,0                ; mulps         0xd4a3(%rip),%xmm1        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,15,219,21,171,212,0,0           ; pand          0xd4ab(%rip),%xmm2        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,86,212,0,0                 ; mulps         0xd456(%rip),%xmm2        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  15,89,21,177,212,0,0                ; mulps         0xd4b1(%rip),%xmm2        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,237,209,0,0                ; movaps        0xd1ed(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,72,210,0,0                 ; movaps        0xd248(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            1e545 <_sk_load_565_sse2+0xae>
+  DB  116,51                              ; je            1e84a <_sk_load_565_sse2+0xae>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e531 <_sk_load_565_sse2+0x9a>
+  DB  116,21                              ; je            1e836 <_sk_load_565_sse2+0x9a>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           1e4bc <_sk_load_565_sse2+0x25>
+  DB  117,154                             ; jne           1e7c1 <_sk_load_565_sse2+0x25>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,208,69                   ; pshufd        $0x45,%xmm0,%xmm2
   DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
   DB  242,15,112,192,212                  ; pshuflw       $0xd4,%xmm0,%xmm0
   DB  242,15,16,208                       ; movsd         %xmm0,%xmm2
-  DB  233,119,255,255,255                 ; jmpq          1e4bc <_sk_load_565_sse2+0x25>
+  DB  233,119,255,255,255                 ; jmpq          1e7c1 <_sk_load_565_sse2+0x25>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,208                      ; movd          %eax,%xmm2
-  DB  233,105,255,255,255                 ; jmpq          1e4bc <_sk_load_565_sse2+0x25>
+  DB  233,105,255,255,255                 ; jmpq          1e7c1 <_sk_load_565_sse2+0x25>
 
 PUBLIC _sk_load_565_dst_sse2
 _sk_load_565_dst_sse2 LABEL PROC
@@ -28733,63 +28853,77 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,83                              ; jne           1e5c1 <_sk_load_565_dst_sse2+0x6e>
+  DB  117,83                              ; jne           1e8c6 <_sk_load_565_dst_sse2+0x6e>
   DB  243,67,15,126,52,80                 ; movq          (%r8,%r10,2),%xmm6
   DB  102,15,97,240                       ; punpcklwd     %xmm0,%xmm6
-  DB  102,15,111,37,128,211,0,0           ; movdqa        0xd380(%rip),%xmm4        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,15,111,37,219,211,0,0           ; movdqa        0xd3db(%rip),%xmm4        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,130,211,0,0                ; mulps         0xd382(%rip),%xmm4        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,45,138,211,0,0           ; movdqa        0xd38a(%rip),%xmm5        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  15,89,37,221,211,0,0                ; mulps         0xd3dd(%rip),%xmm4        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,45,229,211,0,0           ; movdqa        0xd3e5(%rip),%xmm5        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,15,219,238                      ; pand          %xmm6,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,140,211,0,0                ; mulps         0xd38c(%rip),%xmm5        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,15,219,53,148,211,0,0           ; pand          0xd394(%rip),%xmm6        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  15,89,45,231,211,0,0                ; mulps         0xd3e7(%rip),%xmm5        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,15,219,53,239,211,0,0           ; pand          0xd3ef(%rip),%xmm6        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,154,211,0,0                ; mulps         0xd39a(%rip),%xmm6        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  15,89,53,245,211,0,0                ; mulps         0xd3f5(%rip),%xmm6        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,49,209,0,0                 ; movaps        0xd131(%rip),%xmm7        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,61,140,209,0,0                ; movaps        0xd18c(%rip),%xmm7        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            1e601 <_sk_load_565_dst_sse2+0xae>
+  DB  116,51                              ; je            1e906 <_sk_load_565_dst_sse2+0xae>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e5ed <_sk_load_565_dst_sse2+0x9a>
+  DB  116,21                              ; je            1e8f2 <_sk_load_565_dst_sse2+0x9a>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,154                             ; jne           1e578 <_sk_load_565_dst_sse2+0x25>
+  DB  117,154                             ; jne           1e87d <_sk_load_565_dst_sse2+0x25>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,244,69                   ; pshufd        $0x45,%xmm4,%xmm6
   DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
   DB  242,15,112,228,212                  ; pshuflw       $0xd4,%xmm4,%xmm4
   DB  242,15,16,244                       ; movsd         %xmm4,%xmm6
-  DB  233,119,255,255,255                 ; jmpq          1e578 <_sk_load_565_dst_sse2+0x25>
+  DB  233,119,255,255,255                 ; jmpq          1e87d <_sk_load_565_dst_sse2+0x25>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,240                      ; movd          %eax,%xmm6
-  DB  233,105,255,255,255                 ; jmpq          1e578 <_sk_load_565_dst_sse2+0x25>
+  DB  233,105,255,255,255                 ; jmpq          1e87d <_sk_load_565_dst_sse2+0x25>
 
 PUBLIC _sk_gather_565_sse2
 _sk_gather_565_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,88,12                     ; movss         0xc(%rax),%xmm3
+  DB  15,198,219,0                        ; shufps        $0x0,%xmm3,%xmm3
+  DB  102,69,15,118,201                   ; pcmpeqd       %xmm9,%xmm9
+  DB  102,65,15,254,217                   ; paddd         %xmm9,%xmm3
+  DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,208                           ; maxps         %xmm0,%xmm2
+  DB  15,93,211                           ; minps         %xmm3,%xmm2
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
-  DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
-  DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,216,245                  ; pshufd        $0xf5,%xmm0,%xmm3
+  DB  102,15,244,217                      ; pmuludq       %xmm1,%xmm3
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
+  DB  102,15,112,203,232                  ; pshufd        $0xe8,%xmm3,%xmm1
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,202                       ; cvttps2dq     %xmm2,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,73,15,126,194                   ; movq          %xmm0,%r10
+  DB  102,73,15,126,202                   ; movq          %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
   DB  71,15,183,20,80                     ; movzwl        (%r8,%r10,2),%r10d
@@ -28800,21 +28934,20 @@
   DB  102,65,15,196,209,2                 ; pinsrw        $0x2,%r9d,%xmm2
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,208,3                    ; pinsrw        $0x3,%eax,%xmm2
-  DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  102,15,97,208                       ; punpcklwd     %xmm0,%xmm2
-  DB  102,15,111,5,100,210,0,0            ; movdqa        0xd264(%rip),%xmm0        # 2b900 <_sk_srcover_rgba_8888_sse2_lowp+0xc58>
+  DB  102,65,15,97,208                    ; punpcklwd     %xmm8,%xmm2
+  DB  102,15,111,5,138,210,0,0            ; movdqa        0xd28a(%rip),%xmm0        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xc5c>
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,102,210,0,0                 ; mulps         0xd266(%rip),%xmm0        # 2b910 <_sk_srcover_rgba_8888_sse2_lowp+0xc68>
-  DB  102,15,111,13,110,210,0,0           ; movdqa        0xd26e(%rip),%xmm1        # 2b920 <_sk_srcover_rgba_8888_sse2_lowp+0xc78>
+  DB  15,89,5,140,210,0,0                 ; mulps         0xd28c(%rip),%xmm0        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xc6c>
+  DB  102,15,111,13,148,210,0,0           ; movdqa        0xd294(%rip),%xmm1        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xc7c>
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,112,210,0,0                ; mulps         0xd270(%rip),%xmm1        # 2b930 <_sk_srcover_rgba_8888_sse2_lowp+0xc88>
-  DB  102,15,219,21,120,210,0,0           ; pand          0xd278(%rip),%xmm2        # 2b940 <_sk_srcover_rgba_8888_sse2_lowp+0xc98>
+  DB  15,89,13,150,210,0,0                ; mulps         0xd296(%rip),%xmm1        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xc8c>
+  DB  102,15,219,21,158,210,0,0           ; pand          0xd29e(%rip),%xmm2        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xc9c>
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,126,210,0,0                ; mulps         0xd27e(%rip),%xmm2        # 2b950 <_sk_srcover_rgba_8888_sse2_lowp+0xca8>
+  DB  15,89,21,164,210,0,0                ; mulps         0xd2a4(%rip),%xmm2        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0xcac>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,21,208,0,0                 ; movaps        0xd015(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,59,208,0,0                 ; movaps        0xd03b(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_store_565_sse2
@@ -28826,12 +28959,12 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
-  DB  68,15,40,5,5,212,0,0                ; movaps        0xd405(%rip),%xmm8        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xe58>
+  DB  68,15,40,5,43,212,0,0               ; movaps        0xd42b(%rip),%xmm8        # 2be60 <_sk_srcover_rgba_8888_sse2_lowp+0xe5c>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
   DB  102,65,15,114,241,11                ; pslld         $0xb,%xmm9
-  DB  68,15,40,21,250,211,0,0             ; movaps        0xd3fa(%rip),%xmm10        # 2bb10 <_sk_srcover_rgba_8888_sse2_lowp+0xe68>
+  DB  68,15,40,21,32,212,0,0              ; movaps        0xd420(%rip),%xmm10        # 2be70 <_sk_srcover_rgba_8888_sse2_lowp+0xe6c>
   DB  68,15,89,209                        ; mulps         %xmm1,%xmm10
   DB  102,69,15,91,210                    ; cvtps2dq      %xmm10,%xmm10
   DB  102,65,15,114,242,5                 ; pslld         $0x5,%xmm10
@@ -28843,7 +28976,7 @@
   DB  102,65,15,114,224,16                ; psrad         $0x10,%xmm8
   DB  102,68,15,107,192                   ; packssdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1e758 <_sk_store_565_sse2+0x7b>
+  DB  117,10                              ; jne           1ea92 <_sk_store_565_sse2+0x7b>
   DB  102,71,15,214,4,80                  ; movq          %xmm8,(%r8,%r10,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -28851,19 +28984,19 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,38                              ; je            1e790 <_sk_store_565_sse2+0xb3>
+  DB  116,38                              ; je            1eaca <_sk_store_565_sse2+0xb3>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            1e782 <_sk_store_565_sse2+0xa5>
+  DB  116,18                              ; je            1eabc <_sk_store_565_sse2+0xa5>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,222                             ; jne           1e754 <_sk_store_565_sse2+0x77>
+  DB  117,222                             ; jne           1ea8e <_sk_store_565_sse2+0x77>
   DB  102,65,15,197,192,4                 ; pextrw        $0x4,%xmm8,%eax
   DB  102,67,137,68,80,4                  ; mov           %ax,0x4(%r8,%r10,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
   DB  102,71,15,126,4,80                  ; movd          %xmm8,(%r8,%r10,2)
-  DB  235,196                             ; jmp           1e754 <_sk_store_565_sse2+0x77>
+  DB  235,196                             ; jmp           1ea8e <_sk_store_565_sse2+0x77>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,67,137,4,80                     ; mov           %ax,(%r8,%r10,2)
-  DB  235,184                             ; jmp           1e754 <_sk_store_565_sse2+0x77>
+  DB  235,184                             ; jmp           1ea8e <_sk_store_565_sse2+0x77>
 
 PUBLIC _sk_load_4444_sse2
 _sk_load_4444_sse2 LABEL PROC
@@ -28875,45 +29008,45 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           1e819 <_sk_load_4444_sse2+0x7d>
+  DB  117,98                              ; jne           1eb53 <_sk_load_4444_sse2+0x7d>
   DB  243,67,15,126,28,80                 ; movq          (%r8,%r10,2),%xmm3
   DB  102,15,97,216                       ; punpcklwd     %xmm0,%xmm3
-  DB  102,15,111,5,87,211,0,0             ; movdqa        0xd357(%rip),%xmm0        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xe78>
+  DB  102,15,111,5,125,211,0,0            ; movdqa        0xd37d(%rip),%xmm0        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0xe7c>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,89,211,0,0                  ; mulps         0xd359(%rip),%xmm0        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xe88>
-  DB  102,15,111,13,97,211,0,0            ; movdqa        0xd361(%rip),%xmm1        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xe98>
+  DB  15,89,5,127,211,0,0                 ; mulps         0xd37f(%rip),%xmm0        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0xe8c>
+  DB  102,15,111,13,135,211,0,0           ; movdqa        0xd387(%rip),%xmm1        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0xe9c>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,99,211,0,0                 ; mulps         0xd363(%rip),%xmm1        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xea8>
-  DB  102,15,111,21,107,211,0,0           ; movdqa        0xd36b(%rip),%xmm2        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xeb8>
+  DB  15,89,13,137,211,0,0                ; mulps         0xd389(%rip),%xmm1        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0xeac>
+  DB  102,15,111,21,145,211,0,0           ; movdqa        0xd391(%rip),%xmm2        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0xebc>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,109,211,0,0                ; mulps         0xd36d(%rip),%xmm2        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xec8>
-  DB  102,15,219,29,117,211,0,0           ; pand          0xd375(%rip),%xmm3        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xed8>
+  DB  15,89,21,147,211,0,0                ; mulps         0xd393(%rip),%xmm2        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0xecc>
+  DB  102,15,219,29,155,211,0,0           ; pand          0xd39b(%rip),%xmm3        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0xedc>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,123,211,0,0                ; mulps         0xd37b(%rip),%xmm3        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xee8>
+  DB  15,89,29,161,211,0,0                ; mulps         0xd3a1(%rip),%xmm3        # 2bef0 <_sk_srcover_rgba_8888_sse2_lowp+0xeec>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            1e859 <_sk_load_4444_sse2+0xbd>
+  DB  116,51                              ; je            1eb93 <_sk_load_4444_sse2+0xbd>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e845 <_sk_load_4444_sse2+0xa9>
+  DB  116,21                              ; je            1eb7f <_sk_load_4444_sse2+0xa9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           1e7c1 <_sk_load_4444_sse2+0x25>
+  DB  117,139                             ; jne           1eafb <_sk_load_4444_sse2+0x25>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,67,15,110,4,80                  ; movd          (%r8,%r10,2),%xmm0
   DB  242,15,112,192,212                  ; pshuflw       $0xd4,%xmm0,%xmm0
   DB  242,15,16,216                       ; movsd         %xmm0,%xmm3
-  DB  233,104,255,255,255                 ; jmpq          1e7c1 <_sk_load_4444_sse2+0x25>
+  DB  233,104,255,255,255                 ; jmpq          1eafb <_sk_load_4444_sse2+0x25>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  233,90,255,255,255                  ; jmpq          1e7c1 <_sk_load_4444_sse2+0x25>
+  DB  233,90,255,255,255                  ; jmpq          1eafb <_sk_load_4444_sse2+0x25>
 
 PUBLIC _sk_load_4444_dst_sse2
 _sk_load_4444_dst_sse2 LABEL PROC
@@ -28925,66 +29058,80 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           1e8e4 <_sk_load_4444_dst_sse2+0x7d>
+  DB  117,98                              ; jne           1ec1e <_sk_load_4444_dst_sse2+0x7d>
   DB  243,67,15,126,60,80                 ; movq          (%r8,%r10,2),%xmm7
   DB  102,15,97,248                       ; punpcklwd     %xmm0,%xmm7
-  DB  102,15,111,37,140,210,0,0           ; movdqa        0xd28c(%rip),%xmm4        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xe78>
+  DB  102,15,111,37,178,210,0,0           ; movdqa        0xd2b2(%rip),%xmm4        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0xe7c>
   DB  102,15,219,231                      ; pand          %xmm7,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,37,142,210,0,0                ; mulps         0xd28e(%rip),%xmm4        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xe88>
-  DB  102,15,111,45,150,210,0,0           ; movdqa        0xd296(%rip),%xmm5        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xe98>
+  DB  15,89,37,180,210,0,0                ; mulps         0xd2b4(%rip),%xmm4        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0xe8c>
+  DB  102,15,111,45,188,210,0,0           ; movdqa        0xd2bc(%rip),%xmm5        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0xe9c>
   DB  102,15,219,239                      ; pand          %xmm7,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,45,152,210,0,0                ; mulps         0xd298(%rip),%xmm5        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xea8>
-  DB  102,15,111,53,160,210,0,0           ; movdqa        0xd2a0(%rip),%xmm6        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xeb8>
+  DB  15,89,45,190,210,0,0                ; mulps         0xd2be(%rip),%xmm5        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0xeac>
+  DB  102,15,111,53,198,210,0,0           ; movdqa        0xd2c6(%rip),%xmm6        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0xebc>
   DB  102,15,219,247                      ; pand          %xmm7,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,53,162,210,0,0                ; mulps         0xd2a2(%rip),%xmm6        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xec8>
-  DB  102,15,219,61,170,210,0,0           ; pand          0xd2aa(%rip),%xmm7        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xed8>
+  DB  15,89,53,200,210,0,0                ; mulps         0xd2c8(%rip),%xmm6        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0xecc>
+  DB  102,15,219,61,208,210,0,0           ; pand          0xd2d0(%rip),%xmm7        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0xedc>
   DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  15,89,61,176,210,0,0                ; mulps         0xd2b0(%rip),%xmm7        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xee8>
+  DB  15,89,61,214,210,0,0                ; mulps         0xd2d6(%rip),%xmm7        # 2bef0 <_sk_srcover_rgba_8888_sse2_lowp+0xeec>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,51                              ; je            1e924 <_sk_load_4444_dst_sse2+0xbd>
+  DB  116,51                              ; je            1ec5e <_sk_load_4444_dst_sse2+0xbd>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,21                              ; je            1e910 <_sk_load_4444_dst_sse2+0xa9>
+  DB  116,21                              ; je            1ec4a <_sk_load_4444_dst_sse2+0xa9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,139                             ; jne           1e88c <_sk_load_4444_dst_sse2+0x25>
+  DB  117,139                             ; jne           1ebc6 <_sk_load_4444_dst_sse2+0x25>
   DB  67,15,183,68,80,4                   ; movzwl        0x4(%r8,%r10,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,112,252,69                   ; pshufd        $0x45,%xmm4,%xmm7
   DB  102,67,15,110,36,80                 ; movd          (%r8,%r10,2),%xmm4
   DB  242,15,112,228,212                  ; pshuflw       $0xd4,%xmm4,%xmm4
   DB  242,15,16,252                       ; movsd         %xmm4,%xmm7
-  DB  233,104,255,255,255                 ; jmpq          1e88c <_sk_load_4444_dst_sse2+0x25>
+  DB  233,104,255,255,255                 ; jmpq          1ebc6 <_sk_load_4444_dst_sse2+0x25>
   DB  67,15,183,4,80                      ; movzwl        (%r8,%r10,2),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  233,90,255,255,255                  ; jmpq          1e88c <_sk_load_4444_dst_sse2+0x25>
+  DB  233,90,255,255,255                  ; jmpq          1ebc6 <_sk_load_4444_dst_sse2+0x25>
 
 PUBLIC _sk_gather_4444_sse2
 _sk_gather_4444_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,88,12                     ; movss         0xc(%rax),%xmm3
+  DB  15,198,219,0                        ; shufps        $0x0,%xmm3,%xmm3
+  DB  102,69,15,118,201                   ; pcmpeqd       %xmm9,%xmm9
+  DB  102,65,15,254,217                   ; paddd         %xmm9,%xmm3
+  DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,208                           ; maxps         %xmm0,%xmm2
+  DB  15,93,211                           ; minps         %xmm3,%xmm2
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
-  DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
-  DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,216,245                  ; pshufd        $0xf5,%xmm0,%xmm3
+  DB  102,15,244,217                      ; pmuludq       %xmm1,%xmm3
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
+  DB  102,15,112,203,232                  ; pshufd        $0xe8,%xmm3,%xmm1
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,202                       ; cvttps2dq     %xmm2,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,73,15,126,194                   ; movq          %xmm0,%r10
+  DB  102,73,15,126,202                   ; movq          %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
   DB  71,15,183,20,80                     ; movzwl        (%r8,%r10,2),%r10d
@@ -28995,23 +29142,22 @@
   DB  102,65,15,196,217,2                 ; pinsrw        $0x2,%r9d,%xmm3
   DB  65,15,183,4,64                      ; movzwl        (%r8,%rax,2),%eax
   DB  102,15,196,216,3                    ; pinsrw        $0x3,%eax,%xmm3
-  DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  102,15,97,216                       ; punpcklwd     %xmm0,%xmm3
-  DB  102,15,111,5,97,209,0,0             ; movdqa        0xd161(%rip),%xmm0        # 2bb20 <_sk_srcover_rgba_8888_sse2_lowp+0xe78>
+  DB  102,65,15,97,216                    ; punpcklwd     %xmm8,%xmm3
+  DB  102,15,111,5,82,209,0,0             ; movdqa        0xd152(%rip),%xmm0        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0xe7c>
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,5,99,209,0,0                  ; mulps         0xd163(%rip),%xmm0        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xe88>
-  DB  102,15,111,13,107,209,0,0           ; movdqa        0xd16b(%rip),%xmm1        # 2bb40 <_sk_srcover_rgba_8888_sse2_lowp+0xe98>
+  DB  15,89,5,84,209,0,0                  ; mulps         0xd154(%rip),%xmm0        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0xe8c>
+  DB  102,15,111,13,92,209,0,0            ; movdqa        0xd15c(%rip),%xmm1        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0xe9c>
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,13,109,209,0,0                ; mulps         0xd16d(%rip),%xmm1        # 2bb50 <_sk_srcover_rgba_8888_sse2_lowp+0xea8>
-  DB  102,15,111,21,117,209,0,0           ; movdqa        0xd175(%rip),%xmm2        # 2bb60 <_sk_srcover_rgba_8888_sse2_lowp+0xeb8>
+  DB  15,89,13,94,209,0,0                 ; mulps         0xd15e(%rip),%xmm1        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0xeac>
+  DB  102,15,111,21,102,209,0,0           ; movdqa        0xd166(%rip),%xmm2        # 2bec0 <_sk_srcover_rgba_8888_sse2_lowp+0xebc>
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,21,119,209,0,0                ; mulps         0xd177(%rip),%xmm2        # 2bb70 <_sk_srcover_rgba_8888_sse2_lowp+0xec8>
-  DB  102,15,219,29,127,209,0,0           ; pand          0xd17f(%rip),%xmm3        # 2bb80 <_sk_srcover_rgba_8888_sse2_lowp+0xed8>
+  DB  15,89,21,104,209,0,0                ; mulps         0xd168(%rip),%xmm2        # 2bed0 <_sk_srcover_rgba_8888_sse2_lowp+0xecc>
+  DB  102,15,219,29,112,209,0,0           ; pand          0xd170(%rip),%xmm3        # 2bee0 <_sk_srcover_rgba_8888_sse2_lowp+0xedc>
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,29,133,209,0,0                ; mulps         0xd185(%rip),%xmm3        # 2bb90 <_sk_srcover_rgba_8888_sse2_lowp+0xee8>
+  DB  15,89,29,118,209,0,0                ; mulps         0xd176(%rip),%xmm3        # 2bef0 <_sk_srcover_rgba_8888_sse2_lowp+0xeec>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -29024,7 +29170,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  76,99,210                           ; movslq        %edx,%r10
-  DB  68,15,40,5,115,209,0,0              ; movaps        0xd173(%rip),%xmm8        # 2bba0 <_sk_srcover_rgba_8888_sse2_lowp+0xef8>
+  DB  68,15,40,5,100,209,0,0              ; movaps        0xd164(%rip),%xmm8        # 2bf00 <_sk_srcover_rgba_8888_sse2_lowp+0xefc>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
@@ -29046,7 +29192,7 @@
   DB  102,65,15,114,224,16                ; psrad         $0x10,%xmm8
   DB  102,68,15,107,192                   ; packssdw      %xmm0,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1ea9e <_sk_store_4444_sse2+0x8f>
+  DB  117,10                              ; jne           1ee0d <_sk_store_4444_sse2+0x8f>
   DB  102,71,15,214,4,80                  ; movq          %xmm8,(%r8,%r10,2)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -29054,19 +29200,19 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,38                              ; je            1ead6 <_sk_store_4444_sse2+0xc7>
+  DB  116,38                              ; je            1ee45 <_sk_store_4444_sse2+0xc7>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,18                              ; je            1eac8 <_sk_store_4444_sse2+0xb9>
+  DB  116,18                              ; je            1ee37 <_sk_store_4444_sse2+0xb9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,222                             ; jne           1ea9a <_sk_store_4444_sse2+0x8b>
+  DB  117,222                             ; jne           1ee09 <_sk_store_4444_sse2+0x8b>
   DB  102,65,15,197,192,4                 ; pextrw        $0x4,%xmm8,%eax
   DB  102,67,137,68,80,4                  ; mov           %ax,0x4(%r8,%r10,2)
   DB  242,69,15,112,192,232               ; pshuflw       $0xe8,%xmm8,%xmm8
   DB  102,71,15,126,4,80                  ; movd          %xmm8,(%r8,%r10,2)
-  DB  235,196                             ; jmp           1ea9a <_sk_store_4444_sse2+0x8b>
+  DB  235,196                             ; jmp           1ee09 <_sk_store_4444_sse2+0x8b>
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,67,137,4,80                     ; mov           %ax,(%r8,%r10,2)
-  DB  235,184                             ; jmp           1ea9a <_sk_store_4444_sse2+0x8b>
+  DB  235,184                             ; jmp           1ee09 <_sk_store_4444_sse2+0x8b>
 
 PUBLIC _sk_load_8888_sse2
 _sk_load_8888_sse2 LABEL PROC
@@ -29078,13 +29224,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           1eb60 <_sk_load_8888_sse2+0x7e>
+  DB  117,98                              ; jne           1eecf <_sk_load_8888_sse2+0x7e>
   DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,21,148,204,0,0           ; movdqa        0xcc94(%rip),%xmm2        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,21,133,204,0,0           ; movdqa        0xcc85(%rip),%xmm2        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,208,205,0,0              ; movaps        0xcdd0(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,193,205,0,0              ; movaps        0xcdc1(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -29104,18 +29250,18 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            1eb96 <_sk_load_8888_sse2+0xb4>
+  DB  116,41                              ; je            1ef05 <_sk_load_8888_sse2+0xb4>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            1eb8b <_sk_load_8888_sse2+0xa9>
+  DB  116,19                              ; je            1eefa <_sk_load_8888_sse2+0xa9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           1eb04 <_sk_load_8888_sse2+0x22>
+  DB  117,134                             ; jne           1ee73 <_sk_load_8888_sse2+0x22>
   DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
   DB  102,68,15,112,200,69                ; pshufd        $0x45,%xmm0,%xmm9
   DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          1eb04 <_sk_load_8888_sse2+0x22>
+  DB  233,110,255,255,255                 ; jmpq          1ee73 <_sk_load_8888_sse2+0x22>
   DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          1eb04 <_sk_load_8888_sse2+0x22>
+  DB  233,99,255,255,255                  ; jmpq          1ee73 <_sk_load_8888_sse2+0x22>
 
 PUBLIC _sk_load_8888_dst_sse2
 _sk_load_8888_dst_sse2 LABEL PROC
@@ -29127,13 +29273,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           1ec1f <_sk_load_8888_dst_sse2+0x7e>
+  DB  117,98                              ; jne           1ef8e <_sk_load_8888_dst_sse2+0x7e>
   DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,53,213,203,0,0           ; movdqa        0xcbd5(%rip),%xmm6        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,53,198,203,0,0           ; movdqa        0xcbc6(%rip),%xmm6        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,225                   ; movdqa        %xmm9,%xmm4
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  68,15,40,5,17,205,0,0               ; movaps        0xcd11(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,2,205,0,0                ; movaps        0xcd02(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,224                        ; mulps         %xmm8,%xmm4
   DB  102,65,15,111,233                   ; movdqa        %xmm9,%xmm5
   DB  102,15,114,213,8                    ; psrld         $0x8,%xmm5
@@ -29153,39 +29299,52 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            1ec55 <_sk_load_8888_dst_sse2+0xb4>
+  DB  116,41                              ; je            1efc4 <_sk_load_8888_dst_sse2+0xb4>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            1ec4a <_sk_load_8888_dst_sse2+0xa9>
+  DB  116,19                              ; je            1efb9 <_sk_load_8888_dst_sse2+0xa9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           1ebc3 <_sk_load_8888_dst_sse2+0x22>
+  DB  117,134                             ; jne           1ef32 <_sk_load_8888_dst_sse2+0x22>
   DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
   DB  102,68,15,112,204,69                ; pshufd        $0x45,%xmm4,%xmm9
   DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          1ebc3 <_sk_load_8888_dst_sse2+0x22>
+  DB  233,110,255,255,255                 ; jmpq          1ef32 <_sk_load_8888_dst_sse2+0x22>
   DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          1ebc3 <_sk_load_8888_dst_sse2+0x22>
+  DB  233,99,255,255,255                  ; jmpq          1ef32 <_sk_load_8888_dst_sse2+0x22>
 
 PUBLIC _sk_gather_8888_sse2
 _sk_gather_8888_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,65,15,91,201                    ; cvttps2dq     %xmm9,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,73,15,126,194                   ; movq          %xmm0,%r10
+  DB  102,73,15,126,202                   ; movq          %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
   DB  102,67,15,110,4,144                 ; movd          (%r8,%r10,4),%xmm0
@@ -29195,11 +29354,11 @@
   DB  102,67,15,110,12,136                ; movd          (%r8,%r9,4),%xmm1
   DB  102,15,98,200                       ; punpckldq     %xmm0,%xmm1
   DB  102,68,15,108,201                   ; punpcklqdq    %xmm1,%xmm9
-  DB  102,15,111,21,191,202,0,0           ; movdqa        0xcabf(%rip),%xmm2        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,21,121,202,0,0           ; movdqa        0xca79(%rip),%xmm2        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  68,15,40,5,251,203,0,0              ; movaps        0xcbfb(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,181,203,0,0              ; movaps        0xcbb5(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -29226,7 +29385,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  68,15,40,5,124,202,0,0              ; movaps        0xca7c(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,54,202,0,0               ; movaps        0xca36(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
@@ -29245,24 +29404,24 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,194                   ; por           %xmm10,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1edb4 <_sk_store_8888_sse2+0x7f>
+  DB  117,10                              ; jne           1f15a <_sk_store_8888_sse2+0x7f>
   DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,33                              ; je            1ede2 <_sk_store_8888_sse2+0xad>
+  DB  116,33                              ; je            1f188 <_sk_store_8888_sse2+0xad>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            1edda <_sk_store_8888_sse2+0xa5>
+  DB  116,19                              ; je            1f180 <_sk_store_8888_sse2+0xa5>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           1edb0 <_sk_store_8888_sse2+0x7b>
+  DB  117,227                             ; jne           1f156 <_sk_store_8888_sse2+0x7b>
   DB  102,69,15,112,200,78                ; pshufd        $0x4e,%xmm8,%xmm9
   DB  102,69,15,126,76,128,8              ; movd          %xmm9,0x8(%r8,%rax,4)
   DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,206                             ; jmp           1edb0 <_sk_store_8888_sse2+0x7b>
+  DB  235,206                             ; jmp           1f156 <_sk_store_8888_sse2+0x7b>
   DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,198                             ; jmp           1edb0 <_sk_store_8888_sse2+0x7b>
+  DB  235,198                             ; jmp           1f156 <_sk_store_8888_sse2+0x7b>
 
 PUBLIC _sk_load_bgra_sse2
 _sk_load_bgra_sse2 LABEL PROC
@@ -29274,13 +29433,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           1ee68 <_sk_load_bgra_sse2+0x7e>
+  DB  117,98                              ; jne           1f20e <_sk_load_bgra_sse2+0x7e>
   DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,5,140,201,0,0            ; movdqa        0xc98c(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,70,201,0,0             ; movdqa        0xc946(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  15,91,209                           ; cvtdq2ps      %xmm1,%xmm2
-  DB  68,15,40,5,200,202,0,0              ; movaps        0xcac8(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,130,202,0,0              ; movaps        0xca82(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -29300,18 +29459,18 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            1ee9e <_sk_load_bgra_sse2+0xb4>
+  DB  116,41                              ; je            1f244 <_sk_load_bgra_sse2+0xb4>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            1ee93 <_sk_load_bgra_sse2+0xa9>
+  DB  116,19                              ; je            1f239 <_sk_load_bgra_sse2+0xa9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           1ee0c <_sk_load_bgra_sse2+0x22>
+  DB  117,134                             ; jne           1f1b2 <_sk_load_bgra_sse2+0x22>
   DB  102,65,15,110,68,128,8              ; movd          0x8(%r8,%rax,4),%xmm0
   DB  102,68,15,112,200,69                ; pshufd        $0x45,%xmm0,%xmm9
   DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          1ee0c <_sk_load_bgra_sse2+0x22>
+  DB  233,110,255,255,255                 ; jmpq          1f1b2 <_sk_load_bgra_sse2+0x22>
   DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          1ee0c <_sk_load_bgra_sse2+0x22>
+  DB  233,99,255,255,255                  ; jmpq          1f1b2 <_sk_load_bgra_sse2+0x22>
 
 PUBLIC _sk_load_bgra_dst_sse2
 _sk_load_bgra_dst_sse2 LABEL PROC
@@ -29323,13 +29482,13 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,98                              ; jne           1ef27 <_sk_load_bgra_dst_sse2+0x7e>
+  DB  117,98                              ; jne           1f2cd <_sk_load_bgra_dst_sse2+0x7e>
   DB  243,69,15,111,12,128                ; movdqu        (%r8,%rax,4),%xmm9
-  DB  102,15,111,37,205,200,0,0           ; movdqa        0xc8cd(%rip),%xmm4        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,37,135,200,0,0           ; movdqa        0xc887(%rip),%xmm4        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,233                   ; movdqa        %xmm9,%xmm5
   DB  102,15,219,236                      ; pand          %xmm4,%xmm5
   DB  15,91,245                           ; cvtdq2ps      %xmm5,%xmm6
-  DB  68,15,40,5,9,202,0,0                ; movaps        0xca09(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,195,201,0,0              ; movaps        0xc9c3(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,240                        ; mulps         %xmm8,%xmm6
   DB  102,65,15,111,233                   ; movdqa        %xmm9,%xmm5
   DB  102,15,114,213,8                    ; psrld         $0x8,%xmm5
@@ -29349,39 +29508,52 @@
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,41                              ; je            1ef5d <_sk_load_bgra_dst_sse2+0xb4>
+  DB  116,41                              ; je            1f303 <_sk_load_bgra_dst_sse2+0xb4>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            1ef52 <_sk_load_bgra_dst_sse2+0xa9>
+  DB  116,19                              ; je            1f2f8 <_sk_load_bgra_dst_sse2+0xa9>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,134                             ; jne           1eecb <_sk_load_bgra_dst_sse2+0x22>
+  DB  117,134                             ; jne           1f271 <_sk_load_bgra_dst_sse2+0x22>
   DB  102,65,15,110,100,128,8             ; movd          0x8(%r8,%rax,4),%xmm4
   DB  102,68,15,112,204,69                ; pshufd        $0x45,%xmm4,%xmm9
   DB  102,69,15,18,12,128                 ; movlpd        (%r8,%rax,4),%xmm9
-  DB  233,110,255,255,255                 ; jmpq          1eecb <_sk_load_bgra_dst_sse2+0x22>
+  DB  233,110,255,255,255                 ; jmpq          1f271 <_sk_load_bgra_dst_sse2+0x22>
   DB  102,69,15,110,12,128                ; movd          (%r8,%rax,4),%xmm9
-  DB  233,99,255,255,255                  ; jmpq          1eecb <_sk_load_bgra_dst_sse2+0x22>
+  DB  233,99,255,255,255                  ; jmpq          1f271 <_sk_load_bgra_dst_sse2+0x22>
 
 PUBLIC _sk_gather_bgra_sse2
 _sk_gather_bgra_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,192                   ; pcmpeqd       %xmm8,%xmm8
+  DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
+  DB  68,15,95,200                        ; maxps         %xmm0,%xmm9
+  DB  68,15,93,202                        ; minps         %xmm2,%xmm9
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,192                   ; paddd         %xmm8,%xmm0
+  DB  15,95,217                           ; maxps         %xmm1,%xmm3
+  DB  15,93,216                           ; minps         %xmm0,%xmm3
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,65,15,91,201                    ; cvttps2dq     %xmm9,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,73,15,126,194                   ; movq          %xmm0,%r10
+  DB  102,73,15,126,202                   ; movq          %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
   DB  102,67,15,110,4,144                 ; movd          (%r8,%r10,4),%xmm0
@@ -29391,11 +29563,11 @@
   DB  102,67,15,110,12,136                ; movd          (%r8,%r9,4),%xmm1
   DB  102,15,98,200                       ; punpckldq     %xmm0,%xmm1
   DB  102,68,15,108,201                   ; punpcklqdq    %xmm1,%xmm9
-  DB  102,15,111,5,183,199,0,0            ; movdqa        0xc7b7(%rip),%xmm0        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0xaf8>
+  DB  102,15,111,5,58,199,0,0             ; movdqa        0xc73a(%rip),%xmm0        # 2bb00 <_sk_srcover_rgba_8888_sse2_lowp+0xafc>
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  15,91,209                           ; cvtdq2ps      %xmm1,%xmm2
-  DB  68,15,40,5,243,200,0,0              ; movaps        0xc8f3(%rip),%xmm8        # 2b8f0 <_sk_srcover_rgba_8888_sse2_lowp+0xc48>
+  DB  68,15,40,5,118,200,0,0              ; movaps        0xc876(%rip),%xmm8        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xc4c>
   DB  65,15,89,208                        ; mulps         %xmm8,%xmm2
   DB  102,65,15,111,201                   ; movdqa        %xmm9,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -29422,7 +29594,7 @@
   DB  73,193,224,2                        ; shl           $0x2,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
-  DB  68,15,40,5,116,199,0,0              ; movaps        0xc774(%rip),%xmm8        # 2b7d0 <_sk_srcover_rgba_8888_sse2_lowp+0xb28>
+  DB  68,15,40,5,247,198,0,0              ; movaps        0xc6f7(%rip),%xmm8        # 2bb30 <_sk_srcover_rgba_8888_sse2_lowp+0xb2c>
   DB  68,15,40,202                        ; movaps        %xmm2,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  102,69,15,91,201                    ; cvtps2dq      %xmm9,%xmm9
@@ -29441,24 +29613,24 @@
   DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
   DB  102,69,15,235,194                   ; por           %xmm10,%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,10                              ; jne           1f0bc <_sk_store_bgra_sse2+0x7f>
+  DB  117,10                              ; jne           1f499 <_sk_store_bgra_sse2+0x7f>
   DB  243,69,15,127,4,128                 ; movdqu        %xmm8,(%r8,%rax,4)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,137,249                          ; mov           %edi,%r9d
   DB  65,128,225,3                        ; and           $0x3,%r9b
   DB  65,128,249,1                        ; cmp           $0x1,%r9b
-  DB  116,33                              ; je            1f0ea <_sk_store_bgra_sse2+0xad>
+  DB  116,33                              ; je            1f4c7 <_sk_store_bgra_sse2+0xad>
   DB  65,128,249,2                        ; cmp           $0x2,%r9b
-  DB  116,19                              ; je            1f0e2 <_sk_store_bgra_sse2+0xa5>
+  DB  116,19                              ; je            1f4bf <_sk_store_bgra_sse2+0xa5>
   DB  65,128,249,3                        ; cmp           $0x3,%r9b
-  DB  117,227                             ; jne           1f0b8 <_sk_store_bgra_sse2+0x7b>
+  DB  117,227                             ; jne           1f495 <_sk_store_bgra_sse2+0x7b>
   DB  102,69,15,112,200,78                ; pshufd        $0x4e,%xmm8,%xmm9
   DB  102,69,15,126,76,128,8              ; movd          %xmm9,0x8(%r8,%rax,4)
   DB  102,69,15,214,4,128                 ; movq          %xmm8,(%r8,%rax,4)
-  DB  235,206                             ; jmp           1f0b8 <_sk_store_bgra_sse2+0x7b>
+  DB  235,206                             ; jmp           1f495 <_sk_store_bgra_sse2+0x7b>
   DB  102,69,15,126,4,128                 ; movd          %xmm8,(%r8,%rax,4)
-  DB  235,198                             ; jmp           1f0b8 <_sk_store_bgra_sse2+0x7b>
+  DB  235,198                             ; jmp           1f495 <_sk_store_bgra_sse2+0x7b>
 
 PUBLIC _sk_load_f16_sse2
 _sk_load_f16_sse2 LABEL PROC
@@ -29470,7 +29642,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,47,1,0,0                     ; jne           1f241 <_sk_load_f16_sse2+0x14f>
+  DB  15,133,47,1,0,0                     ; jne           1f61e <_sk_load_f16_sse2+0x14f>
   DB  102,65,15,16,4,192                  ; movupd        (%r8,%rax,8),%xmm0
   DB  243,65,15,111,76,192,16             ; movdqu        0x10(%r8,%rax,8),%xmm1
   DB  102,68,15,40,192                    ; movapd        %xmm0,%xmm8
@@ -29482,18 +29654,18 @@
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,65,15,97,202                    ; punpcklwd     %xmm10,%xmm1
-  DB  102,68,15,111,13,94,202,0,0         ; movdqa        0xca5e(%rip),%xmm9        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xf08>
+  DB  102,68,15,111,13,225,201,0,0        ; movdqa        0xc9e1(%rip),%xmm9        # 2bf10 <_sk_srcover_rgba_8888_sse2_lowp+0xf0c>
   DB  102,68,15,111,225                   ; movdqa        %xmm1,%xmm12
   DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,91,202,0,0         ; movdqa        0xca5b(%rip),%xmm11        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xf18>
+  DB  102,68,15,111,29,222,201,0,0        ; movdqa        0xc9de(%rip),%xmm11        # 2bf20 <_sk_srcover_rgba_8888_sse2_lowp+0xf1c>
   DB  102,65,15,219,203                   ; pand          %xmm11,%xmm1
-  DB  102,15,111,29,94,202,0,0            ; movdqa        0xca5e(%rip),%xmm3        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xf28>
+  DB  102,15,111,29,225,201,0,0           ; movdqa        0xc9e1(%rip),%xmm3        # 2bf30 <_sk_srcover_rgba_8888_sse2_lowp+0xf2c>
   DB  102,65,15,114,244,16                ; pslld         $0x10,%xmm12
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,102,193                      ; pcmpgtd       %xmm1,%xmm0
   DB  102,15,114,241,13                   ; pslld         $0xd,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,37,77,202,0,0         ; movdqa        0xca4d(%rip),%xmm12        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xf38>
+  DB  102,68,15,111,37,208,201,0,0        ; movdqa        0xc9d0(%rip),%xmm12        # 2bf40 <_sk_srcover_rgba_8888_sse2_lowp+0xf3c>
   DB  102,65,15,254,204                   ; paddd         %xmm12,%xmm1
   DB  102,15,223,193                      ; pandn         %xmm1,%xmm0
   DB  102,65,15,105,210                   ; punpckhwd     %xmm10,%xmm2
@@ -29532,16 +29704,16 @@
   DB  255,224                             ; jmpq          *%rax
   DB  242,65,15,16,4,192                  ; movsd         (%r8,%rax,8),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1f25a <_sk_load_f16_sse2+0x168>
+  DB  117,13                              ; jne           1f637 <_sk_load_f16_sse2+0x168>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,197,254,255,255                 ; jmpq          1f11f <_sk_load_f16_sse2+0x2d>
+  DB  233,197,254,255,255                 ; jmpq          1f4fc <_sk_load_f16_sse2+0x2d>
   DB  102,65,15,22,68,192,8               ; movhpd        0x8(%r8,%rax,8),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,176,254,255,255              ; jb            1f11f <_sk_load_f16_sse2+0x2d>
+  DB  15,130,176,254,255,255              ; jb            1f4fc <_sk_load_f16_sse2+0x2d>
   DB  243,65,15,126,76,192,16             ; movq          0x10(%r8,%rax,8),%xmm1
-  DB  233,164,254,255,255                 ; jmpq          1f11f <_sk_load_f16_sse2+0x2d>
+  DB  233,164,254,255,255                 ; jmpq          1f4fc <_sk_load_f16_sse2+0x2d>
 
 PUBLIC _sk_load_f16_dst_sse2
 _sk_load_f16_dst_sse2 LABEL PROC
@@ -29553,7 +29725,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,47,1,0,0                     ; jne           1f3ca <_sk_load_f16_dst_sse2+0x14f>
+  DB  15,133,47,1,0,0                     ; jne           1f7a7 <_sk_load_f16_dst_sse2+0x14f>
   DB  102,65,15,16,36,192                 ; movupd        (%r8,%rax,8),%xmm4
   DB  243,65,15,111,108,192,16            ; movdqu        0x10(%r8,%rax,8),%xmm5
   DB  102,68,15,40,196                    ; movapd        %xmm4,%xmm8
@@ -29565,18 +29737,18 @@
   DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,65,15,97,234                    ; punpcklwd     %xmm10,%xmm5
-  DB  102,68,15,111,13,213,200,0,0        ; movdqa        0xc8d5(%rip),%xmm9        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xf08>
+  DB  102,68,15,111,13,88,200,0,0         ; movdqa        0xc858(%rip),%xmm9        # 2bf10 <_sk_srcover_rgba_8888_sse2_lowp+0xf0c>
   DB  102,68,15,111,229                   ; movdqa        %xmm5,%xmm12
   DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,210,200,0,0        ; movdqa        0xc8d2(%rip),%xmm11        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xf18>
+  DB  102,68,15,111,29,85,200,0,0         ; movdqa        0xc855(%rip),%xmm11        # 2bf20 <_sk_srcover_rgba_8888_sse2_lowp+0xf1c>
   DB  102,65,15,219,235                   ; pand          %xmm11,%xmm5
-  DB  102,15,111,61,213,200,0,0           ; movdqa        0xc8d5(%rip),%xmm7        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xf28>
+  DB  102,15,111,61,88,200,0,0            ; movdqa        0xc858(%rip),%xmm7        # 2bf30 <_sk_srcover_rgba_8888_sse2_lowp+0xf2c>
   DB  102,65,15,114,244,16                ; pslld         $0x10,%xmm12
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
   DB  102,15,102,229                      ; pcmpgtd       %xmm5,%xmm4
   DB  102,15,114,245,13                   ; pslld         $0xd,%xmm5
   DB  102,65,15,235,236                   ; por           %xmm12,%xmm5
-  DB  102,68,15,111,37,196,200,0,0        ; movdqa        0xc8c4(%rip),%xmm12        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xf38>
+  DB  102,68,15,111,37,71,200,0,0         ; movdqa        0xc847(%rip),%xmm12        # 2bf40 <_sk_srcover_rgba_8888_sse2_lowp+0xf3c>
   DB  102,65,15,254,236                   ; paddd         %xmm12,%xmm5
   DB  102,15,223,229                      ; pandn         %xmm5,%xmm4
   DB  102,65,15,105,242                   ; punpckhwd     %xmm10,%xmm6
@@ -29615,37 +29787,51 @@
   DB  255,224                             ; jmpq          *%rax
   DB  242,65,15,16,36,192                 ; movsd         (%r8,%rax,8),%xmm4
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1f3e3 <_sk_load_f16_dst_sse2+0x168>
+  DB  117,13                              ; jne           1f7c0 <_sk_load_f16_dst_sse2+0x168>
   DB  243,15,126,228                      ; movq          %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
-  DB  233,197,254,255,255                 ; jmpq          1f2a8 <_sk_load_f16_dst_sse2+0x2d>
+  DB  233,197,254,255,255                 ; jmpq          1f685 <_sk_load_f16_dst_sse2+0x2d>
   DB  102,65,15,22,100,192,8              ; movhpd        0x8(%r8,%rax,8),%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,176,254,255,255              ; jb            1f2a8 <_sk_load_f16_dst_sse2+0x2d>
+  DB  15,130,176,254,255,255              ; jb            1f685 <_sk_load_f16_dst_sse2+0x2d>
   DB  243,65,15,126,108,192,16            ; movq          0x10(%r8,%rax,8),%xmm5
-  DB  233,164,254,255,255                 ; jmpq          1f2a8 <_sk_load_f16_dst_sse2+0x2d>
+  DB  233,164,254,255,255                 ; jmpq          1f685 <_sk_load_f16_dst_sse2+0x2d>
 
 PUBLIC _sk_gather_f16_sse2
 _sk_gather_f16_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
+  DB  243,15,16,80,12                     ; movss         0xc(%rax),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,69,15,118,201                   ; pcmpeqd       %xmm9,%xmm9
+  DB  102,65,15,254,209                   ; paddd         %xmm9,%xmm2
+  DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
+  DB  15,87,219                           ; xorps         %xmm3,%xmm3
+  DB  15,95,216                           ; maxps         %xmm0,%xmm3
+  DB  15,93,218                           ; minps         %xmm2,%xmm3
+  DB  243,15,16,64,16                     ; movss         0x10(%rax),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,209                           ; maxps         %xmm1,%xmm2
+  DB  15,93,208                           ; minps         %xmm0,%xmm2
   DB  76,139,0                            ; mov           (%rax),%r8
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,80,8                     ; movd          0x8(%rax),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,194                       ; cvttps2dq     %xmm2,%xmm0
+  DB  102,15,110,72,8                     ; movd          0x8(%rax),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,72,15,126,200                   ; movq          %xmm1,%rax
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,203                       ; cvttps2dq     %xmm3,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,72,15,126,192                   ; movq          %xmm0,%rax
   DB  65,137,193                          ; mov           %eax,%r9d
   DB  72,193,232,32                       ; shr           $0x20,%rax
-  DB  102,73,15,126,194                   ; movq          %xmm0,%r10
+  DB  102,73,15,126,202                   ; movq          %xmm1,%r10
   DB  69,137,211                          ; mov           %r10d,%r11d
   DB  73,193,234,32                       ; shr           $0x20,%r10
   DB  243,67,15,126,4,208                 ; movq          (%r8,%r10,8),%xmm0
@@ -29654,32 +29840,31 @@
   DB  243,65,15,126,4,192                 ; movq          (%r8,%rax,8),%xmm0
   DB  243,67,15,126,20,200                ; movq          (%r8,%r9,8),%xmm2
   DB  102,15,108,208                      ; punpcklqdq    %xmm0,%xmm2
-  DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
-  DB  102,68,15,97,194                    ; punpcklwd     %xmm2,%xmm8
+  DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
+  DB  102,68,15,97,202                    ; punpcklwd     %xmm2,%xmm9
   DB  102,15,105,202                      ; punpckhwd     %xmm2,%xmm1
-  DB  102,65,15,111,208                   ; movdqa        %xmm8,%xmm2
+  DB  102,65,15,111,209                   ; movdqa        %xmm9,%xmm2
   DB  102,15,97,209                       ; punpcklwd     %xmm1,%xmm2
-  DB  102,68,15,105,193                   ; punpckhwd     %xmm1,%xmm8
-  DB  102,69,15,239,210                   ; pxor          %xmm10,%xmm10
+  DB  102,68,15,105,201                   ; punpckhwd     %xmm1,%xmm9
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,65,15,97,202                    ; punpcklwd     %xmm10,%xmm1
-  DB  102,68,15,111,13,6,199,0,0          ; movdqa        0xc706(%rip),%xmm9        # 2bbb0 <_sk_srcover_rgba_8888_sse2_lowp+0xf08>
+  DB  102,65,15,97,200                    ; punpcklwd     %xmm8,%xmm1
+  DB  102,68,15,111,21,86,198,0,0         ; movdqa        0xc656(%rip),%xmm10        # 2bf10 <_sk_srcover_rgba_8888_sse2_lowp+0xf0c>
   DB  102,68,15,111,225                   ; movdqa        %xmm1,%xmm12
-  DB  102,69,15,219,225                   ; pand          %xmm9,%xmm12
-  DB  102,68,15,111,29,3,199,0,0          ; movdqa        0xc703(%rip),%xmm11        # 2bbc0 <_sk_srcover_rgba_8888_sse2_lowp+0xf18>
+  DB  102,69,15,219,226                   ; pand          %xmm10,%xmm12
+  DB  102,68,15,111,29,83,198,0,0         ; movdqa        0xc653(%rip),%xmm11        # 2bf20 <_sk_srcover_rgba_8888_sse2_lowp+0xf1c>
   DB  102,65,15,219,203                   ; pand          %xmm11,%xmm1
-  DB  102,15,111,29,6,199,0,0             ; movdqa        0xc706(%rip),%xmm3        # 2bbd0 <_sk_srcover_rgba_8888_sse2_lowp+0xf28>
+  DB  102,15,111,29,86,198,0,0            ; movdqa        0xc656(%rip),%xmm3        # 2bf30 <_sk_srcover_rgba_8888_sse2_lowp+0xf2c>
   DB  102,65,15,114,244,16                ; pslld         $0x10,%xmm12
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,102,193                      ; pcmpgtd       %xmm1,%xmm0
   DB  102,15,114,241,13                   ; pslld         $0xd,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,37,245,198,0,0        ; movdqa        0xc6f5(%rip),%xmm12        # 2bbe0 <_sk_srcover_rgba_8888_sse2_lowp+0xf38>
+  DB  102,68,15,111,37,69,198,0,0         ; movdqa        0xc645(%rip),%xmm12        # 2bf40 <_sk_srcover_rgba_8888_sse2_lowp+0xf3c>
   DB  102,65,15,254,204                   ; paddd         %xmm12,%xmm1
   DB  102,15,223,193                      ; pandn         %xmm1,%xmm0
-  DB  102,65,15,105,210                   ; punpckhwd     %xmm10,%xmm2
+  DB  102,65,15,105,208                   ; punpckhwd     %xmm8,%xmm2
   DB  102,68,15,111,234                   ; movdqa        %xmm2,%xmm13
-  DB  102,69,15,219,233                   ; pand          %xmm9,%xmm13
+  DB  102,69,15,219,234                   ; pand          %xmm10,%xmm13
   DB  102,65,15,219,211                   ; pand          %xmm11,%xmm2
   DB  102,65,15,114,245,16                ; pslld         $0x10,%xmm13
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
@@ -29688,10 +29873,10 @@
   DB  102,65,15,235,213                   ; por           %xmm13,%xmm2
   DB  102,65,15,254,212                   ; paddd         %xmm12,%xmm2
   DB  102,15,223,202                      ; pandn         %xmm2,%xmm1
-  DB  102,69,15,111,232                   ; movdqa        %xmm8,%xmm13
-  DB  102,69,15,97,234                    ; punpcklwd     %xmm10,%xmm13
+  DB  102,69,15,111,233                   ; movdqa        %xmm9,%xmm13
+  DB  102,69,15,97,232                    ; punpcklwd     %xmm8,%xmm13
   DB  102,69,15,111,245                   ; movdqa        %xmm13,%xmm14
-  DB  102,69,15,219,241                   ; pand          %xmm9,%xmm14
+  DB  102,69,15,219,242                   ; pand          %xmm10,%xmm14
   DB  102,69,15,219,235                   ; pand          %xmm11,%xmm13
   DB  102,65,15,114,246,16                ; pslld         $0x10,%xmm14
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
@@ -29700,15 +29885,15 @@
   DB  102,69,15,235,238                   ; por           %xmm14,%xmm13
   DB  102,69,15,254,236                   ; paddd         %xmm12,%xmm13
   DB  102,65,15,223,213                   ; pandn         %xmm13,%xmm2
-  DB  102,69,15,105,194                   ; punpckhwd     %xmm10,%xmm8
-  DB  102,69,15,219,200                   ; pand          %xmm8,%xmm9
-  DB  102,69,15,219,195                   ; pand          %xmm11,%xmm8
-  DB  102,65,15,114,241,16                ; pslld         $0x10,%xmm9
-  DB  102,65,15,102,216                   ; pcmpgtd       %xmm8,%xmm3
-  DB  102,65,15,114,240,13                ; pslld         $0xd,%xmm8
-  DB  102,69,15,235,193                   ; por           %xmm9,%xmm8
-  DB  102,69,15,254,196                   ; paddd         %xmm12,%xmm8
-  DB  102,65,15,223,216                   ; pandn         %xmm8,%xmm3
+  DB  102,69,15,105,200                   ; punpckhwd     %xmm8,%xmm9
+  DB  102,69,15,219,209                   ; pand          %xmm9,%xmm10
+  DB  102,69,15,219,203                   ; pand          %xmm11,%xmm9
+  DB  102,65,15,114,242,16                ; pslld         $0x10,%xmm10
+  DB  102,65,15,102,217                   ; pcmpgtd       %xmm9,%xmm3
+  DB  102,65,15,114,241,13                ; pslld         $0xd,%xmm9
+  DB  102,69,15,235,202                   ; por           %xmm10,%xmm9
+  DB  102,69,15,254,204                   ; paddd         %xmm12,%xmm9
+  DB  102,65,15,223,217                   ; pandn         %xmm9,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
 
@@ -29716,19 +29901,19 @@
 _sk_store_f16_sse2 LABEL PROC
   DB  72,131,236,24                       ; sub           $0x18,%rsp
   DB  15,41,60,36                         ; movaps        %xmm7,(%rsp)
-  DB  102,68,15,111,29,70,198,0,0         ; movdqa        0xc646(%rip),%xmm11        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
+  DB  102,68,15,111,29,150,197,0,0        ; movdqa        0xc596(%rip),%xmm11        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,69,15,219,195                   ; pand          %xmm11,%xmm8
-  DB  102,68,15,111,21,67,198,0,0         ; movdqa        0xc643(%rip),%xmm10        # 2bc00 <_sk_srcover_rgba_8888_sse2_lowp+0xf58>
+  DB  102,68,15,111,21,147,197,0,0        ; movdqa        0xc593(%rip),%xmm10        # 2bf60 <_sk_srcover_rgba_8888_sse2_lowp+0xf5c>
   DB  102,68,15,111,240                   ; movdqa        %xmm0,%xmm14
   DB  102,69,15,219,242                   ; pand          %xmm10,%xmm14
-  DB  102,15,111,61,65,198,0,0            ; movdqa        0xc641(%rip),%xmm7        # 2bc10 <_sk_srcover_rgba_8888_sse2_lowp+0xf68>
-  DB  102,68,15,111,37,232,199,0,0        ; movdqa        0xc7e8(%rip),%xmm12        # 2bdc0 <_sk_srcover_rgba_8888_sse2_lowp+0x1118>
+  DB  102,15,111,61,145,197,0,0           ; movdqa        0xc591(%rip),%xmm7        # 2bf70 <_sk_srcover_rgba_8888_sse2_lowp+0xf6c>
+  DB  102,68,15,111,37,56,199,0,0         ; movdqa        0xc738(%rip),%xmm12        # 2c120 <_sk_srcover_rgba_8888_sse2_lowp+0x111c>
   DB  102,68,15,111,248                   ; movdqa        %xmm0,%xmm15
   DB  102,65,15,114,247,3                 ; pslld         $0x3,%xmm15
   DB  102,69,15,219,252                   ; pand          %xmm12,%xmm15
   DB  102,69,15,254,248                   ; paddd         %xmm8,%xmm15
-  DB  102,68,15,111,45,154,194,0,0        ; movdqa        0xc29a(%rip),%xmm13        # 2b890 <_sk_srcover_rgba_8888_sse2_lowp+0xbe8>
+  DB  102,68,15,111,45,234,193,0,0        ; movdqa        0xc1ea(%rip),%xmm13        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xbec>
   DB  102,69,15,254,253                   ; paddd         %xmm13,%xmm15
   DB  102,65,15,114,231,16                ; psrad         $0x10,%xmm15
   DB  102,68,15,111,199                   ; movdqa        %xmm7,%xmm8
@@ -29784,7 +29969,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  72,99,194                           ; movslq        %edx,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,40                              ; jne           1f72b <_sk_store_f16_sse2+0x192>
+  DB  117,40                              ; jne           1fb3b <_sk_store_f16_sse2+0x192>
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,65,15,98,254                    ; punpckldq     %xmm14,%xmm7
   DB  243,65,15,127,60,192                ; movdqu        %xmm7,(%r8,%rax,8)
@@ -29798,13 +29983,13 @@
   DB  102,69,15,98,206                    ; punpckldq     %xmm14,%xmm9
   DB  102,69,15,214,12,192                ; movq          %xmm9,(%r8,%rax,8)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,222                             ; je            1f71f <_sk_store_f16_sse2+0x186>
+  DB  116,222                             ; je            1fb2f <_sk_store_f16_sse2+0x186>
   DB  102,69,15,23,76,192,8               ; movhpd        %xmm9,0x8(%r8,%rax,8)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,209                             ; jb            1f71f <_sk_store_f16_sse2+0x186>
+  DB  114,209                             ; jb            1fb2f <_sk_store_f16_sse2+0x186>
   DB  102,69,15,106,198                   ; punpckhdq     %xmm14,%xmm8
   DB  102,69,15,214,68,192,16             ; movq          %xmm8,0x10(%r8,%rax,8)
-  DB  235,195                             ; jmp           1f71f <_sk_store_f16_sse2+0x186>
+  DB  235,195                             ; jmp           1fb2f <_sk_store_f16_sse2+0x186>
 
 PUBLIC _sk_load_u16_be_sse2
 _sk_load_u16_be_sse2 LABEL PROC
@@ -29817,7 +30002,7 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,190,0,0,0                    ; jne           1f841 <_sk_load_u16_be_sse2+0xe5>
+  DB  15,133,190,0,0,0                    ; jne           1fc51 <_sk_load_u16_be_sse2+0xe5>
   DB  102,65,15,16,4,64                   ; movupd        (%r8,%rax,2),%xmm0
   DB  243,65,15,111,76,64,16              ; movdqu        0x10(%r8,%rax,2),%xmm1
   DB  102,15,40,208                       ; movapd        %xmm0,%xmm2
@@ -29834,7 +30019,7 @@
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,65,15,97,201                    ; punpcklwd     %xmm9,%xmm1
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  68,15,40,5,172,193,0,0              ; movaps        0xc1ac(%rip),%xmm8        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0xcd8>
+  DB  68,15,40,5,252,192,0,0              ; movaps        0xc0fc(%rip),%xmm8        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0xcdc>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -29862,16 +30047,16 @@
   DB  255,224                             ; jmpq          *%rax
   DB  242,65,15,16,4,64                   ; movsd         (%r8,%rax,2),%xmm0
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1f85a <_sk_load_u16_be_sse2+0xfe>
+  DB  117,13                              ; jne           1fc6a <_sk_load_u16_be_sse2+0xfe>
   DB  243,15,126,192                      ; movq          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
-  DB  233,54,255,255,255                  ; jmpq          1f790 <_sk_load_u16_be_sse2+0x34>
+  DB  233,54,255,255,255                  ; jmpq          1fba0 <_sk_load_u16_be_sse2+0x34>
   DB  102,65,15,22,68,64,8                ; movhpd        0x8(%r8,%rax,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  15,130,33,255,255,255               ; jb            1f790 <_sk_load_u16_be_sse2+0x34>
+  DB  15,130,33,255,255,255               ; jb            1fba0 <_sk_load_u16_be_sse2+0x34>
   DB  243,65,15,126,76,64,16              ; movq          0x10(%r8,%rax,2),%xmm1
-  DB  233,21,255,255,255                  ; jmpq          1f790 <_sk_load_u16_be_sse2+0x34>
+  DB  233,21,255,255,255                  ; jmpq          1fba0 <_sk_load_u16_be_sse2+0x34>
 
 PUBLIC _sk_load_rgb_u16_be_sse2
 _sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -29886,7 +30071,7 @@
   DB  72,141,4,64                         ; lea           (%rax,%rax,2),%rax
   DB  72,193,248,32                       ; sar           $0x20,%rax
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  15,133,175,0,0,0                    ; jne           1f955 <_sk_load_rgb_u16_be_sse2+0xda>
+  DB  15,133,175,0,0,0                    ; jne           1fd65 <_sk_load_rgb_u16_be_sse2+0xda>
   DB  243,65,15,111,20,64                 ; movdqu        (%r8,%rax,2),%xmm2
   DB  243,65,15,111,92,64,8               ; movdqu        0x8(%r8,%rax,2),%xmm3
   DB  102,15,115,219,4                    ; psrldq        $0x4,%xmm3
@@ -29907,7 +30092,7 @@
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,65,15,97,200                    ; punpcklwd     %xmm8,%xmm1
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  68,15,40,13,118,192,0,0             ; movaps        0xc076(%rip),%xmm9        # 2b980 <_sk_srcover_rgba_8888_sse2_lowp+0xcd8>
+  DB  68,15,40,13,198,191,0,0             ; movaps        0xbfc6(%rip),%xmm9        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0xcdc>
   DB  65,15,89,193                        ; mulps         %xmm9,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -29924,27 +30109,27 @@
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  65,15,89,209                        ; mulps         %xmm9,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,157,189,0,0                ; movaps        0xbd9d(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,237,188,0,0                ; movaps        0xbced(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,20,64                 ; movd          (%r8,%rax,2),%xmm2
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,84,64,4,2             ; pinsrw        $0x2,0x4(%r8,%rax,2),%xmm2
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,13                              ; jne           1f97a <_sk_load_rgb_u16_be_sse2+0xff>
+  DB  117,13                              ; jne           1fd8a <_sk_load_rgb_u16_be_sse2+0xff>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  233,80,255,255,255                  ; jmpq          1f8ca <_sk_load_rgb_u16_be_sse2+0x4f>
+  DB  233,80,255,255,255                  ; jmpq          1fcda <_sk_load_rgb_u16_be_sse2+0x4f>
   DB  102,65,15,110,68,64,6               ; movd          0x6(%r8,%rax,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,68,64,10,2            ; pinsrw        $0x2,0xa(%r8,%rax,2),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,24                              ; jb            1f9ab <_sk_load_rgb_u16_be_sse2+0x130>
+  DB  114,24                              ; jb            1fdbb <_sk_load_rgb_u16_be_sse2+0x130>
   DB  102,65,15,110,92,64,12              ; movd          0xc(%r8,%rax,2),%xmm3
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,92,64,16,2            ; pinsrw        $0x2,0x10(%r8,%rax,2),%xmm3
-  DB  233,31,255,255,255                  ; jmpq          1f8ca <_sk_load_rgb_u16_be_sse2+0x4f>
+  DB  233,31,255,255,255                  ; jmpq          1fcda <_sk_load_rgb_u16_be_sse2+0x4f>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  233,22,255,255,255                  ; jmpq          1f8ca <_sk_load_rgb_u16_be_sse2+0x4f>
+  DB  233,22,255,255,255                  ; jmpq          1fcda <_sk_load_rgb_u16_be_sse2+0x4f>
 
 PUBLIC _sk_store_u16_be_sse2
 _sk_store_u16_be_sse2 LABEL PROC
@@ -29956,7 +30141,7 @@
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  73,99,193                           ; movslq        %r9d,%rax
-  DB  68,15,40,21,86,194,0,0              ; movaps        0xc256(%rip),%xmm10        # 2bc30 <_sk_srcover_rgba_8888_sse2_lowp+0xf88>
+  DB  68,15,40,21,166,193,0,0             ; movaps        0xc1a6(%rip),%xmm10        # 2bf90 <_sk_srcover_rgba_8888_sse2_lowp+0xf8c>
   DB  68,15,40,192                        ; movaps        %xmm0,%xmm8
   DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
   DB  102,69,15,91,192                    ; cvtps2dq      %xmm8,%xmm8
@@ -30001,7 +30186,7 @@
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
   DB  102,69,15,98,209                    ; punpckldq     %xmm9,%xmm10
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,21                              ; jne           1fad4 <_sk_store_u16_be_sse2+0x120>
+  DB  117,21                              ; jne           1fee4 <_sk_store_u16_be_sse2+0x120>
   DB  69,15,17,20,64                      ; movups        %xmm10,(%r8,%rax,2)
   DB  102,69,15,106,193                   ; punpckhdq     %xmm9,%xmm8
   DB  243,69,15,127,68,64,16              ; movdqu        %xmm8,0x10(%r8,%rax,2)
@@ -30009,13 +30194,13 @@
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,214,20,64                 ; movq          %xmm10,(%r8,%rax,2)
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,240                             ; je            1fad0 <_sk_store_u16_be_sse2+0x11c>
+  DB  116,240                             ; je            1fee0 <_sk_store_u16_be_sse2+0x11c>
   DB  102,69,15,23,84,64,8                ; movhpd        %xmm10,0x8(%r8,%rax,2)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,227                             ; jb            1fad0 <_sk_store_u16_be_sse2+0x11c>
+  DB  114,227                             ; jb            1fee0 <_sk_store_u16_be_sse2+0x11c>
   DB  102,69,15,106,193                   ; punpckhdq     %xmm9,%xmm8
   DB  102,69,15,214,68,64,16              ; movq          %xmm8,0x10(%r8,%rax,2)
-  DB  235,213                             ; jmp           1fad0 <_sk_store_u16_be_sse2+0x11c>
+  DB  235,213                             ; jmp           1fee0 <_sk_store_u16_be_sse2+0x11c>
 
 PUBLIC _sk_load_f32_sse2
 _sk_load_f32_sse2 LABEL PROC
@@ -30029,7 +30214,7 @@
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           1fb66 <_sk_load_f32_sse2+0x6b>
+  DB  117,66                              ; jne           1ff76 <_sk_load_f32_sse2+0x6b>
   DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
   DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
   DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
@@ -30049,17 +30234,17 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           1fb78 <_sk_load_f32_sse2+0x7d>
+  DB  117,8                               ; jne           1ff88 <_sk_load_f32_sse2+0x7d>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
-  DB  235,190                             ; jmp           1fb36 <_sk_load_f32_sse2+0x3b>
+  DB  235,190                             ; jmp           1ff46 <_sk_load_f32_sse2+0x3b>
   DB  65,15,16,68,128,16                  ; movups        0x10(%r8,%rax,4),%xmm0
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            1fb8c <_sk_load_f32_sse2+0x91>
+  DB  114,8                               ; jb            1ff9c <_sk_load_f32_sse2+0x91>
   DB  65,15,16,92,128,32                  ; movups        0x20(%r8,%rax,4),%xmm3
-  DB  235,170                             ; jmp           1fb36 <_sk_load_f32_sse2+0x3b>
+  DB  235,170                             ; jmp           1ff46 <_sk_load_f32_sse2+0x3b>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,165                             ; jmp           1fb36 <_sk_load_f32_sse2+0x3b>
+  DB  235,165                             ; jmp           1ff46 <_sk_load_f32_sse2+0x3b>
 
 PUBLIC _sk_load_f32_dst_sse2
 _sk_load_f32_dst_sse2 LABEL PROC
@@ -30073,7 +30258,7 @@
   DB  73,99,193                           ; movslq        %r9d,%rax
   DB  69,15,16,4,128                      ; movups        (%r8,%rax,4),%xmm8
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,66                              ; jne           1fbfc <_sk_load_f32_dst_sse2+0x6b>
+  DB  117,66                              ; jne           2000c <_sk_load_f32_dst_sse2+0x6b>
   DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
   DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
   DB  69,15,16,76,128,48                  ; movups        0x30(%r8,%rax,4),%xmm9
@@ -30093,17 +30278,17 @@
   DB  255,224                             ; jmpq          *%rax
   DB  69,15,87,201                        ; xorps         %xmm9,%xmm9
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  117,8                               ; jne           1fc0e <_sk_load_f32_dst_sse2+0x7d>
+  DB  117,8                               ; jne           2001e <_sk_load_f32_dst_sse2+0x7d>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  235,190                             ; jmp           1fbcc <_sk_load_f32_dst_sse2+0x3b>
+  DB  235,190                             ; jmp           1ffdc <_sk_load_f32_dst_sse2+0x3b>
   DB  65,15,16,100,128,16                 ; movups        0x10(%r8,%rax,4),%xmm4
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,8                               ; jb            1fc22 <_sk_load_f32_dst_sse2+0x91>
+  DB  114,8                               ; jb            20032 <_sk_load_f32_dst_sse2+0x91>
   DB  65,15,16,124,128,32                 ; movups        0x20(%r8,%rax,4),%xmm7
-  DB  235,170                             ; jmp           1fbcc <_sk_load_f32_dst_sse2+0x3b>
+  DB  235,170                             ; jmp           1ffdc <_sk_load_f32_dst_sse2+0x3b>
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
-  DB  235,165                             ; jmp           1fbcc <_sk_load_f32_dst_sse2+0x3b>
+  DB  235,165                             ; jmp           1ffdc <_sk_load_f32_dst_sse2+0x3b>
 
 PUBLIC _sk_store_f32_sse2
 _sk_store_f32_sse2 LABEL PROC
@@ -30130,7 +30315,7 @@
   DB  102,69,15,20,203                    ; unpcklpd      %xmm11,%xmm9
   DB  102,69,15,17,36,128                 ; movupd        %xmm12,(%r8,%rax,4)
   DB  72,133,255                          ; test          %rdi,%rdi
-  DB  117,29                              ; jne           1fca4 <_sk_store_f32_sse2+0x7d>
+  DB  117,29                              ; jne           200b4 <_sk_store_f32_sse2+0x7d>
   DB  102,69,15,21,211                    ; unpckhpd      %xmm11,%xmm10
   DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
   DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
@@ -30138,160 +30323,108 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  72,131,255,1                        ; cmp           $0x1,%rdi
-  DB  116,246                             ; je            1fca0 <_sk_store_f32_sse2+0x79>
+  DB  116,246                             ; je            200b0 <_sk_store_f32_sse2+0x79>
   DB  69,15,17,68,128,16                  ; movups        %xmm8,0x10(%r8,%rax,4)
   DB  72,131,255,3                        ; cmp           $0x3,%rdi
-  DB  114,234                             ; jb            1fca0 <_sk_store_f32_sse2+0x79>
+  DB  114,234                             ; jb            200b0 <_sk_store_f32_sse2+0x79>
   DB  102,69,15,17,76,128,32              ; movupd        %xmm9,0x20(%r8,%rax,4)
-  DB  235,225                             ; jmp           1fca0 <_sk_store_f32_sse2+0x79>
-
-PUBLIC _sk_clamp_x_sse2
-_sk_clamp_x_sse2 LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  68,15,93,192                        ; minps         %xmm0,%xmm8
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
-  DB  255,224                             ; jmpq          *%rax
-
-PUBLIC _sk_clamp_y_sse2
-_sk_clamp_y_sse2 LABEL PROC
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  68,15,95,193                        ; maxps         %xmm1,%xmm8
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
-  DB  68,15,93,193                        ; minps         %xmm1,%xmm8
-  DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
-  DB  255,224                             ; jmpq          *%rax
+  DB  235,225                             ; jmp           200b0 <_sk_store_f32_sse2+0x79>
 
 PUBLIC _sk_repeat_x_sse2
 _sk_repeat_x_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  243,68,15,16,80,4                   ; movss         0x4(%rax),%xmm10
-  DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
-  DB  68,15,89,208                        ; mulps         %xmm0,%xmm10
-  DB  243,69,15,91,194                    ; cvttps2dq     %xmm10,%xmm8
-  DB  69,15,91,216                        ; cvtdq2ps      %xmm8,%xmm11
-  DB  69,15,194,211,1                     ; cmpltps       %xmm11,%xmm10
-  DB  68,15,84,21,179,185,0,0             ; andps         0xb9b3(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  69,15,92,218                        ; subps         %xmm10,%xmm11
+  DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
+  DB  243,68,15,16,72,4                   ; movss         0x4(%rax),%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  69,15,89,217                        ; mulps         %xmm9,%xmm11
-  DB  65,15,92,195                        ; subps         %xmm11,%xmm0
-  DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  68,15,93,192                        ; minps         %xmm0,%xmm8
+  DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
+  DB  243,69,15,91,209                    ; cvttps2dq     %xmm9,%xmm10
+  DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
+  DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
+  DB  68,15,84,13,85,185,0,0              ; andps         0xb955(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
+  DB  69,15,92,209                        ; subps         %xmm9,%xmm10
+  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
+  DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
+  DB  65,15,92,192                        ; subps         %xmm8,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_repeat_y_sse2
 _sk_repeat_y_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,68,15,16,8                      ; movss         (%rax),%xmm9
-  DB  243,68,15,16,80,4                   ; movss         0x4(%rax),%xmm10
-  DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
-  DB  68,15,89,209                        ; mulps         %xmm1,%xmm10
-  DB  243,69,15,91,194                    ; cvttps2dq     %xmm10,%xmm8
-  DB  69,15,91,216                        ; cvtdq2ps      %xmm8,%xmm11
-  DB  69,15,194,211,1                     ; cmpltps       %xmm11,%xmm10
-  DB  68,15,84,21,89,185,0,0              ; andps         0xb959(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  69,15,92,218                        ; subps         %xmm10,%xmm11
+  DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
+  DB  243,68,15,16,72,4                   ; movss         0x4(%rax),%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  69,15,89,217                        ; mulps         %xmm9,%xmm11
-  DB  65,15,92,203                        ; subps         %xmm11,%xmm1
-  DB  68,15,95,193                        ; maxps         %xmm1,%xmm8
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
-  DB  68,15,93,193                        ; minps         %xmm1,%xmm8
+  DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
+  DB  243,69,15,91,209                    ; cvttps2dq     %xmm9,%xmm10
+  DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
+  DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
+  DB  68,15,84,13,20,185,0,0              ; andps         0xb914(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
+  DB  69,15,92,209                        ; subps         %xmm9,%xmm10
+  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
+  DB  69,15,89,194                        ; mulps         %xmm10,%xmm8
+  DB  65,15,92,200                        ; subps         %xmm8,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_x_sse2
 _sk_mirror_x_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,68,15,16,16                     ; movss         (%rax),%xmm10
-  DB  243,68,15,16,88,4                   ; movss         0x4(%rax),%xmm11
-  DB  69,15,40,202                        ; movaps        %xmm10,%xmm9
-  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  65,15,92,193                        ; subps         %xmm9,%xmm0
-  DB  243,69,15,88,210                    ; addss         %xmm10,%xmm10
+  DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
+  DB  243,68,15,16,72,4                   ; movss         0x4(%rax),%xmm9
+  DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
-  DB  243,68,15,89,29,242,182,0,0         ; mulss         0xb6f2(%rip),%xmm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
-  DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
-  DB  68,15,89,216                        ; mulps         %xmm0,%xmm11
-  DB  243,69,15,91,195                    ; cvttps2dq     %xmm11,%xmm8
-  DB  69,15,91,224                        ; cvtdq2ps      %xmm8,%xmm12
-  DB  69,15,194,220,1                     ; cmpltps       %xmm12,%xmm11
-  DB  68,15,84,29,223,184,0,0             ; andps         0xb8df(%rip),%xmm11        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  69,15,92,227                        ; subps         %xmm11,%xmm12
-  DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
-  DB  65,15,92,196                        ; subps         %xmm12,%xmm0
-  DB  65,15,92,193                        ; subps         %xmm9,%xmm0
-  DB  69,15,87,210                        ; xorps         %xmm10,%xmm10
-  DB  68,15,92,208                        ; subps         %xmm0,%xmm10
-  DB  68,15,84,208                        ; andps         %xmm0,%xmm10
-  DB  69,15,95,194                        ; maxps         %xmm10,%xmm8
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,65,15,254,193                   ; paddd         %xmm9,%xmm0
-  DB  68,15,93,192                        ; minps         %xmm0,%xmm8
+  DB  65,15,92,194                        ; subps         %xmm10,%xmm0
+  DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
+  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
+  DB  243,68,15,89,13,198,182,0,0         ; mulss         0xb6c6(%rip),%xmm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
+  DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
+  DB  243,69,15,91,217                    ; cvttps2dq     %xmm9,%xmm11
+  DB  69,15,91,219                        ; cvtdq2ps      %xmm11,%xmm11
+  DB  69,15,194,203,1                     ; cmpltps       %xmm11,%xmm9
+  DB  68,15,84,13,179,184,0,0             ; andps         0xb8b3(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
+  DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
+  DB  69,15,92,217                        ; subps         %xmm9,%xmm11
+  DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
+  DB  65,15,92,195                        ; subps         %xmm11,%xmm0
+  DB  65,15,92,194                        ; subps         %xmm10,%xmm0
+  DB  68,15,92,224                        ; subps         %xmm0,%xmm12
+  DB  65,15,84,196                        ; andps         %xmm12,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_mirror_y_sse2
 _sk_mirror_y_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,68,15,16,16                     ; movss         (%rax),%xmm10
-  DB  243,68,15,16,88,4                   ; movss         0x4(%rax),%xmm11
-  DB  69,15,40,202                        ; movaps        %xmm10,%xmm9
-  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
-  DB  65,15,92,201                        ; subps         %xmm9,%xmm1
-  DB  243,69,15,88,210                    ; addss         %xmm10,%xmm10
+  DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
+  DB  243,68,15,16,72,4                   ; movss         0x4(%rax),%xmm9
+  DB  69,15,40,208                        ; movaps        %xmm8,%xmm10
   DB  69,15,198,210,0                     ; shufps        $0x0,%xmm10,%xmm10
-  DB  243,68,15,89,29,109,182,0,0         ; mulss         0xb66d(%rip),%xmm11        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
-  DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
-  DB  68,15,89,217                        ; mulps         %xmm1,%xmm11
-  DB  243,69,15,91,195                    ; cvttps2dq     %xmm11,%xmm8
-  DB  69,15,91,224                        ; cvtdq2ps      %xmm8,%xmm12
-  DB  69,15,194,220,1                     ; cmpltps       %xmm12,%xmm11
-  DB  68,15,84,29,90,184,0,0              ; andps         0xb85a(%rip),%xmm11        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
-  DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
-  DB  69,15,92,227                        ; subps         %xmm11,%xmm12
-  DB  69,15,89,226                        ; mulps         %xmm10,%xmm12
-  DB  65,15,92,204                        ; subps         %xmm12,%xmm1
-  DB  65,15,92,201                        ; subps         %xmm9,%xmm1
-  DB  69,15,87,210                        ; xorps         %xmm10,%xmm10
-  DB  68,15,92,209                        ; subps         %xmm1,%xmm10
-  DB  68,15,84,209                        ; andps         %xmm1,%xmm10
-  DB  69,15,95,194                        ; maxps         %xmm10,%xmm8
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,65,15,254,201                   ; paddd         %xmm9,%xmm1
-  DB  68,15,93,193                        ; minps         %xmm1,%xmm8
+  DB  65,15,92,202                        ; subps         %xmm10,%xmm1
+  DB  243,69,15,88,192                    ; addss         %xmm8,%xmm8
+  DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
+  DB  243,68,15,89,13,90,182,0,0          ; mulss         0xb65a(%rip),%xmm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
+  DB  68,15,89,201                        ; mulps         %xmm1,%xmm9
+  DB  243,69,15,91,217                    ; cvttps2dq     %xmm9,%xmm11
+  DB  69,15,91,219                        ; cvtdq2ps      %xmm11,%xmm11
+  DB  69,15,194,203,1                     ; cmpltps       %xmm11,%xmm9
+  DB  68,15,84,13,71,184,0,0              ; andps         0xb847(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
+  DB  69,15,87,228                        ; xorps         %xmm12,%xmm12
+  DB  69,15,92,217                        ; subps         %xmm9,%xmm11
+  DB  69,15,89,216                        ; mulps         %xmm8,%xmm11
+  DB  65,15,92,203                        ; subps         %xmm11,%xmm1
+  DB  65,15,92,202                        ; subps         %xmm10,%xmm1
+  DB  68,15,92,225                        ; subps         %xmm1,%xmm12
+  DB  65,15,84,204                        ; andps         %xmm12,%xmm1
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  65,15,40,200                        ; movaps        %xmm8,%xmm1
   DB  255,224                             ; jmpq          *%rax
 
 PUBLIC _sk_clamp_x_1_sse2
 _sk_clamp_x_1_sse2 LABEL PROC
   DB  69,15,87,192                        ; xorps         %xmm8,%xmm8
   DB  68,15,95,192                        ; maxps         %xmm0,%xmm8
-  DB  68,15,93,5,17,184,0,0               ; minps         0xb811(%rip),%xmm8        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,93,5,23,184,0,0               ; minps         0xb817(%rip),%xmm8        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  65,15,40,192                        ; movaps        %xmm8,%xmm0
   DB  255,224                             ; jmpq          *%rax
@@ -30302,7 +30435,7 @@
   DB  69,15,91,192                        ; cvtdq2ps      %xmm8,%xmm8
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,194,200,1                     ; cmpltps       %xmm8,%xmm9
-  DB  68,15,84,13,239,183,0,0             ; andps         0xb7ef(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,84,13,245,183,0,0             ; andps         0xb7f5(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,193                        ; subps         %xmm9,%xmm8
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -30310,14 +30443,14 @@
 
 PUBLIC _sk_mirror_x_1_sse2
 _sk_mirror_x_1_sse2 LABEL PROC
-  DB  68,15,40,5,59,184,0,0               ; movaps        0xb83b(%rip),%xmm8        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0xaa8>
+  DB  68,15,40,5,65,184,0,0               ; movaps        0xb841(%rip),%xmm8        # 2bab0 <_sk_srcover_rgba_8888_sse2_lowp+0xaac>
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,13,191,183,0,0             ; movaps        0xb7bf(%rip),%xmm9        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,13,197,183,0,0             ; movaps        0xb7c5(%rip),%xmm9        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  68,15,89,200                        ; mulps         %xmm0,%xmm9
   DB  243,69,15,91,209                    ; cvttps2dq     %xmm9,%xmm10
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
   DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
-  DB  68,15,84,13,181,183,0,0             ; andps         0xb7b5(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,84,13,187,183,0,0             ; andps         0xb7bb(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,87,219                        ; xorps         %xmm11,%xmm11
   DB  69,15,92,209                        ; subps         %xmm9,%xmm10
   DB  69,15,88,210                        ; addps         %xmm10,%xmm10
@@ -30331,10 +30464,10 @@
 PUBLIC _sk_luminance_to_alpha_sse2
 _sk_luminance_to_alpha_sse2 LABEL PROC
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
-  DB  15,89,5,219,188,0,0                 ; mulps         0xbcdb(%rip),%xmm0        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xf98>
-  DB  15,89,13,228,188,0,0                ; mulps         0xbce4(%rip),%xmm1        # 2bc50 <_sk_srcover_rgba_8888_sse2_lowp+0xfa8>
+  DB  15,89,5,225,188,0,0                 ; mulps         0xbce1(%rip),%xmm0        # 2bfa0 <_sk_srcover_rgba_8888_sse2_lowp+0xf9c>
+  DB  15,89,13,234,188,0,0                ; mulps         0xbcea(%rip),%xmm1        # 2bfb0 <_sk_srcover_rgba_8888_sse2_lowp+0xfac>
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,29,234,188,0,0                ; mulps         0xbcea(%rip),%xmm3        # 2bc60 <_sk_srcover_rgba_8888_sse2_lowp+0xfb8>
+  DB  15,89,29,240,188,0,0                ; mulps         0xbcf0(%rip),%xmm3        # 2bfc0 <_sk_srcover_rgba_8888_sse2_lowp+0xfbc>
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -30630,9 +30763,9 @@
   DB  72,139,24                           ; mov           (%rax),%rbx
   DB  76,139,112,8                        ; mov           0x8(%rax),%r14
   DB  72,255,203                          ; dec           %rbx
-  DB  120,7                               ; js            20416 <_sk_evenly_spaced_gradient_sse2+0x18>
+  DB  120,7                               ; js            20770 <_sk_evenly_spaced_gradient_sse2+0x18>
   DB  243,72,15,42,203                    ; cvtsi2ss      %rbx,%xmm1
-  DB  235,21                              ; jmp           2042b <_sk_evenly_spaced_gradient_sse2+0x2d>
+  DB  235,21                              ; jmp           20785 <_sk_evenly_spaced_gradient_sse2+0x2d>
   DB  73,137,216                          ; mov           %rbx,%r8
   DB  73,209,232                          ; shr           %r8
   DB  131,227,1                           ; and           $0x1,%ebx
@@ -30728,15 +30861,15 @@
 
 PUBLIC _sk_gauss_a_to_rgba_sse2
 _sk_gauss_a_to_rgba_sse2 LABEL PROC
-  DB  15,40,5,178,182,0,0                 ; movaps        0xb6b2(%rip),%xmm0        # 2bc70 <_sk_srcover_rgba_8888_sse2_lowp+0xfc8>
+  DB  15,40,5,184,182,0,0                 ; movaps        0xb6b8(%rip),%xmm0        # 2bfd0 <_sk_srcover_rgba_8888_sse2_lowp+0xfcc>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,184,182,0,0                 ; addps         0xb6b8(%rip),%xmm0        # 2bc80 <_sk_srcover_rgba_8888_sse2_lowp+0xfd8>
+  DB  15,88,5,190,182,0,0                 ; addps         0xb6be(%rip),%xmm0        # 2bfe0 <_sk_srcover_rgba_8888_sse2_lowp+0xfdc>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,190,182,0,0                 ; addps         0xb6be(%rip),%xmm0        # 2bc90 <_sk_srcover_rgba_8888_sse2_lowp+0xfe8>
+  DB  15,88,5,196,182,0,0                 ; addps         0xb6c4(%rip),%xmm0        # 2bff0 <_sk_srcover_rgba_8888_sse2_lowp+0xfec>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,196,182,0,0                 ; addps         0xb6c4(%rip),%xmm0        # 2bca0 <_sk_srcover_rgba_8888_sse2_lowp+0xff8>
+  DB  15,88,5,202,182,0,0                 ; addps         0xb6ca(%rip),%xmm0        # 2c000 <_sk_srcover_rgba_8888_sse2_lowp+0xffc>
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,5,202,182,0,0                 ; addps         0xb6ca(%rip),%xmm0        # 2bcb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1008>
+  DB  15,88,5,208,182,0,0                 ; addps         0xb6d0(%rip),%xmm0        # 2c010 <_sk_srcover_rgba_8888_sse2_lowp+0x100c>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
@@ -30751,7 +30884,7 @@
   DB  76,139,0                            ; mov           (%rax),%r8
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  73,131,248,2                        ; cmp           $0x2,%r8
-  DB  114,41                              ; jb            2062e <_sk_gradient_sse2+0x3b>
+  DB  114,41                              ; jb            20988 <_sk_gradient_sse2+0x3b>
   DB  76,139,72,72                        ; mov           0x48(%rax),%r9
   DB  73,255,200                          ; dec           %r8
   DB  73,131,193,4                        ; add           $0x4,%r9
@@ -30762,7 +30895,7 @@
   DB  102,15,250,202                      ; psubd         %xmm2,%xmm1
   DB  73,131,193,4                        ; add           $0x4,%r9
   DB  73,255,200                          ; dec           %r8
-  DB  117,230                             ; jne           20614 <_sk_gradient_sse2+0x21>
+  DB  117,230                             ; jne           2096e <_sk_gradient_sse2+0x21>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,209                   ; movq          %xmm2,%r9
   DB  69,137,200                          ; mov           %r9d,%r8d
@@ -30896,29 +31029,29 @@
   DB  69,15,94,220                        ; divps         %xmm12,%xmm11
   DB  69,15,40,227                        ; movaps        %xmm11,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
-  DB  68,15,40,45,90,180,0,0              ; movaps        0xb45a(%rip),%xmm13        # 2bcc0 <_sk_srcover_rgba_8888_sse2_lowp+0x1018>
+  DB  68,15,40,45,96,180,0,0              ; movaps        0xb460(%rip),%xmm13        # 2c020 <_sk_srcover_rgba_8888_sse2_lowp+0x101c>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
-  DB  68,15,88,45,94,180,0,0              ; addps         0xb45e(%rip),%xmm13        # 2bcd0 <_sk_srcover_rgba_8888_sse2_lowp+0x1028>
+  DB  68,15,88,45,100,180,0,0             ; addps         0xb464(%rip),%xmm13        # 2c030 <_sk_srcover_rgba_8888_sse2_lowp+0x102c>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
-  DB  68,15,88,45,98,180,0,0              ; addps         0xb462(%rip),%xmm13        # 2bce0 <_sk_srcover_rgba_8888_sse2_lowp+0x1038>
+  DB  68,15,88,45,104,180,0,0             ; addps         0xb468(%rip),%xmm13        # 2c040 <_sk_srcover_rgba_8888_sse2_lowp+0x103c>
   DB  69,15,89,236                        ; mulps         %xmm12,%xmm13
-  DB  68,15,88,45,102,180,0,0             ; addps         0xb466(%rip),%xmm13        # 2bcf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1048>
+  DB  68,15,88,45,108,180,0,0             ; addps         0xb46c(%rip),%xmm13        # 2c050 <_sk_srcover_rgba_8888_sse2_lowp+0x104c>
   DB  69,15,89,235                        ; mulps         %xmm11,%xmm13
   DB  69,15,194,202,1                     ; cmpltps       %xmm10,%xmm9
-  DB  68,15,40,21,101,180,0,0             ; movaps        0xb465(%rip),%xmm10        # 2bd00 <_sk_srcover_rgba_8888_sse2_lowp+0x1058>
+  DB  68,15,40,21,107,180,0,0             ; movaps        0xb46b(%rip),%xmm10        # 2c060 <_sk_srcover_rgba_8888_sse2_lowp+0x105c>
   DB  69,15,92,213                        ; subps         %xmm13,%xmm10
   DB  69,15,84,209                        ; andps         %xmm9,%xmm10
   DB  69,15,85,205                        ; andnps        %xmm13,%xmm9
   DB  69,15,86,202                        ; orps          %xmm10,%xmm9
   DB  68,15,194,192,1                     ; cmpltps       %xmm0,%xmm8
-  DB  68,15,40,21,40,174,0,0              ; movaps        0xae28(%rip),%xmm10        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,21,46,174,0,0              ; movaps        0xae2e(%rip),%xmm10        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,92,209                        ; subps         %xmm9,%xmm10
   DB  69,15,84,208                        ; andps         %xmm8,%xmm10
   DB  69,15,85,193                        ; andnps        %xmm9,%xmm8
   DB  69,15,86,194                        ; orps          %xmm10,%xmm8
   DB  68,15,40,201                        ; movaps        %xmm1,%xmm9
   DB  68,15,194,200,1                     ; cmpltps       %xmm0,%xmm9
-  DB  68,15,40,21,23,174,0,0              ; movaps        0xae17(%rip),%xmm10        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,21,29,174,0,0              ; movaps        0xae1d(%rip),%xmm10        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,208                        ; subps         %xmm8,%xmm10
   DB  69,15,84,209                        ; andps         %xmm9,%xmm10
   DB  69,15,85,200                        ; andnps        %xmm8,%xmm9
@@ -30949,7 +31082,7 @@
   DB  243,69,15,89,203                    ; mulss         %xmm11,%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,88,200                        ; addps         %xmm0,%xmm9
-  DB  68,15,89,13,206,179,0,0             ; mulps         0xb3ce(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0x1068>
+  DB  68,15,89,13,212,179,0,0             ; mulps         0xb3d4(%rip),%xmm9        # 2c070 <_sk_srcover_rgba_8888_sse2_lowp+0x106c>
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
@@ -30957,7 +31090,7 @@
   DB  243,69,15,89,219                    ; mulss         %xmm11,%xmm11
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,92,227                        ; subps         %xmm11,%xmm12
-  DB  68,15,89,21,185,179,0,0             ; mulps         0xb3b9(%rip),%xmm10        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0x1078>
+  DB  68,15,89,21,191,179,0,0             ; mulps         0xb3bf(%rip),%xmm10        # 2c080 <_sk_srcover_rgba_8888_sse2_lowp+0x107c>
   DB  69,15,89,212                        ; mulps         %xmm12,%xmm10
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
@@ -30966,8 +31099,8 @@
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
-  DB  68,15,87,13,97,178,0,0              ; xorps         0xb261(%rip),%xmm9        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
-  DB  68,15,89,5,73,173,0,0               ; mulps         0xad49(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,87,13,103,178,0,0             ; xorps         0xb267(%rip),%xmm9        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
+  DB  68,15,89,5,79,173,0,0               ; mulps         0xad4f(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
@@ -30986,7 +31119,7 @@
   DB  243,69,15,89,203                    ; mulss         %xmm11,%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,88,200                        ; addps         %xmm0,%xmm9
-  DB  68,15,89,13,48,179,0,0              ; mulps         0xb330(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0x1068>
+  DB  68,15,89,13,54,179,0,0              ; mulps         0xb336(%rip),%xmm9        # 2c070 <_sk_srcover_rgba_8888_sse2_lowp+0x106c>
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,40,225                        ; movaps        %xmm1,%xmm12
   DB  69,15,89,228                        ; mulps         %xmm12,%xmm12
@@ -30994,7 +31127,7 @@
   DB  243,69,15,89,219                    ; mulss         %xmm11,%xmm11
   DB  69,15,198,219,0                     ; shufps        $0x0,%xmm11,%xmm11
   DB  69,15,92,227                        ; subps         %xmm11,%xmm12
-  DB  68,15,89,21,27,179,0,0              ; mulps         0xb31b(%rip),%xmm10        # 2bd20 <_sk_srcover_rgba_8888_sse2_lowp+0x1078>
+  DB  68,15,89,21,33,179,0,0              ; mulps         0xb321(%rip),%xmm10        # 2c080 <_sk_srcover_rgba_8888_sse2_lowp+0x107c>
   DB  69,15,89,212                        ; mulps         %xmm12,%xmm10
   DB  65,15,40,193                        ; movaps        %xmm9,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
@@ -31003,8 +31136,8 @@
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  65,15,40,194                        ; movaps        %xmm10,%xmm0
   DB  65,15,92,193                        ; subps         %xmm9,%xmm0
-  DB  68,15,87,13,195,177,0,0             ; xorps         0xb1c3(%rip),%xmm9        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
-  DB  68,15,89,5,171,172,0,0              ; mulps         0xacab(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,87,13,201,177,0,0             ; xorps         0xb1c9(%rip),%xmm9        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
+  DB  68,15,89,5,177,172,0,0              ; mulps         0xacb1(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  65,15,89,192                        ; mulps         %xmm8,%xmm0
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
@@ -31020,7 +31153,7 @@
   DB  243,69,15,89,200                    ; mulss         %xmm8,%xmm9
   DB  69,15,198,201,0                     ; shufps        $0x0,%xmm9,%xmm9
   DB  68,15,88,200                        ; addps         %xmm0,%xmm9
-  DB  68,15,89,13,163,178,0,0             ; mulps         0xb2a3(%rip),%xmm9        # 2bd10 <_sk_srcover_rgba_8888_sse2_lowp+0x1068>
+  DB  68,15,89,13,169,178,0,0             ; mulps         0xb2a9(%rip),%xmm9        # 2c070 <_sk_srcover_rgba_8888_sse2_lowp+0x106c>
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  68,15,40,209                        ; movaps        %xmm1,%xmm10
   DB  69,15,89,210                        ; mulps         %xmm10,%xmm10
@@ -31028,7 +31161,7 @@
   DB  243,69,15,89,192                    ; mulss         %xmm8,%xmm8
   DB  69,15,198,192,0                     ; shufps        $0x0,%xmm8,%xmm8
   DB  65,15,92,192                        ; subps         %xmm8,%xmm0
-  DB  15,87,5,95,177,0,0                  ; xorps         0xb15f(%rip),%xmm0        # 2bbf0 <_sk_srcover_rgba_8888_sse2_lowp+0xf48>
+  DB  15,87,5,101,177,0,0                 ; xorps         0xb165(%rip),%xmm0        # 2bf50 <_sk_srcover_rgba_8888_sse2_lowp+0xf4c>
   DB  65,15,94,193                        ; divps         %xmm9,%xmm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31065,7 +31198,7 @@
 PUBLIC _sk_save_xy_sse2
 _sk_save_xy_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,229,171,0,0              ; movaps        0xabe5(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,5,235,171,0,0              ; movaps        0xabeb(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  15,17,0                             ; movups        %xmm0,(%rax)
   DB  68,15,40,200                        ; movaps        %xmm0,%xmm9
   DB  69,15,88,200                        ; addps         %xmm8,%xmm9
@@ -31073,7 +31206,7 @@
   DB  69,15,91,210                        ; cvtdq2ps      %xmm10,%xmm10
   DB  69,15,40,217                        ; movaps        %xmm9,%xmm11
   DB  69,15,194,218,1                     ; cmpltps       %xmm10,%xmm11
-  DB  68,15,40,37,208,171,0,0             ; movaps        0xabd0(%rip),%xmm12        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  68,15,40,37,214,171,0,0             ; movaps        0xabd6(%rip),%xmm12        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,84,220                        ; andps         %xmm12,%xmm11
   DB  69,15,92,211                        ; subps         %xmm11,%xmm10
   DB  69,15,92,202                        ; subps         %xmm10,%xmm9
@@ -31116,8 +31249,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,121,177,0,0                 ; addps         0xb179(%rip),%xmm0        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,49,171,0,0              ; movaps        0xab31(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,5,127,177,0,0                 ; addps         0xb17f(%rip),%xmm0        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,55,171,0,0              ; movaps        0xab37(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,128,0,0,0              ; movups        %xmm9,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -31128,7 +31261,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,0,171,0,0                   ; addps         0xab00(%rip),%xmm0        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,88,5,6,171,0,0                   ; addps         0xab06(%rip),%xmm0        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  68,15,17,128,128,0,0,0              ; movups        %xmm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31138,8 +31271,8 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,50,177,0,0                 ; addps         0xb132(%rip),%xmm1        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,234,170,0,0             ; movaps        0xaaea(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,13,56,177,0,0                 ; addps         0xb138(%rip),%xmm1        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,240,170,0,0             ; movaps        0xaaf0(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  68,15,17,136,160,0,0,0              ; movups        %xmm9,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -31150,7 +31283,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,184,170,0,0                ; addps         0xaab8(%rip),%xmm1        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  15,88,13,190,170,0,0                ; addps         0xaabe(%rip),%xmm1        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  68,15,17,128,160,0,0,0              ; movups        %xmm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31160,13 +31293,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,251,176,0,0                 ; addps         0xb0fb(%rip),%xmm0        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0x1098>
-  DB  68,15,40,13,163,170,0,0             ; movaps        0xaaa3(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,5,1,177,0,0                   ; addps         0xb101(%rip),%xmm0        # 2c0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x109c>
+  DB  68,15,40,13,169,170,0,0             ; movaps        0xaaa9(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,239,176,0,0             ; mulps         0xb0ef(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,13,119,172,0,0             ; addps         0xac77(%rip),%xmm9        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,13,245,176,0,0             ; mulps         0xb0f5(%rip),%xmm9        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,13,125,172,0,0             ; addps         0xac7d(%rip),%xmm9        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,128,0,0,0              ; movups        %xmm9,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -31177,16 +31310,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,166,176,0,0                 ; addps         0xb0a6(%rip),%xmm0        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,94,170,0,0              ; movaps        0xaa5e(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,5,172,176,0,0                 ; addps         0xb0ac(%rip),%xmm0        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,100,170,0,0             ; movaps        0xaa64(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,194,176,0,0              ; movaps        0xb0c2(%rip),%xmm8        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,5,200,176,0,0              ; movaps        0xb0c8(%rip),%xmm8        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,198,176,0,0              ; addps         0xb0c6(%rip),%xmm8        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,5,204,176,0,0              ; addps         0xb0cc(%rip),%xmm8        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,42,170,0,0               ; addps         0xaa2a(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,88,5,48,170,0,0               ; addps         0xaa30(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,190,176,0,0              ; addps         0xb0be(%rip),%xmm8        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,5,196,176,0,0              ; addps         0xb0c4(%rip),%xmm8        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,128,128,0,0,0              ; movups        %xmm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31194,17 +31327,17 @@
 PUBLIC _sk_bicubic_p1x_sse2
 _sk_bicubic_p1x_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,8,170,0,0                ; movaps        0xaa08(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,5,14,170,0,0               ; movaps        0xaa0e(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,72,64                      ; movups        0x40(%rax),%xmm9
   DB  65,15,88,192                        ; addps         %xmm8,%xmm0
-  DB  68,15,40,21,116,176,0,0             ; movaps        0xb074(%rip),%xmm10        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,21,122,176,0,0             ; movaps        0xb07a(%rip),%xmm10        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,120,176,0,0             ; addps         0xb078(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,21,126,176,0,0             ; addps         0xb07e(%rip),%xmm10        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,116,176,0,0             ; addps         0xb074(%rip),%xmm10        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,21,122,176,0,0             ; addps         0xb07a(%rip),%xmm10        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,144,128,0,0,0              ; movups        %xmm10,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31214,11 +31347,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,0                             ; movups        (%rax),%xmm0
   DB  68,15,16,64,64                      ; movups        0x40(%rax),%xmm8
-  DB  15,88,5,71,176,0,0                  ; addps         0xb047(%rip),%xmm0        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  15,88,5,77,176,0,0                  ; addps         0xb04d(%rip),%xmm0        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,23,176,0,0               ; mulps         0xb017(%rip),%xmm8        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,5,159,171,0,0              ; addps         0xab9f(%rip),%xmm8        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,5,29,176,0,0               ; mulps         0xb01d(%rip),%xmm8        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,5,165,171,0,0              ; addps         0xaba5(%rip),%xmm8        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,128,0,0,0              ; movups        %xmm8,0x80(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -31229,13 +31362,13 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,221,175,0,0                ; addps         0xafdd(%rip),%xmm1        # 2bd40 <_sk_srcover_rgba_8888_sse2_lowp+0x1098>
-  DB  68,15,40,13,133,169,0,0             ; movaps        0xa985(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,13,227,175,0,0                ; addps         0xafe3(%rip),%xmm1        # 2c0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x109c>
+  DB  68,15,40,13,139,169,0,0             ; movaps        0xa98b(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
   DB  69,15,40,193                        ; movaps        %xmm9,%xmm8
   DB  69,15,89,192                        ; mulps         %xmm8,%xmm8
-  DB  68,15,89,13,209,175,0,0             ; mulps         0xafd1(%rip),%xmm9        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,13,89,171,0,0              ; addps         0xab59(%rip),%xmm9        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,13,215,175,0,0             ; mulps         0xafd7(%rip),%xmm9        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,13,95,171,0,0              ; addps         0xab5f(%rip),%xmm9        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,200                        ; mulps         %xmm8,%xmm9
   DB  68,15,17,136,160,0,0,0              ; movups        %xmm9,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -31246,16 +31379,16 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,135,175,0,0                ; addps         0xaf87(%rip),%xmm1        # 2bd30 <_sk_srcover_rgba_8888_sse2_lowp+0x1088>
-  DB  68,15,40,13,63,169,0,0              ; movaps        0xa93f(%rip),%xmm9        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,88,13,141,175,0,0                ; addps         0xaf8d(%rip),%xmm1        # 2c090 <_sk_srcover_rgba_8888_sse2_lowp+0x108c>
+  DB  68,15,40,13,69,169,0,0              ; movaps        0xa945(%rip),%xmm9        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  69,15,92,200                        ; subps         %xmm8,%xmm9
-  DB  68,15,40,5,163,175,0,0              ; movaps        0xafa3(%rip),%xmm8        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,5,169,175,0,0              ; movaps        0xafa9(%rip),%xmm8        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,167,175,0,0              ; addps         0xafa7(%rip),%xmm8        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,5,173,175,0,0              ; addps         0xafad(%rip),%xmm8        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,11,169,0,0               ; addps         0xa90b(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,88,5,17,169,0,0               ; addps         0xa911(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
-  DB  68,15,88,5,159,175,0,0              ; addps         0xaf9f(%rip),%xmm8        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,5,165,175,0,0              ; addps         0xafa5(%rip),%xmm8        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,128,160,0,0,0              ; movups        %xmm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31263,17 +31396,17 @@
 PUBLIC _sk_bicubic_p1y_sse2
 _sk_bicubic_p1y_sse2 LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  68,15,40,5,233,168,0,0              ; movaps        0xa8e9(%rip),%xmm8        # 2b6e0 <_sk_srcover_rgba_8888_sse2_lowp+0xa38>
+  DB  68,15,40,5,239,168,0,0              ; movaps        0xa8ef(%rip),%xmm8        # 2ba40 <_sk_srcover_rgba_8888_sse2_lowp+0xa3c>
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,72,96                      ; movups        0x60(%rax),%xmm9
   DB  65,15,88,200                        ; addps         %xmm8,%xmm1
-  DB  68,15,40,21,84,175,0,0              ; movaps        0xaf54(%rip),%xmm10        # 2bd60 <_sk_srcover_rgba_8888_sse2_lowp+0x10b8>
+  DB  68,15,40,21,90,175,0,0              ; movaps        0xaf5a(%rip),%xmm10        # 2c0c0 <_sk_srcover_rgba_8888_sse2_lowp+0x10bc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,88,175,0,0              ; addps         0xaf58(%rip),%xmm10        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  68,15,88,21,94,175,0,0              ; addps         0xaf5e(%rip),%xmm10        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
   DB  69,15,88,208                        ; addps         %xmm8,%xmm10
   DB  69,15,89,209                        ; mulps         %xmm9,%xmm10
-  DB  68,15,88,21,84,175,0,0              ; addps         0xaf54(%rip),%xmm10        # 2bd80 <_sk_srcover_rgba_8888_sse2_lowp+0x10d8>
+  DB  68,15,88,21,90,175,0,0              ; addps         0xaf5a(%rip),%xmm10        # 2c0e0 <_sk_srcover_rgba_8888_sse2_lowp+0x10dc>
   DB  68,15,17,144,160,0,0,0              ; movups        %xmm10,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -31283,11 +31416,11 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,16,72,32                         ; movups        0x20(%rax),%xmm1
   DB  68,15,16,64,96                      ; movups        0x60(%rax),%xmm8
-  DB  15,88,13,38,175,0,0                 ; addps         0xaf26(%rip),%xmm1        # 2bd70 <_sk_srcover_rgba_8888_sse2_lowp+0x10c8>
+  DB  15,88,13,44,175,0,0                 ; addps         0xaf2c(%rip),%xmm1        # 2c0d0 <_sk_srcover_rgba_8888_sse2_lowp+0x10cc>
   DB  69,15,40,200                        ; movaps        %xmm8,%xmm9
   DB  69,15,89,201                        ; mulps         %xmm9,%xmm9
-  DB  68,15,89,5,246,174,0,0              ; mulps         0xaef6(%rip),%xmm8        # 2bd50 <_sk_srcover_rgba_8888_sse2_lowp+0x10a8>
-  DB  68,15,88,5,126,170,0,0              ; addps         0xaa7e(%rip),%xmm8        # 2b8e0 <_sk_srcover_rgba_8888_sse2_lowp+0xc38>
+  DB  68,15,89,5,252,174,0,0              ; mulps         0xaefc(%rip),%xmm8        # 2c0b0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ac>
+  DB  68,15,88,5,132,170,0,0              ; addps         0xaa84(%rip),%xmm8        # 2bc40 <_sk_srcover_rgba_8888_sse2_lowp+0xc3c>
   DB  69,15,89,193                        ; mulps         %xmm9,%xmm8
   DB  68,15,17,128,160,0,0,0              ; movups        %xmm8,0xa0(%rax)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -31416,7 +31549,7 @@
   DB  102,65,15,254,205                   ; paddd         %xmm13,%xmm1
   DB  102,68,15,127,108,36,80             ; movdqa        %xmm13,0x50(%rsp)
   DB  102,15,254,217                      ; paddd         %xmm1,%xmm3
-  DB  102,68,15,111,5,83,173,0,0          ; movdqa        0xad53(%rip),%xmm8        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,68,15,111,5,89,173,0,0          ; movdqa        0xad59(%rip),%xmm8        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,112,195,245                  ; pshufd        $0xf5,%xmm3,%xmm0
   DB  102,65,15,244,216                   ; pmuludq       %xmm8,%xmm3
   DB  102,65,15,244,192                   ; pmuludq       %xmm8,%xmm0
@@ -31455,7 +31588,7 @@
   DB  243,66,15,16,44,139                 ; movss         (%rbx,%r9,4),%xmm5
   DB  15,20,236                           ; unpcklps      %xmm4,%xmm5
   DB  102,15,20,221                       ; unpcklpd      %xmm5,%xmm3
-  DB  102,68,15,111,37,26,166,0,0         ; movdqa        0xa61a(%rip),%xmm12        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,37,32,166,0,0         ; movdqa        0xa620(%rip),%xmm12        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,196                   ; paddd         %xmm12,%xmm0
   DB  102,15,112,224,78                   ; pshufd        $0x4e,%xmm0,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
@@ -31471,7 +31604,7 @@
   DB  243,66,15,16,36,139                 ; movss         (%rbx,%r9,4),%xmm4
   DB  15,20,224                           ; unpcklps      %xmm0,%xmm4
   DB  102,15,20,236                       ; unpcklpd      %xmm4,%xmm5
-  DB  15,40,37,63,172,0,0                 ; movaps        0xac3f(%rip),%xmm4        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0x10e8>
+  DB  15,40,37,69,172,0,0                 ; movaps        0xac45(%rip),%xmm4        # 2c0f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ec>
   DB  68,15,88,220                        ; addps         %xmm4,%xmm11
   DB  68,15,41,92,36,64                   ; movaps        %xmm11,0x40(%rsp)
   DB  68,15,40,223                        ; movaps        %xmm7,%xmm11
@@ -31507,7 +31640,7 @@
   DB  15,20,249                           ; unpcklps      %xmm1,%xmm7
   DB  102,15,20,252                       ; unpcklpd      %xmm4,%xmm7
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,15,250,13,180,171,0,0           ; psubd         0xabb4(%rip),%xmm1        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,13,186,171,0,0           ; psubd         0xabba(%rip),%xmm1        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,225,78                   ; pshufd        $0x4e,%xmm1,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -31597,7 +31730,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,233                           ; unpcklps      %xmm1,%xmm5
   DB  102,15,20,221                       ; unpcklpd      %xmm5,%xmm3
-  DB  102,68,15,111,45,140,163,0,0        ; movdqa        0xa38c(%rip),%xmm13        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,45,146,163,0,0        ; movdqa        0xa392(%rip),%xmm13        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,197                   ; paddd         %xmm13,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,73,15,126,200                   ; movq          %xmm1,%r8
@@ -31694,7 +31827,7 @@
   DB  102,15,111,206                      ; movdqa        %xmm6,%xmm1
   DB  102,65,15,254,202                   ; paddd         %xmm10,%xmm1
   DB  102,15,112,209,245                  ; pshufd        $0xf5,%xmm1,%xmm2
-  DB  102,15,111,29,81,168,0,0            ; movdqa        0xa851(%rip),%xmm3        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,29,87,168,0,0            ; movdqa        0xa857(%rip),%xmm3        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,203                      ; pmuludq       %xmm3,%xmm1
   DB  102,15,244,211                      ; pmuludq       %xmm3,%xmm2
   DB  102,15,111,251                      ; movdqa        %xmm3,%xmm7
@@ -31732,7 +31865,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,236                           ; unpcklps      %xmm4,%xmm5
   DB  102,15,20,213                       ; unpcklpd      %xmm5,%xmm2
-  DB  102,15,111,5,33,161,0,0             ; movdqa        0xa121(%rip),%xmm0        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,111,5,39,161,0,0             ; movdqa        0xa127(%rip),%xmm0        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,254,216                      ; paddd         %xmm0,%xmm3
   DB  102,15,112,227,78                   ; pshufd        $0x4e,%xmm3,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
@@ -31813,7 +31946,7 @@
   DB  102,15,111,214                      ; movdqa        %xmm6,%xmm2
   DB  102,65,15,254,212                   ; paddd         %xmm12,%xmm2
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,13,47,166,0,0            ; movdqa        0xa62f(%rip),%xmm1        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,13,53,166,0,0            ; movdqa        0xa635(%rip),%xmm1        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
   DB  102,15,244,193                      ; pmuludq       %xmm1,%xmm0
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
@@ -31835,7 +31968,7 @@
   DB  68,15,20,209                        ; unpcklps      %xmm1,%xmm10
   DB  102,68,15,20,210                    ; unpcklpd      %xmm2,%xmm10
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  102,15,250,13,212,165,0,0           ; psubd         0xa5d4(%rip),%xmm1        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,13,218,165,0,0           ; psubd         0xa5da(%rip),%xmm1        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -31850,7 +31983,7 @@
   DB  243,15,16,20,131                    ; movss         (%rbx,%rax,4),%xmm2
   DB  15,20,209                           ; unpcklps      %xmm1,%xmm2
   DB  102,15,20,226                       ; unpcklpd      %xmm2,%xmm4
-  DB  102,15,254,5,255,158,0,0            ; paddd         0x9eff(%rip),%xmm0        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,5,5,159,0,0              ; paddd         0x9f05(%rip),%xmm0        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,73,15,126,200                   ; movq          %xmm1,%r8
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
@@ -31887,7 +32020,7 @@
   DB  15,20,199                           ; unpcklps      %xmm7,%xmm0
   DB  102,15,20,193                       ; unpcklpd      %xmm1,%xmm0
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,15,250,13,222,164,0,0           ; psubd         0xa4de(%rip),%xmm1        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,13,228,164,0,0           ; psubd         0xa4e4(%rip),%xmm1        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,249,78                   ; pshufd        $0x4e,%xmm1,%xmm7
   DB  102,73,15,126,248                   ; movq          %xmm7,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -31902,7 +32035,7 @@
   DB  243,15,16,52,131                    ; movss         (%rbx,%rax,4),%xmm6
   DB  15,20,247                           ; unpcklps      %xmm7,%xmm6
   DB  102,15,20,206                       ; unpcklpd      %xmm6,%xmm1
-  DB  102,15,254,21,9,158,0,0             ; paddd         0x9e09(%rip),%xmm2        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,21,15,158,0,0            ; paddd         0x9e0f(%rip),%xmm2        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,112,242,78                   ; pshufd        $0x4e,%xmm2,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
@@ -32046,7 +32179,7 @@
   DB  102,65,15,254,210                   ; paddd         %xmm10,%xmm2
   DB  102,15,111,220                      ; movdqa        %xmm4,%xmm3
   DB  102,15,254,218                      ; paddd         %xmm2,%xmm3
-  DB  102,15,111,37,2,162,0,0             ; movdqa        0xa202(%rip),%xmm4        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,37,8,162,0,0             ; movdqa        0xa208(%rip),%xmm4        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,112,195,245                  ; pshufd        $0xf5,%xmm3,%xmm0
   DB  102,15,244,220                      ; pmuludq       %xmm4,%xmm3
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
@@ -32085,7 +32218,7 @@
   DB  243,66,15,16,52,139                 ; movss         (%rbx,%r9,4),%xmm6
   DB  15,20,244                           ; unpcklps      %xmm4,%xmm6
   DB  102,15,20,238                       ; unpcklpd      %xmm6,%xmm5
-  DB  102,15,254,5,204,154,0,0            ; paddd         0x9acc(%rip),%xmm0        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,5,210,154,0,0            ; paddd         0x9ad2(%rip),%xmm0        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,112,224,78                   ; pshufd        $0x4e,%xmm0,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
   DB  102,73,15,126,193                   ; movq          %xmm0,%r9
@@ -32100,7 +32233,7 @@
   DB  243,66,15,16,52,139                 ; movss         (%rbx,%r9,4),%xmm6
   DB  15,20,244                           ; unpcklps      %xmm4,%xmm6
   DB  102,15,20,222                       ; unpcklpd      %xmm6,%xmm3
-  DB  15,40,53,246,160,0,0                ; movaps        0xa0f6(%rip),%xmm6        # 2bd90 <_sk_srcover_rgba_8888_sse2_lowp+0x10e8>
+  DB  15,40,53,252,160,0,0                ; movaps        0xa0fc(%rip),%xmm6        # 2c0f0 <_sk_srcover_rgba_8888_sse2_lowp+0x10ec>
   DB  68,15,88,198                        ; addps         %xmm6,%xmm8
   DB  68,15,41,68,36,48                   ; movaps        %xmm8,0x30(%rsp)
   DB  68,15,88,254                        ; addps         %xmm6,%xmm15
@@ -32118,7 +32251,7 @@
   DB  102,65,15,254,215                   ; paddd         %xmm15,%xmm2
   DB  102,68,15,127,124,36,96             ; movdqa        %xmm15,0x60(%rsp)
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,13,169,160,0,0           ; movdqa        0xa0a9(%rip),%xmm1        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,13,175,160,0,0           ; movdqa        0xa0af(%rip),%xmm1        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
   DB  102,15,244,193                      ; pmuludq       %xmm1,%xmm0
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
@@ -32139,7 +32272,7 @@
   DB  15,20,240                           ; unpcklps      %xmm0,%xmm6
   DB  102,15,20,242                       ; unpcklpd      %xmm2,%xmm6
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
-  DB  102,15,250,5,84,160,0,0             ; psubd         0xa054(%rip),%xmm0        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,5,90,160,0,0             ; psubd         0xa05a(%rip),%xmm0        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,208,78                   ; pshufd        $0x4e,%xmm0,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
@@ -32154,7 +32287,7 @@
   DB  243,68,15,16,28,131                 ; movss         (%rbx,%rax,4),%xmm11
   DB  68,15,20,216                        ; unpcklps      %xmm0,%xmm11
   DB  102,65,15,20,211                    ; unpcklpd      %xmm11,%xmm2
-  DB  102,15,254,13,124,153,0,0           ; paddd         0x997c(%rip),%xmm1        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,13,130,153,0,0           ; paddd         0x9982(%rip),%xmm1        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
   DB  102,73,15,126,192                   ; movq          %xmm0,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -32192,7 +32325,7 @@
   DB  102,65,15,111,194                   ; movdqa        %xmm10,%xmm0
   DB  102,15,254,68,36,32                 ; paddd         0x20(%rsp),%xmm0
   DB  102,15,112,216,245                  ; pshufd        $0xf5,%xmm0,%xmm3
-  DB  102,15,111,37,80,159,0,0            ; movdqa        0x9f50(%rip),%xmm4        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,37,86,159,0,0            ; movdqa        0x9f56(%rip),%xmm4        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
   DB  102,15,244,220                      ; pmuludq       %xmm4,%xmm3
   DB  102,68,15,111,220                   ; movdqa        %xmm4,%xmm11
@@ -32230,7 +32363,7 @@
   DB  243,15,16,60,131                    ; movss         (%rbx,%rax,4),%xmm7
   DB  15,20,253                           ; unpcklps      %xmm5,%xmm7
   DB  102,15,20,199                       ; unpcklpd      %xmm7,%xmm0
-  DB  102,68,15,111,5,28,152,0,0          ; movdqa        0x981c(%rip),%xmm8        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,5,34,152,0,0          ; movdqa        0x9822(%rip),%xmm8        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,224                   ; paddd         %xmm8,%xmm4
   DB  102,15,112,236,78                   ; pshufd        $0x4e,%xmm4,%xmm5
   DB  102,73,15,126,232                   ; movq          %xmm5,%r8
@@ -32376,7 +32509,7 @@
   DB  243,15,16,36,131                    ; movss         (%rbx,%rax,4),%xmm4
   DB  15,20,226                           ; unpcklps      %xmm2,%xmm4
   DB  102,15,20,252                       ; unpcklpd      %xmm4,%xmm7
-  DB  102,68,15,111,61,107,149,0,0        ; movdqa        0x956b(%rip),%xmm15        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,61,113,149,0,0        ; movdqa        0x9571(%rip),%xmm15        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,207                   ; paddd         %xmm15,%xmm1
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
@@ -32459,7 +32592,7 @@
   DB  102,65,15,111,217                   ; movdqa        %xmm9,%xmm3
   DB  102,65,15,254,216                   ; paddd         %xmm8,%xmm3
   DB  102,15,112,211,245                  ; pshufd        $0xf5,%xmm3,%xmm2
-  DB  102,15,111,45,116,154,0,0           ; movdqa        0x9a74(%rip),%xmm5        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,45,122,154,0,0           ; movdqa        0x9a7a(%rip),%xmm5        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,221                      ; pmuludq       %xmm5,%xmm3
   DB  102,15,244,213                      ; pmuludq       %xmm5,%xmm2
   DB  102,15,112,234,232                  ; pshufd        $0xe8,%xmm2,%xmm5
@@ -32480,7 +32613,7 @@
   DB  68,15,20,198                        ; unpcklps      %xmm6,%xmm8
   DB  102,68,15,20,197                    ; unpcklpd      %xmm5,%xmm8
   DB  102,15,111,234                      ; movdqa        %xmm2,%xmm5
-  DB  102,15,250,45,29,154,0,0            ; psubd         0x9a1d(%rip),%xmm5        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,45,35,154,0,0            ; psubd         0x9a23(%rip),%xmm5        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,245,78                   ; pshufd        $0x4e,%xmm5,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,232                   ; movq          %xmm5,%rax
@@ -32512,7 +32645,7 @@
   DB  102,15,20,214                       ; unpcklpd      %xmm6,%xmm2
   DB  102,69,15,254,205                   ; paddd         %xmm13,%xmm9
   DB  102,65,15,112,233,245               ; pshufd        $0xf5,%xmm9,%xmm5
-  DB  102,15,111,29,123,153,0,0           ; movdqa        0x997b(%rip),%xmm3        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,29,129,153,0,0           ; movdqa        0x9981(%rip),%xmm3        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,68,15,244,203                   ; pmuludq       %xmm3,%xmm9
   DB  102,15,244,235                      ; pmuludq       %xmm3,%xmm5
   DB  102,15,112,237,232                  ; pshufd        $0xe8,%xmm5,%xmm5
@@ -32533,7 +32666,7 @@
   DB  69,15,20,233                        ; unpcklps      %xmm9,%xmm13
   DB  102,68,15,20,237                    ; unpcklpd      %xmm5,%xmm13
   DB  102,65,15,111,239                   ; movdqa        %xmm15,%xmm5
-  DB  102,15,250,45,27,153,0,0            ; psubd         0x991b(%rip),%xmm5        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,45,33,153,0,0            ; psubd         0x9921(%rip),%xmm5        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,221,78                   ; pshufd        $0x4e,%xmm5,%xmm3
   DB  102,73,15,126,216                   ; movq          %xmm3,%r8
   DB  102,72,15,126,232                   ; movq          %xmm5,%rax
@@ -32548,7 +32681,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,235                           ; unpcklps      %xmm3,%xmm5
   DB  102,15,20,245                       ; unpcklpd      %xmm5,%xmm6
-  DB  102,68,15,111,13,69,146,0,0         ; movdqa        0x9245(%rip),%xmm9        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,13,75,146,0,0         ; movdqa        0x924b(%rip),%xmm9        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,69,15,254,249                   ; paddd         %xmm9,%xmm15
   DB  102,65,15,112,223,78                ; pshufd        $0x4e,%xmm15,%xmm3
   DB  102,73,15,126,216                   ; movq          %xmm3,%r8
@@ -32610,7 +32743,7 @@
   DB  102,65,15,111,195                   ; movdqa        %xmm11,%xmm0
   DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
   DB  102,15,112,200,245                  ; pshufd        $0xf5,%xmm0,%xmm1
-  DB  102,15,111,21,175,151,0,0           ; movdqa        0x97af(%rip),%xmm2        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,21,181,151,0,0           ; movdqa        0x97b5(%rip),%xmm2        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,194                      ; pmuludq       %xmm2,%xmm0
   DB  102,15,244,202                      ; pmuludq       %xmm2,%xmm1
   DB  102,68,15,111,234                   ; movdqa        %xmm2,%xmm13
@@ -32803,7 +32936,7 @@
   DB  68,15,20,238                        ; unpcklps      %xmm6,%xmm13
   DB  102,68,15,20,234                    ; unpcklpd      %xmm2,%xmm13
   DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
-  DB  102,15,250,21,72,148,0,0            ; psubd         0x9448(%rip),%xmm2        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,21,78,148,0,0            ; psubd         0x944e(%rip),%xmm2        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,242,78                   ; pshufd        $0x4e,%xmm2,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
@@ -32863,7 +32996,7 @@
   DB  102,68,15,111,116,36,32             ; movdqa        0x20(%rsp),%xmm14
   DB  102,65,15,254,198                   ; paddd         %xmm14,%xmm0
   DB  102,15,112,200,245                  ; pshufd        $0xf5,%xmm0,%xmm1
-  DB  102,68,15,111,5,37,147,0,0          ; movdqa        0x9325(%rip),%xmm8        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,68,15,111,5,43,147,0,0          ; movdqa        0x932b(%rip),%xmm8        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,65,15,244,192                   ; pmuludq       %xmm8,%xmm0
   DB  102,65,15,244,200                   ; pmuludq       %xmm8,%xmm1
   DB  102,65,15,111,240                   ; movdqa        %xmm8,%xmm6
@@ -32901,7 +33034,7 @@
   DB  243,15,16,44,131                    ; movss         (%rbx,%rax,4),%xmm5
   DB  15,20,235                           ; unpcklps      %xmm3,%xmm5
   DB  102,15,20,205                       ; unpcklpd      %xmm5,%xmm1
-  DB  102,68,15,111,5,243,139,0,0         ; movdqa        0x8bf3(%rip),%xmm8        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,68,15,111,5,249,139,0,0         ; movdqa        0x8bf9(%rip),%xmm8        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,65,15,254,208                   ; paddd         %xmm8,%xmm2
   DB  102,15,112,218,78                   ; pshufd        $0x4e,%xmm2,%xmm3
   DB  102,73,15,126,216                   ; movq          %xmm3,%r8
@@ -32984,7 +33117,7 @@
   DB  102,15,254,208                      ; paddd         %xmm0,%xmm2
   DB  102,15,111,240                      ; movdqa        %xmm0,%xmm6
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,37,253,144,0,0           ; movdqa        0x90fd(%rip),%xmm4        # 2bda0 <_sk_srcover_rgba_8888_sse2_lowp+0x10f8>
+  DB  102,15,111,37,3,145,0,0             ; movdqa        0x9103(%rip),%xmm4        # 2c100 <_sk_srcover_rgba_8888_sse2_lowp+0x10fc>
   DB  102,15,244,212                      ; pmuludq       %xmm4,%xmm2
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
   DB  102,15,112,200,232                  ; pshufd        $0xe8,%xmm0,%xmm1
@@ -33005,7 +33138,7 @@
   DB  68,15,20,193                        ; unpcklps      %xmm1,%xmm8
   DB  102,68,15,20,194                    ; unpcklpd      %xmm2,%xmm8
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  102,15,250,13,166,144,0,0           ; psubd         0x90a6(%rip),%xmm1        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,13,172,144,0,0           ; psubd         0x90ac(%rip),%xmm1        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,73,15,126,208                   ; movq          %xmm2,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -33020,7 +33153,7 @@
   DB  243,15,16,20,131                    ; movss         (%rbx,%rax,4),%xmm2
   DB  15,20,209                           ; unpcklps      %xmm1,%xmm2
   DB  102,68,15,20,242                    ; unpcklpd      %xmm2,%xmm14
-  DB  102,15,254,5,207,137,0,0            ; paddd         0x89cf(%rip),%xmm0        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,5,213,137,0,0            ; paddd         0x89d5(%rip),%xmm0        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,73,15,126,200                   ; movq          %xmm1,%r8
   DB  102,72,15,126,192                   ; movq          %xmm0,%rax
@@ -33058,7 +33191,7 @@
   DB  15,20,198                           ; unpcklps      %xmm6,%xmm0
   DB  102,15,20,193                       ; unpcklpd      %xmm1,%xmm0
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
-  DB  102,15,250,13,174,143,0,0           ; psubd         0x8fae(%rip),%xmm1        # 2bdb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1108>
+  DB  102,15,250,13,180,143,0,0           ; psubd         0x8fb4(%rip),%xmm1        # 2c110 <_sk_srcover_rgba_8888_sse2_lowp+0x110c>
   DB  102,15,112,241,78                   ; pshufd        $0x4e,%xmm1,%xmm6
   DB  102,73,15,126,240                   ; movq          %xmm6,%r8
   DB  102,72,15,126,200                   ; movq          %xmm1,%rax
@@ -33073,7 +33206,7 @@
   DB  243,15,16,36,131                    ; movss         (%rbx,%rax,4),%xmm4
   DB  15,20,230                           ; unpcklps      %xmm6,%xmm4
   DB  102,15,20,204                       ; unpcklpd      %xmm4,%xmm1
-  DB  102,15,254,21,217,136,0,0           ; paddd         0x88d9(%rip),%xmm2        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0xa78>
+  DB  102,15,254,21,223,136,0,0           ; paddd         0x88df(%rip),%xmm2        # 2ba80 <_sk_srcover_rgba_8888_sse2_lowp+0xa7c>
   DB  102,15,112,226,78                   ; pshufd        $0x4e,%xmm2,%xmm4
   DB  102,73,15,126,224                   ; movq          %xmm4,%r8
   DB  102,72,15,126,208                   ; movq          %xmm2,%rax
@@ -33132,7 +33265,7 @@
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  65,15,88,215                        ; addps         %xmm15,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,191,135,0,0                ; movaps        0x87bf(%rip),%xmm3        # 2b6f0 <_sk_srcover_rgba_8888_sse2_lowp+0xa48>
+  DB  15,40,29,197,135,0,0                ; movaps        0x87c5(%rip),%xmm3        # 2ba50 <_sk_srcover_rgba_8888_sse2_lowp+0xa4c>
   DB  15,40,164,36,224,0,0,0              ; movaps        0xe0(%rsp),%xmm4
   DB  15,40,172,36,240,0,0,0              ; movaps        0xf0(%rsp),%xmm5
   DB  15,40,180,36,0,1,0,0                ; movaps        0x100(%rsp),%xmm6
@@ -33141,6 +33274,8 @@
   DB  91                                  ; pop           %rbx
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
+  DB  144                                 ; nop
+  DB  144                                 ; nop
 
 PUBLIC _sk_start_pipeline_hsw_lowp
 _sk_start_pipeline_hsw_lowp LABEL PROC
@@ -33173,13 +33308,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,169,0,0,0                    ; jae           23088 <_sk_start_pipeline_hsw_lowp+0x12c>
+  DB  15,131,169,0,0,0                    ; jae           233e4 <_sk_start_pipeline_hsw_lowp+0x12c>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,16                        ; lea           0x10(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
-  DB  119,70                              ; ja            23047 <_sk_start_pipeline_hsw_lowp+0xeb>
+  DB  119,70                              ; ja            233a3 <_sk_start_pipeline_hsw_lowp+0xeb>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
@@ -33198,10 +33333,10 @@
   DB  73,131,196,32                       ; add           $0x20,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,193                             ; jbe           23008 <_sk_start_pipeline_hsw_lowp+0xac>
+  DB  118,193                             ; jbe           23364 <_sk_start_pipeline_hsw_lowp+0xac>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,41                              ; je            23078 <_sk_start_pipeline_hsw_lowp+0x11c>
+  DB  116,41                              ; je            233d4 <_sk_start_pipeline_hsw_lowp+0x11c>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -33215,7 +33350,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,105,255,255,255              ; jne           22ff1 <_sk_start_pipeline_hsw_lowp+0x95>
+  DB  15,133,105,255,255,255              ; jne           2334d <_sk_start_pipeline_hsw_lowp+0x95>
   DB  197,248,40,181,32,255,255,255       ; vmovaps       -0xe0(%rbp),%xmm6
   DB  197,248,40,189,48,255,255,255       ; vmovaps       -0xd0(%rbp),%xmm7
   DB  197,120,40,133,64,255,255,255       ; vmovaps       -0xc0(%rbp),%xmm8
@@ -33255,7 +33390,7 @@
 PUBLIC _sk_black_color_hsw_lowp
 _sk_black_color_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,179,130,0,0      ; vpbroadcastw  0x82b3(%rip),%ymm3        # 2b3c0 <_sk_srcover_rgba_8888_sse2_lowp+0x718>
+  DB  196,226,125,121,29,183,130,0,0      ; vpbroadcastw  0x82b7(%rip),%ymm3        # 2b720 <_sk_srcover_rgba_8888_sse2_lowp+0x71c>
   DB  197,252,87,192                      ; vxorps        %ymm0,%ymm0,%ymm0
   DB  197,244,87,201                      ; vxorps        %ymm1,%ymm1,%ymm1
   DB  197,236,87,210                      ; vxorps        %ymm2,%ymm2,%ymm2
@@ -33264,7 +33399,7 @@
 PUBLIC _sk_white_color_hsw_lowp
 _sk_white_color_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,5,156,130,0,0       ; vpbroadcastw  0x829c(%rip),%ymm0        # 2b3c2 <_sk_srcover_rgba_8888_sse2_lowp+0x71a>
+  DB  196,226,125,121,5,160,130,0,0       ; vpbroadcastw  0x82a0(%rip),%ymm0        # 2b722 <_sk_srcover_rgba_8888_sse2_lowp+0x71e>
   DB  197,253,111,200                     ; vmovdqa       %ymm0,%ymm1
   DB  197,253,111,208                     ; vmovdqa       %ymm0,%ymm2
   DB  197,253,111,216                     ; vmovdqa       %ymm0,%ymm3
@@ -33273,8 +33408,8 @@
 PUBLIC _sk_set_rgb_hsw_lowp
 _sk_set_rgb_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  197,122,16,5,166,131,0,0            ; vmovss        0x83a6(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
-  DB  197,250,16,21,206,131,0,0           ; vmovss        0x83ce(%rip),%xmm2        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  197,122,16,5,170,131,0,0            ; vmovss        0x83aa(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
+  DB  197,250,16,21,210,131,0,0           ; vmovss        0x83d2(%rip),%xmm2        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  197,250,16,0                        ; vmovss        (%rax),%xmm0
   DB  196,226,57,153,194                  ; vfmadd132ss   %xmm2,%xmm8,%xmm0
   DB  197,122,44,192                      ; vcvttss2si    %xmm0,%r8d
@@ -33295,7 +33430,7 @@
 PUBLIC _sk_premul_hsw_lowp
 _sk_premul_hsw_lowp LABEL PROC
   DB  197,229,213,192                     ; vpmullw       %ymm0,%ymm3,%ymm0
-  DB  196,98,125,121,5,43,130,0,0         ; vpbroadcastw  0x822b(%rip),%ymm8        # 2b3c4 <_sk_srcover_rgba_8888_sse2_lowp+0x71c>
+  DB  196,98,125,121,5,47,130,0,0         ; vpbroadcastw  0x822f(%rip),%ymm8        # 2b724 <_sk_srcover_rgba_8888_sse2_lowp+0x720>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,229,213,201                     ; vpmullw       %ymm1,%ymm3,%ymm1
@@ -33335,7 +33470,7 @@
 
 PUBLIC _sk_invert_hsw_lowp
 _sk_invert_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,194,129,0,0        ; vpbroadcastw  0x81c2(%rip),%ymm8        # 2b3c6 <_sk_srcover_rgba_8888_sse2_lowp+0x71e>
+  DB  196,98,125,121,5,198,129,0,0        ; vpbroadcastw  0x81c6(%rip),%ymm8        # 2b726 <_sk_srcover_rgba_8888_sse2_lowp+0x722>
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
   DB  197,189,249,201                     ; vpsubw        %ymm1,%ymm8,%ymm1
   DB  197,189,249,210                     ; vpsubw        %ymm2,%ymm8,%ymm2
@@ -33355,7 +33490,7 @@
 PUBLIC _sk_srcatop_hsw_lowp
 _sk_srcatop_hsw_lowp LABEL PROC
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
-  DB  196,98,125,121,5,143,129,0,0        ; vpbroadcastw  0x818f(%rip),%ymm8        # 2b3c8 <_sk_srcover_rgba_8888_sse2_lowp+0x720>
+  DB  196,98,125,121,5,147,129,0,0        ; vpbroadcastw  0x8193(%rip),%ymm8        # 2b728 <_sk_srcover_rgba_8888_sse2_lowp+0x724>
   DB  197,189,249,219                     ; vpsubw        %ymm3,%ymm8,%ymm3
   DB  197,101,213,204                     ; vpmullw       %ymm4,%ymm3,%ymm9
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -33380,7 +33515,7 @@
 PUBLIC _sk_dstatop_hsw_lowp
 _sk_dstatop_hsw_lowp LABEL PROC
   DB  197,93,213,195                      ; vpmullw       %ymm3,%ymm4,%ymm8
-  DB  196,98,125,121,13,47,129,0,0        ; vpbroadcastw  0x812f(%rip),%ymm9        # 2b3ca <_sk_srcover_rgba_8888_sse2_lowp+0x722>
+  DB  196,98,125,121,13,51,129,0,0        ; vpbroadcastw  0x8133(%rip),%ymm9        # 2b72a <_sk_srcover_rgba_8888_sse2_lowp+0x726>
   DB  197,53,249,215                      ; vpsubw        %ymm7,%ymm9,%ymm10
   DB  197,173,213,192                     ; vpmullw       %ymm0,%ymm10,%ymm0
   DB  196,65,61,253,193                   ; vpaddw        %ymm9,%ymm8,%ymm8
@@ -33405,7 +33540,7 @@
 PUBLIC _sk_srcin_hsw_lowp
 _sk_srcin_hsw_lowp LABEL PROC
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
-  DB  196,98,125,121,5,204,128,0,0        ; vpbroadcastw  0x80cc(%rip),%ymm8        # 2b3cc <_sk_srcover_rgba_8888_sse2_lowp+0x724>
+  DB  196,98,125,121,5,208,128,0,0        ; vpbroadcastw  0x80d0(%rip),%ymm8        # 2b72c <_sk_srcover_rgba_8888_sse2_lowp+0x728>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,197,213,201                     ; vpmullw       %ymm1,%ymm7,%ymm1
@@ -33423,7 +33558,7 @@
 PUBLIC _sk_dstin_hsw_lowp
 _sk_dstin_hsw_lowp LABEL PROC
   DB  197,221,213,195                     ; vpmullw       %ymm3,%ymm4,%ymm0
-  DB  196,98,125,121,5,137,128,0,0        ; vpbroadcastw  0x8089(%rip),%ymm8        # 2b3ce <_sk_srcover_rgba_8888_sse2_lowp+0x726>
+  DB  196,98,125,121,5,141,128,0,0        ; vpbroadcastw  0x808d(%rip),%ymm8        # 2b72e <_sk_srcover_rgba_8888_sse2_lowp+0x72a>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,213,213,203                     ; vpmullw       %ymm3,%ymm5,%ymm1
@@ -33440,7 +33575,7 @@
 
 PUBLIC _sk_srcout_hsw_lowp
 _sk_srcout_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,74,128,0,0         ; vpbroadcastw  0x804a(%rip),%ymm8        # 2b3d0 <_sk_srcover_rgba_8888_sse2_lowp+0x728>
+  DB  196,98,125,121,5,78,128,0,0         ; vpbroadcastw  0x804e(%rip),%ymm8        # 2b730 <_sk_srcover_rgba_8888_sse2_lowp+0x72c>
   DB  197,61,249,207                      ; vpsubw        %ymm7,%ymm8,%ymm9
   DB  197,181,213,192                     ; vpmullw       %ymm0,%ymm9,%ymm0
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -33459,7 +33594,7 @@
 
 PUBLIC _sk_dstout_hsw_lowp
 _sk_dstout_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,3,128,0,0          ; vpbroadcastw  0x8003(%rip),%ymm8        # 2b3d2 <_sk_srcover_rgba_8888_sse2_lowp+0x72a>
+  DB  196,98,125,121,5,7,128,0,0          ; vpbroadcastw  0x8007(%rip),%ymm8        # 2b732 <_sk_srcover_rgba_8888_sse2_lowp+0x72e>
   DB  197,189,249,219                     ; vpsubw        %ymm3,%ymm8,%ymm3
   DB  197,229,213,196                     ; vpmullw       %ymm4,%ymm3,%ymm0
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -33478,7 +33613,7 @@
 
 PUBLIC _sk_srcover_hsw_lowp
 _sk_srcover_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,188,127,0,0        ; vpbroadcastw  0x7fbc(%rip),%ymm8        # 2b3d4 <_sk_srcover_rgba_8888_sse2_lowp+0x72c>
+  DB  196,98,125,121,5,192,127,0,0        ; vpbroadcastw  0x7fc0(%rip),%ymm8        # 2b734 <_sk_srcover_rgba_8888_sse2_lowp+0x730>
   DB  197,61,249,203                      ; vpsubw        %ymm3,%ymm8,%ymm9
   DB  197,53,213,212                      ; vpmullw       %ymm4,%ymm9,%ymm10
   DB  196,65,45,253,208                   ; vpaddw        %ymm8,%ymm10,%ymm10
@@ -33501,7 +33636,7 @@
 
 PUBLIC _sk_dstover_hsw_lowp
 _sk_dstover_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,97,127,0,0         ; vpbroadcastw  0x7f61(%rip),%ymm8        # 2b3d6 <_sk_srcover_rgba_8888_sse2_lowp+0x72e>
+  DB  196,98,125,121,5,101,127,0,0        ; vpbroadcastw  0x7f65(%rip),%ymm8        # 2b736 <_sk_srcover_rgba_8888_sse2_lowp+0x732>
   DB  197,61,249,207                      ; vpsubw        %ymm7,%ymm8,%ymm9
   DB  197,181,213,192                     ; vpmullw       %ymm0,%ymm9,%ymm0
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
@@ -33525,7 +33660,7 @@
 PUBLIC _sk_modulate_hsw_lowp
 _sk_modulate_hsw_lowp LABEL PROC
   DB  197,221,213,192                     ; vpmullw       %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,5,6,127,0,0          ; vpbroadcastw  0x7f06(%rip),%ymm8        # 2b3d8 <_sk_srcover_rgba_8888_sse2_lowp+0x730>
+  DB  196,98,125,121,5,10,127,0,0         ; vpbroadcastw  0x7f0a(%rip),%ymm8        # 2b738 <_sk_srcover_rgba_8888_sse2_lowp+0x734>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,213,213,201                     ; vpmullw       %ymm1,%ymm5,%ymm1
@@ -33542,7 +33677,7 @@
 
 PUBLIC _sk_multiply_hsw_lowp
 _sk_multiply_hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,199,126,0,0        ; vpbroadcastw  0x7ec7(%rip),%ymm8        # 2b3da <_sk_srcover_rgba_8888_sse2_lowp+0x732>
+  DB  196,98,125,121,5,203,126,0,0        ; vpbroadcastw  0x7ecb(%rip),%ymm8        # 2b73a <_sk_srcover_rgba_8888_sse2_lowp+0x736>
   DB  197,61,249,203                      ; vpsubw        %ymm3,%ymm8,%ymm9
   DB  197,53,213,212                      ; vpmullw       %ymm4,%ymm9,%ymm10
   DB  196,65,93,253,216                   ; vpaddw        %ymm8,%ymm4,%ymm11
@@ -33576,7 +33711,7 @@
 PUBLIC _sk_plus__hsw_lowp
 _sk_plus__hsw_lowp LABEL PROC
   DB  197,221,253,192                     ; vpaddw        %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,5,61,126,0,0         ; vpbroadcastw  0x7e3d(%rip),%ymm8        # 2b3dc <_sk_srcover_rgba_8888_sse2_lowp+0x734>
+  DB  196,98,125,121,5,65,126,0,0         ; vpbroadcastw  0x7e41(%rip),%ymm8        # 2b73c <_sk_srcover_rgba_8888_sse2_lowp+0x738>
   DB  196,194,125,58,192                  ; vpminuw       %ymm8,%ymm0,%ymm0
   DB  197,213,253,201                     ; vpaddw        %ymm1,%ymm5,%ymm1
   DB  196,194,117,58,200                  ; vpminuw       %ymm8,%ymm1,%ymm1
@@ -33591,7 +33726,7 @@
 _sk_screen_hsw_lowp LABEL PROC
   DB  197,93,253,192                      ; vpaddw        %ymm0,%ymm4,%ymm8
   DB  197,221,213,192                     ; vpmullw       %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,13,10,126,0,0        ; vpbroadcastw  0x7e0a(%rip),%ymm9        # 2b3de <_sk_srcover_rgba_8888_sse2_lowp+0x736>
+  DB  196,98,125,121,13,14,126,0,0        ; vpbroadcastw  0x7e0e(%rip),%ymm9        # 2b73e <_sk_srcover_rgba_8888_sse2_lowp+0x73a>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
@@ -33615,7 +33750,7 @@
 
 PUBLIC _sk_xor__hsw_lowp
 _sk_xor__hsw_lowp LABEL PROC
-  DB  196,98,125,121,5,175,125,0,0        ; vpbroadcastw  0x7daf(%rip),%ymm8        # 2b3e0 <_sk_srcover_rgba_8888_sse2_lowp+0x738>
+  DB  196,98,125,121,5,179,125,0,0        ; vpbroadcastw  0x7db3(%rip),%ymm8        # 2b740 <_sk_srcover_rgba_8888_sse2_lowp+0x73c>
   DB  197,61,249,207                      ; vpsubw        %ymm7,%ymm8,%ymm9
   DB  197,181,213,192                     ; vpmullw       %ymm0,%ymm9,%ymm0
   DB  197,61,249,211                      ; vpsubw        %ymm3,%ymm8,%ymm10
@@ -33647,7 +33782,7 @@
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
   DB  197,93,213,203                      ; vpmullw       %ymm3,%ymm4,%ymm9
   DB  196,194,125,62,193                  ; vpmaxuw       %ymm9,%ymm0,%ymm0
-  DB  196,98,125,121,13,51,125,0,0        ; vpbroadcastw  0x7d33(%rip),%ymm9        # 2b3e2 <_sk_srcover_rgba_8888_sse2_lowp+0x73a>
+  DB  196,98,125,121,13,55,125,0,0        ; vpbroadcastw  0x7d37(%rip),%ymm9        # 2b742 <_sk_srcover_rgba_8888_sse2_lowp+0x73e>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
@@ -33679,7 +33814,7 @@
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
   DB  197,93,213,203                      ; vpmullw       %ymm3,%ymm4,%ymm9
   DB  196,194,125,58,193                  ; vpminuw       %ymm9,%ymm0,%ymm0
-  DB  196,98,125,121,13,180,124,0,0       ; vpbroadcastw  0x7cb4(%rip),%ymm9        # 2b3e4 <_sk_srcover_rgba_8888_sse2_lowp+0x73c>
+  DB  196,98,125,121,13,184,124,0,0       ; vpbroadcastw  0x7cb8(%rip),%ymm9        # 2b744 <_sk_srcover_rgba_8888_sse2_lowp+0x740>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
@@ -33711,10 +33846,10 @@
   DB  197,197,213,192                     ; vpmullw       %ymm0,%ymm7,%ymm0
   DB  197,93,213,203                      ; vpmullw       %ymm3,%ymm4,%ymm9
   DB  196,194,125,58,193                  ; vpminuw       %ymm9,%ymm0,%ymm0
-  DB  196,98,125,121,13,53,124,0,0        ; vpbroadcastw  0x7c35(%rip),%ymm9        # 2b3e6 <_sk_srcover_rgba_8888_sse2_lowp+0x73e>
+  DB  196,98,125,121,13,57,124,0,0        ; vpbroadcastw  0x7c39(%rip),%ymm9        # 2b746 <_sk_srcover_rgba_8888_sse2_lowp+0x742>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,7                   ; vpsrlw        $0x7,%ymm0,%ymm0
-  DB  196,98,125,121,21,36,124,0,0        ; vpbroadcastw  0x7c24(%rip),%ymm10        # 2b3e8 <_sk_srcover_rgba_8888_sse2_lowp+0x740>
+  DB  196,98,125,121,21,40,124,0,0        ; vpbroadcastw  0x7c28(%rip),%ymm10        # 2b748 <_sk_srcover_rgba_8888_sse2_lowp+0x744>
   DB  196,193,125,219,194                 ; vpand         %ymm10,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
   DB  197,85,253,193                      ; vpaddw        %ymm1,%ymm5,%ymm8
@@ -33745,10 +33880,10 @@
 _sk_exclusion_hsw_lowp LABEL PROC
   DB  197,93,253,192                      ; vpaddw        %ymm0,%ymm4,%ymm8
   DB  197,221,213,192                     ; vpmullw       %ymm0,%ymm4,%ymm0
-  DB  196,98,125,121,13,169,123,0,0       ; vpbroadcastw  0x7ba9(%rip),%ymm9        # 2b3ea <_sk_srcover_rgba_8888_sse2_lowp+0x742>
+  DB  196,98,125,121,13,173,123,0,0       ; vpbroadcastw  0x7bad(%rip),%ymm9        # 2b74a <_sk_srcover_rgba_8888_sse2_lowp+0x746>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,7                   ; vpsrlw        $0x7,%ymm0,%ymm0
-  DB  196,98,125,121,21,152,123,0,0       ; vpbroadcastw  0x7b98(%rip),%ymm10        # 2b3ec <_sk_srcover_rgba_8888_sse2_lowp+0x744>
+  DB  196,98,125,121,21,156,123,0,0       ; vpbroadcastw  0x7b9c(%rip),%ymm10        # 2b74c <_sk_srcover_rgba_8888_sse2_lowp+0x748>
   DB  196,193,125,219,194                 ; vpand         %ymm10,%ymm0,%ymm0
   DB  197,189,249,192                     ; vpsubw        %ymm0,%ymm8,%ymm0
   DB  197,85,253,193                      ; vpaddw        %ymm1,%ymm5,%ymm8
@@ -33774,7 +33909,7 @@
 PUBLIC _sk_hardlight_hsw_lowp
 _sk_hardlight_hsw_lowp LABEL PROC
   DB  197,125,253,192                     ; vpaddw        %ymm0,%ymm0,%ymm8
-  DB  196,98,125,121,13,53,123,0,0        ; vpbroadcastw  0x7b35(%rip),%ymm9        # 2b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0x748>
+  DB  196,98,125,121,13,57,123,0,0        ; vpbroadcastw  0x7b39(%rip),%ymm9        # 2b750 <_sk_srcover_rgba_8888_sse2_lowp+0x74c>
   DB  196,65,101,239,209                  ; vpxor         %ymm9,%ymm3,%ymm10
   DB  196,65,61,239,217                   ; vpxor         %ymm9,%ymm8,%ymm11
   DB  196,65,37,101,218                   ; vpcmpgtw      %ymm10,%ymm11,%ymm11
@@ -33802,7 +33937,7 @@
   DB  197,101,249,210                     ; vpsubw        %ymm2,%ymm3,%ymm10
   DB  197,69,249,246                      ; vpsubw        %ymm6,%ymm7,%ymm14
   DB  196,65,45,213,214                   ; vpmullw       %ymm14,%ymm10,%ymm10
-  DB  196,98,125,121,53,172,122,0,0       ; vpbroadcastw  0x7aac(%rip),%ymm14        # 2b3ee <_sk_srcover_rgba_8888_sse2_lowp+0x746>
+  DB  196,98,125,121,53,176,122,0,0       ; vpbroadcastw  0x7ab0(%rip),%ymm14        # 2b74e <_sk_srcover_rgba_8888_sse2_lowp+0x74a>
   DB  196,65,45,253,210                   ; vpaddw        %ymm10,%ymm10,%ymm10
   DB  196,65,61,249,194                   ; vpsubw        %ymm10,%ymm8,%ymm8
   DB  197,13,249,215                      ; vpsubw        %ymm7,%ymm14,%ymm10
@@ -33837,7 +33972,7 @@
 PUBLIC _sk_overlay_hsw_lowp
 _sk_overlay_hsw_lowp LABEL PROC
   DB  197,93,253,196                      ; vpaddw        %ymm4,%ymm4,%ymm8
-  DB  196,98,125,121,13,33,122,0,0        ; vpbroadcastw  0x7a21(%rip),%ymm9        # 2b3f4 <_sk_srcover_rgba_8888_sse2_lowp+0x74c>
+  DB  196,98,125,121,13,37,122,0,0        ; vpbroadcastw  0x7a25(%rip),%ymm9        # 2b754 <_sk_srcover_rgba_8888_sse2_lowp+0x750>
   DB  196,65,69,239,209                   ; vpxor         %ymm9,%ymm7,%ymm10
   DB  196,65,61,239,193                   ; vpxor         %ymm9,%ymm8,%ymm8
   DB  196,65,61,101,218                   ; vpcmpgtw      %ymm10,%ymm8,%ymm11
@@ -33861,7 +33996,7 @@
   DB  196,65,21,253,237                   ; vpaddw        %ymm13,%ymm13,%ymm13
   DB  196,65,61,249,237                   ; vpsubw        %ymm13,%ymm8,%ymm13
   DB  196,67,13,76,229,192                ; vpblendvb     %ymm12,%ymm13,%ymm14,%ymm12
-  DB  196,98,125,121,45,169,121,0,0       ; vpbroadcastw  0x79a9(%rip),%ymm13        # 2b3f2 <_sk_srcover_rgba_8888_sse2_lowp+0x74a>
+  DB  196,98,125,121,45,173,121,0,0       ; vpbroadcastw  0x79ad(%rip),%ymm13        # 2b752 <_sk_srcover_rgba_8888_sse2_lowp+0x74e>
   DB  197,77,253,246                      ; vpaddw        %ymm6,%ymm6,%ymm14
   DB  196,65,13,239,201                   ; vpxor         %ymm9,%ymm14,%ymm9
   DB  196,65,53,101,202                   ; vpcmpgtw      %ymm10,%ymm9,%ymm9
@@ -33911,10 +34046,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            23b3f <_sk_load_8888_hsw_lowp+0x52>
+  DB  119,55                              ; ja            23e9b <_sk_load_8888_hsw_lowp+0x52>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,162,1,0,0                 ; lea           0x1a2(%rip),%r9        # 23cb8 <_sk_load_8888_hsw_lowp+0x1cb>
+  DB  76,141,13,162,1,0,0                 ; lea           0x1a2(%rip),%r9        # 24014 <_sk_load_8888_hsw_lowp+0x1cb>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -33924,10 +34059,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,12,144              ; vmovd         (%r8,%rdx,4),%xmm1
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
-  DB  233,39,1,0,0                        ; jmpq          23c66 <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          23fc2 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
   DB  196,193,126,111,68,144,32           ; vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  DB  233,21,1,0,0                        ; jmpq          23c66 <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          23fc2 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
@@ -33936,7 +34071,7 @@
   DB  197,249,112,201,232                 ; vpshufd       $0xe8,%xmm1,%xmm1
   DB  196,227,125,2,201,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   DB  197,253,111,195                     ; vmovdqa       %ymm3,%ymm0
-  DB  233,229,0,0,0                       ; jmpq          23c66 <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          23fc2 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -33952,7 +34087,7 @@
   DB  196,193,122,111,12,144              ; vmovdqu       (%r8,%rdx,4),%xmm1
   DB  196,227,117,2,200,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   DB  197,125,127,192                     ; vmovdqa       %ymm8,%ymm0
-  DB  233,138,0,0,0                       ; jmpq          23c66 <_sk_load_8888_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          23fc2 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,40           ; vmovd         0x28(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -33962,7 +34097,7 @@
   DB  196,193,121,110,76,144,32           ; vmovd         0x20(%r8,%rdx,4),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
-  DB  235,81                              ; jmp           23c66 <_sk_load_8888_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           23fc2 <_sk_load_8888_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,56           ; vmovd         0x38(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -33982,7 +34117,7 @@
   DB  196,227,101,14,200,170              ; vpblendw      $0xaa,%ymm0,%ymm3,%ymm1
   DB  196,227,109,14,192,170              ; vpblendw      $0xaa,%ymm0,%ymm2,%ymm0
   DB  196,226,125,43,201                  ; vpackusdw     %ymm1,%ymm0,%ymm1
-  DB  197,125,111,5,113,119,0,0           ; vmovdqa       0x7771(%rip),%ymm8        # 2b400 <_sk_srcover_rgba_8888_sse2_lowp+0x758>
+  DB  197,125,111,5,117,119,0,0           ; vmovdqa       0x7775(%rip),%ymm8        # 2b760 <_sk_srcover_rgba_8888_sse2_lowp+0x75c>
   DB  196,193,117,219,192                 ; vpand         %ymm8,%ymm1,%ymm0
   DB  197,245,113,209,8                   ; vpsrlw        $0x8,%ymm1,%ymm1
   DB  197,229,114,211,16                  ; vpsrld        $0x10,%ymm3,%ymm3
@@ -33993,7 +34128,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,144                             ; xchg          %ax,%ax
-  DB  120,254                             ; js            23cb8 <_sk_load_8888_hsw_lowp+0x1cb>
+  DB  120,254                             ; js            24014 <_sk_load_8888_hsw_lowp+0x1cb>
   DB  255                                 ; (bad)
   DB  255,175,254,255,255,153             ; ljmp          *-0x66000002(%rdi)
   DB  254                                 ; (bad)
@@ -34039,10 +34174,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            23d46 <_sk_load_8888_dst_hsw_lowp+0x52>
+  DB  119,55                              ; ja            240a2 <_sk_load_8888_dst_hsw_lowp+0x52>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 23ec0 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 2421c <_sk_load_8888_dst_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34052,10 +34187,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,44,144              ; vmovd         (%r8,%rdx,4),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,39,1,0,0                        ; jmpq          23e6d <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          241c9 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
   DB  196,193,126,111,100,144,32          ; vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  DB  233,21,1,0,0                        ; jmpq          23e6d <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          241c9 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -34064,7 +34199,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,229,0,0,0                       ; jmpq          23e6d <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          241c9 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34080,7 +34215,7 @@
   DB  196,193,122,111,44,144              ; vmovdqu       (%r8,%rdx,4),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,138,0,0,0                       ; jmpq          23e6d <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          241c9 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,40          ; vmovd         0x28(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34090,7 +34225,7 @@
   DB  196,193,121,110,108,144,32          ; vmovd         0x20(%r8,%rdx,4),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
-  DB  235,81                              ; jmp           23e6d <_sk_load_8888_dst_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           241c9 <_sk_load_8888_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,56          ; vmovd         0x38(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34110,7 +34245,7 @@
   DB  196,227,69,14,236,170               ; vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   DB  196,227,77,14,228,170               ; vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   DB  196,226,93,43,237                   ; vpackusdw     %ymm5,%ymm4,%ymm5
-  DB  197,125,111,5,138,117,0,0           ; vmovdqa       0x758a(%rip),%ymm8        # 2b420 <_sk_srcover_rgba_8888_sse2_lowp+0x778>
+  DB  197,125,111,5,142,117,0,0           ; vmovdqa       0x758e(%rip),%ymm8        # 2b780 <_sk_srcover_rgba_8888_sse2_lowp+0x77c>
   DB  196,193,85,219,224                  ; vpand         %ymm8,%ymm5,%ymm4
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,197,114,215,16                  ; vpsrld        $0x10,%ymm7,%ymm7
@@ -34121,7 +34256,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            23ec0 <_sk_load_8888_dst_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            2421c <_sk_load_8888_dst_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -34180,20 +34315,20 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,30                              ; ja            23f7d <_sk_store_8888_hsw_lowp+0x81>
+  DB  119,30                              ; ja            242d9 <_sk_store_8888_hsw_lowp+0x81>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 2402c <_sk_store_8888_hsw_lowp+0x130>
+  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 24388 <_sk_store_8888_hsw_lowp+0x130>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
-  DB  233,171,0,0,0                       ; jmpq          24028 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  233,171,0,0,0                       ; jmpq          24384 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  196,65,126,127,76,144,32            ; vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  DB  233,153,0,0,0                       ; jmpq          24028 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  233,153,0,0,0                       ; jmpq          24384 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
-  DB  233,134,0,0,0                       ; jmpq          24028 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  233,134,0,0,0                       ; jmpq          24384 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -34201,12 +34336,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
   DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
-  DB  235,85                              ; jmp           24028 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  235,85                              ; jmp           24384 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,121,22,76,144,40,2           ; vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   DB  196,67,121,22,76,144,36,1           ; vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   DB  196,65,121,126,76,144,32            ; vmovd         %xmm9,0x20(%r8,%rdx,4)
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
-  DB  235,54                              ; jmp           24028 <_sk_store_8888_hsw_lowp+0x12c>
+  DB  235,54                              ; jmp           24384 <_sk_store_8888_hsw_lowp+0x12c>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,84,144,56,2           ; vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -34261,10 +34396,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            240ba <_sk_load_bgra_hsw_lowp+0x52>
+  DB  119,55                              ; ja            24416 <_sk_load_bgra_hsw_lowp+0x52>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 24234 <_sk_load_bgra_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 24590 <_sk_load_bgra_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -34274,10 +34409,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,12,144              ; vmovd         (%r8,%rdx,4),%xmm1
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
-  DB  233,39,1,0,0                        ; jmpq          241e1 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          2453d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
   DB  196,193,126,111,68,144,32           ; vmovdqu       0x20(%r8,%rdx,4),%ymm0
-  DB  233,21,1,0,0                        ; jmpq          241e1 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          2453d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,8            ; vmovd         0x8(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,229,239,219                     ; vpxor         %ymm3,%ymm3,%ymm3
@@ -34286,7 +34421,7 @@
   DB  197,249,112,201,232                 ; vpshufd       $0xe8,%xmm1,%xmm1
   DB  196,227,125,2,201,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm1
   DB  197,253,111,195                     ; vmovdqa       %ymm3,%ymm0
-  DB  233,229,0,0,0                       ; jmpq          241e1 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          2453d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,24           ; vmovd         0x18(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -34302,7 +34437,7 @@
   DB  196,193,122,111,12,144              ; vmovdqu       (%r8,%rdx,4),%xmm1
   DB  196,227,117,2,200,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm1
   DB  197,125,127,192                     ; vmovdqa       %ymm8,%ymm0
-  DB  233,138,0,0,0                       ; jmpq          241e1 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          2453d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,40           ; vmovd         0x28(%r8,%rdx,4),%xmm0
   DB  196,226,121,89,192                  ; vpbroadcastq  %xmm0,%xmm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -34312,7 +34447,7 @@
   DB  196,193,121,110,76,144,32           ; vmovd         0x20(%r8,%rdx,4),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
   DB  196,193,126,111,12,144              ; vmovdqu       (%r8,%rdx,4),%ymm1
-  DB  235,81                              ; jmp           241e1 <_sk_load_bgra_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           2453d <_sk_load_bgra_hsw_lowp+0x179>
   DB  196,193,121,110,68,144,56           ; vmovd         0x38(%r8,%rdx,4),%xmm0
   DB  196,226,125,89,192                  ; vpbroadcastq  %xmm0,%ymm0
   DB  197,245,239,201                     ; vpxor         %ymm1,%ymm1,%ymm1
@@ -34332,7 +34467,7 @@
   DB  196,227,125,14,209,170              ; vpblendw      $0xaa,%ymm1,%ymm0,%ymm2
   DB  196,227,101,14,201,170              ; vpblendw      $0xaa,%ymm1,%ymm3,%ymm1
   DB  196,226,117,43,202                  ; vpackusdw     %ymm2,%ymm1,%ymm1
-  DB  197,125,111,5,54,114,0,0            ; vmovdqa       0x7236(%rip),%ymm8        # 2b440 <_sk_srcover_rgba_8888_sse2_lowp+0x798>
+  DB  197,125,111,5,58,114,0,0            ; vmovdqa       0x723a(%rip),%ymm8        # 2b7a0 <_sk_srcover_rgba_8888_sse2_lowp+0x79c>
   DB  196,193,117,219,208                 ; vpand         %ymm8,%ymm1,%ymm2
   DB  197,245,113,209,8                   ; vpsrlw        $0x8,%ymm1,%ymm1
   DB  197,253,114,208,16                  ; vpsrld        $0x10,%ymm0,%ymm0
@@ -34343,7 +34478,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            24234 <_sk_load_bgra_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            24590 <_sk_load_bgra_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -34388,10 +34523,10 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,55                              ; ja            242c2 <_sk_load_bgra_dst_hsw_lowp+0x52>
+  DB  119,55                              ; ja            2461e <_sk_load_bgra_dst_hsw_lowp+0x52>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 2443c <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  DB  76,141,13,163,1,0,0                 ; lea           0x1a3(%rip),%r9        # 24798 <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34401,10 +34536,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,44,144              ; vmovd         (%r8,%rdx,4),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,39,1,0,0                        ; jmpq          243e9 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,39,1,0,0                        ; jmpq          24745 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
   DB  196,193,126,111,100,144,32          ; vmovdqu       0x20(%r8,%rdx,4),%ymm4
-  DB  233,21,1,0,0                        ; jmpq          243e9 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,21,1,0,0                        ; jmpq          24745 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,8           ; vmovd         0x8(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -34413,7 +34548,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,229,0,0,0                       ; jmpq          243e9 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,229,0,0,0                       ; jmpq          24745 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,24          ; vmovd         0x18(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34429,7 +34564,7 @@
   DB  196,193,122,111,44,144              ; vmovdqu       (%r8,%rdx,4),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,138,0,0,0                       ; jmpq          243e9 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  233,138,0,0,0                       ; jmpq          24745 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,40          ; vmovd         0x28(%r8,%rdx,4),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34439,7 +34574,7 @@
   DB  196,193,121,110,108,144,32          ; vmovd         0x20(%r8,%rdx,4),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,44,144              ; vmovdqu       (%r8,%rdx,4),%ymm5
-  DB  235,81                              ; jmp           243e9 <_sk_load_bgra_dst_hsw_lowp+0x179>
+  DB  235,81                              ; jmp           24745 <_sk_load_bgra_dst_hsw_lowp+0x179>
   DB  196,193,121,110,100,144,56          ; vmovd         0x38(%r8,%rdx,4),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -34459,7 +34594,7 @@
   DB  196,227,93,14,245,170               ; vpblendw      $0xaa,%ymm5,%ymm4,%ymm6
   DB  196,227,69,14,237,170               ; vpblendw      $0xaa,%ymm5,%ymm7,%ymm5
   DB  196,226,85,43,238                   ; vpackusdw     %ymm6,%ymm5,%ymm5
-  DB  197,125,111,5,78,112,0,0            ; vmovdqa       0x704e(%rip),%ymm8        # 2b460 <_sk_srcover_rgba_8888_sse2_lowp+0x7b8>
+  DB  197,125,111,5,82,112,0,0            ; vmovdqa       0x7052(%rip),%ymm8        # 2b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0x7bc>
   DB  196,193,85,219,240                  ; vpand         %ymm8,%ymm5,%ymm6
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,221,114,212,16                  ; vpsrld        $0x10,%ymm4,%ymm4
@@ -34470,7 +34605,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,254                             ; ja            2443c <_sk_load_bgra_dst_hsw_lowp+0x1cc>
+  DB  119,254                             ; ja            24798 <_sk_load_bgra_dst_hsw_lowp+0x1cc>
   DB  255                                 ; (bad)
   DB  255,174,254,255,255,152             ; ljmp          *-0x67000002(%rsi)
   DB  254                                 ; (bad)
@@ -34529,20 +34664,20 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,30                              ; ja            244f9 <_sk_store_bgra_hsw_lowp+0x81>
+  DB  119,30                              ; ja            24855 <_sk_store_bgra_hsw_lowp+0x81>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 245a8 <_sk_store_bgra_hsw_lowp+0x130>
+  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 24904 <_sk_store_bgra_hsw_lowp+0x130>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,4,144                ; vmovd         %xmm8,(%r8,%rdx,4)
-  DB  233,171,0,0,0                       ; jmpq          245a4 <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  233,171,0,0,0                       ; jmpq          24900 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
   DB  196,65,126,127,76,144,32            ; vmovdqu       %ymm9,0x20(%r8,%rdx,4)
-  DB  233,153,0,0,0                       ; jmpq          245a4 <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  233,153,0,0,0                       ; jmpq          24900 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,121,22,68,144,8,2            ; vpextrd       $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  196,65,121,214,4,144                ; vmovq         %xmm8,(%r8,%rdx,4)
-  DB  233,134,0,0,0                       ; jmpq          245a4 <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  233,134,0,0,0                       ; jmpq          24900 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,76,144,24,2           ; vpextrd       $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -34550,12 +34685,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,76,144,16            ; vmovd         %xmm9,0x10(%r8,%rdx,4)
   DB  196,65,122,127,4,144                ; vmovdqu       %xmm8,(%r8,%rdx,4)
-  DB  235,85                              ; jmp           245a4 <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  235,85                              ; jmp           24900 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,121,22,76,144,40,2           ; vpextrd       $0x2,%xmm9,0x28(%r8,%rdx,4)
   DB  196,67,121,22,76,144,36,1           ; vpextrd       $0x1,%xmm9,0x24(%r8,%rdx,4)
   DB  196,65,121,126,76,144,32            ; vmovd         %xmm9,0x20(%r8,%rdx,4)
   DB  196,65,126,127,4,144                ; vmovdqu       %ymm8,(%r8,%rdx,4)
-  DB  235,54                              ; jmp           245a4 <_sk_store_bgra_hsw_lowp+0x12c>
+  DB  235,54                              ; jmp           24900 <_sk_store_bgra_hsw_lowp+0x12c>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,84,144,56,2           ; vpextrd       $0x2,%xmm10,0x38(%r8,%rdx,4)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -34610,24 +34745,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            24623 <_sk_load_565_hsw_lowp+0x3f>
+  DB  119,37                              ; ja            2497f <_sk_load_565_hsw_lowp+0x3f>
   DB  197,253,239,192                     ; vpxor         %ymm0,%ymm0,%ymm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,132,1,0,0                 ; lea           0x184(%rip),%r9        # 24790 <_sk_load_565_hsw_lowp+0x1ac>
+  DB  76,141,13,132,1,0,0                 ; lea           0x184(%rip),%r9        # 24aec <_sk_load_565_hsw_lowp+0x1ac>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,8,1,0,0                         ; jmpq          2472b <_sk_load_565_hsw_lowp+0x147>
+  DB  233,8,1,0,0                         ; jmpq          24a87 <_sk_load_565_hsw_lowp+0x147>
   DB  196,193,126,111,4,80                ; vmovdqu       (%r8,%rdx,2),%ymm0
-  DB  233,253,0,0,0                       ; jmpq          2472b <_sk_load_565_hsw_lowp+0x147>
+  DB  233,253,0,0,0                       ; jmpq          24a87 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,117,56,192,1                ; vinserti128   $0x1,%xmm0,%ymm1,%ymm0
   DB  196,193,121,110,12,80               ; vmovd         (%r8,%rdx,2),%xmm1
   DB  196,227,125,2,193,1                 ; vpblendd      $0x1,%ymm1,%ymm0,%ymm0
-  DB  233,218,0,0,0                       ; jmpq          2472b <_sk_load_565_hsw_lowp+0x147>
+  DB  233,218,0,0,0                       ; jmpq          24a87 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,117,56,192,1                ; vinserti128   $0x1,%xmm0,%ymm1,%ymm0
@@ -34637,7 +34772,7 @@
   DB  196,227,125,2,193,15                ; vpblendd      $0xf,%ymm1,%ymm0,%ymm0
   DB  196,193,122,126,12,80               ; vmovq         (%r8,%rdx,2),%xmm1
   DB  196,227,125,2,193,3                 ; vpblendd      $0x3,%ymm1,%ymm0,%ymm0
-  DB  233,155,0,0,0                       ; jmpq          2472b <_sk_load_565_hsw_lowp+0x147>
+  DB  233,155,0,0,0                       ; jmpq          24a87 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,20,2          ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -34649,7 +34784,7 @@
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
   DB  196,193,122,111,12,80               ; vmovdqu       (%r8,%rdx,2),%xmm1
   DB  196,227,117,2,192,240               ; vpblendd      $0xf0,%ymm0,%ymm1,%ymm0
-  DB  235,83                              ; jmp           2472b <_sk_load_565_hsw_lowp+0x147>
+  DB  235,83                              ; jmp           24a87 <_sk_load_565_hsw_lowp+0x147>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,193,121,196,76,80,28,6          ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm0,%xmm1
   DB  196,227,125,56,193,1                ; vinserti128   $0x1,%xmm1,%ymm0,%ymm0
@@ -34663,13 +34798,13 @@
   DB  196,193,122,111,20,80               ; vmovdqu       (%r8,%rdx,2),%xmm2
   DB  196,227,109,56,201,1                ; vinserti128   $0x1,%xmm1,%ymm2,%ymm1
   DB  196,227,117,2,192,192               ; vpblendd      $0xc0,%ymm0,%ymm1,%ymm0
-  DB  196,226,125,121,13,76,109,0,0       ; vpbroadcastw  0x6d4c(%rip),%ymm1        # 2b480 <_sk_srcover_rgba_8888_sse2_lowp+0x7d8>
+  DB  196,226,125,121,13,80,109,0,0       ; vpbroadcastw  0x6d50(%rip),%ymm1        # 2b7e0 <_sk_srcover_rgba_8888_sse2_lowp+0x7dc>
   DB  197,237,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm2
   DB  197,237,219,201                     ; vpand         %ymm1,%ymm2,%ymm1
   DB  197,237,113,208,5                   ; vpsrlw        $0x5,%ymm0,%ymm2
-  DB  196,226,125,121,29,55,109,0,0       ; vpbroadcastw  0x6d37(%rip),%ymm3        # 2b482 <_sk_srcover_rgba_8888_sse2_lowp+0x7da>
+  DB  196,226,125,121,29,59,109,0,0       ; vpbroadcastw  0x6d3b(%rip),%ymm3        # 2b7e2 <_sk_srcover_rgba_8888_sse2_lowp+0x7de>
   DB  197,237,219,211                     ; vpand         %ymm3,%ymm2,%ymm2
-  DB  196,226,125,121,29,44,109,0,0       ; vpbroadcastw  0x6d2c(%rip),%ymm3        # 2b484 <_sk_srcover_rgba_8888_sse2_lowp+0x7dc>
+  DB  196,226,125,121,29,48,109,0,0       ; vpbroadcastw  0x6d30(%rip),%ymm3        # 2b7e4 <_sk_srcover_rgba_8888_sse2_lowp+0x7e0>
   DB  197,253,219,219                     ; vpand         %ymm3,%ymm0,%ymm3
   DB  197,253,113,208,13                  ; vpsrlw        $0xd,%ymm0,%ymm0
   DB  197,245,235,192                     ; vpor          %ymm0,%ymm1,%ymm0
@@ -34680,7 +34815,7 @@
   DB  197,229,113,211,2                   ; vpsrlw        $0x2,%ymm3,%ymm3
   DB  197,237,235,211                     ; vpor          %ymm3,%ymm2,%ymm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,250,108,0,0      ; vpbroadcastw  0x6cfa(%rip),%ymm3        # 2b486 <_sk_srcover_rgba_8888_sse2_lowp+0x7de>
+  DB  196,226,125,121,29,254,108,0,0      ; vpbroadcastw  0x6cfe(%rip),%ymm3        # 2b7e6 <_sk_srcover_rgba_8888_sse2_lowp+0x7e2>
   DB  255,224                             ; jmpq          *%rax
   DB  102,144                             ; xchg          %ax,%ax
   DB  133,254                             ; test          %edi,%esi
@@ -34733,24 +34868,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            2480b <_sk_load_565_dst_hsw_lowp+0x3f>
+  DB  119,37                              ; ja            24b67 <_sk_load_565_dst_hsw_lowp+0x3f>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,132,1,0,0                 ; lea           0x184(%rip),%r9        # 24978 <_sk_load_565_dst_hsw_lowp+0x1ac>
+  DB  76,141,13,132,1,0,0                 ; lea           0x184(%rip),%r9        # 24cd4 <_sk_load_565_dst_hsw_lowp+0x1ac>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,8,1,0,0                         ; jmpq          24913 <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,8,1,0,0                         ; jmpq          24c6f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  196,193,126,111,36,80               ; vmovdqu       (%r8,%rdx,2),%ymm4
-  DB  233,253,0,0,0                       ; jmpq          24913 <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,253,0,0,0                       ; jmpq          24c6f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,4,2           ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,85,56,228,1                 ; vinserti128   $0x1,%xmm4,%ymm5,%ymm4
   DB  196,193,121,110,44,80               ; vmovd         (%r8,%rdx,2),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
-  DB  233,218,0,0,0                       ; jmpq          24913 <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,218,0,0,0                       ; jmpq          24c6f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,12,6          ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,85,56,228,1                 ; vinserti128   $0x1,%xmm4,%ymm5,%ymm4
@@ -34760,7 +34895,7 @@
   DB  196,227,93,2,229,15                 ; vpblendd      $0xf,%ymm5,%ymm4,%ymm4
   DB  196,193,122,126,44,80               ; vmovq         (%r8,%rdx,2),%xmm5
   DB  196,227,93,2,229,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm4
-  DB  233,155,0,0,0                       ; jmpq          24913 <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  233,155,0,0,0                       ; jmpq          24c6f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,20,2          ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -34772,7 +34907,7 @@
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
   DB  196,193,122,111,44,80               ; vmovdqu       (%r8,%rdx,2),%xmm5
   DB  196,227,85,2,228,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm4
-  DB  235,83                              ; jmp           24913 <_sk_load_565_dst_hsw_lowp+0x147>
+  DB  235,83                              ; jmp           24c6f <_sk_load_565_dst_hsw_lowp+0x147>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,193,89,196,108,80,28,6          ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm4,%xmm5
   DB  196,227,93,56,229,1                 ; vinserti128   $0x1,%xmm5,%ymm4,%ymm4
@@ -34786,13 +34921,13 @@
   DB  196,193,122,111,52,80               ; vmovdqu       (%r8,%rdx,2),%xmm6
   DB  196,227,77,56,237,1                 ; vinserti128   $0x1,%xmm5,%ymm6,%ymm5
   DB  196,227,85,2,228,192                ; vpblendd      $0xc0,%ymm4,%ymm5,%ymm4
-  DB  196,226,125,121,45,108,107,0,0      ; vpbroadcastw  0x6b6c(%rip),%ymm5        # 2b488 <_sk_srcover_rgba_8888_sse2_lowp+0x7e0>
+  DB  196,226,125,121,45,112,107,0,0      ; vpbroadcastw  0x6b70(%rip),%ymm5        # 2b7e8 <_sk_srcover_rgba_8888_sse2_lowp+0x7e4>
   DB  197,205,113,212,8                   ; vpsrlw        $0x8,%ymm4,%ymm6
   DB  197,205,219,237                     ; vpand         %ymm5,%ymm6,%ymm5
   DB  197,205,113,212,5                   ; vpsrlw        $0x5,%ymm4,%ymm6
-  DB  196,226,125,121,61,87,107,0,0       ; vpbroadcastw  0x6b57(%rip),%ymm7        # 2b48a <_sk_srcover_rgba_8888_sse2_lowp+0x7e2>
+  DB  196,226,125,121,61,91,107,0,0       ; vpbroadcastw  0x6b5b(%rip),%ymm7        # 2b7ea <_sk_srcover_rgba_8888_sse2_lowp+0x7e6>
   DB  197,205,219,247                     ; vpand         %ymm7,%ymm6,%ymm6
-  DB  196,226,125,121,61,76,107,0,0       ; vpbroadcastw  0x6b4c(%rip),%ymm7        # 2b48c <_sk_srcover_rgba_8888_sse2_lowp+0x7e4>
+  DB  196,226,125,121,61,80,107,0,0       ; vpbroadcastw  0x6b50(%rip),%ymm7        # 2b7ec <_sk_srcover_rgba_8888_sse2_lowp+0x7e8>
   DB  197,221,219,255                     ; vpand         %ymm7,%ymm4,%ymm7
   DB  197,221,113,212,13                  ; vpsrlw        $0xd,%ymm4,%ymm4
   DB  197,213,235,228                     ; vpor          %ymm4,%ymm5,%ymm4
@@ -34803,7 +34938,7 @@
   DB  197,197,113,215,2                   ; vpsrlw        $0x2,%ymm7,%ymm7
   DB  197,205,235,247                     ; vpor          %ymm7,%ymm6,%ymm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,61,26,107,0,0       ; vpbroadcastw  0x6b1a(%rip),%ymm7        # 2b48e <_sk_srcover_rgba_8888_sse2_lowp+0x7e6>
+  DB  196,226,125,121,61,30,107,0,0       ; vpbroadcastw  0x6b1e(%rip),%ymm7        # 2b7ee <_sk_srcover_rgba_8888_sse2_lowp+0x7ea>
   DB  255,224                             ; jmpq          *%rax
   DB  102,144                             ; xchg          %ax,%ax
   DB  133,254                             ; test          %edi,%esi
@@ -34852,10 +34987,10 @@
   DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  77,1,192                            ; add           %r8,%r8
   DB  76,3,0                              ; add           (%rax),%r8
-  DB  196,98,125,121,5,195,106,0,0        ; vpbroadcastw  0x6ac3(%rip),%ymm8        # 2b490 <_sk_srcover_rgba_8888_sse2_lowp+0x7e8>
+  DB  196,98,125,121,5,199,106,0,0        ; vpbroadcastw  0x6ac7(%rip),%ymm8        # 2b7f0 <_sk_srcover_rgba_8888_sse2_lowp+0x7ec>
   DB  197,181,113,240,8                   ; vpsllw        $0x8,%ymm0,%ymm9
   DB  196,65,53,219,192                   ; vpand         %ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,178,106,0,0       ; vpbroadcastw  0x6ab2(%rip),%ymm9        # 2b492 <_sk_srcover_rgba_8888_sse2_lowp+0x7ea>
+  DB  196,98,125,121,13,182,106,0,0       ; vpbroadcastw  0x6ab6(%rip),%ymm9        # 2b7f2 <_sk_srcover_rgba_8888_sse2_lowp+0x7ee>
   DB  197,173,113,241,3                   ; vpsllw        $0x3,%ymm1,%ymm10
   DB  196,65,45,219,201                   ; vpand         %ymm9,%ymm10,%ymm9
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
@@ -34865,31 +35000,31 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,31                              ; ja            24a22 <_sk_store_565_hsw_lowp+0x6e>
+  DB  119,31                              ; ja            24d7e <_sk_store_565_hsw_lowp+0x6e>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 24ad0 <_sk_store_565_hsw_lowp+0x11c>
+  DB  76,141,13,195,0,0,0                 ; lea           0xc3(%rip),%r9        # 24e2c <_sk_store_565_hsw_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,67,121,21,4,80,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,2)
-  DB  233,167,0,0,0                       ; jmpq          24ac9 <_sk_store_565_hsw_lowp+0x115>
+  DB  233,167,0,0,0                       ; jmpq          24e25 <_sk_store_565_hsw_lowp+0x115>
   DB  196,65,126,127,4,80                 ; vmovdqu       %ymm8,(%r8,%rdx,2)
-  DB  233,156,0,0,0                       ; jmpq          24ac9 <_sk_store_565_hsw_lowp+0x115>
+  DB  233,156,0,0,0                       ; jmpq          24e25 <_sk_store_565_hsw_lowp+0x115>
   DB  196,67,121,21,68,80,4,2             ; vpextrw       $0x2,%xmm8,0x4(%r8,%rdx,2)
   DB  196,65,121,126,4,80                 ; vmovd         %xmm8,(%r8,%rdx,2)
-  DB  233,137,0,0,0                       ; jmpq          24ac9 <_sk_store_565_hsw_lowp+0x115>
+  DB  233,137,0,0,0                       ; jmpq          24e25 <_sk_store_565_hsw_lowp+0x115>
   DB  196,67,121,21,68,80,12,6            ; vpextrw       $0x6,%xmm8,0xc(%r8,%rdx,2)
   DB  196,67,121,21,68,80,10,5            ; vpextrw       $0x5,%xmm8,0xa(%r8,%rdx,2)
   DB  196,67,121,21,68,80,8,4             ; vpextrw       $0x4,%xmm8,0x8(%r8,%rdx,2)
   DB  196,65,121,214,4,80                 ; vmovq         %xmm8,(%r8,%rdx,2)
-  DB  235,105                             ; jmp           24ac9 <_sk_store_565_hsw_lowp+0x115>
+  DB  235,105                             ; jmp           24e25 <_sk_store_565_hsw_lowp+0x115>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,20,2            ; vpextrw       $0x2,%xmm9,0x14(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,18,1            ; vpextrw       $0x1,%xmm9,0x12(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,16,0            ; vpextrw       $0x0,%xmm9,0x10(%r8,%rdx,2)
-  DB  235,55                              ; jmp           24ac3 <_sk_store_565_hsw_lowp+0x10f>
+  DB  235,55                              ; jmp           24e1f <_sk_store_565_hsw_lowp+0x10f>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,21,76,80,28,6            ; vpextrw       $0x6,%xmm9,0x1c(%r8,%rdx,2)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -34912,7 +35047,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  120,255                             ; js            24ae5 <_sk_store_565_hsw_lowp+0x131>
+  DB  120,255                             ; js            24e41 <_sk_store_565_hsw_lowp+0x131>
   DB  255                                 ; (bad)
   DB  255,112,255                         ; pushq         -0x1(%rax)
   DB  255                                 ; (bad)
@@ -34946,38 +35081,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            24b48 <_sk_load_a8_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            24ea4 <_sk_load_a8_hsw_lowp+0x3c>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,219,0,0,0                 ; lea           0xdb(%rip),%r9        # 24c0c <_sk_load_a8_hsw_lowp+0x100>
+  DB  76,141,13,219,0,0,0                 ; lea           0xdb(%rip),%r9        # 24f68 <_sk_load_a8_hsw_lowp+0x100>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,175,0,0,0                       ; jmpq          24bf7 <_sk_load_a8_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          24f53 <_sk_load_a8_hsw_lowp+0xeb>
   DB  196,193,122,111,4,16                ; vmovdqu       (%r8,%rdx,1),%xmm0
-  DB  233,164,0,0,0                       ; jmpq          24bf7 <_sk_load_a8_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          24f53 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,227,121,14,193,1                ; vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,132,0,0,0                       ; jmpq          24bf7 <_sk_load_a8_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          24f53 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  235,90                              ; jmp           24bf7 <_sk_load_a8_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           24f53 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,122,126,12,16               ; vmovq         (%r8,%rdx,1),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  235,48                              ; jmp           24bf7 <_sk_load_a8_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           24f53 <_sk_load_a8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -35035,38 +35170,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            24c84 <_sk_load_a8_dst_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            24fe0 <_sk_load_a8_dst_hsw_lowp+0x3c>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,219,0,0,0                 ; lea           0xdb(%rip),%r9        # 24d48 <_sk_load_a8_dst_hsw_lowp+0x100>
+  DB  76,141,13,219,0,0,0                 ; lea           0xdb(%rip),%r9        # 250a4 <_sk_load_a8_dst_hsw_lowp+0x100>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,175,0,0,0                       ; jmpq          24d33 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          2508f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  196,193,122,111,36,16               ; vmovdqu       (%r8,%rdx,1),%xmm4
-  DB  233,164,0,0,0                       ; jmpq          24d33 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          2508f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,227,89,14,229,1                 ; vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,132,0,0,0                       ; jmpq          24d33 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          2508f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  235,90                              ; jmp           24d33 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           2508f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,122,126,44,16               ; vmovq         (%r8,%rdx,1),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  235,48                              ; jmp           24d33 <_sk_load_a8_dst_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           2508f <_sk_load_a8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -35121,7 +35256,7 @@
   DB  76,15,175,193                       ; imul          %rcx,%r8
   DB  76,3,0                              ; add           (%rax),%r8
   DB  196,195,125,57,216,1                ; vextracti128  $0x1,%ymm3,%xmm8
-  DB  197,121,111,13,49,112,0,0           ; vmovdqa       0x7031(%rip),%xmm9        # 2bdd0 <_sk_srcover_rgba_8888_sse2_lowp+0x1128>
+  DB  197,121,111,13,53,112,0,0           ; vmovdqa       0x7035(%rip),%xmm9        # 2c130 <_sk_srcover_rgba_8888_sse2_lowp+0x112c>
   DB  196,66,57,0,193                     ; vpshufb       %xmm9,%xmm8,%xmm8
   DB  196,66,97,0,201                     ; vpshufb       %xmm9,%xmm3,%xmm9
   DB  196,65,49,108,192                   ; vpunpcklqdq   %xmm8,%xmm9,%xmm8
@@ -35129,28 +35264,28 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,28                              ; ja            24dd4 <_sk_store_a8_hsw_lowp+0x50>
+  DB  119,28                              ; ja            25130 <_sk_store_a8_hsw_lowp+0x50>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # 24e54 <_sk_store_a8_hsw_lowp+0xd0>
+  DB  76,141,13,146,0,0,0                 ; lea           0x92(%rip),%r9        # 251b0 <_sk_store_a8_hsw_lowp+0xd0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,67,121,20,4,16,0                ; vpextrb       $0x0,%xmm8,(%r8,%rdx,1)
-  DB  235,121                             ; jmp           24e4d <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,121                             ; jmp           251a9 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,65,122,127,4,16                 ; vmovdqu       %xmm8,(%r8,%rdx,1)
-  DB  235,113                             ; jmp           24e4d <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,113                             ; jmp           251a9 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,67,121,20,68,16,2,2             ; vpextrb       $0x2,%xmm8,0x2(%r8,%rdx,1)
   DB  196,67,121,21,4,16,0                ; vpextrw       $0x0,%xmm8,(%r8,%rdx,1)
-  DB  235,96                              ; jmp           24e4d <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,96                              ; jmp           251a9 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,67,121,20,68,16,6,6             ; vpextrb       $0x6,%xmm8,0x6(%r8,%rdx,1)
   DB  196,67,121,20,68,16,5,5             ; vpextrb       $0x5,%xmm8,0x5(%r8,%rdx,1)
   DB  196,67,121,20,68,16,4,4             ; vpextrb       $0x4,%xmm8,0x4(%r8,%rdx,1)
   DB  196,65,121,126,4,16                 ; vmovd         %xmm8,(%r8,%rdx,1)
-  DB  235,64                              ; jmp           24e4d <_sk_store_a8_hsw_lowp+0xc9>
+  DB  235,64                              ; jmp           251a9 <_sk_store_a8_hsw_lowp+0xc9>
   DB  196,67,121,20,68,16,10,10           ; vpextrb       $0xa,%xmm8,0xa(%r8,%rdx,1)
   DB  196,67,121,20,68,16,9,9             ; vpextrb       $0x9,%xmm8,0x9(%r8,%rdx,1)
   DB  196,67,121,20,68,16,8,8             ; vpextrb       $0x8,%xmm8,0x8(%r8,%rdx,1)
-  DB  235,32                              ; jmp           24e47 <_sk_store_a8_hsw_lowp+0xc3>
+  DB  235,32                              ; jmp           251a3 <_sk_store_a8_hsw_lowp+0xc3>
   DB  196,67,121,20,68,16,14,14           ; vpextrb       $0xe,%xmm8,0xe(%r8,%rdx,1)
   DB  196,67,121,20,68,16,13,13           ; vpextrb       $0xd,%xmm8,0xd(%r8,%rdx,1)
   DB  196,67,121,20,68,16,12,12           ; vpextrb       $0xc,%xmm8,0xc(%r8,%rdx,1)
@@ -35159,7 +35294,7 @@
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  119,255                             ; ja            24e55 <_sk_store_a8_hsw_lowp+0xd1>
+  DB  119,255                             ; ja            251b1 <_sk_store_a8_hsw_lowp+0xd1>
   DB  255                                 ; (bad)
   DB  255,144,255,255,255,136             ; callq         *-0x77000001(%rax)
   DB  255                                 ; (bad)
@@ -35204,38 +35339,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            24ecc <_sk_load_g8_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            25228 <_sk_load_g8_hsw_lowp+0x3c>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,227,0,0,0                 ; lea           0xe3(%rip),%r9        # 24f98 <_sk_load_g8_hsw_lowp+0x108>
+  DB  76,141,13,227,0,0,0                 ; lea           0xe3(%rip),%r9        # 252f4 <_sk_load_g8_hsw_lowp+0x108>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,192                     ; vmovd         %eax,%xmm0
-  DB  233,175,0,0,0                       ; jmpq          24f7b <_sk_load_g8_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          252d7 <_sk_load_g8_hsw_lowp+0xeb>
   DB  196,193,122,111,4,16                ; vmovdqu       (%r8,%rdx,1),%xmm0
-  DB  233,164,0,0,0                       ; jmpq          24f7b <_sk_load_g8_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          252d7 <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm0,%xmm0
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,200                     ; vmovd         %eax,%xmm1
   DB  196,227,121,14,193,1                ; vpblendw      $0x1,%xmm1,%xmm0,%xmm0
-  DB  233,132,0,0,0                       ; jmpq          24f7b <_sk_load_g8_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          252d7 <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,121,110,12,16               ; vmovd         (%r8,%rdx,1),%xmm1
   DB  196,227,121,2,193,1                 ; vpblendd      $0x1,%xmm1,%xmm0,%xmm0
-  DB  235,90                              ; jmp           24f7b <_sk_load_g8_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           252d7 <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,193,122,126,12,16               ; vmovq         (%r8,%rdx,1),%xmm1
   DB  196,227,113,2,192,12                ; vpblendd      $0xc,%xmm0,%xmm1,%xmm0
-  DB  235,48                              ; jmp           24f7b <_sk_load_g8_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           252d7 <_sk_load_g8_hsw_lowp+0xeb>
   DB  197,249,239,192                     ; vpxor         %xmm0,%xmm0,%xmm0
   DB  196,195,121,32,68,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm0,%xmm0
   DB  196,195,121,32,68,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm0,%xmm0
@@ -35245,7 +35380,7 @@
   DB  196,227,113,2,192,8                 ; vpblendd      $0x8,%xmm0,%xmm1,%xmm0
   DB  196,226,125,48,192                  ; vpmovzxbw     %xmm0,%ymm0
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,29,9,101,0,0        ; vpbroadcastw  0x6509(%rip),%ymm3        # 2b494 <_sk_srcover_rgba_8888_sse2_lowp+0x7ec>
+  DB  196,226,125,121,29,13,101,0,0       ; vpbroadcastw  0x650d(%rip),%ymm3        # 2b7f4 <_sk_srcover_rgba_8888_sse2_lowp+0x7f0>
   DB  197,253,111,200                     ; vmovdqa       %ymm0,%ymm1
   DB  197,253,111,208                     ; vmovdqa       %ymm0,%ymm2
   DB  255,224                             ; jmpq          *%rax
@@ -35259,7 +35394,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           24fa5 <_sk_load_g8_hsw_lowp+0x115>
+  DB  123,255                             ; jnp           25301 <_sk_load_g8_hsw_lowp+0x115>
   DB  255                                 ; (bad)
   DB  255,115,255                         ; pushq         -0x1(%rbx)
   DB  255                                 ; (bad)
@@ -35295,38 +35430,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,37                              ; ja            25010 <_sk_load_g8_dst_hsw_lowp+0x3c>
+  DB  119,37                              ; ja            2536c <_sk_load_g8_dst_hsw_lowp+0x3c>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,227,0,0,0                 ; lea           0xe3(%rip),%r9        # 250dc <_sk_load_g8_dst_hsw_lowp+0x108>
+  DB  76,141,13,227,0,0,0                 ; lea           0xe3(%rip),%r9        # 25438 <_sk_load_g8_dst_hsw_lowp+0x108>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,249,110,224                     ; vmovd         %eax,%xmm4
-  DB  233,175,0,0,0                       ; jmpq          250bf <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  233,175,0,0,0                       ; jmpq          2541b <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  196,193,122,111,36,16               ; vmovdqu       (%r8,%rdx,1),%xmm4
-  DB  233,164,0,0,0                       ; jmpq          250bf <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  233,164,0,0,0                       ; jmpq          2541b <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,2,2            ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm4,%xmm4
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,249,110,232                     ; vmovd         %eax,%xmm5
   DB  196,227,89,14,229,1                 ; vpblendw      $0x1,%xmm5,%xmm4,%xmm4
-  DB  233,132,0,0,0                       ; jmpq          250bf <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  233,132,0,0,0                       ; jmpq          2541b <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,6,6            ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,5,5            ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,4,4            ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,121,110,44,16               ; vmovd         (%r8,%rdx,1),%xmm5
   DB  196,227,89,2,229,1                  ; vpblendd      $0x1,%xmm5,%xmm4,%xmm4
-  DB  235,90                              ; jmp           250bf <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  235,90                              ; jmp           2541b <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,10,10          ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,9,9            ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,8,8            ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,193,122,126,44,16               ; vmovq         (%r8,%rdx,1),%xmm5
   DB  196,227,81,2,228,12                 ; vpblendd      $0xc,%xmm4,%xmm5,%xmm4
-  DB  235,48                              ; jmp           250bf <_sk_load_g8_dst_hsw_lowp+0xeb>
+  DB  235,48                              ; jmp           2541b <_sk_load_g8_dst_hsw_lowp+0xeb>
   DB  197,217,239,228                     ; vpxor         %xmm4,%xmm4,%xmm4
   DB  196,195,89,32,100,16,14,14          ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm4,%xmm4
   DB  196,195,89,32,100,16,13,13          ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm4,%xmm4
@@ -35336,7 +35471,7 @@
   DB  196,227,81,2,228,8                  ; vpblendd      $0x8,%xmm4,%xmm5,%xmm4
   DB  196,226,125,48,228                  ; vpmovzxbw     %xmm4,%ymm4
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  196,226,125,121,61,199,99,0,0       ; vpbroadcastw  0x63c7(%rip),%ymm7        # 2b496 <_sk_srcover_rgba_8888_sse2_lowp+0x7ee>
+  DB  196,226,125,121,61,203,99,0,0       ; vpbroadcastw  0x63cb(%rip),%ymm7        # 2b7f6 <_sk_srcover_rgba_8888_sse2_lowp+0x7f2>
   DB  197,253,111,236                     ; vmovdqa       %ymm4,%ymm5
   DB  197,253,111,244                     ; vmovdqa       %ymm4,%ymm6
   DB  255,224                             ; jmpq          *%rax
@@ -35350,7 +35485,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           250e9 <_sk_load_g8_dst_hsw_lowp+0x115>
+  DB  123,255                             ; jnp           25445 <_sk_load_g8_dst_hsw_lowp+0x115>
   DB  255                                 ; (bad)
   DB  255,115,255                         ; pushq         -0x1(%rbx)
   DB  255                                 ; (bad)
@@ -35378,12 +35513,12 @@
 
 PUBLIC _sk_luminance_to_alpha_hsw_lowp
 _sk_luminance_to_alpha_hsw_lowp LABEL PROC
-  DB  196,226,125,121,29,119,99,0,0       ; vpbroadcastw  0x6377(%rip),%ymm3        # 2b498 <_sk_srcover_rgba_8888_sse2_lowp+0x7f0>
+  DB  196,226,125,121,29,123,99,0,0       ; vpbroadcastw  0x637b(%rip),%ymm3        # 2b7f8 <_sk_srcover_rgba_8888_sse2_lowp+0x7f4>
   DB  197,253,213,195                     ; vpmullw       %ymm3,%ymm0,%ymm0
-  DB  196,226,125,121,29,108,99,0,0       ; vpbroadcastw  0x636c(%rip),%ymm3        # 2b49a <_sk_srcover_rgba_8888_sse2_lowp+0x7f2>
+  DB  196,226,125,121,29,112,99,0,0       ; vpbroadcastw  0x6370(%rip),%ymm3        # 2b7fa <_sk_srcover_rgba_8888_sse2_lowp+0x7f6>
   DB  197,245,213,203                     ; vpmullw       %ymm3,%ymm1,%ymm1
   DB  197,245,253,192                     ; vpaddw        %ymm0,%ymm1,%ymm0
-  DB  196,226,125,121,13,93,99,0,0        ; vpbroadcastw  0x635d(%rip),%ymm1        # 2b49c <_sk_srcover_rgba_8888_sse2_lowp+0x7f4>
+  DB  196,226,125,121,13,97,99,0,0        ; vpbroadcastw  0x6361(%rip),%ymm1        # 2b7fc <_sk_srcover_rgba_8888_sse2_lowp+0x7f8>
   DB  197,237,213,201                     ; vpmullw       %ymm1,%ymm2,%ymm1
   DB  197,253,253,193                     ; vpaddw        %ymm1,%ymm0,%ymm0
   DB  197,229,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm3
@@ -35397,13 +35532,13 @@
 _sk_scale_1_float_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,122,16,0                        ; vmovss        (%rax),%xmm8
-  DB  197,122,16,13,170,99,0,0            ; vmovss        0x63aa(%rip),%xmm9        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  196,98,57,169,13,113,99,0,0         ; vfmadd213ss   0x6371(%rip),%xmm8,%xmm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  197,122,16,13,174,99,0,0            ; vmovss        0x63ae(%rip),%xmm9        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,57,169,13,117,99,0,0         ; vfmadd213ss   0x6375(%rip),%xmm8,%xmm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,122,44,193                  ; vcvttss2si    %xmm9,%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
   DB  196,66,125,121,192                  ; vpbroadcastw  %xmm8,%ymm8
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
-  DB  196,98,125,121,13,16,99,0,0         ; vpbroadcastw  0x6310(%rip),%ymm9        # 2b49e <_sk_srcover_rgba_8888_sse2_lowp+0x7f6>
+  DB  196,98,125,121,13,20,99,0,0         ; vpbroadcastw  0x6314(%rip),%ymm9        # 2b7fe <_sk_srcover_rgba_8888_sse2_lowp+0x7fa>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,213,201                     ; vpmullw       %ymm1,%ymm8,%ymm1
@@ -35422,12 +35557,12 @@
 _sk_lerp_1_float_hsw_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  197,122,16,0                        ; vmovss        (%rax),%xmm8
-  DB  197,122,16,13,64,99,0,0             ; vmovss        0x6340(%rip),%xmm9        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  196,98,57,169,13,7,99,0,0           ; vfmadd213ss   0x6307(%rip),%xmm8,%xmm9        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  197,122,16,13,68,99,0,0             ; vmovss        0x6344(%rip),%xmm9        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  196,98,57,169,13,11,99,0,0          ; vfmadd213ss   0x630b(%rip),%xmm8,%xmm9        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  196,193,122,44,193                  ; vcvttss2si    %xmm9,%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
   DB  196,66,125,121,192                  ; vpbroadcastw  %xmm8,%ymm8
-  DB  196,98,125,121,13,172,98,0,0        ; vpbroadcastw  0x62ac(%rip),%ymm9        # 2b4a0 <_sk_srcover_rgba_8888_sse2_lowp+0x7f8>
+  DB  196,98,125,121,13,176,98,0,0        ; vpbroadcastw  0x62b0(%rip),%ymm9        # 2b800 <_sk_srcover_rgba_8888_sse2_lowp+0x7fc>
   DB  196,65,53,249,208                   ; vpsubw        %ymm8,%ymm9,%ymm10
   DB  197,45,213,220                      ; vpmullw       %ymm4,%ymm10,%ymm11
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
@@ -35462,38 +35597,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            25292 <_sk_scale_u8_hsw_lowp+0x3d>
+  DB  119,38                              ; ja            255ee <_sk_scale_u8_hsw_lowp+0x3d>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,21,1,0,0                  ; lea           0x115(%rip),%r9        # 25390 <_sk_scale_u8_hsw_lowp+0x13b>
+  DB  76,141,13,21,1,0,0                  ; lea           0x115(%rip),%r9        # 256ec <_sk_scale_u8_hsw_lowp+0x13b>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,179,0,0,0                       ; jmpq          25345 <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  233,179,0,0,0                       ; jmpq          256a1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,122,111,4,16                 ; vmovdqu       (%r8,%rdx,1),%xmm8
-  DB  233,168,0,0,0                       ; jmpq          25345 <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  233,168,0,0,0                       ; jmpq          256a1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,2,2              ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,67,57,14,193,1                  ; vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,135,0,0,0                       ; jmpq          25345 <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  233,135,0,0,0                       ; jmpq          256a1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,6,6              ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,5,5              ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,4,4              ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  235,92                              ; jmp           25345 <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  235,92                              ; jmp           256a1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,10,10            ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,9,9              ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,8,8              ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,122,126,12,16                ; vmovq         (%r8,%rdx,1),%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  235,49                              ; jmp           25345 <_sk_scale_u8_hsw_lowp+0xf0>
+  DB  235,49                              ; jmp           256a1 <_sk_scale_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,14,14            ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,13,13            ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -35503,7 +35638,7 @@
   DB  196,67,49,2,192,8                   ; vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   DB  196,66,125,48,192                   ; vpmovzxbw     %xmm8,%ymm8
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
-  DB  196,98,125,121,13,75,97,0,0         ; vpbroadcastw  0x614b(%rip),%ymm9        # 2b4a2 <_sk_srcover_rgba_8888_sse2_lowp+0x7fa>
+  DB  196,98,125,121,13,79,97,0,0         ; vpbroadcastw  0x614f(%rip),%ymm9        # 2b802 <_sk_srcover_rgba_8888_sse2_lowp+0x7fe>
   DB  196,193,125,253,193                 ; vpaddw        %ymm9,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,189,213,201                     ; vpmullw       %ymm1,%ymm8,%ymm1
@@ -35524,7 +35659,7 @@
   DB  255,26                              ; lcall         *(%rdx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,75               ; decl          0x4bffffff(%rip)        # 4c02539c <_sk_srcover_rgba_8888_sse2_lowp+0x4bffa6f4>
+  DB  255,13,255,255,255,75               ; decl          0x4bffffff(%rip)        # 4c0256f8 <_sk_srcover_rgba_8888_sse2_lowp+0x4bffa6f4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,67,255                          ; incl          -0x1(%rbx)
@@ -35561,38 +35696,38 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            25409 <_sk_lerp_u8_hsw_lowp+0x3d>
+  DB  119,38                              ; ja            25765 <_sk_lerp_u8_hsw_lowp+0x3d>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,58,1,0,0                  ; lea           0x13a(%rip),%r9        # 2552c <_sk_lerp_u8_hsw_lowp+0x160>
+  DB  76,141,13,58,1,0,0                  ; lea           0x13a(%rip),%r9        # 25888 <_sk_lerp_u8_hsw_lowp+0x160>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,179,0,0,0                       ; jmpq          254bc <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  233,179,0,0,0                       ; jmpq          25818 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,122,111,4,16                 ; vmovdqu       (%r8,%rdx,1),%xmm8
-  DB  233,168,0,0,0                       ; jmpq          254bc <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  233,168,0,0,0                       ; jmpq          25818 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,2,2              ; vpinsrb       $0x2,0x2(%r8,%rdx,1),%xmm8,%xmm8
   DB  65,15,183,4,16                      ; movzwl        (%r8,%rdx,1),%eax
   DB  197,121,110,200                     ; vmovd         %eax,%xmm9
   DB  196,67,57,14,193,1                  ; vpblendw      $0x1,%xmm9,%xmm8,%xmm8
-  DB  233,135,0,0,0                       ; jmpq          254bc <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  233,135,0,0,0                       ; jmpq          25818 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,6,6              ; vpinsrb       $0x6,0x6(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,5,5              ; vpinsrb       $0x5,0x5(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,4,4              ; vpinsrb       $0x4,0x4(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,121,110,12,16                ; vmovd         (%r8,%rdx,1),%xmm9
   DB  196,67,57,2,193,1                   ; vpblendd      $0x1,%xmm9,%xmm8,%xmm8
-  DB  235,92                              ; jmp           254bc <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  235,92                              ; jmp           25818 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,10,10            ; vpinsrb       $0xa,0xa(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,9,9              ; vpinsrb       $0x9,0x9(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,8,8              ; vpinsrb       $0x8,0x8(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,65,122,126,12,16                ; vmovq         (%r8,%rdx,1),%xmm9
   DB  196,67,49,2,192,12                  ; vpblendd      $0xc,%xmm8,%xmm9,%xmm8
-  DB  235,49                              ; jmp           254bc <_sk_lerp_u8_hsw_lowp+0xf0>
+  DB  235,49                              ; jmp           25818 <_sk_lerp_u8_hsw_lowp+0xf0>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,67,57,32,68,16,14,14            ; vpinsrb       $0xe,0xe(%r8,%rdx,1),%xmm8,%xmm8
   DB  196,67,57,32,68,16,13,13            ; vpinsrb       $0xd,0xd(%r8,%rdx,1),%xmm8,%xmm8
@@ -35601,7 +35736,7 @@
   DB  196,67,49,34,76,16,8,2              ; vpinsrd       $0x2,0x8(%r8,%rdx,1),%xmm9,%xmm9
   DB  196,67,49,2,192,8                   ; vpblendd      $0x8,%xmm8,%xmm9,%xmm8
   DB  196,66,125,48,192                   ; vpmovzxbw     %xmm8,%ymm8
-  DB  196,98,125,121,13,218,95,0,0        ; vpbroadcastw  0x5fda(%rip),%ymm9        # 2b4a4 <_sk_srcover_rgba_8888_sse2_lowp+0x7fc>
+  DB  196,98,125,121,13,222,95,0,0        ; vpbroadcastw  0x5fde(%rip),%ymm9        # 2b804 <_sk_srcover_rgba_8888_sse2_lowp+0x800>
   DB  196,65,61,239,209                   ; vpxor         %ymm9,%ymm8,%ymm10
   DB  197,45,213,220                      ; vpmullw       %ymm4,%ymm10,%ymm11
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
@@ -35633,7 +35768,7 @@
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  232,254,255,255,38                  ; callq         27025537 <_sk_srcover_rgba_8888_sse2_lowp+0x26ffa88f>
+  DB  232,254,255,255,38                  ; callq         27025893 <_sk_srcover_rgba_8888_sse2_lowp+0x26ffa88f>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,30                              ; lcall         *(%rsi)
@@ -35654,7 +35789,7 @@
   DB  255,52,255                          ; pushq         (%rdi,%rdi,8)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  124,255                             ; jl            25559 <_sk_lerp_u8_hsw_lowp+0x18d>
+  DB  124,255                             ; jl            258b5 <_sk_lerp_u8_hsw_lowp+0x18d>
   DB  255                                 ; (bad)
   DB  255,116,255,255                     ; pushq         -0x1(%rdi,%rdi,8)
   DB  255,108,255,255                     ; ljmp          *-0x1(%rdi,%rdi,8)
@@ -35673,24 +35808,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            255a8 <_sk_scale_565_hsw_lowp+0x40>
+  DB  119,38                              ; ja            25904 <_sk_scale_565_hsw_lowp+0x40>
   DB  196,65,61,239,192                   ; vpxor         %ymm8,%ymm8,%ymm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,255,1,0,0                 ; lea           0x1ff(%rip),%r9        # 25790 <_sk_scale_565_hsw_lowp+0x228>
+  DB  76,141,13,255,1,0,0                 ; lea           0x1ff(%rip),%r9        # 25aec <_sk_scale_565_hsw_lowp+0x228>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,12,1,0,0                        ; jmpq          256b4 <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,12,1,0,0                        ; jmpq          25a10 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,126,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%ymm8
-  DB  233,1,1,0,0                         ; jmpq          256b4 <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,1,1,0,0                         ; jmpq          25a10 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,1                   ; vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  DB  233,221,0,0,0                       ; jmpq          256b4 <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,221,0,0,0                       ; jmpq          25a10 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -35700,7 +35835,7 @@
   DB  196,67,61,2,193,15                  ; vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,3                   ; vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  DB  233,157,0,0,0                       ; jmpq          256b4 <_sk_scale_565_hsw_lowp+0x14c>
+  DB  233,157,0,0,0                       ; jmpq          25a10 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,20,2            ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -35712,7 +35847,7 @@
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   DB  196,65,122,111,12,80                ; vmovdqu       (%r8,%rdx,2),%xmm9
   DB  196,67,53,2,192,240                 ; vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  DB  235,84                              ; jmp           256b4 <_sk_scale_565_hsw_lowp+0x14c>
+  DB  235,84                              ; jmp           25a10 <_sk_scale_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,28,6            ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -35726,13 +35861,13 @@
   DB  196,65,122,111,20,80                ; vmovdqu       (%r8,%rdx,2),%xmm10
   DB  196,67,45,56,201,1                  ; vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   DB  196,67,53,2,192,192                 ; vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,233,93,0,0        ; vpbroadcastw  0x5de9(%rip),%ymm9        # 2b4a6 <_sk_srcover_rgba_8888_sse2_lowp+0x7fe>
+  DB  196,98,125,121,13,237,93,0,0        ; vpbroadcastw  0x5ded(%rip),%ymm9        # 2b806 <_sk_srcover_rgba_8888_sse2_lowp+0x802>
   DB  196,193,45,113,208,8                ; vpsrlw        $0x8,%ymm8,%ymm10
   DB  196,65,45,219,201                   ; vpand         %ymm9,%ymm10,%ymm9
   DB  196,193,45,113,208,5                ; vpsrlw        $0x5,%ymm8,%ymm10
-  DB  196,98,125,121,29,209,93,0,0        ; vpbroadcastw  0x5dd1(%rip),%ymm11        # 2b4a8 <_sk_srcover_rgba_8888_sse2_lowp+0x800>
+  DB  196,98,125,121,29,213,93,0,0        ; vpbroadcastw  0x5dd5(%rip),%ymm11        # 2b808 <_sk_srcover_rgba_8888_sse2_lowp+0x804>
   DB  196,65,45,219,211                   ; vpand         %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,197,93,0,0        ; vpbroadcastw  0x5dc5(%rip),%ymm11        # 2b4aa <_sk_srcover_rgba_8888_sse2_lowp+0x802>
+  DB  196,98,125,121,29,201,93,0,0        ; vpbroadcastw  0x5dc9(%rip),%ymm11        # 2b80a <_sk_srcover_rgba_8888_sse2_lowp+0x806>
   DB  196,65,61,219,219                   ; vpand         %ymm11,%ymm8,%ymm11
   DB  196,193,61,113,208,13               ; vpsrlw        $0xd,%ymm8,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
@@ -35742,7 +35877,7 @@
   DB  196,193,45,113,243,3                ; vpsllw        $0x3,%ymm11,%ymm10
   DB  196,193,37,113,211,2                ; vpsrlw        $0x2,%ymm11,%ymm11
   DB  196,65,45,235,211                   ; vpor          %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,140,93,0,0        ; vpbroadcastw  0x5d8c(%rip),%ymm11        # 2b4ac <_sk_srcover_rgba_8888_sse2_lowp+0x804>
+  DB  196,98,125,121,29,144,93,0,0        ; vpbroadcastw  0x5d90(%rip),%ymm11        # 2b80c <_sk_srcover_rgba_8888_sse2_lowp+0x808>
   DB  196,65,101,239,227                  ; vpxor         %ymm11,%ymm3,%ymm12
   DB  196,65,69,239,219                   ; vpxor         %ymm11,%ymm7,%ymm11
   DB  196,65,37,101,220                   ; vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -35752,7 +35887,7 @@
   DB  196,66,21,62,232                    ; vpmaxuw       %ymm8,%ymm13,%ymm13
   DB  196,67,21,76,220,176                ; vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
-  DB  196,98,125,121,5,88,93,0,0          ; vpbroadcastw  0x5d58(%rip),%ymm8        # 2b4ae <_sk_srcover_rgba_8888_sse2_lowp+0x806>
+  DB  196,98,125,121,5,92,93,0,0          ; vpbroadcastw  0x5d5c(%rip),%ymm8        # 2b80e <_sk_srcover_rgba_8888_sse2_lowp+0x80a>
   DB  196,193,125,253,192                 ; vpaddw        %ymm8,%ymm0,%ymm0
   DB  197,253,113,208,8                   ; vpsrlw        $0x8,%ymm0,%ymm0
   DB  197,181,213,201                     ; vpmullw       %ymm1,%ymm9,%ymm1
@@ -35814,24 +35949,24 @@
   DB  36,15                               ; and           $0xf,%al
   DB  254,200                             ; dec           %al
   DB  60,14                               ; cmp           $0xe,%al
-  DB  119,38                              ; ja            2580c <_sk_lerp_565_hsw_lowp+0x40>
+  DB  119,38                              ; ja            25b68 <_sk_lerp_565_hsw_lowp+0x40>
   DB  196,65,61,239,192                   ; vpxor         %ymm8,%ymm8,%ymm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,51,2,0,0                  ; lea           0x233(%rip),%r9        # 25a28 <_sk_lerp_565_hsw_lowp+0x25c>
+  DB  76,141,13,51,2,0,0                  ; lea           0x233(%rip),%r9        # 25d84 <_sk_lerp_565_hsw_lowp+0x25c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  197,121,110,192                     ; vmovd         %eax,%xmm8
-  DB  233,12,1,0,0                        ; jmpq          25918 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,12,1,0,0                        ; jmpq          25c74 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,126,111,4,80                 ; vmovdqu       (%r8,%rdx,2),%ymm8
-  DB  233,1,1,0,0                         ; jmpq          25918 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,1,1,0,0                         ; jmpq          25c74 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,4,2             ; vpinsrw       $0x2,0x4(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
   DB  196,65,121,110,12,80                ; vmovd         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,1                   ; vpblendd      $0x1,%ymm9,%ymm8,%ymm8
-  DB  233,221,0,0,0                       ; jmpq          25918 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,221,0,0,0                       ; jmpq          25c74 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,12,6            ; vpinsrw       $0x6,0xc(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,53,56,192,1                  ; vinserti128   $0x1,%xmm8,%ymm9,%ymm8
@@ -35841,7 +35976,7 @@
   DB  196,67,61,2,193,15                  ; vpblendd      $0xf,%ymm9,%ymm8,%ymm8
   DB  196,65,122,126,12,80                ; vmovq         (%r8,%rdx,2),%xmm9
   DB  196,67,61,2,193,3                   ; vpblendd      $0x3,%ymm9,%ymm8,%ymm8
-  DB  233,157,0,0,0                       ; jmpq          25918 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  233,157,0,0,0                       ; jmpq          25c74 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,20,2            ; vpinsrw       $0x2,0x14(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -35853,7 +35988,7 @@
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
   DB  196,65,122,111,12,80                ; vmovdqu       (%r8,%rdx,2),%xmm9
   DB  196,67,53,2,192,240                 ; vpblendd      $0xf0,%ymm8,%ymm9,%ymm8
-  DB  235,84                              ; jmp           25918 <_sk_lerp_565_hsw_lowp+0x14c>
+  DB  235,84                              ; jmp           25c74 <_sk_lerp_565_hsw_lowp+0x14c>
   DB  196,65,57,239,192                   ; vpxor         %xmm8,%xmm8,%xmm8
   DB  196,65,57,196,76,80,28,6            ; vpinsrw       $0x6,0x1c(%r8,%rdx,2),%xmm8,%xmm9
   DB  196,67,61,56,193,1                  ; vinserti128   $0x1,%xmm9,%ymm8,%ymm8
@@ -35867,13 +36002,13 @@
   DB  196,65,122,111,20,80                ; vmovdqu       (%r8,%rdx,2),%xmm10
   DB  196,67,45,56,201,1                  ; vinserti128   $0x1,%xmm9,%ymm10,%ymm9
   DB  196,67,53,2,192,192                 ; vpblendd      $0xc0,%ymm8,%ymm9,%ymm8
-  DB  196,98,125,121,13,143,91,0,0        ; vpbroadcastw  0x5b8f(%rip),%ymm9        # 2b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0x808>
+  DB  196,98,125,121,13,147,91,0,0        ; vpbroadcastw  0x5b93(%rip),%ymm9        # 2b810 <_sk_srcover_rgba_8888_sse2_lowp+0x80c>
   DB  196,193,45,113,208,8                ; vpsrlw        $0x8,%ymm8,%ymm10
   DB  196,65,45,219,201                   ; vpand         %ymm9,%ymm10,%ymm9
   DB  196,193,45,113,208,5                ; vpsrlw        $0x5,%ymm8,%ymm10
-  DB  196,98,125,121,29,119,91,0,0        ; vpbroadcastw  0x5b77(%rip),%ymm11        # 2b4b2 <_sk_srcover_rgba_8888_sse2_lowp+0x80a>
+  DB  196,98,125,121,29,123,91,0,0        ; vpbroadcastw  0x5b7b(%rip),%ymm11        # 2b812 <_sk_srcover_rgba_8888_sse2_lowp+0x80e>
   DB  196,65,45,219,211                   ; vpand         %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,107,91,0,0        ; vpbroadcastw  0x5b6b(%rip),%ymm11        # 2b4b4 <_sk_srcover_rgba_8888_sse2_lowp+0x80c>
+  DB  196,98,125,121,29,111,91,0,0        ; vpbroadcastw  0x5b6f(%rip),%ymm11        # 2b814 <_sk_srcover_rgba_8888_sse2_lowp+0x810>
   DB  196,65,61,219,219                   ; vpand         %ymm11,%ymm8,%ymm11
   DB  196,193,61,113,208,13               ; vpsrlw        $0xd,%ymm8,%ymm8
   DB  196,65,53,235,192                   ; vpor          %ymm8,%ymm9,%ymm8
@@ -35883,7 +36018,7 @@
   DB  196,193,45,113,243,3                ; vpsllw        $0x3,%ymm11,%ymm10
   DB  196,193,37,113,211,2                ; vpsrlw        $0x2,%ymm11,%ymm11
   DB  196,65,45,235,211                   ; vpor          %ymm11,%ymm10,%ymm10
-  DB  196,98,125,121,29,50,91,0,0         ; vpbroadcastw  0x5b32(%rip),%ymm11        # 2b4b6 <_sk_srcover_rgba_8888_sse2_lowp+0x80e>
+  DB  196,98,125,121,29,54,91,0,0         ; vpbroadcastw  0x5b36(%rip),%ymm11        # 2b816 <_sk_srcover_rgba_8888_sse2_lowp+0x812>
   DB  196,65,101,239,227                  ; vpxor         %ymm11,%ymm3,%ymm12
   DB  196,65,69,239,219                   ; vpxor         %ymm11,%ymm7,%ymm11
   DB  196,65,37,101,220                   ; vpcmpgtw      %ymm12,%ymm11,%ymm11
@@ -35892,7 +36027,7 @@
   DB  196,66,53,62,234                    ; vpmaxuw       %ymm10,%ymm9,%ymm13
   DB  196,66,21,62,232                    ; vpmaxuw       %ymm8,%ymm13,%ymm13
   DB  196,67,21,76,220,176                ; vpblendvb     %ymm11,%ymm12,%ymm13,%ymm11
-  DB  196,98,125,121,37,2,91,0,0          ; vpbroadcastw  0x5b02(%rip),%ymm12        # 2b4b8 <_sk_srcover_rgba_8888_sse2_lowp+0x810>
+  DB  196,98,125,121,37,6,91,0,0          ; vpbroadcastw  0x5b06(%rip),%ymm12        # 2b818 <_sk_srcover_rgba_8888_sse2_lowp+0x814>
   DB  196,65,61,239,236                   ; vpxor         %ymm12,%ymm8,%ymm13
   DB  197,21,213,236                      ; vpmullw       %ymm4,%ymm13,%ymm13
   DB  197,189,213,192                     ; vpmullw       %ymm0,%ymm8,%ymm0
@@ -35971,9 +36106,9 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,194                       ; movzbl        %r10b,%r8d
   DB  65,128,248,14                       ; cmp           $0xe,%r8b
-  DB  119,51                              ; ja            25ac0 <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
+  DB  119,51                              ; ja            25e1c <_sk_srcover_rgba_8888_hsw_lowp+0x5c>
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  76,141,29,236,2,0,0                 ; lea           0x2ec(%rip),%r11        # 25d84 <_sk_srcover_rgba_8888_hsw_lowp+0x320>
+  DB  76,141,29,236,2,0,0                 ; lea           0x2ec(%rip),%r11        # 260e0 <_sk_srcover_rgba_8888_hsw_lowp+0x320>
   DB  75,99,4,131                         ; movslq        (%r11,%r8,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -35983,10 +36118,10 @@
   DB  255,224                             ; jmpq          *%rax
   DB  196,193,121,110,41                  ; vmovd         (%r9),%xmm5
   DB  197,221,239,228                     ; vpxor         %ymm4,%ymm4,%ymm4
-  DB  233,22,1,0,0                        ; jmpq          25bd6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,22,1,0,0                        ; jmpq          25f32 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,126,111,41                  ; vmovdqu       (%r9),%ymm5
   DB  196,193,126,111,97,32               ; vmovdqu       0x20(%r9),%ymm4
-  DB  233,6,1,0,0                         ; jmpq          25bd6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,6,1,0,0                         ; jmpq          25f32 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,8                ; vmovd         0x8(%r9),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,197,239,255                     ; vpxor         %ymm7,%ymm7,%ymm7
@@ -35995,7 +36130,7 @@
   DB  197,249,112,237,232                 ; vpshufd       $0xe8,%xmm5,%xmm5
   DB  196,227,93,2,237,3                  ; vpblendd      $0x3,%ymm5,%ymm4,%ymm5
   DB  197,253,111,231                     ; vmovdqa       %ymm7,%ymm4
-  DB  233,216,0,0,0                       ; jmpq          25bd6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,216,0,0,0                       ; jmpq          25f32 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,24               ; vmovd         0x18(%r9),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36011,7 +36146,7 @@
   DB  196,193,122,111,41                  ; vmovdqu       (%r9),%xmm5
   DB  196,227,85,2,236,240                ; vpblendd      $0xf0,%ymm4,%ymm5,%ymm5
   DB  197,125,127,196                     ; vmovdqa       %ymm8,%ymm4
-  DB  233,129,0,0,0                       ; jmpq          25bd6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  233,129,0,0,0                       ; jmpq          25f32 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,40               ; vmovd         0x28(%r9),%xmm4
   DB  196,226,121,89,228                  ; vpbroadcastq  %xmm4,%xmm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36021,7 +36156,7 @@
   DB  196,193,121,110,105,32              ; vmovd         0x20(%r9),%xmm5
   DB  196,227,93,2,229,1                  ; vpblendd      $0x1,%ymm5,%ymm4,%ymm4
   DB  196,193,126,111,41                  ; vmovdqu       (%r9),%ymm5
-  DB  235,76                              ; jmp           25bd6 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
+  DB  235,76                              ; jmp           25f32 <_sk_srcover_rgba_8888_hsw_lowp+0x172>
   DB  196,193,121,110,97,56               ; vmovd         0x38(%r9),%xmm4
   DB  196,226,125,89,228                  ; vpbroadcastq  %xmm4,%ymm4
   DB  197,213,239,237                     ; vpxor         %ymm5,%ymm5,%ymm5
@@ -36041,9 +36176,9 @@
   DB  196,227,69,14,236,170               ; vpblendw      $0xaa,%ymm4,%ymm7,%ymm5
   DB  196,227,77,14,228,170               ; vpblendw      $0xaa,%ymm4,%ymm6,%ymm4
   DB  196,226,93,43,237                   ; vpackusdw     %ymm5,%ymm4,%ymm5
-  DB  197,125,111,5,193,88,0,0            ; vmovdqa       0x58c1(%rip),%ymm8        # 2b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0x818>
+  DB  197,125,111,5,197,88,0,0            ; vmovdqa       0x58c5(%rip),%ymm8        # 2b820 <_sk_srcover_rgba_8888_sse2_lowp+0x81c>
   DB  196,193,85,219,224                  ; vpand         %ymm8,%ymm5,%ymm4
-  DB  196,98,125,121,13,211,88,0,0        ; vpbroadcastw  0x58d3(%rip),%ymm9        # 2b4e0 <_sk_srcover_rgba_8888_sse2_lowp+0x838>
+  DB  196,98,125,121,13,215,88,0,0        ; vpbroadcastw  0x58d7(%rip),%ymm9        # 2b840 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
   DB  197,213,113,213,8                   ; vpsrlw        $0x8,%ymm5,%ymm5
   DB  197,197,114,215,16                  ; vpsrld        $0x10,%ymm7,%ymm7
   DB  197,205,114,214,16                  ; vpsrld        $0x10,%ymm6,%ymm6
@@ -36082,19 +36217,19 @@
   DB  196,193,53,114,243,16               ; vpslld        $0x10,%ymm11,%ymm9
   DB  196,65,53,235,202                   ; vpor          %ymm10,%ymm9,%ymm9
   DB  65,128,250,14                       ; cmp           $0xe,%r10b
-  DB  119,26                              ; ja            25ce7 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
-  DB  76,141,21,236,0,0,0                 ; lea           0xec(%rip),%r10        # 25dc0 <_sk_srcover_rgba_8888_hsw_lowp+0x35c>
+  DB  119,26                              ; ja            26043 <_sk_srcover_rgba_8888_hsw_lowp+0x283>
+  DB  76,141,21,236,0,0,0                 ; lea           0xec(%rip),%r10        # 2611c <_sk_srcover_rgba_8888_hsw_lowp+0x35c>
   DB  75,99,4,130                         ; movslq        (%r10,%r8,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  196,65,121,126,1                    ; vmovd         %xmm8,(%r9)
-  DB  233,151,0,0,0                       ; jmpq          25d7e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  233,151,0,0,0                       ; jmpq          260da <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,65,126,127,1                    ; vmovdqu       %ymm8,(%r9)
   DB  196,65,126,127,73,32                ; vmovdqu       %ymm9,0x20(%r9)
-  DB  233,135,0,0,0                       ; jmpq          25d7e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  233,135,0,0,0                       ; jmpq          260da <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,121,22,65,8,2                ; vpextrd       $0x2,%xmm8,0x8(%r9)
   DB  196,65,121,214,1                    ; vmovq         %xmm8,(%r9)
-  DB  235,121                             ; jmp           25d7e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  235,121                             ; jmp           260da <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,67,121,22,73,24,2               ; vpextrd       $0x2,%xmm9,0x18(%r9)
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
@@ -36102,12 +36237,12 @@
   DB  196,67,125,57,193,1                 ; vextracti128  $0x1,%ymm8,%xmm9
   DB  196,65,121,126,73,16                ; vmovd         %xmm9,0x10(%r9)
   DB  196,65,122,127,1                    ; vmovdqu       %xmm8,(%r9)
-  DB  235,76                              ; jmp           25d7e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  235,76                              ; jmp           260da <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,121,22,73,40,2               ; vpextrd       $0x2,%xmm9,0x28(%r9)
   DB  196,67,121,22,73,36,1               ; vpextrd       $0x1,%xmm9,0x24(%r9)
   DB  196,65,121,126,73,32                ; vmovd         %xmm9,0x20(%r9)
   DB  196,65,126,127,1                    ; vmovdqu       %ymm8,(%r9)
-  DB  235,49                              ; jmp           25d7e <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
+  DB  235,49                              ; jmp           260da <_sk_srcover_rgba_8888_hsw_lowp+0x31a>
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
   DB  196,67,121,22,81,56,2               ; vpextrd       $0x2,%xmm10,0x38(%r9)
   DB  196,67,125,57,202,1                 ; vextracti128  $0x1,%ymm9,%xmm10
@@ -36155,7 +36290,7 @@
   DB  255,6                               ; incl          (%rsi)
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,62               ; lcall         *0x3effffff(%rip)        # 3f025dc4 <_sk_srcover_rgba_8888_sse2_lowp+0x3effb11c>
+  DB  255,29,255,255,255,62               ; lcall         *0x3effffff(%rip)        # 3f026120 <_sk_srcover_rgba_8888_sse2_lowp+0x3effb11c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,55                              ; pushq         (%rdi)
@@ -36173,7 +36308,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  121,255                             ; jns           25de5 <_sk_srcover_rgba_8888_hsw_lowp+0x381>
+  DB  121,255                             ; jns           26141 <_sk_srcover_rgba_8888_hsw_lowp+0x381>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -36216,13 +36351,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,153,0,0,0                    ; jae           25f16 <_sk_start_pipeline_sse41_lowp+0x11a>
+  DB  15,131,153,0,0,0                    ; jae           26272 <_sk_start_pipeline_sse41_lowp+0x11a>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,8                         ; lea           0x8(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,62                              ; ja            25edd <_sk_start_pipeline_sse41_lowp+0xe1>
+  DB  119,62                              ; ja            26239 <_sk_start_pipeline_sse41_lowp+0xe1>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -36241,10 +36376,10 @@
   DB  73,131,196,16                       ; add           $0x10,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,201                             ; jbe           25ea6 <_sk_start_pipeline_sse41_lowp+0xaa>
+  DB  118,201                             ; jbe           26202 <_sk_start_pipeline_sse41_lowp+0xaa>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,33                              ; je            25f06 <_sk_start_pipeline_sse41_lowp+0x10a>
+  DB  116,33                              ; je            26262 <_sk_start_pipeline_sse41_lowp+0x10a>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -36258,7 +36393,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,121,255,255,255              ; jne           25e8f <_sk_start_pipeline_sse41_lowp+0x93>
+  DB  15,133,121,255,255,255              ; jne           261eb <_sk_start_pipeline_sse41_lowp+0x93>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -36307,7 +36442,7 @@
 PUBLIC _sk_black_color_sse41_lowp
 _sk_black_color_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,192,86,0,0                 ; movaps        0x56c0(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,29,196,86,0,0                 ; movaps        0x56c4(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -36316,7 +36451,7 @@
 PUBLIC _sk_white_color_sse41_lowp
 _sk_white_color_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,172,86,0,0                  ; movaps        0x56ac(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,5,176,86,0,0                  ; movaps        0x56b0(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -36325,10 +36460,10 @@
 PUBLIC _sk_set_rgb_sse41_lowp
 _sk_set_rgb_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,15,16,21,43,85,0,0              ; movss         0x552b(%rip),%xmm2        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  243,15,16,21,47,85,0,0              ; movss         0x552f(%rip),%xmm2        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  243,15,16,0                         ; movss         (%rax),%xmm0
   DB  243,15,89,194                       ; mulss         %xmm2,%xmm0
-  DB  243,68,15,16,5,234,84,0,0           ; movss         0x54ea(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,16,5,238,84,0,0           ; movss         0x54ee(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  243,65,15,88,192                    ; addss         %xmm8,%xmm0
   DB  243,68,15,44,192                    ; cvttss2si     %xmm0,%r8d
   DB  102,65,15,110,192                   ; movd          %r8d,%xmm0
@@ -36353,7 +36488,7 @@
 PUBLIC _sk_premul_sse41_lowp
 _sk_premul_sse41_lowp LABEL PROC
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,30,86,0,0           ; movdqa        0x561e(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,34,86,0,0           ; movdqa        0x5622(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
@@ -36393,7 +36528,7 @@
 
 PUBLIC _sk_invert_sse41_lowp
 _sk_invert_sse41_lowp LABEL PROC
-  DB  102,68,15,111,5,188,85,0,0          ; movdqa        0x55bc(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,192,85,0,0          ; movdqa        0x55c0(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,200                   ; psubw         %xmm0,%xmm9
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -36421,7 +36556,7 @@
 _sk_srcatop_sse41_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,15,111,29,96,85,0,0             ; movdqa        0x5560(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,111,29,100,85,0,0            ; movdqa        0x5564(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,111,203                   ; movdqa        %xmm3,%xmm9
   DB  102,69,15,249,200                   ; psubw         %xmm8,%xmm9
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
@@ -36451,7 +36586,7 @@
 _sk_dstatop_sse41_lowp LABEL PROC
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
   DB  102,68,15,213,195                   ; pmullw        %xmm3,%xmm8
-  DB  102,68,15,111,13,224,84,0,0         ; movdqa        0x54e0(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,228,84,0,0         ; movdqa        0x54e4(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,253,193                   ; paddw         %xmm9,%xmm8
   DB  102,68,15,111,213                   ; movdqa        %xmm5,%xmm10
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
@@ -36478,7 +36613,7 @@
 PUBLIC _sk_srcin_sse41_lowp
 _sk_srcin_sse41_lowp LABEL PROC
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,68,15,111,5,107,84,0,0          ; movdqa        0x546b(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,111,84,0,0          ; movdqa        0x546f(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,207                      ; pmullw        %xmm7,%xmm1
@@ -36497,7 +36632,7 @@
 _sk_dstin_sse41_lowp LABEL PROC
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,34,84,0,0           ; movdqa        0x5422(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,38,84,0,0           ; movdqa        0x5426(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -36516,7 +36651,7 @@
 
 PUBLIC _sk_srcout_sse41_lowp
 _sk_srcout_sse41_lowp LABEL PROC
-  DB  102,68,15,111,5,217,83,0,0          ; movdqa        0x53d9(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,221,83,0,0          ; movdqa        0x53dd(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -36537,7 +36672,7 @@
 PUBLIC _sk_dstout_sse41_lowp
 _sk_dstout_sse41_lowp LABEL PROC
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,68,15,111,5,130,83,0,0          ; movdqa        0x5382(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,134,83,0,0          ; movdqa        0x5386(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,249,216                      ; psubw         %xmm0,%xmm3
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
@@ -36560,7 +36695,7 @@
 
 PUBLIC _sk_srcover_sse41_lowp
 _sk_srcover_sse41_lowp LABEL PROC
-  DB  102,68,15,111,13,40,83,0,0          ; movdqa        0x5328(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,44,83,0,0          ; movdqa        0x532c(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -36587,7 +36722,7 @@
 
 PUBLIC _sk_dstover_sse41_lowp
 _sk_dstover_sse41_lowp LABEL PROC
-  DB  102,68,15,111,5,174,82,0,0          ; movdqa        0x52ae(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,178,82,0,0          ; movdqa        0x52b2(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -36612,7 +36747,7 @@
 PUBLIC _sk_modulate_sse41_lowp
 _sk_modulate_sse41_lowp LABEL PROC
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
-  DB  102,68,15,111,5,71,82,0,0           ; movdqa        0x5247(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,75,82,0,0           ; movdqa        0x524b(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
@@ -36629,7 +36764,7 @@
 
 PUBLIC _sk_multiply_sse41_lowp
 _sk_multiply_sse41_lowp LABEL PROC
-  DB  102,68,15,111,13,6,82,0,0           ; movdqa        0x5206(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,10,82,0,0          ; movdqa        0x520a(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -36670,7 +36805,7 @@
 PUBLIC _sk_plus__sse41_lowp
 _sk_plus__sse41_lowp LABEL PROC
   DB  102,15,253,196                      ; paddw         %xmm4,%xmm0
-  DB  102,68,15,111,5,75,81,0,0           ; movdqa        0x514b(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,79,81,0,0           ; movdqa        0x514f(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,56,58,192                 ; pminuw        %xmm8,%xmm0
   DB  102,15,253,205                      ; paddw         %xmm5,%xmm1
   DB  102,65,15,56,58,200                 ; pminuw        %xmm8,%xmm1
@@ -36688,7 +36823,7 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,21,5,81,0,0           ; movdqa        0x5105(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,21,9,81,0,0           ; movdqa        0x5109(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -36718,7 +36853,7 @@
 PUBLIC _sk_xor__sse41_lowp
 _sk_xor__sse41_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,111,13,131,80,0,0         ; movdqa        0x5083(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,135,80,0,0         ; movdqa        0x5087(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,68,15,249,215                   ; psubw         %xmm7,%xmm10
   DB  102,65,15,213,194                   ; pmullw        %xmm10,%xmm0
@@ -36759,7 +36894,7 @@
   DB  102,68,15,213,207                   ; pmullw        %xmm7,%xmm9
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,65,15,56,62,201                 ; pmaxuw        %xmm9,%xmm1
-  DB  102,68,15,111,13,202,79,0,0         ; movdqa        0x4fca(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,206,79,0,0         ; movdqa        0x4fce(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -36801,7 +36936,7 @@
   DB  102,68,15,213,207                   ; pmullw        %xmm7,%xmm9
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,65,15,56,58,201                 ; pminuw        %xmm9,%xmm1
-  DB  102,68,15,111,13,13,79,0,0          ; movdqa        0x4f0d(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,17,79,0,0          ; movdqa        0x4f11(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -36843,10 +36978,10 @@
   DB  102,68,15,213,207                   ; pmullw        %xmm7,%xmm9
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,65,15,56,58,201                 ; pminuw        %xmm9,%xmm1
-  DB  102,68,15,111,13,80,78,0,0          ; movdqa        0x4e50(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,84,78,0,0          ; movdqa        0x4e54(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,21,157,85,0,0         ; movdqa        0x559d(%rip),%xmm10        # 2bde0 <_sk_srcover_rgba_8888_sse2_lowp+0x1138>
+  DB  102,68,15,111,21,161,85,0,0         ; movdqa        0x55a1(%rip),%xmm10        # 2c140 <_sk_srcover_rgba_8888_sse2_lowp+0x113c>
   DB  102,65,15,219,202                   ; pand          %xmm10,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,68,15,111,221                   ; movdqa        %xmm5,%xmm11
@@ -36886,10 +37021,10 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,13,140,77,0,0         ; movdqa        0x4d8c(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,144,77,0,0         ; movdqa        0x4d90(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,21,217,84,0,0         ; movdqa        0x54d9(%rip),%xmm10        # 2bde0 <_sk_srcover_rgba_8888_sse2_lowp+0x1138>
+  DB  102,68,15,111,21,221,84,0,0         ; movdqa        0x54dd(%rip),%xmm10        # 2c140 <_sk_srcover_rgba_8888_sse2_lowp+0x113c>
   DB  102,65,15,219,202                   ; pand          %xmm10,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -36924,14 +37059,14 @@
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  102,68,15,111,29,228,76,0,0         ; movdqa        0x4ce4(%rip),%xmm11        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,29,232,76,0,0         ; movdqa        0x4ce8(%rip),%xmm11        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,249,220                   ; psubw         %xmm12,%xmm11
   DB  102,65,15,111,227                   ; movdqa        %xmm11,%xmm4
   DB  102,65,15,213,224                   ; pmullw        %xmm8,%xmm4
   DB  102,68,15,111,251                   ; movdqa        %xmm3,%xmm15
   DB  102,69,15,249,248                   ; psubw         %xmm8,%xmm15
   DB  102,69,15,253,192                   ; paddw         %xmm8,%xmm8
-  DB  102,68,15,111,13,45,84,0,0          ; movdqa        0x542d(%rip),%xmm9        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,13,49,84,0,0          ; movdqa        0x5431(%rip),%xmm9        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,68,15,111,243                   ; movdqa        %xmm3,%xmm14
   DB  102,69,15,239,241                   ; pxor          %xmm9,%xmm14
   DB  102,65,15,111,196                   ; movdqa        %xmm12,%xmm0
@@ -36978,7 +37113,7 @@
   DB  102,68,15,111,232                   ; movdqa        %xmm0,%xmm13
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,56,16,210                 ; pblendvb      %xmm0,%xmm10,%xmm2
-  DB  102,68,15,111,13,214,75,0,0         ; movdqa        0x4bd6(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,218,75,0,0         ; movdqa        0x4bda(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,249,195                      ; psubw         %xmm3,%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
@@ -37017,7 +37152,7 @@
   DB  72,131,236,24                       ; sub           $0x18,%rsp
   DB  102,68,15,111,231                   ; movdqa        %xmm7,%xmm12
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  102,68,15,111,29,49,75,0,0          ; movdqa        0x4b31(%rip),%xmm11        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,29,53,75,0,0          ; movdqa        0x4b35(%rip),%xmm11        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,249,220                   ; psubw         %xmm12,%xmm11
   DB  102,65,15,111,195                   ; movdqa        %xmm11,%xmm0
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
@@ -37029,7 +37164,7 @@
   DB  102,68,15,249,252                   ; psubw         %xmm4,%xmm15
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,192                      ; paddw         %xmm0,%xmm0
-  DB  102,68,15,111,13,99,82,0,0          ; movdqa        0x5263(%rip),%xmm9        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,13,103,82,0,0         ; movdqa        0x5267(%rip),%xmm9        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,69,15,111,212                   ; movdqa        %xmm12,%xmm10
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
   DB  102,69,15,213,254                   ; pmullw        %xmm14,%xmm15
@@ -37075,7 +37210,7 @@
   DB  102,15,253,210                      ; paddw         %xmm2,%xmm2
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,56,16,210                 ; pblendvb      %xmm0,%xmm10,%xmm2
-  DB  102,68,15,111,13,21,74,0,0          ; movdqa        0x4a15(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,25,74,0,0          ; movdqa        0x4a19(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,249,195                      ; psubw         %xmm3,%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
@@ -37117,49 +37252,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            26d30 <_sk_load_8888_sse41_lowp+0x44>
+  DB  119,41                              ; ja            2708c <_sk_load_8888_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 26e08 <_sk_load_8888_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 27164 <_sk_load_8888_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,20,144                ; movd          (%r8,%rdx,4),%xmm2
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           26d89 <_sk_load_8888_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           270e5 <_sk_load_8888_sse41_lowp+0x9d>
   DB  243,65,15,111,20,144                ; movdqu        (%r8,%rdx,4),%xmm2
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           26d89 <_sk_load_8888_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           270e5 <_sk_load_8888_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  243,65,15,126,20,144                ; movq          (%r8,%rdx,4),%xmm2
   DB  102,65,15,58,14,208,240             ; pblendw       $0xf0,%xmm8,%xmm2
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  235,37                              ; jmp           26d89 <_sk_load_8888_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           270e5 <_sk_load_8888_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,20,144                ; movdqu        (%r8,%rdx,4),%xmm2
-  DB  102,15,111,5,111,80,0,0             ; movdqa        0x506f(%rip),%xmm0        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0x1158>
+  DB  102,15,111,5,115,80,0,0             ; movdqa        0x5073(%rip),%xmm0        # 2c160 <_sk_srcover_rgba_8888_sse2_lowp+0x115c>
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,15,56,0,200                     ; pshufb        %xmm0,%xmm1
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,56,0,216                     ; pshufb        %xmm0,%xmm3
   DB  102,15,108,203                      ; punpcklqdq    %xmm3,%xmm1
-  DB  102,68,15,111,13,207,72,0,0         ; movdqa        0x48cf(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,211,72,0,0         ; movdqa        0x48d3(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,193                   ; pand          %xmm9,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,68,15,111,21,72,80,0,0          ; movdqa        0x5048(%rip),%xmm10        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0x1168>
+  DB  102,68,15,111,21,76,80,0,0          ; movdqa        0x504c(%rip),%xmm10        # 2c170 <_sk_srcover_rgba_8888_sse2_lowp+0x116c>
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
   DB  102,65,15,56,0,218                  ; pshufb        %xmm10,%xmm3
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,219                   ; punpcklqdq    %xmm11,%xmm3
-  DB  102,68,15,111,21,53,80,0,0          ; movdqa        0x5035(%rip),%xmm10        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0x1178>
+  DB  102,68,15,111,21,57,80,0,0          ; movdqa        0x5039(%rip),%xmm10        # 2c180 <_sk_srcover_rgba_8888_sse2_lowp+0x117c>
   DB  102,65,15,56,0,210                  ; pshufb        %xmm10,%xmm2
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,208                   ; punpcklqdq    %xmm8,%xmm2
@@ -37175,7 +37310,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           26e15 <_sk_load_8888_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           27171 <_sk_load_8888_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -37195,49 +37330,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            26e68 <_sk_load_8888_dst_sse41_lowp+0x44>
+  DB  119,41                              ; ja            271c4 <_sk_load_8888_dst_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 26f40 <_sk_load_8888_dst_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 2729c <_sk_load_8888_dst_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,52,144                ; movd          (%r8,%rdx,4),%xmm6
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           26ec1 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           2721d <_sk_load_8888_dst_sse41_lowp+0x9d>
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           26ec1 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           2721d <_sk_load_8888_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  243,65,15,126,52,144                ; movq          (%r8,%rdx,4),%xmm6
   DB  102,65,15,58,14,240,240             ; pblendw       $0xf0,%xmm8,%xmm6
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,37                              ; jmp           26ec1 <_sk_load_8888_dst_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           2721d <_sk_load_8888_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
-  DB  102,15,111,37,55,79,0,0             ; movdqa        0x4f37(%rip),%xmm4        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0x1158>
+  DB  102,15,111,37,59,79,0,0             ; movdqa        0x4f3b(%rip),%xmm4        # 2c160 <_sk_srcover_rgba_8888_sse2_lowp+0x115c>
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,15,56,0,236                     ; pshufb        %xmm4,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,252                     ; pshufb        %xmm4,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,13,151,71,0,0         ; movdqa        0x4797(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,155,71,0,0         ; movdqa        0x479b(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,225                   ; pand          %xmm9,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,21,16,79,0,0          ; movdqa        0x4f10(%rip),%xmm10        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0x1168>
+  DB  102,68,15,111,21,20,79,0,0          ; movdqa        0x4f14(%rip),%xmm10        # 2c170 <_sk_srcover_rgba_8888_sse2_lowp+0x116c>
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,65,15,56,0,250                  ; pshufb        %xmm10,%xmm7
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,251                   ; punpcklqdq    %xmm11,%xmm7
-  DB  102,68,15,111,21,253,78,0,0         ; movdqa        0x4efd(%rip),%xmm10        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0x1178>
+  DB  102,68,15,111,21,1,79,0,0           ; movdqa        0x4f01(%rip),%xmm10        # 2c180 <_sk_srcover_rgba_8888_sse2_lowp+0x117c>
   DB  102,65,15,56,0,242                  ; pshufb        %xmm10,%xmm6
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,240                   ; punpcklqdq    %xmm8,%xmm6
@@ -37253,7 +37388,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           26f4d <_sk_load_8888_dst_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           272a9 <_sk_load_8888_dst_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -37288,20 +37423,20 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            26fe2 <_sk_store_8888_sse41_lowp+0x86>
+  DB  119,27                              ; ja            2733e <_sk_store_8888_sse41_lowp+0x86>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 27028 <_sk_store_8888_sse41_lowp+0xcc>
+  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 27384 <_sk_store_8888_sse41_lowp+0xcc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           27021 <_sk_store_8888_sse41_lowp+0xc5>
+  DB  235,63                              ; jmp           2737d <_sk_store_8888_sse41_lowp+0xc5>
   DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  243,69,15,127,76,144,16             ; movdqu        %xmm9,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           27021 <_sk_store_8888_sse41_lowp+0xc5>
+  DB  235,48                              ; jmp           2737d <_sk_store_8888_sse41_lowp+0xc5>
   DB  102,69,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           27021 <_sk_store_8888_sse41_lowp+0xc5>
+  DB  235,31                              ; jmp           2737d <_sk_store_8888_sse41_lowp+0xc5>
   DB  102,69,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  102,69,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  102,69,15,126,76,144,16             ; movd          %xmm9,0x10(%r8,%rdx,4)
@@ -37343,49 +37478,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            27088 <_sk_load_bgra_sse41_lowp+0x44>
+  DB  119,41                              ; ja            273e4 <_sk_load_bgra_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 27160 <_sk_load_bgra_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 274bc <_sk_load_bgra_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,4,144                 ; movd          (%r8,%rdx,4),%xmm0
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           270e1 <_sk_load_bgra_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           2743d <_sk_load_bgra_sse41_lowp+0x9d>
   DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           270e1 <_sk_load_bgra_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           2743d <_sk_load_bgra_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  243,65,15,126,4,144                 ; movq          (%r8,%rdx,4),%xmm0
   DB  102,65,15,58,14,192,240             ; pblendw       $0xf0,%xmm8,%xmm0
   DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
-  DB  235,37                              ; jmp           270e1 <_sk_load_bgra_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           2743d <_sk_load_bgra_sse41_lowp+0x9d>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,4,144                 ; movdqu        (%r8,%rdx,4),%xmm0
-  DB  102,15,111,21,23,77,0,0             ; movdqa        0x4d17(%rip),%xmm2        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0x1158>
+  DB  102,15,111,21,27,77,0,0             ; movdqa        0x4d1b(%rip),%xmm2        # 2c160 <_sk_srcover_rgba_8888_sse2_lowp+0x115c>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,56,0,202                     ; pshufb        %xmm2,%xmm1
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,56,0,218                     ; pshufb        %xmm2,%xmm3
   DB  102,15,108,203                      ; punpcklqdq    %xmm3,%xmm1
-  DB  102,68,15,111,13,119,69,0,0         ; movdqa        0x4577(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,123,69,0,0         ; movdqa        0x457b(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,65,15,219,209                   ; pand          %xmm9,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,68,15,111,21,240,76,0,0         ; movdqa        0x4cf0(%rip),%xmm10        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0x1168>
+  DB  102,68,15,111,21,244,76,0,0         ; movdqa        0x4cf4(%rip),%xmm10        # 2c170 <_sk_srcover_rgba_8888_sse2_lowp+0x116c>
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,65,15,56,0,218                  ; pshufb        %xmm10,%xmm3
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,219                   ; punpcklqdq    %xmm11,%xmm3
-  DB  102,68,15,111,21,221,76,0,0         ; movdqa        0x4cdd(%rip),%xmm10        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0x1178>
+  DB  102,68,15,111,21,225,76,0,0         ; movdqa        0x4ce1(%rip),%xmm10        # 2c180 <_sk_srcover_rgba_8888_sse2_lowp+0x117c>
   DB  102,65,15,56,0,194                  ; pshufb        %xmm10,%xmm0
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,192                   ; punpcklqdq    %xmm8,%xmm0
@@ -37401,7 +37536,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           2716d <_sk_load_bgra_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           274c9 <_sk_load_bgra_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -37421,49 +37556,49 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            271c0 <_sk_load_bgra_dst_sse41_lowp+0x44>
+  DB  119,41                              ; ja            2751c <_sk_load_bgra_dst_sse41_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 27298 <_sk_load_bgra_dst_sse41_lowp+0x11c>
+  DB  76,141,13,242,0,0,0                 ; lea           0xf2(%rip),%r9        # 275f4 <_sk_load_bgra_dst_sse41_lowp+0x11c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,36,144                ; movd          (%r8,%rdx,4),%xmm4
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           27219 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  DB  235,89                              ; jmp           27575 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   DB  243,65,15,111,36,144                ; movdqu        (%r8,%rdx,4),%xmm4
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           27219 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  DB  235,74                              ; jmp           27575 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  243,65,15,126,36,144                ; movq          (%r8,%rdx,4),%xmm4
   DB  102,65,15,58,14,224,240             ; pblendw       $0xf0,%xmm8,%xmm4
   DB  102,68,15,111,197                   ; movdqa        %xmm5,%xmm8
-  DB  235,37                              ; jmp           27219 <_sk_load_bgra_dst_sse41_lowp+0x9d>
+  DB  235,37                              ; jmp           27575 <_sk_load_bgra_dst_sse41_lowp+0x9d>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,36,144                ; movdqu        (%r8,%rdx,4),%xmm4
-  DB  102,15,111,53,223,75,0,0            ; movdqa        0x4bdf(%rip),%xmm6        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0x1158>
+  DB  102,15,111,53,227,75,0,0            ; movdqa        0x4be3(%rip),%xmm6        # 2c160 <_sk_srcover_rgba_8888_sse2_lowp+0x115c>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,56,0,238                     ; pshufb        %xmm6,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,254                     ; pshufb        %xmm6,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,13,63,68,0,0          ; movdqa        0x443f(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,67,68,0,0          ; movdqa        0x4443(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,65,15,219,241                   ; pand          %xmm9,%xmm6
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,21,184,75,0,0         ; movdqa        0x4bb8(%rip),%xmm10        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0x1168>
+  DB  102,68,15,111,21,188,75,0,0         ; movdqa        0x4bbc(%rip),%xmm10        # 2c170 <_sk_srcover_rgba_8888_sse2_lowp+0x116c>
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,65,15,56,0,250                  ; pshufb        %xmm10,%xmm7
   DB  102,69,15,111,216                   ; movdqa        %xmm8,%xmm11
   DB  102,69,15,56,0,218                  ; pshufb        %xmm10,%xmm11
   DB  102,65,15,108,251                   ; punpcklqdq    %xmm11,%xmm7
-  DB  102,68,15,111,21,165,75,0,0         ; movdqa        0x4ba5(%rip),%xmm10        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0x1178>
+  DB  102,68,15,111,21,169,75,0,0         ; movdqa        0x4ba9(%rip),%xmm10        # 2c180 <_sk_srcover_rgba_8888_sse2_lowp+0x117c>
   DB  102,65,15,56,0,226                  ; pshufb        %xmm10,%xmm4
   DB  102,69,15,56,0,194                  ; pshufb        %xmm10,%xmm8
   DB  102,65,15,108,224                   ; punpcklqdq    %xmm8,%xmm4
@@ -37479,7 +37614,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           272a5 <_sk_load_bgra_dst_sse41_lowp+0x129>
+  DB  123,255                             ; jnp           27601 <_sk_load_bgra_dst_sse41_lowp+0x129>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -37514,20 +37649,20 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            2733a <_sk_store_bgra_sse41_lowp+0x86>
+  DB  119,27                              ; ja            27696 <_sk_store_bgra_sse41_lowp+0x86>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 27380 <_sk_store_bgra_sse41_lowp+0xcc>
+  DB  76,141,13,87,0,0,0                  ; lea           0x57(%rip),%r9        # 276dc <_sk_store_bgra_sse41_lowp+0xcc>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,4,144                 ; movd          %xmm8,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           27379 <_sk_store_bgra_sse41_lowp+0xc5>
+  DB  235,63                              ; jmp           276d5 <_sk_store_bgra_sse41_lowp+0xc5>
   DB  243,69,15,127,4,144                 ; movdqu        %xmm8,(%r8,%rdx,4)
   DB  243,69,15,127,76,144,16             ; movdqu        %xmm9,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           27379 <_sk_store_bgra_sse41_lowp+0xc5>
+  DB  235,48                              ; jmp           276d5 <_sk_store_bgra_sse41_lowp+0xc5>
   DB  102,69,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,4,144                 ; movq          %xmm8,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           27379 <_sk_store_bgra_sse41_lowp+0xc5>
+  DB  235,31                              ; jmp           276d5 <_sk_store_bgra_sse41_lowp+0xc5>
   DB  102,69,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm9,0x18(%r8,%rdx,4)
   DB  102,69,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm9,0x14(%r8,%rdx,4)
   DB  102,69,15,126,76,144,16             ; movd          %xmm9,0x10(%r8,%rdx,4)
@@ -37569,23 +37704,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            273d8 <_sk_load_565_sse41_lowp+0x3c>
+  DB  119,34                              ; ja            27734 <_sk_load_565_sse41_lowp+0x3c>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 27488 <_sk_load_565_sse41_lowp+0xec>
+  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 277e4 <_sk_load_565_sse41_lowp+0xec>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,74                              ; jmp           27422 <_sk_load_565_sse41_lowp+0x86>
+  DB  235,74                              ; jmp           2777e <_sk_load_565_sse41_lowp+0x86>
   DB  243,65,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm0
-  DB  235,66                              ; jmp           27422 <_sk_load_565_sse41_lowp+0x86>
+  DB  235,66                              ; jmp           2777e <_sk_load_565_sse41_lowp+0x86>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,76,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm1
   DB  102,65,15,110,4,80                  ; movd          (%r8,%rdx,2),%xmm0
   DB  102,15,58,14,193,252                ; pblendw       $0xfc,%xmm1,%xmm0
-  DB  235,40                              ; jmp           27422 <_sk_load_565_sse41_lowp+0x86>
+  DB  235,40                              ; jmp           2777e <_sk_load_565_sse41_lowp+0x86>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,65,15,196,76,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm1
   DB  102,65,15,196,76,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm1
@@ -37594,11 +37729,11 @@
   DB  102,15,58,14,193,240                ; pblendw       $0xf0,%xmm1,%xmm0
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
-  DB  102,15,219,29,253,73,0,0            ; pand          0x49fd(%rip),%xmm3        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,15,219,29,1,74,0,0              ; pand          0x4a01(%rip),%xmm3        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,13,252,73,0,0            ; pand          0x49fc(%rip),%xmm1        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,15,111,21,4,74,0,0              ; movdqa        0x4a04(%rip),%xmm2        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,15,219,13,0,74,0,0              ; pand          0x4a00(%rip),%xmm1        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,15,111,21,8,74,0,0              ; movdqa        0x4a08(%rip),%xmm2        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,195                      ; por           %xmm3,%xmm0
@@ -37611,7 +37746,7 @@
   DB  102,15,113,210,2                    ; psrlw         $0x2,%xmm2
   DB  102,15,235,211                      ; por           %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,250,65,0,0                 ; movaps        0x41fa(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,29,254,65,0,0                 ; movaps        0x41fe(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  255,224                             ; jmpq          *%rax
   DB  69,255                              ; rex.RB        (bad)
   DB  255                                 ; (bad)
@@ -37622,7 +37757,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           2749d <_sk_load_565_sse41_lowp+0x101>
+  DB  126,255                             ; jle           277f9 <_sk_load_565_sse41_lowp+0x101>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -37639,23 +37774,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            274e0 <_sk_load_565_dst_sse41_lowp+0x3c>
+  DB  119,34                              ; ja            2783c <_sk_load_565_dst_sse41_lowp+0x3c>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 27590 <_sk_load_565_dst_sse41_lowp+0xec>
+  DB  76,141,13,196,0,0,0                 ; lea           0xc4(%rip),%r9        # 278ec <_sk_load_565_dst_sse41_lowp+0xec>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,74                              ; jmp           2752a <_sk_load_565_dst_sse41_lowp+0x86>
+  DB  235,74                              ; jmp           27886 <_sk_load_565_dst_sse41_lowp+0x86>
   DB  243,65,15,111,36,80                 ; movdqu        (%r8,%rdx,2),%xmm4
-  DB  235,66                              ; jmp           2752a <_sk_load_565_dst_sse41_lowp+0x86>
+  DB  235,66                              ; jmp           27886 <_sk_load_565_dst_sse41_lowp+0x86>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,65,15,196,108,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm5
   DB  102,65,15,110,36,80                 ; movd          (%r8,%rdx,2),%xmm4
   DB  102,15,58,14,229,252                ; pblendw       $0xfc,%xmm5,%xmm4
-  DB  235,40                              ; jmp           2752a <_sk_load_565_dst_sse41_lowp+0x86>
+  DB  235,40                              ; jmp           27886 <_sk_load_565_dst_sse41_lowp+0x86>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,65,15,196,108,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm5
   DB  102,65,15,196,108,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm5
@@ -37664,11 +37799,11 @@
   DB  102,15,58,14,229,240                ; pblendw       $0xf0,%xmm5,%xmm4
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,15,113,215,8                    ; psrlw         $0x8,%xmm7
-  DB  102,15,219,61,245,72,0,0            ; pand          0x48f5(%rip),%xmm7        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,15,219,61,249,72,0,0            ; pand          0x48f9(%rip),%xmm7        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,113,213,5                    ; psrlw         $0x5,%xmm5
-  DB  102,15,219,45,244,72,0,0            ; pand          0x48f4(%rip),%xmm5        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,15,111,53,252,72,0,0            ; movdqa        0x48fc(%rip),%xmm6        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,15,219,45,248,72,0,0            ; pand          0x48f8(%rip),%xmm5        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,15,111,53,0,73,0,0              ; movdqa        0x4900(%rip),%xmm6        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,15,219,244                      ; pand          %xmm4,%xmm6
   DB  102,15,113,212,13                   ; psrlw         $0xd,%xmm4
   DB  102,15,235,231                      ; por           %xmm7,%xmm4
@@ -37681,7 +37816,7 @@
   DB  102,15,113,214,2                    ; psrlw         $0x2,%xmm6
   DB  102,15,235,247                      ; por           %xmm7,%xmm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,242,64,0,0                 ; movaps        0x40f2(%rip),%xmm7        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,61,246,64,0,0                 ; movaps        0x40f6(%rip),%xmm7        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  255,224                             ; jmpq          *%rax
   DB  69,255                              ; rex.RB        (bad)
   DB  255                                 ; (bad)
@@ -37692,7 +37827,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  126,255                             ; jle           275a5 <_sk_load_565_dst_sse41_lowp+0x101>
+  DB  126,255                             ; jle           27901 <_sk_load_565_dst_sse41_lowp+0x101>
   DB  255                                 ; (bad)
   DB  255,114,255                         ; pushq         -0x1(%rdx)
   DB  255                                 ; (bad)
@@ -37707,10 +37842,10 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,65,15,113,240,8                 ; psllw         $0x8,%xmm8
-  DB  102,68,15,219,5,144,72,0,0          ; pand          0x4890(%rip),%xmm8        # 2be60 <_sk_srcover_rgba_8888_sse2_lowp+0x11b8>
+  DB  102,68,15,219,5,148,72,0,0          ; pand          0x4894(%rip),%xmm8        # 2c1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x11bc>
   DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
   DB  102,65,15,113,241,3                 ; psllw         $0x3,%xmm9
-  DB  102,68,15,219,13,140,72,0,0         ; pand          0x488c(%rip),%xmm9        # 2be70 <_sk_srcover_rgba_8888_sse2_lowp+0x11c8>
+  DB  102,68,15,219,13,144,72,0,0         ; pand          0x4890(%rip),%xmm9        # 2c1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x11cc>
   DB  102,69,15,235,200                   ; por           %xmm8,%xmm9
   DB  102,68,15,111,194                   ; movdqa        %xmm2,%xmm8
   DB  102,65,15,113,208,3                 ; psrlw         $0x3,%xmm8
@@ -37719,19 +37854,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            27620 <_sk_store_565_sse41_lowp+0x74>
+  DB  119,29                              ; ja            2797c <_sk_store_565_sse41_lowp+0x74>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,83,0,0,0                  ; lea           0x53(%rip),%r9        # 27660 <_sk_store_565_sse41_lowp+0xb4>
+  DB  76,141,13,83,0,0,0                  ; lea           0x53(%rip),%r9        # 279bc <_sk_store_565_sse41_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,58,21,4,80,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,2)
-  DB  235,58                              ; jmp           2765a <_sk_store_565_sse41_lowp+0xae>
+  DB  235,58                              ; jmp           279b6 <_sk_store_565_sse41_lowp+0xae>
   DB  243,69,15,127,4,80                  ; movdqu        %xmm8,(%r8,%rdx,2)
-  DB  235,50                              ; jmp           2765a <_sk_store_565_sse41_lowp+0xae>
+  DB  235,50                              ; jmp           279b6 <_sk_store_565_sse41_lowp+0xae>
   DB  102,69,15,58,21,68,80,4,2           ; pextrw        $0x2,%xmm8,0x4(%r8,%rdx,2)
   DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
-  DB  235,33                              ; jmp           2765a <_sk_store_565_sse41_lowp+0xae>
+  DB  235,33                              ; jmp           279b6 <_sk_store_565_sse41_lowp+0xae>
   DB  102,69,15,58,21,68,80,12,6          ; pextrw        $0x6,%xmm8,0xc(%r8,%rdx,2)
   DB  102,69,15,58,21,68,80,10,5          ; pextrw        $0x5,%xmm8,0xa(%r8,%rdx,2)
   DB  102,69,15,58,21,68,80,8,4           ; pextrw        $0x4,%xmm8,0x8(%r8,%rdx,2)
@@ -37751,7 +37886,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  235,255                             ; jmp           27671 <_sk_store_565_sse41_lowp+0xc5>
+  DB  235,255                             ; jmp           279cd <_sk_store_565_sse41_lowp+0xc5>
   DB  255                                 ; (bad)
   DB  255,226                             ; jmpq          *%rdx
   DB  255                                 ; (bad)
@@ -37771,18 +37906,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            276b5 <_sk_load_a8_sse41_lowp+0x39>
+  DB  119,34                              ; ja            27a11 <_sk_load_a8_sse41_lowp+0x39>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,143,0,0,0                 ; lea           0x8f(%rip),%r9        # 27730 <_sk_load_a8_sse41_lowp+0xb4>
+  DB  76,141,13,143,0,0,0                 ; lea           0x8f(%rip),%r9        # 27a8c <_sk_load_a8_sse41_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  235,100                             ; jmp           27719 <_sk_load_a8_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           27a75 <_sk_load_a8_sse41_lowp+0x9d>
   DB  102,65,15,56,48,28,16               ; pmovzxbw      (%r8,%rdx,1),%xmm3
-  DB  235,91                              ; jmp           27719 <_sk_load_a8_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           27a75 <_sk_load_a8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,2                    ; pinsrw        $0x2,%eax,%xmm0
@@ -37790,7 +37925,7 @@
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,56,48,217                    ; pmovzxbw      %xmm1,%xmm3
   DB  102,15,58,14,216,252                ; pblendw       $0xfc,%xmm0,%xmm3
-  DB  235,54                              ; jmp           27719 <_sk_load_a8_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           27a75 <_sk_load_a8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,6                    ; pinsrw        $0x6,%eax,%xmm0
@@ -37801,13 +37936,13 @@
   DB  102,65,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm1
   DB  102,15,56,48,217                    ; pmovzxbw      %xmm1,%xmm3
   DB  102,15,58,14,216,240                ; pblendw       $0xf0,%xmm0,%xmm3
-  DB  102,15,219,29,95,63,0,0             ; pand          0x3f5f(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,29,99,63,0,0             ; pand          0x3f63(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
-  DB  122,255                             ; jp            27731 <_sk_load_a8_sse41_lowp+0xb5>
+  DB  122,255                             ; jp            27a8d <_sk_load_a8_sse41_lowp+0xb5>
   DB  255                                 ; (bad)
   DB  255,157,255,255,255,142             ; lcall         *-0x71000001(%rbp)
   DB  255                                 ; (bad)
@@ -37836,18 +37971,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            27785 <_sk_load_a8_dst_sse41_lowp+0x39>
+  DB  119,34                              ; ja            27ae1 <_sk_load_a8_dst_sse41_lowp+0x39>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,143,0,0,0                 ; lea           0x8f(%rip),%r9        # 27800 <_sk_load_a8_dst_sse41_lowp+0xb4>
+  DB  76,141,13,143,0,0,0                 ; lea           0x8f(%rip),%r9        # 27b5c <_sk_load_a8_dst_sse41_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  235,100                             ; jmp           277e9 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           27b45 <_sk_load_a8_dst_sse41_lowp+0x9d>
   DB  102,65,15,56,48,60,16               ; pmovzxbw      (%r8,%rdx,1),%xmm7
-  DB  235,91                              ; jmp           277e9 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           27b45 <_sk_load_a8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,2                    ; pinsrw        $0x2,%eax,%xmm4
@@ -37855,7 +37990,7 @@
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,56,48,253                    ; pmovzxbw      %xmm5,%xmm7
   DB  102,15,58,14,252,252                ; pblendw       $0xfc,%xmm4,%xmm7
-  DB  235,54                              ; jmp           277e9 <_sk_load_a8_dst_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           27b45 <_sk_load_a8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,6                    ; pinsrw        $0x6,%eax,%xmm4
@@ -37866,13 +38001,13 @@
   DB  102,65,15,110,44,16                 ; movd          (%r8,%rdx,1),%xmm5
   DB  102,15,56,48,253                    ; pmovzxbw      %xmm5,%xmm7
   DB  102,15,58,14,252,240                ; pblendw       $0xf0,%xmm4,%xmm7
-  DB  102,15,219,61,143,62,0,0            ; pand          0x3e8f(%rip),%xmm7        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,61,147,62,0,0            ; pand          0x3e93(%rip),%xmm7        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  122,255                             ; jp            27801 <_sk_load_a8_dst_sse41_lowp+0xb5>
+  DB  122,255                             ; jp            27b5d <_sk_load_a8_dst_sse41_lowp+0xb5>
   DB  255                                 ; (bad)
   DB  255,157,255,255,255,142             ; lcall         *-0x71000001(%rbp)
   DB  255                                 ; (bad)
@@ -37901,28 +38036,28 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            27850 <_sk_store_a8_sse41_lowp+0x34>
+  DB  119,29                              ; ja            27bac <_sk_store_a8_sse41_lowp+0x34>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,131,0,0,0                 ; lea           0x83(%rip),%r9        # 278c0 <_sk_store_a8_sse41_lowp+0xa4>
+  DB  76,141,13,131,0,0,0                 ; lea           0x83(%rip),%r9        # 27c1c <_sk_store_a8_sse41_lowp+0xa4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,58,20,28,16,0             ; pextrb        $0x0,%xmm3,(%r8,%rdx,1)
-  DB  235,105                             ; jmp           278b9 <_sk_store_a8_sse41_lowp+0x9d>
+  DB  235,105                             ; jmp           27c15 <_sk_store_a8_sse41_lowp+0x9d>
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,56,0,5,113,69,0,0         ; pshufb        0x4571(%rip),%xmm8        # 2bdd0 <_sk_srcover_rgba_8888_sse2_lowp+0x1128>
+  DB  102,68,15,56,0,5,117,69,0,0         ; pshufb        0x4575(%rip),%xmm8        # 2c130 <_sk_srcover_rgba_8888_sse2_lowp+0x112c>
   DB  102,69,15,214,4,16                  ; movq          %xmm8,(%r8,%rdx,1)
-  DB  235,82                              ; jmp           278b9 <_sk_store_a8_sse41_lowp+0x9d>
+  DB  235,82                              ; jmp           27c15 <_sk_store_a8_sse41_lowp+0x9d>
   DB  102,65,15,58,20,92,16,2,4           ; pextrb        $0x4,%xmm3,0x2(%r8,%rdx,1)
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,56,0,5,17,62,0,0          ; pshufb        0x3e11(%rip),%xmm8        # 2b690 <_sk_srcover_rgba_8888_sse2_lowp+0x9e8>
+  DB  102,68,15,56,0,5,21,62,0,0          ; pshufb        0x3e15(%rip),%xmm8        # 2b9f0 <_sk_srcover_rgba_8888_sse2_lowp+0x9ec>
   DB  102,69,15,58,21,4,16,0              ; pextrw        $0x0,%xmm8,(%r8,%rdx,1)
-  DB  235,48                              ; jmp           278b9 <_sk_store_a8_sse41_lowp+0x9d>
+  DB  235,48                              ; jmp           27c15 <_sk_store_a8_sse41_lowp+0x9d>
   DB  102,65,15,58,20,92,16,6,12          ; pextrb        $0xc,%xmm3,0x6(%r8,%rdx,1)
   DB  102,65,15,58,20,92,16,5,10          ; pextrb        $0xa,%xmm3,0x5(%r8,%rdx,1)
   DB  102,65,15,58,20,92,16,4,8           ; pextrb        $0x8,%xmm3,0x4(%r8,%rdx,1)
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,56,0,5,237,61,0,0         ; pshufb        0x3ded(%rip),%xmm8        # 2b6a0 <_sk_srcover_rgba_8888_sse2_lowp+0x9f8>
+  DB  102,68,15,56,0,5,241,61,0,0         ; pshufb        0x3df1(%rip),%xmm8        # 2ba00 <_sk_srcover_rgba_8888_sse2_lowp+0x9fc>
   DB  102,69,15,126,4,16                  ; movd          %xmm8,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
@@ -37956,18 +38091,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            27915 <_sk_load_g8_sse41_lowp+0x39>
+  DB  119,34                              ; ja            27c71 <_sk_load_g8_sse41_lowp+0x39>
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 27994 <_sk_load_g8_sse41_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 27cf0 <_sk_load_g8_sse41_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,100                             ; jmp           27979 <_sk_load_g8_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           27cd5 <_sk_load_g8_sse41_lowp+0x9d>
   DB  102,65,15,56,48,4,16                ; pmovzxbw      (%r8,%rdx,1),%xmm0
-  DB  235,91                              ; jmp           27979 <_sk_load_g8_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           27cd5 <_sk_load_g8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,15,196,200,2                    ; pinsrw        $0x2,%eax,%xmm1
@@ -37975,7 +38110,7 @@
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,56,48,192                    ; pmovzxbw      %xmm0,%xmm0
   DB  102,15,58,14,193,252                ; pblendw       $0xfc,%xmm1,%xmm0
-  DB  235,54                              ; jmp           27979 <_sk_load_g8_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           27cd5 <_sk_load_g8_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,15,196,200,6                    ; pinsrw        $0x6,%eax,%xmm1
@@ -37986,13 +38121,13 @@
   DB  102,65,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm0
   DB  102,15,56,48,192                    ; pmovzxbw      %xmm0,%xmm0
   DB  102,15,58,14,193,240                ; pblendw       $0xf0,%xmm1,%xmm0
-  DB  102,15,219,5,255,60,0,0             ; pand          0x3cff(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,5,3,61,0,0               ; pand          0x3d03(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,246,60,0,0                 ; movaps        0x3cf6(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,29,250,60,0,0                 ; movaps        0x3cfa(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
-  DB  118,255                             ; jbe           27995 <_sk_load_g8_sse41_lowp+0xb9>
+  DB  118,255                             ; jbe           27cf1 <_sk_load_g8_sse41_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,138             ; lcall         *-0x75000001(%rcx)
   DB  255                                 ; (bad)
@@ -38019,18 +38154,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            279e9 <_sk_load_g8_dst_sse41_lowp+0x39>
+  DB  119,34                              ; ja            27d45 <_sk_load_g8_dst_sse41_lowp+0x39>
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 27a68 <_sk_load_g8_dst_sse41_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 27dc4 <_sk_load_g8_dst_sse41_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,100                             ; jmp           27a4d <_sk_load_g8_dst_sse41_lowp+0x9d>
+  DB  235,100                             ; jmp           27da9 <_sk_load_g8_dst_sse41_lowp+0x9d>
   DB  102,65,15,56,48,36,16               ; pmovzxbw      (%r8,%rdx,1),%xmm4
-  DB  235,91                              ; jmp           27a4d <_sk_load_g8_dst_sse41_lowp+0x9d>
+  DB  235,91                              ; jmp           27da9 <_sk_load_g8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,15,196,232,2                    ; pinsrw        $0x2,%eax,%xmm5
@@ -38038,7 +38173,7 @@
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,56,48,228                    ; pmovzxbw      %xmm4,%xmm4
   DB  102,15,58,14,229,252                ; pblendw       $0xfc,%xmm5,%xmm4
-  DB  235,54                              ; jmp           27a4d <_sk_load_g8_dst_sse41_lowp+0x9d>
+  DB  235,54                              ; jmp           27da9 <_sk_load_g8_dst_sse41_lowp+0x9d>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,237                      ; pxor          %xmm5,%xmm5
   DB  102,15,196,232,6                    ; pinsrw        $0x6,%eax,%xmm5
@@ -38049,13 +38184,13 @@
   DB  102,65,15,110,36,16                 ; movd          (%r8,%rdx,1),%xmm4
   DB  102,15,56,48,228                    ; pmovzxbw      %xmm4,%xmm4
   DB  102,15,58,14,229,240                ; pblendw       $0xf0,%xmm5,%xmm4
-  DB  102,15,219,37,43,60,0,0             ; pand          0x3c2b(%rip),%xmm4        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,37,47,60,0,0             ; pand          0x3c2f(%rip),%xmm4        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,34,60,0,0                  ; movaps        0x3c22(%rip),%xmm7        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,61,38,60,0,0                  ; movaps        0x3c26(%rip),%xmm7        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
-  DB  118,255                             ; jbe           27a69 <_sk_load_g8_dst_sse41_lowp+0xb9>
+  DB  118,255                             ; jbe           27dc5 <_sk_load_g8_dst_sse41_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,153,255,255,255,138             ; lcall         *-0x75000001(%rcx)
   DB  255                                 ; (bad)
@@ -38075,10 +38210,10 @@
 PUBLIC _sk_luminance_to_alpha_sse41_lowp
 _sk_luminance_to_alpha_sse41_lowp LABEL PROC
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
-  DB  102,15,213,5,240,67,0,0             ; pmullw        0x43f0(%rip),%xmm0        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0x11d8>
-  DB  102,15,213,13,248,67,0,0            ; pmullw        0x43f8(%rip),%xmm1        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0x11e8>
+  DB  102,15,213,5,244,67,0,0             ; pmullw        0x43f4(%rip),%xmm0        # 2c1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x11dc>
+  DB  102,15,213,13,252,67,0,0            ; pmullw        0x43fc(%rip),%xmm1        # 2c1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ec>
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
-  DB  102,15,213,29,252,67,0,0            ; pmullw        0x43fc(%rip),%xmm3        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0x11f8>
+  DB  102,15,213,29,0,68,0,0              ; pmullw        0x4400(%rip),%xmm3        # 2c200 <_sk_srcover_rgba_8888_sse2_lowp+0x11fc>
   DB  102,15,253,217                      ; paddw         %xmm1,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -38091,14 +38226,14 @@
 _sk_scale_1_float_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,71,58,0,0            ; mulss         0x3a47(%rip),%xmm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  243,68,15,88,5,14,58,0,0            ; addss         0x3a0e(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,89,5,75,58,0,0            ; mulss         0x3a4b(%rip),%xmm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  243,68,15,88,5,18,58,0,0            ; addss         0x3a12(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,134,59,0,0         ; movdqa        0x3b86(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,138,59,0,0         ; movdqa        0x3b8a(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -38117,13 +38252,13 @@
 _sk_lerp_1_float_sse41_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,207,57,0,0           ; mulss         0x39cf(%rip),%xmm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  243,68,15,88,5,150,57,0,0           ; addss         0x3996(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,89,5,211,57,0,0           ; mulss         0x39d3(%rip),%xmm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  243,68,15,88,5,154,57,0,0           ; addss         0x399a(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
-  DB  102,68,15,111,13,19,59,0,0          ; movdqa        0x3b13(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,23,59,0,0          ; movdqa        0x3b17(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -38161,18 +38296,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            27c24 <_sk_scale_u8_sse41_lowp+0x3b>
+  DB  119,36                              ; ja            27f80 <_sk_scale_u8_sse41_lowp+0x3b>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,221,0,0,0                 ; lea           0xdd(%rip),%r9        # 27cec <_sk_scale_u8_sse41_lowp+0x103>
+  DB  76,141,13,221,0,0,0                 ; lea           0xdd(%rip),%r9        # 28048 <_sk_scale_u8_sse41_lowp+0x103>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,111                             ; jmp           27c93 <_sk_scale_u8_sse41_lowp+0xaa>
+  DB  235,111                             ; jmp           27fef <_sk_scale_u8_sse41_lowp+0xaa>
   DB  102,69,15,56,48,4,16                ; pmovzxbw      (%r8,%rdx,1),%xmm8
-  DB  235,102                             ; jmp           27c93 <_sk_scale_u8_sse41_lowp+0xaa>
+  DB  235,102                             ; jmp           27fef <_sk_scale_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,2                 ; pinsrw        $0x2,%eax,%xmm9
@@ -38180,7 +38315,7 @@
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,252             ; pblendw       $0xfc,%xmm9,%xmm8
-  DB  235,60                              ; jmp           27c93 <_sk_scale_u8_sse41_lowp+0xaa>
+  DB  235,60                              ; jmp           27fef <_sk_scale_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,6                 ; pinsrw        $0x6,%eax,%xmm9
@@ -38191,9 +38326,9 @@
   DB  102,69,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,240             ; pblendw       $0xf0,%xmm9,%xmm8
-  DB  102,68,15,219,5,228,57,0,0          ; pand          0x39e4(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,219,5,232,57,0,0          ; pand          0x39e8(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,214,57,0,0         ; movdqa        0x39d6(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,218,57,0,0         ; movdqa        0x39da(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -38218,7 +38353,7 @@
   DB  255,148,255,255,255,136,255         ; callq         *-0x770001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  124,255                             ; jl            27d01 <_sk_scale_u8_sse41_lowp+0x118>
+  DB  124,255                             ; jl            2805d <_sk_scale_u8_sse41_lowp+0x118>
   DB  255                                 ; (bad)
   DB  255,107,255                         ; ljmp          *-0x1(%rbx)
   DB  255                                 ; (bad)
@@ -38234,18 +38369,18 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            27d43 <_sk_lerp_u8_sse41_lowp+0x3b>
+  DB  119,36                              ; ja            2809f <_sk_lerp_u8_sse41_lowp+0x3b>
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 27e4c <_sk_lerp_u8_sse41_lowp+0x144>
+  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 281a8 <_sk_lerp_u8_sse41_lowp+0x144>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,111                             ; jmp           27db2 <_sk_lerp_u8_sse41_lowp+0xaa>
+  DB  235,111                             ; jmp           2810e <_sk_lerp_u8_sse41_lowp+0xaa>
   DB  102,69,15,56,48,4,16                ; pmovzxbw      (%r8,%rdx,1),%xmm8
-  DB  235,102                             ; jmp           27db2 <_sk_lerp_u8_sse41_lowp+0xaa>
+  DB  235,102                             ; jmp           2810e <_sk_lerp_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,2                 ; pinsrw        $0x2,%eax,%xmm9
@@ -38253,7 +38388,7 @@
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,252             ; pblendw       $0xfc,%xmm9,%xmm8
-  DB  235,60                              ; jmp           27db2 <_sk_lerp_u8_sse41_lowp+0xaa>
+  DB  235,60                              ; jmp           2810e <_sk_lerp_u8_sse41_lowp+0xaa>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,201                   ; pxor          %xmm9,%xmm9
   DB  102,68,15,196,200,6                 ; pinsrw        $0x6,%eax,%xmm9
@@ -38264,8 +38399,8 @@
   DB  102,69,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm8
   DB  102,69,15,56,48,192                 ; pmovzxbw      %xmm8,%xmm8
   DB  102,69,15,58,14,193,240             ; pblendw       $0xf0,%xmm9,%xmm8
-  DB  102,68,15,219,5,197,56,0,0          ; pand          0x38c5(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
-  DB  102,68,15,111,21,188,56,0,0         ; movdqa        0x38bc(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,219,5,201,56,0,0          ; pand          0x38c9(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
+  DB  102,68,15,111,21,192,56,0,0         ; movdqa        0x38c0(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,239,202                   ; pxor          %xmm10,%xmm9
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
@@ -38295,7 +38430,7 @@
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  235,254                             ; jmp           27e4c <_sk_lerp_u8_sse41_lowp+0x144>
+  DB  235,254                             ; jmp           281a8 <_sk_lerp_u8_sse41_lowp+0x144>
   DB  255                                 ; (bad)
   DB  255,17                              ; callq         *(%rcx)
   DB  255                                 ; (bad)
@@ -38327,23 +38462,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,35                              ; ja            27eaa <_sk_scale_565_sse41_lowp+0x42>
+  DB  119,35                              ; ja            28206 <_sk_scale_565_sse41_lowp+0x42>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,111,1,0,0                 ; lea           0x16f(%rip),%r9        # 28004 <_sk_scale_565_sse41_lowp+0x19c>
+  DB  76,141,13,111,1,0,0                 ; lea           0x16f(%rip),%r9        # 28360 <_sk_scale_565_sse41_lowp+0x19c>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
-  DB  235,76                              ; jmp           27ef6 <_sk_scale_565_sse41_lowp+0x8e>
+  DB  235,76                              ; jmp           28252 <_sk_scale_565_sse41_lowp+0x8e>
   DB  243,69,15,111,12,80                 ; movdqu        (%r8,%rdx,2),%xmm9
-  DB  235,68                              ; jmp           27ef6 <_sk_scale_565_sse41_lowp+0x8e>
+  DB  235,68                              ; jmp           28252 <_sk_scale_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  102,69,15,110,12,80                 ; movd          (%r8,%rdx,2),%xmm9
   DB  102,68,15,58,14,200,252             ; pblendw       $0xfc,%xmm0,%xmm9
-  DB  235,41                              ; jmp           27ef6 <_sk_scale_565_sse41_lowp+0x8e>
+  DB  235,41                              ; jmp           28252 <_sk_scale_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -38352,11 +38487,11 @@
   DB  102,68,15,58,14,200,240             ; pblendw       $0xf0,%xmm0,%xmm9
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
-  DB  102,15,219,5,40,63,0,0              ; pand          0x3f28(%rip),%xmm0        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,15,219,5,44,63,0,0              ; pand          0x3f2c(%rip),%xmm0        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,65,15,113,210,5                 ; psrlw         $0x5,%xmm10
-  DB  102,68,15,219,21,36,63,0,0          ; pand          0x3f24(%rip),%xmm10        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,68,15,111,29,43,63,0,0          ; movdqa        0x3f2b(%rip),%xmm11        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,68,15,219,21,40,63,0,0          ; pand          0x3f28(%rip),%xmm10        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,68,15,111,29,47,63,0,0          ; movdqa        0x3f2f(%rip),%xmm11        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,69,15,219,217                   ; pand          %xmm9,%xmm11
   DB  102,65,15,113,209,13                ; psrlw         $0xd,%xmm9
   DB  102,68,15,235,200                   ; por           %xmm0,%xmm9
@@ -38368,7 +38503,7 @@
   DB  102,15,113,240,3                    ; psllw         $0x3,%xmm0
   DB  102,65,15,113,211,2                 ; psrlw         $0x2,%xmm11
   DB  102,68,15,235,216                   ; por           %xmm0,%xmm11
-  DB  102,15,111,5,137,62,0,0             ; movdqa        0x3e89(%rip),%xmm0        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,15,111,5,141,62,0,0             ; movdqa        0x3e8d(%rip),%xmm0        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,68,15,111,227                   ; movdqa        %xmm3,%xmm12
   DB  102,68,15,239,224                   ; pxor          %xmm0,%xmm12
   DB  102,15,239,199                      ; pxor          %xmm7,%xmm0
@@ -38381,7 +38516,7 @@
   DB  102,69,15,56,62,225                 ; pmaxuw        %xmm9,%xmm12
   DB  102,69,15,56,16,229                 ; pblendvb      %xmm0,%xmm13,%xmm12
   DB  102,69,15,213,200                   ; pmullw        %xmm8,%xmm9
-  DB  102,15,111,5,209,54,0,0             ; movdqa        0x36d1(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,111,5,213,54,0,0             ; movdqa        0x36d5(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,253,200                   ; paddw         %xmm0,%xmm9
   DB  102,65,15,113,209,8                 ; psrlw         $0x8,%xmm9
   DB  102,68,15,213,209                   ; pmullw        %xmm1,%xmm10
@@ -38433,23 +38568,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,35                              ; ja            28062 <_sk_lerp_565_sse41_lowp+0x42>
+  DB  119,35                              ; ja            283be <_sk_lerp_565_sse41_lowp+0x42>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,187,1,0,0                 ; lea           0x1bb(%rip),%r9        # 28208 <_sk_lerp_565_sse41_lowp+0x1e8>
+  DB  76,141,13,187,1,0,0                 ; lea           0x1bb(%rip),%r9        # 28564 <_sk_lerp_565_sse41_lowp+0x1e8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
-  DB  235,76                              ; jmp           280ae <_sk_lerp_565_sse41_lowp+0x8e>
+  DB  235,76                              ; jmp           2840a <_sk_lerp_565_sse41_lowp+0x8e>
   DB  243,69,15,111,12,80                 ; movdqu        (%r8,%rdx,2),%xmm9
-  DB  235,68                              ; jmp           280ae <_sk_lerp_565_sse41_lowp+0x8e>
+  DB  235,68                              ; jmp           2840a <_sk_lerp_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  102,69,15,110,12,80                 ; movd          (%r8,%rdx,2),%xmm9
   DB  102,68,15,58,14,200,252             ; pblendw       $0xfc,%xmm0,%xmm9
-  DB  235,41                              ; jmp           280ae <_sk_lerp_565_sse41_lowp+0x8e>
+  DB  235,41                              ; jmp           2840a <_sk_lerp_565_sse41_lowp+0x8e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -38458,11 +38593,11 @@
   DB  102,68,15,58,14,200,240             ; pblendw       $0xf0,%xmm0,%xmm9
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
-  DB  102,15,219,5,112,61,0,0             ; pand          0x3d70(%rip),%xmm0        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,15,219,5,116,61,0,0             ; pand          0x3d74(%rip),%xmm0        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,65,15,113,210,5                 ; psrlw         $0x5,%xmm10
-  DB  102,68,15,219,21,108,61,0,0         ; pand          0x3d6c(%rip),%xmm10        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,68,15,111,29,115,61,0,0         ; movdqa        0x3d73(%rip),%xmm11        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,68,15,219,21,112,61,0,0         ; pand          0x3d70(%rip),%xmm10        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,68,15,111,29,119,61,0,0         ; movdqa        0x3d77(%rip),%xmm11        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,69,15,219,217                   ; pand          %xmm9,%xmm11
   DB  102,65,15,113,209,13                ; psrlw         $0xd,%xmm9
   DB  102,68,15,235,200                   ; por           %xmm0,%xmm9
@@ -38474,7 +38609,7 @@
   DB  102,15,113,240,3                    ; psllw         $0x3,%xmm0
   DB  102,65,15,113,211,2                 ; psrlw         $0x2,%xmm11
   DB  102,68,15,235,216                   ; por           %xmm0,%xmm11
-  DB  102,15,111,5,209,60,0,0             ; movdqa        0x3cd1(%rip),%xmm0        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,15,111,5,213,60,0,0             ; movdqa        0x3cd5(%rip),%xmm0        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,68,15,111,227                   ; movdqa        %xmm3,%xmm12
   DB  102,68,15,239,224                   ; pxor          %xmm0,%xmm12
   DB  102,15,239,199                      ; pxor          %xmm7,%xmm0
@@ -38486,7 +38621,7 @@
   DB  102,69,15,56,62,227                 ; pmaxuw        %xmm11,%xmm12
   DB  102,69,15,56,62,225                 ; pmaxuw        %xmm9,%xmm12
   DB  102,69,15,56,16,229                 ; pblendvb      %xmm0,%xmm13,%xmm12
-  DB  102,68,15,111,45,29,53,0,0          ; movdqa        0x351d(%rip),%xmm13        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,45,33,53,0,0          ; movdqa        0x3521(%rip),%xmm13        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,111,193                   ; movdqa        %xmm9,%xmm0
   DB  102,65,15,239,197                   ; pxor          %xmm13,%xmm0
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
@@ -38548,48 +38683,48 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,202                       ; movzbl        %r10b,%r9d
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,38                              ; ja            2826f <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
+  DB  119,38                              ; ja            285cb <_sk_srcover_rgba_8888_sse41_lowp+0x4b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  76,141,29,23,2,0,0                  ; lea           0x217(%rip),%r11        # 2846c <_sk_srcover_rgba_8888_sse41_lowp+0x248>
+  DB  76,141,29,23,2,0,0                  ; lea           0x217(%rip),%r11        # 287c8 <_sk_srcover_rgba_8888_sse41_lowp+0x248>
   DB  75,99,4,139                         ; movslq        (%r11,%r9,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,110,52,144                ; movd          (%r8,%rdx,4),%xmm6
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,89                              ; jmp           282c8 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  DB  235,89                              ; jmp           28624 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,74                              ; jmp           282c8 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  DB  235,74                              ; jmp           28624 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  243,65,15,126,52,144                ; movq          (%r8,%rdx,4),%xmm6
   DB  102,65,15,58,14,240,240             ; pblendw       $0xf0,%xmm8,%xmm6
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,37                              ; jmp           282c8 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
+  DB  235,37                              ; jmp           28624 <_sk_srcover_rgba_8888_sse41_lowp+0xa4>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,69,15,58,34,68,144,20,1         ; pinsrd        $0x1,0x14(%r8,%rdx,4),%xmm8
   DB  102,69,15,58,34,68,144,16,0         ; pinsrd        $0x0,0x10(%r8,%rdx,4),%xmm8
   DB  243,65,15,111,52,144                ; movdqu        (%r8,%rdx,4),%xmm6
-  DB  102,15,111,37,48,59,0,0             ; movdqa        0x3b30(%rip),%xmm4        # 2be00 <_sk_srcover_rgba_8888_sse2_lowp+0x1158>
+  DB  102,15,111,37,52,59,0,0             ; movdqa        0x3b34(%rip),%xmm4        # 2c160 <_sk_srcover_rgba_8888_sse2_lowp+0x115c>
   DB  102,15,111,238                      ; movdqa        %xmm6,%xmm5
   DB  102,15,56,0,236                     ; pshufb        %xmm4,%xmm5
   DB  102,65,15,111,248                   ; movdqa        %xmm8,%xmm7
   DB  102,15,56,0,252                     ; pshufb        %xmm4,%xmm7
   DB  102,15,108,239                      ; punpcklqdq    %xmm7,%xmm5
-  DB  102,68,15,111,37,144,51,0,0         ; movdqa        0x3390(%rip),%xmm12        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,37,148,51,0,0         ; movdqa        0x3394(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,228                   ; pand          %xmm12,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
-  DB  102,68,15,111,13,9,59,0,0           ; movdqa        0x3b09(%rip),%xmm9        # 2be10 <_sk_srcover_rgba_8888_sse2_lowp+0x1168>
+  DB  102,68,15,111,13,13,59,0,0          ; movdqa        0x3b0d(%rip),%xmm9        # 2c170 <_sk_srcover_rgba_8888_sse2_lowp+0x116c>
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,65,15,56,0,249                  ; pshufb        %xmm9,%xmm7
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
   DB  102,69,15,56,0,209                  ; pshufb        %xmm9,%xmm10
   DB  102,65,15,108,250                   ; punpcklqdq    %xmm10,%xmm7
-  DB  102,68,15,111,13,246,58,0,0         ; movdqa        0x3af6(%rip),%xmm9        # 2be20 <_sk_srcover_rgba_8888_sse2_lowp+0x1178>
+  DB  102,68,15,111,13,250,58,0,0         ; movdqa        0x3afa(%rip),%xmm9        # 2c180 <_sk_srcover_rgba_8888_sse2_lowp+0x117c>
   DB  102,65,15,56,0,241                  ; pshufb        %xmm9,%xmm6
   DB  102,69,15,56,0,193                  ; pshufb        %xmm9,%xmm8
   DB  102,65,15,108,240                   ; punpcklqdq    %xmm8,%xmm6
@@ -38631,19 +38766,19 @@
   DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
   DB  102,65,15,235,196                   ; por           %xmm12,%xmm0
   DB  65,128,250,6                        ; cmp           $0x6,%r10b
-  DB  119,24                              ; ja            28412 <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
-  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 28488 <_sk_srcover_rgba_8888_sse41_lowp+0x264>
+  DB  119,24                              ; ja            2876e <_sk_srcover_rgba_8888_sse41_lowp+0x1ee>
+  DB  76,141,21,135,0,0,0                 ; lea           0x87(%rip),%r10        # 287e4 <_sk_srcover_rgba_8888_sse41_lowp+0x264>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,65,15,126,4,144                 ; movd          %xmm0,(%r8,%rdx,4)
-  DB  235,63                              ; jmp           28451 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  DB  235,63                              ; jmp           287ad <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   DB  243,65,15,127,4,144                 ; movdqu        %xmm0,(%r8,%rdx,4)
   DB  243,65,15,127,76,144,16             ; movdqu        %xmm1,0x10(%r8,%rdx,4)
-  DB  235,48                              ; jmp           28451 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  DB  235,48                              ; jmp           287ad <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   DB  102,65,15,58,22,68,144,8,2          ; pextrd        $0x2,%xmm0,0x8(%r8,%rdx,4)
   DB  102,65,15,214,4,144                 ; movq          %xmm0,(%r8,%rdx,4)
-  DB  235,31                              ; jmp           28451 <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
+  DB  235,31                              ; jmp           287ad <_sk_srcover_rgba_8888_sse41_lowp+0x22d>
   DB  102,65,15,58,22,76,144,24,2         ; pextrd        $0x2,%xmm1,0x18(%r8,%rdx,4)
   DB  102,65,15,58,22,76,144,20,1         ; pextrd        $0x1,%xmm1,0x14(%r8,%rdx,4)
   DB  102,65,15,126,76,144,16             ; movd          %xmm1,0x10(%r8,%rdx,4)
@@ -38718,13 +38853,13 @@
   DB  73,137,246                          ; mov           %rsi,%r14
   DB  76,137,141,8,255,255,255            ; mov           %r9,-0xf8(%rbp)
   DB  76,57,203                           ; cmp           %r9,%rbx
-  DB  15,131,153,0,0,0                    ; jae           285be <_sk_start_pipeline_sse2_lowp+0x11a>
+  DB  15,131,153,0,0,0                    ; jae           2891a <_sk_start_pipeline_sse2_lowp+0x11a>
   DB  72,139,133,24,255,255,255           ; mov           -0xe8(%rbp),%rax
   DB  72,141,64,8                         ; lea           0x8(%rax),%rax
   DB  72,137,133,16,255,255,255           ; mov           %rax,-0xf0(%rbp)
   DB  76,57,189,16,255,255,255            ; cmp           %r15,-0xf0(%rbp)
   DB  72,139,149,24,255,255,255           ; mov           -0xe8(%rbp),%rdx
-  DB  119,62                              ; ja            28585 <_sk_start_pipeline_sse2_lowp+0xe1>
+  DB  119,62                              ; ja            288e1 <_sk_start_pipeline_sse2_lowp+0xe1>
   DB  76,139,165,24,255,255,255           ; mov           -0xe8(%rbp),%r12
   DB  49,255                              ; xor           %edi,%edi
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -38743,10 +38878,10 @@
   DB  73,131,196,16                       ; add           $0x10,%r12
   DB  77,57,252                           ; cmp           %r15,%r12
   DB  73,137,212                          ; mov           %rdx,%r12
-  DB  118,201                             ; jbe           2854e <_sk_start_pipeline_sse2_lowp+0xaa>
+  DB  118,201                             ; jbe           288aa <_sk_start_pipeline_sse2_lowp+0xaa>
   DB  76,137,255                          ; mov           %r15,%rdi
   DB  72,41,215                           ; sub           %rdx,%rdi
-  DB  116,33                              ; je            285ae <_sk_start_pipeline_sse2_lowp+0x10a>
+  DB  116,33                              ; je            2890a <_sk_start_pipeline_sse2_lowp+0x10a>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -38760,7 +38895,7 @@
   DB  65,255,213                          ; callq         *%r13
   DB  72,255,195                          ; inc           %rbx
   DB  72,59,157,8,255,255,255             ; cmp           -0xf8(%rbp),%rbx
-  DB  15,133,121,255,255,255              ; jne           28537 <_sk_start_pipeline_sse2_lowp+0x93>
+  DB  15,133,121,255,255,255              ; jne           28893 <_sk_start_pipeline_sse2_lowp+0x93>
   DB  15,40,181,32,255,255,255            ; movaps        -0xe0(%rbp),%xmm6
   DB  15,40,189,48,255,255,255            ; movaps        -0xd0(%rbp),%xmm7
   DB  68,15,40,133,64,255,255,255         ; movaps        -0xc0(%rbp),%xmm8
@@ -38809,7 +38944,7 @@
 PUBLIC _sk_black_color_sse2_lowp
 _sk_black_color_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,24,48,0,0                  ; movaps        0x3018(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,29,28,48,0,0                  ; movaps        0x301c(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -38818,7 +38953,7 @@
 PUBLIC _sk_white_color_sse2_lowp
 _sk_white_color_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,5,4,48,0,0                    ; movaps        0x3004(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,5,8,48,0,0                    ; movaps        0x3008(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -38827,10 +38962,10 @@
 PUBLIC _sk_set_rgb_sse2_lowp
 _sk_set_rgb_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  243,15,16,21,131,46,0,0             ; movss         0x2e83(%rip),%xmm2        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
+  DB  243,15,16,21,135,46,0,0             ; movss         0x2e87(%rip),%xmm2        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
   DB  243,15,16,0                         ; movss         (%rax),%xmm0
   DB  243,15,89,194                       ; mulss         %xmm2,%xmm0
-  DB  243,68,15,16,5,66,46,0,0            ; movss         0x2e42(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,16,5,70,46,0,0            ; movss         0x2e46(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  243,65,15,88,192                    ; addss         %xmm8,%xmm0
   DB  243,68,15,44,192                    ; cvttss2si     %xmm0,%r8d
   DB  102,65,15,110,192                   ; movd          %r8d,%xmm0
@@ -38855,7 +38990,7 @@
 PUBLIC _sk_premul_sse2_lowp
 _sk_premul_sse2_lowp LABEL PROC
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,118,47,0,0          ; movdqa        0x2f76(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,122,47,0,0          ; movdqa        0x2f7a(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
@@ -38895,7 +39030,7 @@
 
 PUBLIC _sk_invert_sse2_lowp
 _sk_invert_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,20,47,0,0           ; movdqa        0x2f14(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,24,47,0,0           ; movdqa        0x2f18(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,200                   ; psubw         %xmm0,%xmm9
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -38923,7 +39058,7 @@
 _sk_srcatop_sse2_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,15,111,29,184,46,0,0            ; movdqa        0x2eb8(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,111,29,188,46,0,0            ; movdqa        0x2ebc(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,111,203                   ; movdqa        %xmm3,%xmm9
   DB  102,69,15,249,200                   ; psubw         %xmm8,%xmm9
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
@@ -38953,7 +39088,7 @@
 _sk_dstatop_sse2_lowp LABEL PROC
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
   DB  102,68,15,213,195                   ; pmullw        %xmm3,%xmm8
-  DB  102,68,15,111,13,56,46,0,0          ; movdqa        0x2e38(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,60,46,0,0          ; movdqa        0x2e3c(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,253,193                   ; paddw         %xmm9,%xmm8
   DB  102,68,15,111,213                   ; movdqa        %xmm5,%xmm10
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
@@ -38980,7 +39115,7 @@
 PUBLIC _sk_srcin_sse2_lowp
 _sk_srcin_sse2_lowp LABEL PROC
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,68,15,111,5,195,45,0,0          ; movdqa        0x2dc3(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,199,45,0,0          ; movdqa        0x2dc7(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,207                      ; pmullw        %xmm7,%xmm1
@@ -38999,7 +39134,7 @@
 _sk_dstin_sse2_lowp LABEL PROC
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,68,15,111,5,122,45,0,0          ; movdqa        0x2d7a(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,126,45,0,0          ; movdqa        0x2d7e(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -39018,7 +39153,7 @@
 
 PUBLIC _sk_srcout_sse2_lowp
 _sk_srcout_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,49,45,0,0           ; movdqa        0x2d31(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,53,45,0,0           ; movdqa        0x2d35(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -39039,7 +39174,7 @@
 PUBLIC _sk_dstout_sse2_lowp
 _sk_dstout_sse2_lowp LABEL PROC
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,68,15,111,5,218,44,0,0          ; movdqa        0x2cda(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,222,44,0,0          ; movdqa        0x2cde(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  102,15,249,216                      ; psubw         %xmm0,%xmm3
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
@@ -39062,7 +39197,7 @@
 
 PUBLIC _sk_srcover_sse2_lowp
 _sk_srcover_sse2_lowp LABEL PROC
-  DB  102,68,15,111,13,128,44,0,0         ; movdqa        0x2c80(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,132,44,0,0         ; movdqa        0x2c84(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -39089,7 +39224,7 @@
 
 PUBLIC _sk_dstover_sse2_lowp
 _sk_dstover_sse2_lowp LABEL PROC
-  DB  102,68,15,111,5,6,44,0,0            ; movdqa        0x2c06(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,10,44,0,0           ; movdqa        0x2c0a(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,68,15,249,207                   ; psubw         %xmm7,%xmm9
   DB  102,65,15,213,193                   ; pmullw        %xmm9,%xmm0
@@ -39114,7 +39249,7 @@
 PUBLIC _sk_modulate_sse2_lowp
 _sk_modulate_sse2_lowp LABEL PROC
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
-  DB  102,68,15,111,5,159,43,0,0          ; movdqa        0x2b9f(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,163,43,0,0          ; movdqa        0x2ba3(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,192                   ; paddw         %xmm8,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
@@ -39131,7 +39266,7 @@
 
 PUBLIC _sk_multiply_sse2_lowp
 _sk_multiply_sse2_lowp LABEL PROC
-  DB  102,68,15,111,13,94,43,0,0          ; movdqa        0x2b5e(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,98,43,0,0          ; movdqa        0x2b62(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,193                   ; movdqa        %xmm9,%xmm8
   DB  102,68,15,249,195                   ; psubw         %xmm3,%xmm8
   DB  102,69,15,111,208                   ; movdqa        %xmm8,%xmm10
@@ -39174,12 +39309,12 @@
   DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,253,204                      ; paddw         %xmm4,%xmm1
-  DB  102,68,15,111,21,202,50,0,0         ; movdqa        0x32ca(%rip),%xmm10        # 2beb0 <_sk_srcover_rgba_8888_sse2_lowp+0x1208>
+  DB  102,68,15,111,21,206,50,0,0         ; movdqa        0x32ce(%rip),%xmm10        # 2c210 <_sk_srcover_rgba_8888_sse2_lowp+0x120c>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,217,194                   ; psubusw       %xmm10,%xmm0
   DB  102,69,15,239,228                   ; pxor          %xmm12,%xmm12
   DB  102,65,15,117,196                   ; pcmpeqw       %xmm12,%xmm0
-  DB  102,68,15,111,29,126,42,0,0         ; movdqa        0x2a7e(%rip),%xmm11        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,29,130,42,0,0         ; movdqa        0x2a82(%rip),%xmm11        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  102,65,15,223,195                   ; pandn         %xmm11,%xmm0
   DB  102,15,235,193                      ; por           %xmm1,%xmm0
@@ -39216,7 +39351,7 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,21,222,41,0,0         ; movdqa        0x29de(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,21,226,41,0,0         ; movdqa        0x29e2(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -39246,7 +39381,7 @@
 PUBLIC _sk_xor__sse2_lowp
 _sk_xor__sse2_lowp LABEL PROC
   DB  102,68,15,111,195                   ; movdqa        %xmm3,%xmm8
-  DB  102,68,15,111,13,92,41,0,0          ; movdqa        0x295c(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,96,41,0,0          ; movdqa        0x2960(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,209                   ; movdqa        %xmm9,%xmm10
   DB  102,68,15,249,215                   ; psubw         %xmm7,%xmm10
   DB  102,65,15,213,194                   ; pmullw        %xmm10,%xmm0
@@ -39286,7 +39421,7 @@
   DB  102,65,15,253,194                   ; paddw         %xmm10,%xmm0
   DB  102,68,15,213,215                   ; pmullw        %xmm7,%xmm10
   DB  102,68,15,213,227                   ; pmullw        %xmm3,%xmm12
-  DB  102,68,15,111,13,23,48,0,0          ; movdqa        0x3017(%rip),%xmm9        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,13,27,48,0,0          ; movdqa        0x301b(%rip),%xmm9        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,69,15,111,218                   ; movdqa        %xmm10,%xmm11
   DB  102,69,15,239,217                   ; pxor          %xmm9,%xmm11
   DB  102,65,15,111,204                   ; movdqa        %xmm12,%xmm1
@@ -39295,7 +39430,7 @@
   DB  102,68,15,219,225                   ; pand          %xmm1,%xmm12
   DB  102,65,15,223,202                   ; pandn         %xmm10,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,21,118,40,0,0         ; movdqa        0x2876(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,21,122,40,0,0         ; movdqa        0x287a(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -39349,7 +39484,7 @@
   DB  102,65,15,253,196                   ; paddw         %xmm12,%xmm0
   DB  102,68,15,213,231                   ; pmullw        %xmm7,%xmm12
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
-  DB  102,68,15,111,13,238,46,0,0         ; movdqa        0x2eee(%rip),%xmm9        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,13,242,46,0,0         ; movdqa        0x2ef2(%rip),%xmm9        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,69,15,111,220                   ; movdqa        %xmm12,%xmm11
   DB  102,69,15,239,217                   ; pxor          %xmm9,%xmm11
   DB  102,65,15,111,202                   ; movdqa        %xmm10,%xmm1
@@ -39358,7 +39493,7 @@
   DB  102,68,15,219,225                   ; pand          %xmm1,%xmm12
   DB  102,65,15,223,202                   ; pandn         %xmm10,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,21,77,39,0,0          ; movdqa        0x274d(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,21,81,39,0,0          ; movdqa        0x2751(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -39412,7 +39547,7 @@
   DB  102,65,15,253,196                   ; paddw         %xmm12,%xmm0
   DB  102,68,15,213,231                   ; pmullw        %xmm7,%xmm12
   DB  102,68,15,213,211                   ; pmullw        %xmm3,%xmm10
-  DB  102,68,15,111,13,197,45,0,0         ; movdqa        0x2dc5(%rip),%xmm9        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,13,201,45,0,0         ; movdqa        0x2dc9(%rip),%xmm9        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,69,15,111,220                   ; movdqa        %xmm12,%xmm11
   DB  102,69,15,239,217                   ; pxor          %xmm9,%xmm11
   DB  102,65,15,111,202                   ; movdqa        %xmm10,%xmm1
@@ -39421,10 +39556,10 @@
   DB  102,68,15,219,225                   ; pand          %xmm1,%xmm12
   DB  102,65,15,223,202                   ; pandn         %xmm10,%xmm1
   DB  102,65,15,235,204                   ; por           %xmm12,%xmm1
-  DB  102,68,15,111,21,36,38,0,0          ; movdqa        0x2624(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,21,40,38,0,0          ; movdqa        0x2628(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,202                   ; paddw         %xmm10,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,29,113,45,0,0         ; movdqa        0x2d71(%rip),%xmm11        # 2bde0 <_sk_srcover_rgba_8888_sse2_lowp+0x1138>
+  DB  102,68,15,111,29,117,45,0,0         ; movdqa        0x2d75(%rip),%xmm11        # 2c140 <_sk_srcover_rgba_8888_sse2_lowp+0x113c>
   DB  102,65,15,219,203                   ; pand          %xmm11,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,68,15,111,229                   ; movdqa        %xmm5,%xmm12
@@ -39477,10 +39612,10 @@
   DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
-  DB  102,68,15,111,13,33,37,0,0          ; movdqa        0x2521(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,37,37,0,0          ; movdqa        0x2525(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,201                   ; paddw         %xmm9,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,68,15,111,21,110,44,0,0         ; movdqa        0x2c6e(%rip),%xmm10        # 2bde0 <_sk_srcover_rgba_8888_sse2_lowp+0x1138>
+  DB  102,68,15,111,21,114,44,0,0         ; movdqa        0x2c72(%rip),%xmm10        # 2c140 <_sk_srcover_rgba_8888_sse2_lowp+0x113c>
   DB  102,65,15,219,202                   ; pand          %xmm10,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
@@ -39515,7 +39650,7 @@
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,68,15,111,194                   ; movdqa        %xmm2,%xmm8
   DB  102,68,15,111,200                   ; movdqa        %xmm0,%xmm9
-  DB  102,15,111,21,122,36,0,0            ; movdqa        0x247a(%rip),%xmm2        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,111,21,126,36,0,0            ; movdqa        0x247e(%rip),%xmm2        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,111,226                   ; movdqa        %xmm2,%xmm12
   DB  102,68,15,249,231                   ; psubw         %xmm7,%xmm12
   DB  102,65,15,111,196                   ; movdqa        %xmm12,%xmm0
@@ -39528,7 +39663,7 @@
   DB  102,68,15,111,243                   ; movdqa        %xmm3,%xmm14
   DB  102,69,15,249,241                   ; psubw         %xmm9,%xmm14
   DB  102,69,15,253,201                   ; paddw         %xmm9,%xmm9
-  DB  102,15,111,21,166,43,0,0            ; movdqa        0x2ba6(%rip),%xmm2        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,15,111,21,170,43,0,0            ; movdqa        0x2baa(%rip),%xmm2        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,15,111,199                      ; movdqa        %xmm7,%xmm0
   DB  102,68,15,111,215                   ; movdqa        %xmm7,%xmm10
   DB  102,15,111,231                      ; movdqa        %xmm7,%xmm4
@@ -39547,7 +39682,7 @@
   DB  102,68,15,219,232                   ; pand          %xmm0,%xmm13
   DB  102,65,15,223,193                   ; pandn         %xmm9,%xmm0
   DB  102,65,15,235,197                   ; por           %xmm13,%xmm0
-  DB  102,15,253,5,217,35,0,0             ; paddw         0x23d9(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,253,5,221,35,0,0             ; paddw         0x23dd(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,199                   ; paddw         %xmm15,%xmm0
   DB  102,69,15,111,204                   ; movdqa        %xmm12,%xmm9
   DB  102,68,15,213,201                   ; pmullw        %xmm1,%xmm9
@@ -39570,7 +39705,7 @@
   DB  102,65,15,219,249                   ; pand          %xmm9,%xmm7
   DB  102,68,15,223,201                   ; pandn         %xmm1,%xmm9
   DB  102,68,15,235,207                   ; por           %xmm7,%xmm9
-  DB  102,68,15,253,13,100,35,0,0         ; paddw         0x2364(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,253,13,104,35,0,0         ; paddw         0x2368(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,253,205                   ; paddw         %xmm13,%xmm9
   DB  102,69,15,213,224                   ; pmullw        %xmm8,%xmm12
   DB  102,69,15,111,251                   ; movdqa        %xmm11,%xmm15
@@ -39592,7 +39727,7 @@
   DB  102,68,15,219,210                   ; pand          %xmm2,%xmm10
   DB  102,65,15,223,208                   ; pandn         %xmm8,%xmm2
   DB  102,65,15,235,210                   ; por           %xmm10,%xmm2
-  DB  102,68,15,111,5,245,34,0,0          ; movdqa        0x22f5(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,249,34,0,0          ; movdqa        0x22f9(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,208                   ; paddw         %xmm8,%xmm2
   DB  102,65,15,253,215                   ; paddw         %xmm15,%xmm2
   DB  102,68,15,213,220                   ; pmullw        %xmm4,%xmm11
@@ -39620,7 +39755,7 @@
   DB  102,15,127,124,36,16                ; movdqa        %xmm7,0x10(%rsp)
   DB  102,68,15,111,193                   ; movdqa        %xmm1,%xmm8
   DB  102,68,15,111,248                   ; movdqa        %xmm0,%xmm15
-  DB  102,15,111,53,127,34,0,0            ; movdqa        0x227f(%rip),%xmm6        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,111,53,131,34,0,0            ; movdqa        0x2283(%rip),%xmm6        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,111,222                   ; movdqa        %xmm6,%xmm11
   DB  102,69,15,249,222                   ; psubw         %xmm14,%xmm11
   DB  102,65,15,111,203                   ; movdqa        %xmm11,%xmm1
@@ -39642,7 +39777,7 @@
   DB  102,15,253,201                      ; paddw         %xmm1,%xmm1
   DB  102,69,15,111,225                   ; movdqa        %xmm9,%xmm12
   DB  102,68,15,249,225                   ; psubw         %xmm1,%xmm12
-  DB  102,15,111,13,131,41,0,0            ; movdqa        0x2983(%rip),%xmm1        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,15,111,13,135,41,0,0            ; movdqa        0x2987(%rip),%xmm1        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,69,15,111,238                   ; movdqa        %xmm14,%xmm13
   DB  102,68,15,239,233                   ; pxor          %xmm1,%xmm13
   DB  102,15,239,249                      ; pxor          %xmm1,%xmm7
@@ -39669,7 +39804,7 @@
   DB  102,68,15,213,197                   ; pmullw        %xmm5,%xmm8
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,15,253,228                      ; paddw         %xmm4,%xmm4
-  DB  102,15,111,61,2,41,0,0              ; movdqa        0x2902(%rip),%xmm7        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,15,111,61,6,41,0,0              ; movdqa        0x2906(%rip),%xmm7        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,15,239,231                      ; pxor          %xmm7,%xmm4
   DB  102,65,15,101,229                   ; pcmpgtw       %xmm13,%xmm4
   DB  102,69,15,253,192                   ; paddw         %xmm8,%xmm8
@@ -39728,27 +39863,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            29607 <_sk_load_8888_sse2_lowp+0x44>
+  DB  119,41                              ; ja            29963 <_sk_load_8888_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,23,1,0,0                  ; lea           0x117(%rip),%r9        # 29704 <_sk_load_8888_sse2_lowp+0x141>
+  DB  76,141,13,23,1,0,0                  ; lea           0x117(%rip),%r9        # 29a60 <_sk_load_8888_sse2_lowp+0x141>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,28,144                 ; movss         (%r8,%rdx,4),%xmm3
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           2966d <_sk_load_8888_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           299c9 <_sk_load_8888_sse2_lowp+0xaa>
   DB  102,65,15,16,28,144                 ; movupd        (%r8,%rdx,4),%xmm3
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           2966d <_sk_load_8888_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           299c9 <_sk_load_8888_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,216                    ; movapd        %xmm8,%xmm3
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  235,52                              ; jmp           2966d <_sk_load_8888_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           299c9 <_sk_load_8888_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  243,65,15,16,68,144,20              ; movss         0x14(%r8,%rdx,4),%xmm0
@@ -39765,7 +39900,7 @@
   DB  102,15,114,240,16                   ; pslld         $0x10,%xmm0
   DB  102,15,114,224,16                   ; psrad         $0x10,%xmm0
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,68,15,111,13,233,31,0,0         ; movdqa        0x1fe9(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,237,31,0,0         ; movdqa        0x1fed(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,65,15,219,193                   ; pand          %xmm9,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -39820,27 +39955,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            29764 <_sk_load_8888_dst_sse2_lowp+0x44>
+  DB  119,41                              ; ja            29ac0 <_sk_load_8888_dst_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 29860 <_sk_load_8888_dst_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 29bbc <_sk_load_8888_dst_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           297ca <_sk_load_8888_dst_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           29b26 <_sk_load_8888_dst_sse2_lowp+0xaa>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           297ca <_sk_load_8888_dst_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           29b26 <_sk_load_8888_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           297ca <_sk_load_8888_dst_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           29b26 <_sk_load_8888_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -39857,7 +39992,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,13,140,30,0,0         ; movdqa        0x1e8c(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,144,30,0,0         ; movdqa        0x1e90(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,225                   ; pand          %xmm9,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -39923,21 +40058,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            298ff <_sk_store_8888_sse2_lowp+0x83>
+  DB  119,27                              ; ja            29c5b <_sk_store_8888_sse2_lowp+0x83>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 29950 <_sk_store_8888_sse2_lowp+0xd4>
+  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 29cac <_sk_store_8888_sse2_lowp+0xd4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,12,144                ; movd          %xmm9,(%r8,%rdx,4)
-  DB  235,75                              ; jmp           2994a <_sk_store_8888_sse2_lowp+0xce>
+  DB  235,75                              ; jmp           29ca6 <_sk_store_8888_sse2_lowp+0xce>
   DB  243,69,15,127,12,144                ; movdqu        %xmm9,(%r8,%rdx,4)
   DB  243,69,15,127,68,144,16             ; movdqu        %xmm8,0x10(%r8,%rdx,4)
-  DB  235,60                              ; jmp           2994a <_sk_store_8888_sse2_lowp+0xce>
+  DB  235,60                              ; jmp           29ca6 <_sk_store_8888_sse2_lowp+0xce>
   DB  102,69,15,112,193,78                ; pshufd        $0x4e,%xmm9,%xmm8
   DB  102,69,15,126,68,144,8              ; movd          %xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,12,144                ; movq          %xmm9,(%r8,%rdx,4)
-  DB  235,39                              ; jmp           2994a <_sk_store_8888_sse2_lowp+0xce>
+  DB  235,39                              ; jmp           29ca6 <_sk_store_8888_sse2_lowp+0xce>
   DB  102,69,15,112,208,78                ; pshufd        $0x4e,%xmm8,%xmm10
   DB  102,69,15,126,84,144,24             ; movd          %xmm10,0x18(%r8,%rdx,4)
   DB  102,69,15,112,208,229               ; pshufd        $0xe5,%xmm8,%xmm10
@@ -39980,27 +40115,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            299b0 <_sk_load_bgra_sse2_lowp+0x44>
+  DB  119,41                              ; ja            29d0c <_sk_load_bgra_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 29aac <_sk_load_bgra_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 29e08 <_sk_load_bgra_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,28,144                 ; movss         (%r8,%rdx,4),%xmm3
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           29a16 <_sk_load_bgra_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           29d72 <_sk_load_bgra_sse2_lowp+0xaa>
   DB  102,65,15,16,28,144                 ; movupd        (%r8,%rdx,4),%xmm3
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           29a16 <_sk_load_bgra_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           29d72 <_sk_load_bgra_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,8              ; movd          0x8(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,216                    ; movapd        %xmm8,%xmm3
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
-  DB  235,52                              ; jmp           29a16 <_sk_load_bgra_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           29d72 <_sk_load_bgra_sse2_lowp+0xaa>
   DB  102,65,15,110,68,144,24             ; movd          0x18(%r8,%rdx,4),%xmm0
   DB  102,68,15,112,192,69                ; pshufd        $0x45,%xmm0,%xmm8
   DB  243,65,15,16,68,144,20              ; movss         0x14(%r8,%rdx,4),%xmm0
@@ -40017,7 +40152,7 @@
   DB  102,15,114,240,16                   ; pslld         $0x10,%xmm0
   DB  102,15,114,224,16                   ; psrad         $0x10,%xmm0
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,68,15,111,13,64,28,0,0          ; movdqa        0x1c40(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,68,28,0,0          ; movdqa        0x1c44(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,65,15,219,209                   ; pand          %xmm9,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -40068,27 +40203,27 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,41                              ; ja            29b0c <_sk_load_bgra_dst_sse2_lowp+0x44>
+  DB  119,41                              ; ja            29e68 <_sk_load_bgra_dst_sse2_lowp+0x44>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 29c08 <_sk_load_bgra_dst_sse2_lowp+0x140>
+  DB  76,141,13,22,1,0,0                  ; lea           0x116(%rip),%r9        # 29f64 <_sk_load_bgra_dst_sse2_lowp+0x140>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           29b72 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  DB  235,102                             ; jmp           29ece <_sk_load_bgra_dst_sse2_lowp+0xaa>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           29b72 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  DB  235,87                              ; jmp           29ece <_sk_load_bgra_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           29b72 <_sk_load_bgra_dst_sse2_lowp+0xaa>
+  DB  235,52                              ; jmp           29ece <_sk_load_bgra_dst_sse2_lowp+0xaa>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -40105,7 +40240,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,13,228,26,0,0         ; movdqa        0x1ae4(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,232,26,0,0         ; movdqa        0x1ae8(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,65,15,219,241                   ; pand          %xmm9,%xmm6
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -40171,21 +40306,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,27                              ; ja            29ca7 <_sk_store_bgra_sse2_lowp+0x83>
+  DB  119,27                              ; ja            2a003 <_sk_store_bgra_sse2_lowp+0x83>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 29cf8 <_sk_store_bgra_sse2_lowp+0xd4>
+  DB  76,141,13,98,0,0,0                  ; lea           0x62(%rip),%r9        # 2a054 <_sk_store_bgra_sse2_lowp+0xd4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,12,144                ; movd          %xmm9,(%r8,%rdx,4)
-  DB  235,75                              ; jmp           29cf2 <_sk_store_bgra_sse2_lowp+0xce>
+  DB  235,75                              ; jmp           2a04e <_sk_store_bgra_sse2_lowp+0xce>
   DB  243,69,15,127,12,144                ; movdqu        %xmm9,(%r8,%rdx,4)
   DB  243,69,15,127,68,144,16             ; movdqu        %xmm8,0x10(%r8,%rdx,4)
-  DB  235,60                              ; jmp           29cf2 <_sk_store_bgra_sse2_lowp+0xce>
+  DB  235,60                              ; jmp           2a04e <_sk_store_bgra_sse2_lowp+0xce>
   DB  102,69,15,112,193,78                ; pshufd        $0x4e,%xmm9,%xmm8
   DB  102,69,15,126,68,144,8              ; movd          %xmm8,0x8(%r8,%rdx,4)
   DB  102,69,15,214,12,144                ; movq          %xmm9,(%r8,%rdx,4)
-  DB  235,39                              ; jmp           29cf2 <_sk_store_bgra_sse2_lowp+0xce>
+  DB  235,39                              ; jmp           2a04e <_sk_store_bgra_sse2_lowp+0xce>
   DB  102,69,15,112,208,78                ; pshufd        $0x4e,%xmm8,%xmm10
   DB  102,69,15,126,84,144,24             ; movd          %xmm10,0x18(%r8,%rdx,4)
   DB  102,69,15,112,208,229               ; pshufd        $0xe5,%xmm8,%xmm10
@@ -40228,23 +40363,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            29d50 <_sk_load_565_sse2_lowp+0x3c>
+  DB  119,34                              ; ja            2a0ac <_sk_load_565_sse2_lowp+0x3c>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,188,0,0,0                 ; lea           0xbc(%rip),%r9        # 29df8 <_sk_load_565_sse2_lowp+0xe4>
+  DB  76,141,13,188,0,0,0                 ; lea           0xbc(%rip),%r9        # 2a154 <_sk_load_565_sse2_lowp+0xe4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,66                              ; jmp           29d92 <_sk_load_565_sse2_lowp+0x7e>
+  DB  235,66                              ; jmp           2a0ee <_sk_load_565_sse2_lowp+0x7e>
   DB  243,65,15,111,4,80                  ; movdqu        (%r8,%rdx,2),%xmm0
-  DB  235,58                              ; jmp           29d92 <_sk_load_565_sse2_lowp+0x7e>
+  DB  235,58                              ; jmp           2a0ee <_sk_load_565_sse2_lowp+0x7e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm0
   DB  243,65,15,16,12,80                  ; movss         (%r8,%rdx,2),%xmm1
   DB  243,15,16,193                       ; movss         %xmm1,%xmm0
-  DB  235,34                              ; jmp           29d92 <_sk_load_565_sse2_lowp+0x7e>
+  DB  235,34                              ; jmp           2a0ee <_sk_load_565_sse2_lowp+0x7e>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,65,15,196,68,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm0
   DB  102,65,15,196,68,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm0
@@ -40252,11 +40387,11 @@
   DB  102,65,15,18,4,80                   ; movlpd        (%r8,%rdx,2),%xmm0
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
-  DB  102,15,219,29,141,32,0,0            ; pand          0x208d(%rip),%xmm3        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,15,219,29,145,32,0,0            ; pand          0x2091(%rip),%xmm3        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,13,140,32,0,0            ; pand          0x208c(%rip),%xmm1        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,15,111,21,148,32,0,0            ; movdqa        0x2094(%rip),%xmm2        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,15,219,13,144,32,0,0            ; pand          0x2090(%rip),%xmm1        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,15,111,21,152,32,0,0            ; movdqa        0x2098(%rip),%xmm2        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,195                      ; por           %xmm3,%xmm0
@@ -40269,7 +40404,7 @@
   DB  102,15,113,210,2                    ; psrlw         $0x2,%xmm2
   DB  102,15,235,211                      ; por           %xmm3,%xmm2
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,138,24,0,0                 ; movaps        0x188a(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,29,142,24,0,0                 ; movaps        0x188e(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  255,224                             ; jmpq          *%rax
   DB  77,255                              ; rex.WRB       (bad)
   DB  255                                 ; (bad)
@@ -40293,23 +40428,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            29e50 <_sk_load_565_dst_sse2_lowp+0x3c>
+  DB  119,34                              ; ja            2a1ac <_sk_load_565_dst_sse2_lowp+0x3c>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,188,0,0,0                 ; lea           0xbc(%rip),%r9        # 29ef8 <_sk_load_565_dst_sse2_lowp+0xe4>
+  DB  76,141,13,188,0,0,0                 ; lea           0xbc(%rip),%r9        # 2a254 <_sk_load_565_dst_sse2_lowp+0xe4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,66                              ; jmp           29e92 <_sk_load_565_dst_sse2_lowp+0x7e>
+  DB  235,66                              ; jmp           2a1ee <_sk_load_565_dst_sse2_lowp+0x7e>
   DB  243,65,15,111,36,80                 ; movdqu        (%r8,%rdx,2),%xmm4
-  DB  235,58                              ; jmp           29e92 <_sk_load_565_dst_sse2_lowp+0x7e>
+  DB  235,58                              ; jmp           2a1ee <_sk_load_565_dst_sse2_lowp+0x7e>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,65,15,196,100,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm4
   DB  243,65,15,16,44,80                  ; movss         (%r8,%rdx,2),%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,34                              ; jmp           29e92 <_sk_load_565_dst_sse2_lowp+0x7e>
+  DB  235,34                              ; jmp           2a1ee <_sk_load_565_dst_sse2_lowp+0x7e>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,65,15,196,100,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm4
   DB  102,65,15,196,100,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm4
@@ -40317,11 +40452,11 @@
   DB  102,65,15,18,36,80                  ; movlpd        (%r8,%rdx,2),%xmm4
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
   DB  102,15,113,215,8                    ; psrlw         $0x8,%xmm7
-  DB  102,15,219,61,141,31,0,0            ; pand          0x1f8d(%rip),%xmm7        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,15,219,61,145,31,0,0            ; pand          0x1f91(%rip),%xmm7        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,113,213,5                    ; psrlw         $0x5,%xmm5
-  DB  102,15,219,45,140,31,0,0            ; pand          0x1f8c(%rip),%xmm5        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,15,111,53,148,31,0,0            ; movdqa        0x1f94(%rip),%xmm6        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,15,219,45,144,31,0,0            ; pand          0x1f90(%rip),%xmm5        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,15,111,53,152,31,0,0            ; movdqa        0x1f98(%rip),%xmm6        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,15,219,244                      ; pand          %xmm4,%xmm6
   DB  102,15,113,212,13                   ; psrlw         $0xd,%xmm4
   DB  102,15,235,231                      ; por           %xmm7,%xmm4
@@ -40334,7 +40469,7 @@
   DB  102,15,113,214,2                    ; psrlw         $0x2,%xmm6
   DB  102,15,235,247                      ; por           %xmm7,%xmm6
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,138,23,0,0                 ; movaps        0x178a(%rip),%xmm7        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,61,142,23,0,0                 ; movaps        0x178e(%rip),%xmm7        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  255,224                             ; jmpq          *%rax
   DB  77,255                              ; rex.WRB       (bad)
   DB  255                                 ; (bad)
@@ -40356,10 +40491,10 @@
   DB  76,3,0                              ; add           (%rax),%r8
   DB  102,68,15,111,192                   ; movdqa        %xmm0,%xmm8
   DB  102,65,15,113,240,8                 ; psllw         $0x8,%xmm8
-  DB  102,68,15,219,5,40,31,0,0           ; pand          0x1f28(%rip),%xmm8        # 2be60 <_sk_srcover_rgba_8888_sse2_lowp+0x11b8>
+  DB  102,68,15,219,5,44,31,0,0           ; pand          0x1f2c(%rip),%xmm8        # 2c1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x11bc>
   DB  102,68,15,111,201                   ; movdqa        %xmm1,%xmm9
   DB  102,65,15,113,241,3                 ; psllw         $0x3,%xmm9
-  DB  102,68,15,219,13,36,31,0,0          ; pand          0x1f24(%rip),%xmm9        # 2be70 <_sk_srcover_rgba_8888_sse2_lowp+0x11c8>
+  DB  102,68,15,219,13,40,31,0,0          ; pand          0x1f28(%rip),%xmm9        # 2c1d0 <_sk_srcover_rgba_8888_sse2_lowp+0x11cc>
   DB  102,69,15,235,200                   ; por           %xmm8,%xmm9
   DB  102,68,15,111,194                   ; movdqa        %xmm2,%xmm8
   DB  102,65,15,113,208,3                 ; psrlw         $0x3,%xmm8
@@ -40368,21 +40503,21 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,31                              ; ja            29f8a <_sk_store_565_sse2_lowp+0x76>
+  DB  119,31                              ; ja            2a2e6 <_sk_store_565_sse2_lowp+0x76>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,95,0,0,0                  ; lea           0x5f(%rip),%r9        # 29fd4 <_sk_store_565_sse2_lowp+0xc0>
+  DB  76,141,13,95,0,0,0                  ; lea           0x5f(%rip),%r9        # 2a330 <_sk_store_565_sse2_lowp+0xc0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,65,137,4,80                     ; mov           %ax,(%r8,%rdx,2)
-  DB  235,70                              ; jmp           29fd0 <_sk_store_565_sse2_lowp+0xbc>
+  DB  235,70                              ; jmp           2a32c <_sk_store_565_sse2_lowp+0xbc>
   DB  243,69,15,127,4,80                  ; movdqu        %xmm8,(%r8,%rdx,2)
-  DB  235,62                              ; jmp           29fd0 <_sk_store_565_sse2_lowp+0xbc>
+  DB  235,62                              ; jmp           2a32c <_sk_store_565_sse2_lowp+0xbc>
   DB  102,65,15,197,192,2                 ; pextrw        $0x2,%xmm8,%eax
   DB  102,65,137,68,80,4                  ; mov           %ax,0x4(%r8,%rdx,2)
   DB  102,69,15,126,4,80                  ; movd          %xmm8,(%r8,%rdx,2)
-  DB  235,42                              ; jmp           29fd0 <_sk_store_565_sse2_lowp+0xbc>
+  DB  235,42                              ; jmp           2a32c <_sk_store_565_sse2_lowp+0xbc>
   DB  102,65,15,197,192,6                 ; pextrw        $0x6,%xmm8,%eax
   DB  102,65,137,68,80,12                 ; mov           %ax,0xc(%r8,%rdx,2)
   DB  102,65,15,197,192,5                 ; pextrw        $0x5,%xmm8,%eax
@@ -40424,19 +40559,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2a029 <_sk_load_a8_sse2_lowp+0x39>
+  DB  119,34                              ; ja            2a385 <_sk_load_a8_sse2_lowp+0x39>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,139,0,0,0                 ; lea           0x8b(%rip),%r9        # 2a0a0 <_sk_load_a8_sse2_lowp+0xb0>
+  DB  76,141,13,139,0,0,0                 ; lea           0x8b(%rip),%r9        # 2a3fc <_sk_load_a8_sse2_lowp+0xb0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,216                      ; movd          %eax,%xmm3
-  DB  235,97                              ; jmp           2a08a <_sk_load_a8_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           2a3e6 <_sk_load_a8_sse2_lowp+0x9a>
   DB  243,65,15,126,28,16                 ; movq          (%r8,%rdx,1),%xmm3
   DB  102,15,96,216                       ; punpcklbw     %xmm0,%xmm3
-  DB  235,85                              ; jmp           2a08a <_sk_load_a8_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           2a3e6 <_sk_load_a8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,216,2                    ; pinsrw        $0x2,%eax,%xmm3
@@ -40444,7 +40579,7 @@
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  243,15,16,216                       ; movss         %xmm0,%xmm3
-  DB  235,51                              ; jmp           2a08a <_sk_load_a8_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           2a3e6 <_sk_load_a8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,216,6                    ; pinsrw        $0x6,%eax,%xmm3
@@ -40455,14 +40590,14 @@
   DB  102,65,15,110,4,16                  ; movd          (%r8,%rdx,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  242,15,16,216                       ; movsd         %xmm0,%xmm3
-  DB  102,15,219,29,238,21,0,0            ; pand          0x15ee(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,29,242,21,0,0            ; pand          0x15f2(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  126,255                             ; jle           2a0a1 <_sk_load_a8_sse2_lowp+0xb1>
+  DB  126,255                             ; jle           2a3fd <_sk_load_a8_sse2_lowp+0xb1>
   DB  255                                 ; (bad)
   DB  255,164,255,255,255,149,255         ; jmpq          *-0x6a0001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -40490,19 +40625,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2a0f5 <_sk_load_a8_dst_sse2_lowp+0x39>
+  DB  119,34                              ; ja            2a451 <_sk_load_a8_dst_sse2_lowp+0x39>
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,139,0,0,0                 ; lea           0x8b(%rip),%r9        # 2a16c <_sk_load_a8_dst_sse2_lowp+0xb0>
+  DB  76,141,13,139,0,0,0                 ; lea           0x8b(%rip),%r9        # 2a4c8 <_sk_load_a8_dst_sse2_lowp+0xb0>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,248                      ; movd          %eax,%xmm7
-  DB  235,97                              ; jmp           2a156 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           2a4b2 <_sk_load_a8_dst_sse2_lowp+0x9a>
   DB  243,65,15,126,60,16                 ; movq          (%r8,%rdx,1),%xmm7
   DB  102,15,96,248                       ; punpcklbw     %xmm0,%xmm7
-  DB  235,85                              ; jmp           2a156 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           2a4b2 <_sk_load_a8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  102,15,196,248,2                    ; pinsrw        $0x2,%eax,%xmm7
@@ -40510,7 +40645,7 @@
   DB  102,15,110,224                      ; movd          %eax,%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  243,15,16,252                       ; movss         %xmm4,%xmm7
-  DB  235,51                              ; jmp           2a156 <_sk_load_a8_dst_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           2a4b2 <_sk_load_a8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  102,15,196,248,6                    ; pinsrw        $0x6,%eax,%xmm7
@@ -40521,14 +40656,14 @@
   DB  102,65,15,110,36,16                 ; movd          (%r8,%rdx,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  242,15,16,252                       ; movsd         %xmm4,%xmm7
-  DB  102,15,219,61,34,21,0,0             ; pand          0x1522(%rip),%xmm7        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,61,38,21,0,0             ; pand          0x1526(%rip),%xmm7        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  126,255                             ; jle           2a16d <_sk_load_a8_dst_sse2_lowp+0xb1>
+  DB  126,255                             ; jle           2a4c9 <_sk_load_a8_dst_sse2_lowp+0xb1>
   DB  255                                 ; (bad)
   DB  255,164,255,255,255,149,255         ; jmpq          *-0x6a0001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -40556,42 +40691,42 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,29                              ; ja            2a1bc <_sk_store_a8_sse2_lowp+0x34>
+  DB  119,29                              ; ja            2a518 <_sk_store_a8_sse2_lowp+0x34>
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2a23c <_sk_store_a8_sse2_lowp+0xb4>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2a598 <_sk_store_a8_sse2_lowp+0xb4>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,15,126,216                      ; movd          %xmm3,%eax
   DB  65,136,4,16                         ; mov           %al,(%r8,%rdx,1)
-  DB  235,123                             ; jmp           2a237 <_sk_store_a8_sse2_lowp+0xaf>
-  DB  102,68,15,111,5,187,20,0,0          ; movdqa        0x14bb(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  235,123                             ; jmp           2a593 <_sk_store_a8_sse2_lowp+0xaf>
+  DB  102,68,15,111,5,191,20,0,0          ; movdqa        0x14bf(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,219,195                   ; pand          %xmm3,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,69,15,214,4,16                  ; movq          %xmm8,(%r8,%rdx,1)
-  DB  235,96                              ; jmp           2a237 <_sk_store_a8_sse2_lowp+0xaf>
+  DB  235,96                              ; jmp           2a593 <_sk_store_a8_sse2_lowp+0xaf>
   DB  102,15,197,195,2                    ; pextrw        $0x2,%xmm3,%eax
   DB  65,136,68,16,2                      ; mov           %al,0x2(%r8,%rdx,1)
-  DB  102,68,15,111,5,150,20,0,0          ; movdqa        0x1496(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,154,20,0,0          ; movdqa        0x149a(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,219,195                   ; pand          %xmm3,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,68,15,126,192                   ; movd          %xmm8,%eax
   DB  102,65,137,4,16                     ; mov           %ax,(%r8,%rdx,1)
-  DB  235,55                              ; jmp           2a237 <_sk_store_a8_sse2_lowp+0xaf>
+  DB  235,55                              ; jmp           2a593 <_sk_store_a8_sse2_lowp+0xaf>
   DB  102,15,197,195,6                    ; pextrw        $0x6,%xmm3,%eax
   DB  65,136,68,16,6                      ; mov           %al,0x6(%r8,%rdx,1)
   DB  102,15,197,195,5                    ; pextrw        $0x5,%xmm3,%eax
   DB  65,136,68,16,5                      ; mov           %al,0x5(%r8,%rdx,1)
   DB  102,15,197,195,4                    ; pextrw        $0x4,%xmm3,%eax
   DB  65,136,68,16,4                      ; mov           %al,0x4(%r8,%rdx,1)
-  DB  102,68,15,111,5,89,20,0,0           ; movdqa        0x1459(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,93,20,0,0           ; movdqa        0x145d(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,68,15,219,195                   ; pand          %xmm3,%xmm8
   DB  102,69,15,103,192                   ; packuswb      %xmm8,%xmm8
   DB  102,69,15,126,4,16                  ; movd          %xmm8,(%r8,%rdx,1)
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  255,224                             ; jmpq          *%rax
   DB  144                                 ; nop
-  DB  118,255                             ; jbe           2a23d <_sk_store_a8_sse2_lowp+0xb5>
+  DB  118,255                             ; jbe           2a599 <_sk_store_a8_sse2_lowp+0xb5>
   DB  255                                 ; (bad)
   DB  255,165,255,255,255,155             ; jmpq          *-0x64000001(%rbp)
   DB  255                                 ; (bad)
@@ -40620,19 +40755,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2a291 <_sk_load_g8_sse2_lowp+0x39>
+  DB  119,34                              ; ja            2a5ed <_sk_load_g8_sse2_lowp+0x39>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2a310 <_sk_load_g8_sse2_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2a66c <_sk_load_g8_sse2_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,192                      ; movd          %eax,%xmm0
-  DB  235,97                              ; jmp           2a2f2 <_sk_load_g8_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           2a64e <_sk_load_g8_sse2_lowp+0x9a>
   DB  243,65,15,126,4,16                  ; movq          (%r8,%rdx,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
-  DB  235,85                              ; jmp           2a2f2 <_sk_load_g8_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           2a64e <_sk_load_g8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,2                    ; pinsrw        $0x2,%eax,%xmm0
@@ -40640,7 +40775,7 @@
   DB  102,15,110,200                      ; movd          %eax,%xmm1
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  243,15,16,193                       ; movss         %xmm1,%xmm0
-  DB  235,51                              ; jmp           2a2f2 <_sk_load_g8_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           2a64e <_sk_load_g8_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,192,6                    ; pinsrw        $0x6,%eax,%xmm0
@@ -40651,14 +40786,14 @@
   DB  102,65,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm1
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  102,15,219,5,134,19,0,0             ; pand          0x1386(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,5,138,19,0,0             ; pand          0x138a(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,29,125,19,0,0                 ; movaps        0x137d(%rip),%xmm3        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,29,129,19,0,0                 ; movaps        0x1381(%rip),%xmm3        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  118,255                             ; jbe           2a311 <_sk_load_g8_sse2_lowp+0xb9>
+  DB  118,255                             ; jbe           2a66d <_sk_load_g8_sse2_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,156,255,255,255,141,255         ; lcall         *-0x720001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -40684,19 +40819,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2a365 <_sk_load_g8_dst_sse2_lowp+0x39>
+  DB  119,34                              ; ja            2a6c1 <_sk_load_g8_dst_sse2_lowp+0x39>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2a3e4 <_sk_load_g8_dst_sse2_lowp+0xb8>
+  DB  76,141,13,147,0,0,0                 ; lea           0x93(%rip),%r9        # 2a740 <_sk_load_g8_dst_sse2_lowp+0xb8>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,15,110,224                      ; movd          %eax,%xmm4
-  DB  235,97                              ; jmp           2a3c6 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  DB  235,97                              ; jmp           2a722 <_sk_load_g8_dst_sse2_lowp+0x9a>
   DB  243,65,15,126,36,16                 ; movq          (%r8,%rdx,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
-  DB  235,85                              ; jmp           2a3c6 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  DB  235,85                              ; jmp           2a722 <_sk_load_g8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,2                    ; pinsrw        $0x2,%eax,%xmm4
@@ -40704,7 +40839,7 @@
   DB  102,15,110,232                      ; movd          %eax,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,51                              ; jmp           2a3c6 <_sk_load_g8_dst_sse2_lowp+0x9a>
+  DB  235,51                              ; jmp           2a722 <_sk_load_g8_dst_sse2_lowp+0x9a>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,224,6                    ; pinsrw        $0x6,%eax,%xmm4
@@ -40715,14 +40850,14 @@
   DB  102,65,15,110,44,16                 ; movd          (%r8,%rdx,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  102,15,219,37,178,18,0,0            ; pand          0x12b2(%rip),%xmm4        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,219,37,182,18,0,0            ; pand          0x12b6(%rip),%xmm4        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  72,173                              ; lods          %ds:(%rsi),%rax
-  DB  15,40,61,169,18,0,0                 ; movaps        0x12a9(%rip),%xmm7        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  15,40,61,173,18,0,0                 ; movaps        0x12ad(%rip),%xmm7        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  118,255                             ; jbe           2a3e5 <_sk_load_g8_dst_sse2_lowp+0xb9>
+  DB  118,255                             ; jbe           2a741 <_sk_load_g8_dst_sse2_lowp+0xb9>
   DB  255                                 ; (bad)
   DB  255,156,255,255,255,141,255         ; lcall         *-0x720001(%rdi,%rdi,8)
   DB  255                                 ; (bad)
@@ -40741,10 +40876,10 @@
 PUBLIC _sk_luminance_to_alpha_sse2_lowp
 _sk_luminance_to_alpha_sse2_lowp LABEL PROC
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
-  DB  102,15,213,5,116,26,0,0             ; pmullw        0x1a74(%rip),%xmm0        # 2be80 <_sk_srcover_rgba_8888_sse2_lowp+0x11d8>
-  DB  102,15,213,13,124,26,0,0            ; pmullw        0x1a7c(%rip),%xmm1        # 2be90 <_sk_srcover_rgba_8888_sse2_lowp+0x11e8>
+  DB  102,15,213,5,120,26,0,0             ; pmullw        0x1a78(%rip),%xmm0        # 2c1e0 <_sk_srcover_rgba_8888_sse2_lowp+0x11dc>
+  DB  102,15,213,13,128,26,0,0            ; pmullw        0x1a80(%rip),%xmm1        # 2c1f0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ec>
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
-  DB  102,15,213,29,128,26,0,0            ; pmullw        0x1a80(%rip),%xmm3        # 2bea0 <_sk_srcover_rgba_8888_sse2_lowp+0x11f8>
+  DB  102,15,213,29,132,26,0,0            ; pmullw        0x1a84(%rip),%xmm3        # 2c200 <_sk_srcover_rgba_8888_sse2_lowp+0x11fc>
   DB  102,15,253,217                      ; paddw         %xmm1,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
   DB  72,173                              ; lods          %ds:(%rsi),%rax
@@ -40757,14 +40892,14 @@
 _sk_scale_1_float_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,203,16,0,0           ; mulss         0x10cb(%rip),%xmm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  243,68,15,88,5,146,16,0,0           ; addss         0x1092(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,89,5,207,16,0,0           ; mulss         0x10cf(%rip),%xmm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  243,68,15,88,5,150,16,0,0           ; addss         0x1096(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,10,18,0,0          ; movdqa        0x120a(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,14,18,0,0          ; movdqa        0x120e(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -40783,13 +40918,13 @@
 _sk_lerp_1_float_sse2_lowp LABEL PROC
   DB  72,173                              ; lods          %ds:(%rsi),%rax
   DB  243,68,15,16,0                      ; movss         (%rax),%xmm8
-  DB  243,68,15,89,5,83,16,0,0            ; mulss         0x1053(%rip),%xmm8        # 2b514 <_sk_srcover_rgba_8888_sse2_lowp+0x86c>
-  DB  243,68,15,88,5,26,16,0,0            ; addss         0x101a(%rip),%xmm8        # 2b4e4 <_sk_srcover_rgba_8888_sse2_lowp+0x83c>
+  DB  243,68,15,89,5,87,16,0,0            ; mulss         0x1057(%rip),%xmm8        # 2b874 <_sk_srcover_rgba_8888_sse2_lowp+0x870>
+  DB  243,68,15,88,5,30,16,0,0            ; addss         0x101e(%rip),%xmm8        # 2b844 <_sk_srcover_rgba_8888_sse2_lowp+0x840>
   DB  243,65,15,44,192                    ; cvttss2si     %xmm8,%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
   DB  242,69,15,112,192,0                 ; pshuflw       $0x0,%xmm8,%xmm8
   DB  102,69,15,112,192,80                ; pshufd        $0x50,%xmm8,%xmm8
-  DB  102,68,15,111,13,151,17,0,0         ; movdqa        0x1197(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,155,17,0,0         ; movdqa        0x119b(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -40827,19 +40962,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            2a5a0 <_sk_scale_u8_sse2_lowp+0x3b>
+  DB  119,36                              ; ja            2a8fc <_sk_scale_u8_sse2_lowp+0x3b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,221,0,0,0                 ; lea           0xdd(%rip),%r9        # 2a668 <_sk_scale_u8_sse2_lowp+0x103>
+  DB  76,141,13,221,0,0,0                 ; lea           0xdd(%rip),%r9        # 2a9c4 <_sk_scale_u8_sse2_lowp+0x103>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,109                             ; jmp           2a60d <_sk_scale_u8_sse2_lowp+0xa8>
+  DB  235,109                             ; jmp           2a969 <_sk_scale_u8_sse2_lowp+0xa8>
   DB  243,69,15,126,4,16                  ; movq          (%r8,%rdx,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
-  DB  235,96                              ; jmp           2a60d <_sk_scale_u8_sse2_lowp+0xa8>
+  DB  235,96                              ; jmp           2a969 <_sk_scale_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,2                 ; pinsrw        $0x2,%eax,%xmm8
@@ -40847,7 +40982,7 @@
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  243,69,15,16,193                    ; movss         %xmm9,%xmm8
-  DB  235,57                              ; jmp           2a60d <_sk_scale_u8_sse2_lowp+0xa8>
+  DB  235,57                              ; jmp           2a969 <_sk_scale_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,6                 ; pinsrw        $0x6,%eax,%xmm8
@@ -40858,9 +40993,9 @@
   DB  102,69,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  102,68,15,219,5,106,16,0,0          ; pand          0x106a(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,219,5,110,16,0,0          ; pand          0x106e(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,213,192                   ; pmullw        %xmm8,%xmm0
-  DB  102,68,15,111,13,92,16,0,0          ; movdqa        0x105c(%rip),%xmm9        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,13,96,16,0,0          ; movdqa        0x1060(%rip),%xmm9        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,253,193                   ; paddw         %xmm9,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,65,15,213,200                   ; pmullw        %xmm8,%xmm1
@@ -40886,7 +41021,7 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  125,255                             ; jge           2a67d <_sk_scale_u8_sse2_lowp+0x118>
+  DB  125,255                             ; jge           2a9d9 <_sk_scale_u8_sse2_lowp+0x118>
   DB  255                                 ; (bad)
   DB  255,108,255,255                     ; ljmp          *-0x1(%rdi,%rdi,8)
   DB  255                                 ; .byte         0xff
@@ -40901,19 +41036,19 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,36                              ; ja            2a6bf <_sk_lerp_u8_sse2_lowp+0x3b>
+  DB  119,36                              ; ja            2aa1b <_sk_lerp_u8_sse2_lowp+0x3b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 2a7c8 <_sk_lerp_u8_sse2_lowp+0x144>
+  DB  76,141,13,30,1,0,0                  ; lea           0x11e(%rip),%r9        # 2ab24 <_sk_lerp_u8_sse2_lowp+0x144>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,182,4,16                      ; movzbl        (%r8,%rdx,1),%eax
   DB  102,68,15,110,192                   ; movd          %eax,%xmm8
-  DB  235,109                             ; jmp           2a72c <_sk_lerp_u8_sse2_lowp+0xa8>
+  DB  235,109                             ; jmp           2aa88 <_sk_lerp_u8_sse2_lowp+0xa8>
   DB  243,69,15,126,4,16                  ; movq          (%r8,%rdx,1),%xmm8
   DB  102,68,15,96,192                    ; punpcklbw     %xmm0,%xmm8
-  DB  235,96                              ; jmp           2a72c <_sk_lerp_u8_sse2_lowp+0xa8>
+  DB  235,96                              ; jmp           2aa88 <_sk_lerp_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,2                   ; movzbl        0x2(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,2                 ; pinsrw        $0x2,%eax,%xmm8
@@ -40921,7 +41056,7 @@
   DB  102,68,15,110,200                   ; movd          %eax,%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  243,69,15,16,193                    ; movss         %xmm9,%xmm8
-  DB  235,57                              ; jmp           2a72c <_sk_lerp_u8_sse2_lowp+0xa8>
+  DB  235,57                              ; jmp           2aa88 <_sk_lerp_u8_sse2_lowp+0xa8>
   DB  65,15,182,68,16,6                   ; movzbl        0x6(%r8,%rdx,1),%eax
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
   DB  102,68,15,196,192,6                 ; pinsrw        $0x6,%eax,%xmm8
@@ -40932,8 +41067,8 @@
   DB  102,69,15,110,12,16                 ; movd          (%r8,%rdx,1),%xmm9
   DB  102,68,15,96,200                    ; punpcklbw     %xmm0,%xmm9
   DB  242,69,15,16,193                    ; movsd         %xmm9,%xmm8
-  DB  102,68,15,219,5,75,15,0,0           ; pand          0xf4b(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
-  DB  102,68,15,111,21,66,15,0,0          ; movdqa        0xf42(%rip),%xmm10        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,219,5,79,15,0,0           ; pand          0xf4f(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
+  DB  102,68,15,111,21,70,15,0,0          ; movdqa        0xf46(%rip),%xmm10        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,69,15,111,200                   ; movdqa        %xmm8,%xmm9
   DB  102,69,15,239,202                   ; pxor          %xmm10,%xmm9
   DB  102,69,15,111,217                   ; movdqa        %xmm9,%xmm11
@@ -40963,9 +41098,9 @@
   DB  102,65,15,111,216                   ; movdqa        %xmm8,%xmm3
   DB  255,224                             ; jmpq          *%rax
   DB  15,31,0                             ; nopl          (%rax)
-  DB  235,254                             ; jmp           2a7c8 <_sk_lerp_u8_sse2_lowp+0x144>
+  DB  235,254                             ; jmp           2ab24 <_sk_lerp_u8_sse2_lowp+0x144>
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,4                ; callq         *0x4ffffff(%rip)        # 502a7d0 <_sk_srcover_rgba_8888_sse2_lowp+0x4fffb28>
+  DB  255,21,255,255,255,4                ; callq         *0x4ffffff(%rip)        # 502ab2c <_sk_srcover_rgba_8888_sse2_lowp+0x4fffb28>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,84,255,255                      ; callq         *-0x1(%rdi,%rdi,8)
@@ -40994,23 +41129,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2a832 <_sk_scale_565_sse2_lowp+0x4e>
+  DB  119,34                              ; ja            2ab8e <_sk_scale_565_sse2_lowp+0x4e>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,234,1,0,0                 ; lea           0x1ea(%rip),%r9        # 2aa08 <_sk_scale_565_sse2_lowp+0x224>
+  DB  76,141,13,234,1,0,0                 ; lea           0x1ea(%rip),%r9        # 2ad64 <_sk_scale_565_sse2_lowp+0x224>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,240                      ; movd          %eax,%xmm6
-  DB  235,67                              ; jmp           2a875 <_sk_scale_565_sse2_lowp+0x91>
+  DB  235,67                              ; jmp           2abd1 <_sk_scale_565_sse2_lowp+0x91>
   DB  243,65,15,111,52,80                 ; movdqu        (%r8,%rdx,2),%xmm6
-  DB  235,59                              ; jmp           2a875 <_sk_scale_565_sse2_lowp+0x91>
+  DB  235,59                              ; jmp           2abd1 <_sk_scale_565_sse2_lowp+0x91>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  102,65,15,196,116,80,4,2            ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm6
   DB  243,69,15,16,12,80                  ; movss         (%r8,%rdx,2),%xmm9
   DB  243,65,15,16,241                    ; movss         %xmm9,%xmm6
-  DB  235,34                              ; jmp           2a875 <_sk_scale_565_sse2_lowp+0x91>
+  DB  235,34                              ; jmp           2abd1 <_sk_scale_565_sse2_lowp+0x91>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  102,65,15,196,116,80,12,6           ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm6
   DB  102,65,15,196,116,80,10,5           ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm6
@@ -41018,11 +41153,11 @@
   DB  102,65,15,18,52,80                  ; movlpd        (%r8,%rdx,2),%xmm6
   DB  102,68,15,111,222                   ; movdqa        %xmm6,%xmm11
   DB  102,65,15,113,211,8                 ; psrlw         $0x8,%xmm11
-  DB  102,68,15,219,29,167,21,0,0         ; pand          0x15a7(%rip),%xmm11        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,68,15,219,29,171,21,0,0         ; pand          0x15ab(%rip),%xmm11        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,68,15,111,206                   ; movdqa        %xmm6,%xmm9
   DB  102,65,15,113,209,5                 ; psrlw         $0x5,%xmm9
-  DB  102,68,15,219,13,163,21,0,0         ; pand          0x15a3(%rip),%xmm9        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,68,15,111,21,170,21,0,0         ; movdqa        0x15aa(%rip),%xmm10        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,68,15,219,13,167,21,0,0         ; pand          0x15a7(%rip),%xmm9        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,68,15,111,21,174,21,0,0         ; movdqa        0x15ae(%rip),%xmm10        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,68,15,219,214                   ; pand          %xmm6,%xmm10
   DB  102,15,113,214,13                   ; psrlw         $0xd,%xmm6
   DB  102,65,15,235,243                   ; por           %xmm11,%xmm6
@@ -41034,7 +41169,7 @@
   DB  102,65,15,113,243,3                 ; psllw         $0x3,%xmm11
   DB  102,65,15,113,210,2                 ; psrlw         $0x2,%xmm10
   DB  102,69,15,235,211                   ; por           %xmm11,%xmm10
-  DB  102,68,15,111,37,6,21,0,0           ; movdqa        0x1506(%rip),%xmm12        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,37,10,21,0,0          ; movdqa        0x150a(%rip),%xmm12        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,68,15,111,235                   ; movdqa        %xmm3,%xmm13
   DB  102,69,15,239,236                   ; pxor          %xmm12,%xmm13
   DB  102,68,15,111,223                   ; movdqa        %xmm7,%xmm11
@@ -41075,7 +41210,7 @@
   DB  102,68,15,213,201                   ; pmullw        %xmm1,%xmm9
   DB  102,68,15,213,210                   ; pmullw        %xmm2,%xmm10
   DB  102,68,15,213,219                   ; pmullw        %xmm3,%xmm11
-  DB  102,15,111,5,200,12,0,0             ; movdqa        0xcc8(%rip),%xmm0        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,15,111,5,204,12,0,0             ; movdqa        0xccc(%rip),%xmm0        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,253,240                      ; paddw         %xmm0,%xmm6
   DB  102,68,15,253,200                   ; paddw         %xmm0,%xmm9
   DB  102,68,15,253,208                   ; paddw         %xmm0,%xmm10
@@ -41128,23 +41263,23 @@
   DB  36,7                                ; and           $0x7,%al
   DB  254,200                             ; dec           %al
   DB  60,6                                ; cmp           $0x6,%al
-  DB  119,34                              ; ja            2aa72 <_sk_lerp_565_sse2_lowp+0x4e>
+  DB  119,34                              ; ja            2adce <_sk_lerp_565_sse2_lowp+0x4e>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  15,182,192                          ; movzbl        %al,%eax
-  DB  76,141,13,46,2,0,0                  ; lea           0x22e(%rip),%r9        # 2ac8c <_sk_lerp_565_sse2_lowp+0x268>
+  DB  76,141,13,46,2,0,0                  ; lea           0x22e(%rip),%r9        # 2afe8 <_sk_lerp_565_sse2_lowp+0x268>
   DB  73,99,4,129                         ; movslq        (%r9,%rax,4),%rax
   DB  76,1,200                            ; add           %r9,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  65,15,183,4,80                      ; movzwl        (%r8,%rdx,2),%eax
   DB  102,15,110,208                      ; movd          %eax,%xmm2
-  DB  235,67                              ; jmp           2aab5 <_sk_lerp_565_sse2_lowp+0x91>
+  DB  235,67                              ; jmp           2ae11 <_sk_lerp_565_sse2_lowp+0x91>
   DB  243,65,15,111,20,80                 ; movdqu        (%r8,%rdx,2),%xmm2
-  DB  235,59                              ; jmp           2aab5 <_sk_lerp_565_sse2_lowp+0x91>
+  DB  235,59                              ; jmp           2ae11 <_sk_lerp_565_sse2_lowp+0x91>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  102,65,15,196,84,80,4,2             ; pinsrw        $0x2,0x4(%r8,%rdx,2),%xmm2
   DB  243,69,15,16,12,80                  ; movss         (%r8,%rdx,2),%xmm9
   DB  243,65,15,16,209                    ; movss         %xmm9,%xmm2
-  DB  235,34                              ; jmp           2aab5 <_sk_lerp_565_sse2_lowp+0x91>
+  DB  235,34                              ; jmp           2ae11 <_sk_lerp_565_sse2_lowp+0x91>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  102,65,15,196,84,80,12,6            ; pinsrw        $0x6,0xc(%r8,%rdx,2),%xmm2
   DB  102,65,15,196,84,80,10,5            ; pinsrw        $0x5,0xa(%r8,%rdx,2),%xmm2
@@ -41152,11 +41287,11 @@
   DB  102,65,15,18,20,80                  ; movlpd        (%r8,%rdx,2),%xmm2
   DB  102,68,15,111,218                   ; movdqa        %xmm2,%xmm11
   DB  102,65,15,113,211,8                 ; psrlw         $0x8,%xmm11
-  DB  102,68,15,219,29,103,19,0,0         ; pand          0x1367(%rip),%xmm11        # 2be30 <_sk_srcover_rgba_8888_sse2_lowp+0x1188>
+  DB  102,68,15,219,29,107,19,0,0         ; pand          0x136b(%rip),%xmm11        # 2c190 <_sk_srcover_rgba_8888_sse2_lowp+0x118c>
   DB  102,68,15,111,202                   ; movdqa        %xmm2,%xmm9
   DB  102,65,15,113,209,5                 ; psrlw         $0x5,%xmm9
-  DB  102,68,15,219,13,99,19,0,0          ; pand          0x1363(%rip),%xmm9        # 2be40 <_sk_srcover_rgba_8888_sse2_lowp+0x1198>
-  DB  102,68,15,111,21,106,19,0,0         ; movdqa        0x136a(%rip),%xmm10        # 2be50 <_sk_srcover_rgba_8888_sse2_lowp+0x11a8>
+  DB  102,68,15,219,13,103,19,0,0         ; pand          0x1367(%rip),%xmm9        # 2c1a0 <_sk_srcover_rgba_8888_sse2_lowp+0x119c>
+  DB  102,68,15,111,21,110,19,0,0         ; movdqa        0x136e(%rip),%xmm10        # 2c1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x11ac>
   DB  102,68,15,219,210                   ; pand          %xmm2,%xmm10
   DB  102,15,113,210,13                   ; psrlw         $0xd,%xmm2
   DB  102,65,15,235,211                   ; por           %xmm11,%xmm2
@@ -41168,7 +41303,7 @@
   DB  102,65,15,113,243,3                 ; psllw         $0x3,%xmm11
   DB  102,65,15,113,210,2                 ; psrlw         $0x2,%xmm10
   DB  102,69,15,235,211                   ; por           %xmm11,%xmm10
-  DB  102,68,15,111,37,198,18,0,0         ; movdqa        0x12c6(%rip),%xmm12        # 2bdf0 <_sk_srcover_rgba_8888_sse2_lowp+0x1148>
+  DB  102,68,15,111,37,202,18,0,0         ; movdqa        0x12ca(%rip),%xmm12        # 2c150 <_sk_srcover_rgba_8888_sse2_lowp+0x114c>
   DB  102,68,15,111,235                   ; movdqa        %xmm3,%xmm13
   DB  102,69,15,239,236                   ; pxor          %xmm12,%xmm13
   DB  102,68,15,111,223                   ; movdqa        %xmm7,%xmm11
@@ -41207,7 +41342,7 @@
   DB  102,69,15,235,222                   ; por           %xmm14,%xmm11
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,213,209                      ; pmullw        %xmm1,%xmm2
-  DB  102,68,15,111,5,146,10,0,0          ; movdqa        0xa92(%rip),%xmm8        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,5,150,10,0,0          ; movdqa        0xa96(%rip),%xmm8        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,65,15,239,192                   ; pxor          %xmm8,%xmm0
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
   DB  102,65,15,253,208                   ; paddw         %xmm8,%xmm2
@@ -41277,26 +41412,26 @@
   DB  65,254,202                          ; dec           %r10b
   DB  69,15,182,202                       ; movzbl        %r10b,%r9d
   DB  65,128,249,6                        ; cmp           $0x6,%r9b
-  DB  119,38                              ; ja            2acf3 <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
+  DB  119,38                              ; ja            2b04f <_sk_srcover_rgba_8888_sse2_lowp+0x4b>
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  76,141,29,67,2,0,0                  ; lea           0x243(%rip),%r11        # 2af1c <_sk_srcover_rgba_8888_sse2_lowp+0x274>
+  DB  76,141,29,67,2,0,0                  ; lea           0x243(%rip),%r11        # 2b278 <_sk_srcover_rgba_8888_sse2_lowp+0x274>
   DB  75,99,4,139                         ; movslq        (%r11,%r9,4),%rax
   DB  76,1,216                            ; add           %r11,%rax
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  255,224                             ; jmpq          *%rax
   DB  243,65,15,16,60,144                 ; movss         (%r8,%rdx,4),%xmm7
   DB  102,69,15,239,192                   ; pxor          %xmm8,%xmm8
-  DB  235,102                             ; jmp           2ad59 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  DB  235,102                             ; jmp           2b0b5 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   DB  102,65,15,16,60,144                 ; movupd        (%r8,%rdx,4),%xmm7
   DB  243,69,15,111,68,144,16             ; movdqu        0x10(%r8,%rdx,4),%xmm8
-  DB  235,87                              ; jmp           2ad59 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  DB  235,87                              ; jmp           2b0b5 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   DB  102,65,15,110,100,144,8             ; movd          0x8(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,69,15,18,4,144                  ; movlpd        (%r8,%rdx,4),%xmm8
   DB  102,65,15,40,248                    ; movapd        %xmm8,%xmm7
   DB  102,68,15,111,196                   ; movdqa        %xmm4,%xmm8
-  DB  235,52                              ; jmp           2ad59 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
+  DB  235,52                              ; jmp           2b0b5 <_sk_srcover_rgba_8888_sse2_lowp+0xb1>
   DB  102,65,15,110,100,144,24            ; movd          0x18(%r8,%rdx,4),%xmm4
   DB  102,68,15,112,196,69                ; pshufd        $0x45,%xmm4,%xmm8
   DB  243,65,15,16,100,144,20             ; movss         0x14(%r8,%rdx,4),%xmm4
@@ -41313,7 +41448,7 @@
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,114,228,16                   ; psrad         $0x10,%xmm4
   DB  102,15,107,236                      ; packssdw      %xmm4,%xmm5
-  DB  102,68,15,111,37,253,8,0,0          ; movdqa        0x8fd(%rip),%xmm12        # 2b680 <_sk_srcover_rgba_8888_sse2_lowp+0x9d8>
+  DB  102,68,15,111,37,1,9,0,0            ; movdqa        0x901(%rip),%xmm12        # 2b9e0 <_sk_srcover_rgba_8888_sse2_lowp+0x9dc>
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,65,15,219,228                   ; pand          %xmm12,%xmm4
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -41371,20 +41506,20 @@
   DB  102,15,105,193                      ; punpckhwd     %xmm1,%xmm0
   DB  102,15,235,194                      ; por           %xmm2,%xmm0
   DB  65,128,250,6                        ; cmp           $0x6,%r10b
-  DB  119,24                              ; ja            2aebb <_sk_srcover_rgba_8888_sse2_lowp+0x213>
-  DB  76,141,21,142,0,0,0                 ; lea           0x8e(%rip),%r10        # 2af38 <_sk_srcover_rgba_8888_sse2_lowp+0x290>
+  DB  119,24                              ; ja            2b217 <_sk_srcover_rgba_8888_sse2_lowp+0x213>
+  DB  76,141,21,142,0,0,0                 ; lea           0x8e(%rip),%r10        # 2b294 <_sk_srcover_rgba_8888_sse2_lowp+0x290>
   DB  75,99,4,138                         ; movslq        (%r10,%r9,4),%rax
   DB  76,1,208                            ; add           %r10,%rax
   DB  255,224                             ; jmpq          *%rax
   DB  102,69,15,126,36,144                ; movd          %xmm12,(%r8,%rdx,4)
-  DB  235,73                              ; jmp           2af04 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  DB  235,73                              ; jmp           2b260 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   DB  243,69,15,127,36,144                ; movdqu        %xmm12,(%r8,%rdx,4)
   DB  243,65,15,127,68,144,16             ; movdqu        %xmm0,0x10(%r8,%rdx,4)
-  DB  235,58                              ; jmp           2af04 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  DB  235,58                              ; jmp           2b260 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   DB  102,65,15,112,196,78                ; pshufd        $0x4e,%xmm12,%xmm0
   DB  102,65,15,126,68,144,8              ; movd          %xmm0,0x8(%r8,%rdx,4)
   DB  102,69,15,214,36,144                ; movq          %xmm12,(%r8,%rdx,4)
-  DB  235,37                              ; jmp           2af04 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
+  DB  235,37                              ; jmp           2b260 <_sk_srcover_rgba_8888_sse2_lowp+0x25c>
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
   DB  102,65,15,126,76,144,24             ; movd          %xmm1,0x18(%r8,%rdx,4)
   DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
@@ -41417,7 +41552,7 @@
   DB  254                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  123,255                             ; jnp           2af39 <_sk_srcover_rgba_8888_sse2_lowp+0x291>
+  DB  123,255                             ; jnp           2b295 <_sk_srcover_rgba_8888_sse2_lowp+0x291>
   DB  255                                 ; (bad)
   DB  255,159,255,255,255,146             ; lcall         *-0x6d000001(%rdi)
   DB  255                                 ; (bad)
@@ -41483,16 +41618,16 @@
   DB  0,1                                 ; add           %al,(%rcx)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02afc8 <_sk_srcover_rgba_8888_sse2_lowp+0xa000320>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b328 <_sk_srcover_rgba_8888_sse2_lowp+0xa000324>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202afd0 <_sk_srcover_rgba_8888_sse2_lowp+0x12000328>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b330 <_sk_srcover_rgba_8888_sse2_lowp+0x1200032c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02afd8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000330>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b338 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000334>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302afe0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000338>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b340 <_sk_srcover_rgba_8888_sse2_lowp+0x300033c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41535,16 +41670,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b028 <_sk_srcover_rgba_8888_sse2_lowp+0xa000380>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b388 <_sk_srcover_rgba_8888_sse2_lowp+0xa000384>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b030 <_sk_srcover_rgba_8888_sse2_lowp+0x12000388>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b390 <_sk_srcover_rgba_8888_sse2_lowp+0x1200038c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b038 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000390>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b398 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000394>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b040 <_sk_srcover_rgba_8888_sse2_lowp+0x3000398>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b3a0 <_sk_srcover_rgba_8888_sse2_lowp+0x300039c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41587,16 +41722,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b088 <_sk_srcover_rgba_8888_sse2_lowp+0xa0003e0>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b3e8 <_sk_srcover_rgba_8888_sse2_lowp+0xa0003e4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b090 <_sk_srcover_rgba_8888_sse2_lowp+0x120003e8>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b3f0 <_sk_srcover_rgba_8888_sse2_lowp+0x120003ec>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b098 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0003f0>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b3f8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0003f4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b0a0 <_sk_srcover_rgba_8888_sse2_lowp+0x30003f8>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b400 <_sk_srcover_rgba_8888_sse2_lowp+0x30003fc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41639,16 +41774,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b0e8 <_sk_srcover_rgba_8888_sse2_lowp+0xa000440>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b448 <_sk_srcover_rgba_8888_sse2_lowp+0xa000444>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b0f0 <_sk_srcover_rgba_8888_sse2_lowp+0x12000448>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b450 <_sk_srcover_rgba_8888_sse2_lowp+0x1200044c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b0f8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000450>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b458 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000454>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b100 <_sk_srcover_rgba_8888_sse2_lowp+0x3000458>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b460 <_sk_srcover_rgba_8888_sse2_lowp+0x300045c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41691,16 +41826,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b148 <_sk_srcover_rgba_8888_sse2_lowp+0xa0004a0>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b4a8 <_sk_srcover_rgba_8888_sse2_lowp+0xa0004a4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b150 <_sk_srcover_rgba_8888_sse2_lowp+0x120004a8>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b4b0 <_sk_srcover_rgba_8888_sse2_lowp+0x120004ac>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b158 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0004b0>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b4b8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0004b4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b160 <_sk_srcover_rgba_8888_sse2_lowp+0x30004b8>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b4c0 <_sk_srcover_rgba_8888_sse2_lowp+0x30004bc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41743,16 +41878,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b1a8 <_sk_srcover_rgba_8888_sse2_lowp+0xa000500>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b508 <_sk_srcover_rgba_8888_sse2_lowp+0xa000504>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b1b0 <_sk_srcover_rgba_8888_sse2_lowp+0x12000508>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b510 <_sk_srcover_rgba_8888_sse2_lowp+0x1200050c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b1b8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000510>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b518 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000514>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b1c0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000518>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b520 <_sk_srcover_rgba_8888_sse2_lowp+0x300051c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41795,16 +41930,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b208 <_sk_srcover_rgba_8888_sse2_lowp+0xa000560>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b568 <_sk_srcover_rgba_8888_sse2_lowp+0xa000564>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b210 <_sk_srcover_rgba_8888_sse2_lowp+0x12000568>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b570 <_sk_srcover_rgba_8888_sse2_lowp+0x1200056c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b218 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000570>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b578 <_sk_srcover_rgba_8888_sse2_lowp+0x1a000574>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b220 <_sk_srcover_rgba_8888_sse2_lowp+0x3000578>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b580 <_sk_srcover_rgba_8888_sse2_lowp+0x300057c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -41847,16 +41982,16 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b268 <_sk_srcover_rgba_8888_sse2_lowp+0xa0005c0>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b5c8 <_sk_srcover_rgba_8888_sse2_lowp+0xa0005c4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b270 <_sk_srcover_rgba_8888_sse2_lowp+0x120005c8>
+  DB  255,13,255,255,255,17               ; decl          0x11ffffff(%rip)        # 1202b5d0 <_sk_srcover_rgba_8888_sse2_lowp+0x120005cc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b278 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0005d0>
+  DB  255,21,255,255,255,25               ; callq         *0x19ffffff(%rip)        # 1a02b5d8 <_sk_srcover_rgba_8888_sse2_lowp+0x1a0005d4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b280 <_sk_srcover_rgba_8888_sse2_lowp+0x30005d8>
+  DB  255,29,255,255,255,2                ; lcall         *0x2ffffff(%rip)        # 302b5e0 <_sk_srcover_rgba_8888_sse2_lowp+0x30005dc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -42127,7 +42262,7 @@
   DB  0,255                               ; add           %bh,%bh
   DB  0,0                                 ; add           %al,(%rax)
   DB  248                                 ; clc
-  DB  224,255                             ; loopne        2b493 <.const+0x533>
+  DB  224,255                             ; loopne        2b7f3 <.const+0x533>
   DB  255,0                               ; incl          (%rax)
   DB  255,0                               ; incl          (%rax)
   DB  54,0,183,0,19,0,255                 ; add           %dh,%ss:-0xffed00(%rdi)
@@ -42180,14 +42315,14 @@
   DB  252                                 ; cld
   DB  190,0,0,128,191                     ; mov           $0xbf800000,%esi
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        2b548 <.literal4+0x64>
+  DB  224,64                              ; loopne        2b8a8 <.literal4+0x64>
   DB  154                                 ; (bad)
   DB  153                                 ; cltd
   DB  153                                 ; cltd
   DB  62,61,10,23,63,174                  ; ds            cmp $0xae3f170a,%eax
-  DB  71,225,61                           ; rex.RXB       loope 2b551 <.literal4+0x6d>
+  DB  71,225,61                           ; rex.RXB       loope 2b8b1 <.literal4+0x6d>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            2b55b <.literal4+0x77>
+  DB  127,67                              ; jg            2b8bb <.literal4+0x77>
   DB  145                                 ; xchg          %eax,%ecx
   DB  131,158,61,92,143,50,63             ; sbbl          $0x3f,0x328f5c3d(%rsi)
   DB  10,215                              ; or            %bh,%dl
@@ -42220,7 +42355,7 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  8,33                                ; or            %ah,(%rcx)
   DB  132,55                              ; test          %dh,(%rdi)
-  DB  224,7                               ; loopne        2b571 <.literal4+0x8d>
+  DB  224,7                               ; loopne        2b8d1 <.literal4+0x8d>
   DB  0,0                                 ; add           %al,(%rax)
   DB  33,8                                ; and           %ecx,(%rax)
   DB  2,58                                ; add           (%rdx),%bh
@@ -42231,8 +42366,8 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,52,255                            ; add           %dh,(%rdi,%rdi,8)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2b584 <.literal4+0xa0>
-  DB  119,115                             ; ja            2b5f9 <.literal4+0x115>
+  DB  127,0                               ; jg            2b8e4 <.literal4+0xa0>
+  DB  119,115                             ; ja            2b959 <.literal4+0x115>
   DB  248                                 ; clc
   DB  194,117,191                         ; retq          $0xbf75
   DB  191,63,249,68,180                   ; mov           $0xb444f93f,%edi
@@ -42255,12 +42390,12 @@
   DB  190,80,128,3,62                     ; mov           $0x3e038050,%esi
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           2b60f <.literal4+0x12b>
+  DB  118,63                              ; jbe           2b96f <.literal4+0x12b>
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  248                                 ; clc
   DB  65,0,0                              ; add           %al,(%r8)
-  DB  124,66                              ; jl            2b61e <.literal4+0x13a>
+  DB  124,66                              ; jl            2b97e <.literal4+0x13a>
   DB  0,240                               ; add           %dh,%al
   DB  0,0                                 ; add           %al,(%rax)
   DB  137,136,136,55,0,15                 ; mov           %ecx,0xf003788(%rax)
@@ -42270,9 +42405,9 @@
   DB  137,136,136,59,15,0                 ; mov           %ecx,0xf3b88(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  137,136,136,61,0,0                  ; mov           %ecx,0x3d88(%rax)
-  DB  112,65                              ; jo            2b641 <.literal4+0x15d>
+  DB  112,65                              ; jo            2b9a1 <.literal4+0x15d>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            2b64b <.literal4+0x167>
+  DB  127,71                              ; jg            2b9ab <.literal4+0x167>
   DB  208                                 ; (bad)
   DB  179,89                              ; mov           $0x59,%bl
   DB  62,89                               ; ds            pop %rcx
@@ -42299,15 +42434,15 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  128,0,0                             ; addb          $0x0,(%rax)
   DB  0,191,0,0,192,191                   ; add           %bh,-0x40400000(%rdi)
-  DB  114,28                              ; jb            2b66a <.literal4+0x186>
+  DB  114,28                              ; jb            2b9ca <.literal4+0x186>
   DB  199                                 ; (bad)
   DB  62,0,0                              ; add           %al,%ds:(%rax)
   DB  192,63,85                           ; sarb          $0x55,(%rdi)
   DB  85                                  ; push          %rbp
   DB  149                                 ; xchg          %eax,%ebp
   DB  191,57,142,99,61                    ; mov           $0x3d638e39,%edi
-  DB  114,249                             ; jb            2b657 <.literal4+0x173>
-  DB  127,63                              ; jg            2b69f <_sk_srcover_rgba_8888_sse2_lowp+0x9f7>
+  DB  114,249                             ; jb            2b9b7 <.literal4+0x173>
+  DB  127,63                              ; jg            2b9ff <_sk_srcover_rgba_8888_sse2_lowp+0x9fb>
   DB  3,0                                 ; add           (%rax),%eax
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,4,0                               ; add           %al,(%rax,%rax,1)
@@ -42316,7 +42451,7 @@
   DB  56,255                              ; cmp           %bh,%bh
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2b671 <.literal4+0x18d>
+  DB  127,0                               ; jg            2b9d1 <.literal4+0x18d>
   DB  0,128,56,0,64,254                   ; add           %al,-0x1bfffc8(%rax)
   DB  255                                 ; .byte         0xff
 
@@ -42419,11 +42554,11 @@
   DB  0,128,191,0,0,128                   ; add           %al,-0x7fffff41(%rax)
   DB  191,0,0,224,64                      ; mov           $0x40e00000,%edi
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        2b7a8 <.literal16+0x128>
+  DB  224,64                              ; loopne        2bb08 <.literal16+0x128>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        2b7ac <.literal16+0x12c>
+  DB  224,64                              ; loopne        2bb0c <.literal16+0x12c>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,64                              ; loopne        2b7b0 <.literal16+0x130>
+  DB  224,64                              ; loopne        2bb10 <.literal16+0x130>
   DB  154                                 ; (bad)
   DB  153                                 ; cltd
   DB  153                                 ; cltd
@@ -42443,13 +42578,13 @@
   DB  10,23                               ; or            (%rdi),%dl
   DB  63                                  ; (bad)
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 2b7d1 <.literal16+0x151>
+  DB  71,225,61                           ; rex.RXB       loope 2bb31 <.literal16+0x151>
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 2b7d5 <.literal16+0x155>
+  DB  71,225,61                           ; rex.RXB       loope 2bb35 <.literal16+0x155>
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 2b7d9 <.literal16+0x159>
+  DB  71,225,61                           ; rex.RXB       loope 2bb39 <.literal16+0x159>
   DB  174                                 ; scas          %es:(%rdi),%al
-  DB  71,225,61                           ; rex.RXB       loope 2b7dd <.literal16+0x15d>
+  DB  71,225,61                           ; rex.RXB       loope 2bb3d <.literal16+0x15d>
   DB  255,0                               ; incl          (%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  255,0                               ; incl          (%rax)
@@ -42460,10 +42595,10 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  1,255                               ; add           %edi,%edi
   DB  255                                 ; (bad)
-  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02b7b8 <_sk_srcover_rgba_8888_sse2_lowp+0xa000b10>
+  DB  255,5,255,255,255,9                 ; incl          0x9ffffff(%rip)        # a02bb18 <_sk_srcover_rgba_8888_sse2_lowp+0xa000b14>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  255,13,255,255,255,2                ; decl          0x2ffffff(%rip)        # 302b7c0 <_sk_srcover_rgba_8888_sse2_lowp+0x3000b18>
+  DB  255,13,255,255,255,2                ; decl          0x2ffffff(%rip)        # 302bb20 <_sk_srcover_rgba_8888_sse2_lowp+0x3000b1c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255,6                               ; incl          (%rsi)
@@ -42478,11 +42613,11 @@
   DB  255,0                               ; incl          (%rax)
   DB  0,127,67                            ; add           %bh,0x43(%rdi)
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            2b81b <.literal16+0x19b>
+  DB  127,67                              ; jg            2bb7b <.literal16+0x19b>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            2b81f <.literal16+0x19f>
+  DB  127,67                              ; jg            2bb7f <.literal16+0x19f>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  127,67                              ; jg            2b823 <.literal16+0x1a3>
+  DB  127,67                              ; jg            2bb83 <.literal16+0x1a3>
   DB  145                                 ; xchg          %eax,%ecx
   DB  131,158,61,145,131,158,61           ; sbbl          $0x3d,-0x617c6ec3(%rsi)
   DB  145                                 ; xchg          %eax,%ecx
@@ -42633,13 +42768,13 @@
   DB  132,55                              ; test          %dh,(%rdi)
   DB  8,33                                ; or            %ah,(%rcx)
   DB  132,55                              ; test          %dh,(%rdi)
-  DB  224,7                               ; loopne        2b929 <.literal16+0x2a9>
+  DB  224,7                               ; loopne        2bc89 <.literal16+0x2a9>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,7                               ; loopne        2b92d <.literal16+0x2ad>
+  DB  224,7                               ; loopne        2bc8d <.literal16+0x2ad>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,7                               ; loopne        2b931 <.literal16+0x2b1>
+  DB  224,7                               ; loopne        2bc91 <.literal16+0x2b1>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  224,7                               ; loopne        2b935 <.literal16+0x2b5>
+  DB  224,7                               ; loopne        2bc95 <.literal16+0x2b5>
   DB  0,0                                 ; add           %al,(%rax)
   DB  33,8                                ; and           %ecx,(%rax)
   DB  2,58                                ; add           (%rdx),%bh
@@ -42693,17 +42828,17 @@
   DB  0,0                                 ; add           %al,(%rax)
   DB  52,255                              ; xor           $0xff,%al
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2b9a4 <.literal16+0x324>
+  DB  127,0                               ; jg            2bd04 <.literal16+0x324>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2b9a8 <.literal16+0x328>
+  DB  127,0                               ; jg            2bd08 <.literal16+0x328>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2b9ac <.literal16+0x32c>
+  DB  127,0                               ; jg            2bd0c <.literal16+0x32c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2b9b0 <.literal16+0x330>
-  DB  119,115                             ; ja            2ba25 <.literal16+0x3a5>
+  DB  127,0                               ; jg            2bd10 <.literal16+0x330>
+  DB  119,115                             ; ja            2bd85 <.literal16+0x3a5>
   DB  248                                 ; clc
   DB  194,119,115                         ; retq          $0x7377
   DB  248                                 ; clc
@@ -42714,7 +42849,7 @@
   DB  194,117,191                         ; retq          $0xbf75
   DB  191,63,117,191,191                  ; mov           $0xbfbf753f,%edi
   DB  63                                  ; (bad)
-  DB  117,191                             ; jne           2b989 <.literal16+0x309>
+  DB  117,191                             ; jne           2bce9 <.literal16+0x309>
   DB  191,63,117,191,191                  ; mov           $0xbfbf753f,%edi
   DB  63                                  ; (bad)
   DB  249                                 ; stc
@@ -42726,7 +42861,7 @@
   DB  249                                 ; stc
   DB  68,180,62                           ; rex.R         mov $0x3e,%spl
   DB  163,233,220,63,163,233,220,63,163   ; movabs        %eax,0xa33fdce9a33fdce9
-  DB  233,220,63,163,233                  ; jmpq          ffffffffe9a5f9ca <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe9a34d22>
+  DB  233,220,63,163,233                  ; jmpq          ffffffffe9a5fd2a <_sk_srcover_rgba_8888_sse2_lowp+0xffffffffe9a34d26>
   DB  220,63                              ; fdivrl        (%rdi)
   DB  81                                  ; push          %rcx
   DB  140,242                             ; mov           %?,%edx
@@ -42816,16 +42951,16 @@
   DB  128,3,62                            ; addb          $0x3e,(%rbx)
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           2bb13 <.literal16+0x493>
+  DB  118,63                              ; jbe           2be73 <.literal16+0x493>
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           2bb17 <.literal16+0x497>
+  DB  118,63                              ; jbe           2be77 <.literal16+0x497>
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           2bb1b <.literal16+0x49b>
+  DB  118,63                              ; jbe           2be7b <.literal16+0x49b>
   DB  31                                  ; (bad)
   DB  215                                 ; xlat          %ds:(%rbx)
-  DB  118,63                              ; jbe           2bb1f <.literal16+0x49f>
+  DB  118,63                              ; jbe           2be7f <.literal16+0x49f>
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%rax)
@@ -42846,13 +42981,13 @@
   DB  65,0,0                              ; add           %al,(%r8)
   DB  248                                 ; clc
   DB  65,0,0                              ; add           %al,(%r8)
-  DB  124,66                              ; jl            2bb56 <.literal16+0x4d6>
+  DB  124,66                              ; jl            2beb6 <.literal16+0x4d6>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  124,66                              ; jl            2bb5a <.literal16+0x4da>
+  DB  124,66                              ; jl            2beba <.literal16+0x4da>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  124,66                              ; jl            2bb5e <.literal16+0x4de>
+  DB  124,66                              ; jl            2bebe <.literal16+0x4de>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  124,66                              ; jl            2bb62 <.literal16+0x4e2>
+  DB  124,66                              ; jl            2bec2 <.literal16+0x4e2>
   DB  0,240                               ; add           %dh,%al
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,240                               ; add           %dh,%al
@@ -42898,25 +43033,25 @@
   DB  136,136,61,137,136,136              ; mov           %cl,-0x777776c3(%rax)
   DB  61,137,136,136,61                   ; cmp           $0x3d888889,%eax
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            2bbe5 <.literal16+0x565>
+  DB  112,65                              ; jo            2bf45 <.literal16+0x565>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            2bbe9 <.literal16+0x569>
+  DB  112,65                              ; jo            2bf49 <.literal16+0x569>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            2bbed <.literal16+0x56d>
+  DB  112,65                              ; jo            2bf4d <.literal16+0x56d>
   DB  0,0                                 ; add           %al,(%rax)
-  DB  112,65                              ; jo            2bbf1 <.literal16+0x571>
+  DB  112,65                              ; jo            2bf51 <.literal16+0x571>
   DB  0,128,0,0,0,128                     ; add           %al,-0x80000000(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  0,128,0,0,0,128                     ; add           %al,-0x80000000(%rax)
   DB  0,0                                 ; add           %al,(%rax)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2bbc3 <.literal16+0x543>
+  DB  127,0                               ; jg            2bf23 <.literal16+0x543>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            2bbc7 <.literal16+0x547>
+  DB  127,0                               ; jg            2bf27 <.literal16+0x547>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            2bbcb <.literal16+0x54b>
+  DB  127,0                               ; jg            2bf2b <.literal16+0x54b>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            2bbcf <.literal16+0x54f>
+  DB  127,0                               ; jg            2bf2f <.literal16+0x54f>
   DB  0,0                                 ; add           %al,(%rax)
   DB  4,0                                 ; add           $0x0,%al
   DB  0,0                                 ; add           %al,(%rax)
@@ -42942,13 +43077,13 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            2bc08 <.literal16+0x588>
+  DB  127,255                             ; jg            2bf68 <.literal16+0x588>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            2bc0c <.literal16+0x58c>
+  DB  127,255                             ; jg            2bf6c <.literal16+0x58c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2bc11 <.literal16+0x591>
+  DB  127,0                               ; jg            2bf71 <.literal16+0x591>
   DB  0,128,56,0,0,128                    ; add           %al,-0x7fffffc8(%rax)
   DB  56,0                                ; cmp           %al,(%rax)
   DB  0,128,56,0,0,128                    ; add           %al,-0x7fffffc8(%rax)
@@ -42962,13 +43097,13 @@
   DB  64,254                              ; rex           (bad)
   DB  255,0                               ; incl          (%rax)
   DB  255                                 ; (bad)
-  DB  127,71                              ; jg            2bc7b <.literal16+0x5fb>
+  DB  127,71                              ; jg            2bfdb <.literal16+0x5fb>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            2bc7f <.literal16+0x5ff>
+  DB  127,71                              ; jg            2bfdf <.literal16+0x5ff>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            2bc83 <.literal16+0x603>
+  DB  127,71                              ; jg            2bfe3 <.literal16+0x603>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            2bc87 <.literal16+0x607>
+  DB  127,71                              ; jg            2bfe7 <.literal16+0x607>
   DB  208                                 ; (bad)
   DB  179,89                              ; mov           $0x59,%bl
   DB  62,208                              ; ds            (bad)
@@ -42998,10 +43133,10 @@
   DB  61,152,221,147,61                   ; cmp           $0x3d93dd98,%eax
   DB  152                                 ; cwtl
   DB  221,147,61,45,16,17                 ; fstl          0x11102d3d(%rbx)
-  DB  192,45,16,17,192,45,16              ; shrb          $0x10,0x2dc01110(%rip)        # 2dc2cd8a <_sk_srcover_rgba_8888_sse2_lowp+0x2dc020e2>
+  DB  192,45,16,17,192,45,16              ; shrb          $0x10,0x2dc01110(%rip)        # 2dc2d0ea <_sk_srcover_rgba_8888_sse2_lowp+0x2dc020e6>
   DB  17,192                              ; adc           %eax,%eax
   DB  45,16,17,192,18                     ; sub           $0x12c01110,%eax
-  DB  120,57                              ; js            2bcbc <.literal16+0x63c>
+  DB  120,57                              ; js            2c01c <.literal16+0x63c>
   DB  64,18,120,57                        ; adc           0x39(%rax),%dil
   DB  64,18,120,57                        ; adc           0x39(%rax),%dil
   DB  64,18,120,57                        ; adc           0x39(%rax),%dil
@@ -43066,13 +43201,13 @@
   DB  192,191,0,0,192,191,0               ; sarb          $0x0,-0x40400000(%rdi)
   DB  0,192                               ; add           %al,%al
   DB  191,0,0,192,191                     ; mov           $0xbfc00000,%edi
-  DB  114,28                              ; jb            2bd6e <.literal16+0x6ee>
+  DB  114,28                              ; jb            2c0ce <.literal16+0x6ee>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         2bd72 <.literal16+0x6f2>
+  DB  62,114,28                           ; jb,pt         2c0d2 <.literal16+0x6f2>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         2bd76 <.literal16+0x6f6>
+  DB  62,114,28                           ; jb,pt         2c0d6 <.literal16+0x6f6>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         2bd7a <.literal16+0x6fa>
+  DB  62,114,28                           ; jb,pt         2c0da <.literal16+0x6fa>
   DB  199                                 ; (bad)
   DB  62,85                               ; ds            push %rbp
   DB  85                                  ; push          %rbp
@@ -43091,15 +43226,15 @@
   DB  0,192                               ; add           %al,%al
   DB  63                                  ; (bad)
   DB  57,142,99,61,57,142                 ; cmp           %ecx,-0x71c6c29d(%rsi)
-  DB  99,61,57,142,99,61                  ; movslq        0x3d638e39(%rip),%edi        # 3d664bc5 <_sk_srcover_rgba_8888_sse2_lowp+0x3d639f1d>
+  DB  99,61,57,142,99,61                  ; movslq        0x3d638e39(%rip),%edi        # 3d664f25 <_sk_srcover_rgba_8888_sse2_lowp+0x3d639f21>
   DB  57,142,99,61,114,249                ; cmp           %ecx,-0x68dc29d(%rsi)
-  DB  127,63                              ; jg            2bdd3 <.literal16+0x753>
-  DB  114,249                             ; jb            2bd8f <.literal16+0x70f>
-  DB  127,63                              ; jg            2bdd7 <.literal16+0x757>
-  DB  114,249                             ; jb            2bd93 <.literal16+0x713>
-  DB  127,63                              ; jg            2bddb <.literal16+0x75b>
-  DB  114,249                             ; jb            2bd97 <.literal16+0x717>
-  DB  127,63                              ; jg            2bddf <.literal16+0x75f>
+  DB  127,63                              ; jg            2c133 <.literal16+0x753>
+  DB  114,249                             ; jb            2c0ef <.literal16+0x70f>
+  DB  127,63                              ; jg            2c137 <.literal16+0x757>
+  DB  114,249                             ; jb            2c0f3 <.literal16+0x713>
+  DB  127,63                              ; jg            2c13b <.literal16+0x75b>
+  DB  114,249                             ; jb            2c0f7 <.literal16+0x717>
+  DB  127,63                              ; jg            2c13f <.literal16+0x75f>
   DB  3,0                                 ; add           (%rax),%eax
   DB  0,0                                 ; add           %al,(%rax)
   DB  3,0                                 ; add           (%rax),%eax
@@ -43209,14 +43344,14 @@
   DB  0,248                               ; add           %bh,%al
   DB  0,248                               ; add           %bh,%al
   DB  0,248                               ; add           %bh,%al
-  DB  224,255                             ; loopne        2be71 <.literal16+0x7f1>
-  DB  224,255                             ; loopne        2be73 <.literal16+0x7f3>
-  DB  224,255                             ; loopne        2be75 <.literal16+0x7f5>
-  DB  224,255                             ; loopne        2be77 <.literal16+0x7f7>
-  DB  224,255                             ; loopne        2be79 <.literal16+0x7f9>
-  DB  224,255                             ; loopne        2be7b <.literal16+0x7fb>
-  DB  224,255                             ; loopne        2be7d <.literal16+0x7fd>
-  DB  224,255                             ; loopne        2be7f <.literal16+0x7ff>
+  DB  224,255                             ; loopne        2c1d1 <.literal16+0x7f1>
+  DB  224,255                             ; loopne        2c1d3 <.literal16+0x7f3>
+  DB  224,255                             ; loopne        2c1d5 <.literal16+0x7f5>
+  DB  224,255                             ; loopne        2c1d7 <.literal16+0x7f7>
+  DB  224,255                             ; loopne        2c1d9 <.literal16+0x7f9>
+  DB  224,255                             ; loopne        2c1db <.literal16+0x7fb>
+  DB  224,255                             ; loopne        2c1dd <.literal16+0x7fd>
+  DB  224,255                             ; loopne        2c1df <.literal16+0x7ff>
   DB  54,0,54                             ; add           %dh,%ss:(%rsi)
   DB  0,54                                ; add           %dh,(%rsi)
   DB  0,54                                ; add           %dh,(%rsi)
@@ -43258,9 +43393,9 @@
   DB  4,0                                 ; add           $0x0,%al
   DB  0,0                                 ; add           %al,(%rax)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            2bedb <.literal8+0x1b>
+  DB  127,0                               ; jg            2c23b <.literal8+0x1b>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            2bedf <.literal8+0x1f>
+  DB  127,0                               ; jg            2c23f <.literal8+0x1f>
   DB  0,0                                 ; add           %al,(%rax)
   DB  128,0,0                             ; addb          $0x0,(%rax)
   DB  0                                   ; .byte         0x0
@@ -43349,11 +43484,11 @@
   DB  102,15,110,2                        ; movd          (%edx),%xmm0
   DB  102,15,112,192,0                    ; pshufd        $0x0,%xmm0,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,88,128,93,203,0,0                ; addps         0xcb5d(%eax),%xmm0
+  DB  15,88,128,237,203,0,0               ; addps         0xcbed(%eax),%xmm0
   DB  102,15,110,74,4                     ; movd          0x4(%edx),%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,88,136,109,203,0,0               ; addps         0xcb6d(%eax),%xmm1
+  DB  15,88,136,253,203,0,0               ; addps         0xcbfd(%eax),%xmm1
   DB  141,113,4                           ; lea           0x4(%ecx),%esi
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  15,41,82,64                         ; movaps        %xmm2,0x40(%edx)
@@ -43361,7 +43496,7 @@
   DB  15,41,82,32                         ; movaps        %xmm2,0x20(%edx)
   DB  15,41,82,16                         ; movaps        %xmm2,0x10(%edx)
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,144,125,203,0,0               ; movaps        0xcb7d(%eax),%xmm2
+  DB  15,40,144,13,204,0,0                ; movaps        0xcc0d(%eax),%xmm2
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  86                                  ; push          %esi
   DB  82                                  ; push          %edx
@@ -43386,15 +43521,15 @@
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  102,15,110,32                       ; movd          (%eax),%xmm4
   DB  102,15,112,228,0                    ; pshufd        $0x0,%xmm4,%xmm4
-  DB  102,15,254,161,24,203,0,0           ; paddd         0xcb18(%ecx),%xmm4
+  DB  102,15,254,161,168,203,0,0          ; paddd         0xcba8(%ecx),%xmm4
   DB  102,15,110,104,4                    ; movd          0x4(%eax),%xmm5
   DB  102,15,112,253,0                    ; pshufd        $0x0,%xmm5,%xmm7
   DB  102,15,239,252                      ; pxor          %xmm4,%xmm7
-  DB  102,15,111,177,40,203,0,0           ; movdqa        0xcb28(%ecx),%xmm6
+  DB  102,15,111,177,184,203,0,0          ; movdqa        0xcbb8(%ecx),%xmm6
   DB  102,15,111,207                      ; movdqa        %xmm7,%xmm1
   DB  102,15,219,206                      ; pand          %xmm6,%xmm1
   DB  102,15,114,241,5                    ; pslld         $0x5,%xmm1
-  DB  102,15,111,129,72,203,0,0           ; movdqa        0xcb48(%ecx),%xmm0
+  DB  102,15,111,129,216,203,0,0          ; movdqa        0xcbd8(%ecx),%xmm0
   DB  102,15,111,239                      ; movdqa        %xmm7,%xmm5
   DB  102,15,219,232                      ; pand          %xmm0,%xmm5
   DB  102,15,114,245,2                    ; pslld         $0x2,%xmm5
@@ -43404,7 +43539,7 @@
   DB  102,15,219,196                      ; pand          %xmm4,%xmm0
   DB  102,15,254,192                      ; paddd         %xmm0,%xmm0
   DB  102,15,235,198                      ; por           %xmm6,%xmm0
-  DB  102,15,111,137,56,203,0,0           ; movdqa        0xcb38(%ecx),%xmm1
+  DB  102,15,111,137,200,203,0,0          ; movdqa        0xcbc8(%ecx),%xmm1
   DB  102,15,219,249                      ; pand          %xmm1,%xmm7
   DB  102,15,219,225                      ; pand          %xmm1,%xmm4
   DB  102,15,114,212,2                    ; psrld         $0x2,%xmm4
@@ -43415,8 +43550,8 @@
   DB  102,15,114,215,1                    ; psrld         $0x1,%xmm7
   DB  102,15,235,231                      ; por           %xmm7,%xmm4
   DB  15,91,196                           ; cvtdq2ps      %xmm4,%xmm0
-  DB  15,89,129,88,203,0,0                ; mulps         0xcb58(%ecx),%xmm0
-  DB  15,88,129,104,203,0,0               ; addps         0xcb68(%ecx),%xmm0
+  DB  15,89,129,232,203,0,0               ; mulps         0xcbe8(%ecx),%xmm0
+  DB  15,88,129,248,203,0,0               ; addps         0xcbf8(%ecx),%xmm0
   DB  243,15,16,14                        ; movss         (%esi),%xmm1
   DB  15,198,201,0                        ; shufps        $0x0,%xmm1,%xmm1
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
@@ -43480,7 +43615,7 @@
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  141,81,4                            ; lea           0x4(%ecx),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,152,204,201,0,0               ; movaps        0xc9cc(%eax),%xmm3
+  DB  15,40,152,92,202,0,0                ; movaps        0xca5c(%eax),%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -43501,7 +43636,7 @@
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  141,81,4                            ; lea           0x4(%ecx),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,128,156,201,0,0               ; movaps        0xc99c(%eax),%xmm0
+  DB  15,40,128,44,202,0,0                ; movaps        0xca2c(%eax),%xmm0
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -43583,7 +43718,7 @@
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  15,40,97,64                         ; movaps        0x40(%ecx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
-  DB  15,40,170,237,200,0,0               ; movaps        0xc8ed(%edx),%xmm5
+  DB  15,40,170,125,201,0,0               ; movaps        0xc97d(%edx),%xmm5
   DB  15,92,235                           ; subps         %xmm3,%xmm5
   DB  15,40,113,16                        ; movaps        0x10(%ecx),%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
@@ -43620,7 +43755,7 @@
   DB  15,40,105,64                        ; movaps        0x40(%ecx),%xmm5
   DB  15,40,113,16                        ; movaps        0x10(%ecx),%xmm6
   DB  15,89,243                           ; mulps         %xmm3,%xmm6
-  DB  15,40,162,142,200,0,0               ; movaps        0xc88e(%edx),%xmm4
+  DB  15,40,162,30,201,0,0                ; movaps        0xc91e(%edx),%xmm4
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  15,88,198                           ; addps         %xmm6,%xmm0
@@ -43698,7 +43833,7 @@
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,85,8                            ; mov           0x8(%ebp),%edx
-  DB  15,40,160,205,199,0,0               ; movaps        0xc7cd(%eax),%xmm4
+  DB  15,40,160,93,200,0,0                ; movaps        0xc85d(%eax),%xmm4
   DB  15,92,98,64                         ; subps         0x40(%edx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
@@ -43722,7 +43857,7 @@
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,85,8                            ; mov           0x8(%ebp),%edx
-  DB  15,40,160,149,199,0,0               ; movaps        0xc795(%eax),%xmm4
+  DB  15,40,160,37,200,0,0                ; movaps        0xc825(%eax),%xmm4
   DB  15,92,227                           ; subps         %xmm3,%xmm4
   DB  15,40,66,16                         ; movaps        0x10(%edx),%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
@@ -43750,7 +43885,7 @@
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,85,8                            ; mov           0x8(%ebp),%edx
-  DB  15,40,160,78,199,0,0                ; movaps        0xc74e(%eax),%xmm4
+  DB  15,40,160,222,199,0,0               ; movaps        0xc7de(%eax),%xmm4
   DB  15,92,227                           ; subps         %xmm3,%xmm4
   DB  15,40,106,16                        ; movaps        0x10(%edx),%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
@@ -43782,7 +43917,7 @@
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,85,8                            ; mov           0x8(%ebp),%edx
   DB  15,40,106,64                        ; movaps        0x40(%edx),%xmm5
-  DB  15,40,160,254,198,0,0               ; movaps        0xc6fe(%eax),%xmm4
+  DB  15,40,160,142,199,0,0               ; movaps        0xc78e(%eax),%xmm4
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  15,88,66,16                         ; addps         0x10(%edx),%xmm0
@@ -43834,7 +43969,7 @@
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  15,40,80,64                         ; movaps        0x40(%eax),%xmm2
   DB  15,41,85,200                        ; movaps        %xmm2,-0x38(%ebp)
-  DB  15,40,129,127,198,0,0               ; movaps        0xc67f(%ecx),%xmm0
+  DB  15,40,129,15,199,0,0                ; movaps        0xc70f(%ecx),%xmm0
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  15,92,242                           ; subps         %xmm2,%xmm6
   DB  15,40,254                           ; movaps        %xmm6,%xmm7
@@ -43892,7 +44027,7 @@
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,85,8                            ; mov           0x8(%ebp),%edx
   DB  15,88,66,16                         ; addps         0x10(%edx),%xmm0
-  DB  15,40,160,217,197,0,0               ; movaps        0xc5d9(%eax),%xmm4
+  DB  15,40,160,105,198,0,0               ; movaps        0xc669(%eax),%xmm4
   DB  15,93,196                           ; minps         %xmm4,%xmm0
   DB  15,88,74,32                         ; addps         0x20(%edx),%xmm1
   DB  15,93,204                           ; minps         %xmm4,%xmm1
@@ -43960,7 +44095,7 @@
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  15,40,105,64                        ; movaps        0x40(%ecx),%xmm5
-  DB  15,40,154,43,197,0,0                ; movaps        0xc52b(%edx),%xmm3
+  DB  15,40,154,187,197,0,0               ; movaps        0xc5bb(%edx),%xmm3
   DB  15,40,243                           ; movaps        %xmm3,%xmm6
   DB  15,92,245                           ; subps         %xmm5,%xmm6
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
@@ -44020,7 +44155,7 @@
   DB  15,89,203                           ; mulps         %xmm3,%xmm1
   DB  15,95,209                           ; maxps         %xmm1,%xmm2
   DB  15,92,234                           ; subps         %xmm2,%xmm5
-  DB  15,40,138,195,196,0,0               ; movaps        0xc4c3(%edx),%xmm1
+  DB  15,40,138,83,197,0,0                ; movaps        0xc553(%edx),%xmm1
   DB  15,92,203                           ; subps         %xmm3,%xmm1
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
   DB  15,88,217                           ; addps         %xmm1,%xmm3
@@ -44067,7 +44202,7 @@
   DB  15,89,203                           ; mulps         %xmm3,%xmm1
   DB  15,93,209                           ; minps         %xmm1,%xmm2
   DB  15,92,234                           ; subps         %xmm2,%xmm5
-  DB  15,40,138,67,196,0,0                ; movaps        0xc443(%edx),%xmm1
+  DB  15,40,138,211,196,0,0               ; movaps        0xc4d3(%edx),%xmm1
   DB  15,92,203                           ; subps         %xmm3,%xmm1
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
   DB  15,88,217                           ; addps         %xmm1,%xmm3
@@ -44118,7 +44253,7 @@
   DB  15,93,214                           ; minps         %xmm6,%xmm2
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  15,92,226                           ; subps         %xmm2,%xmm4
-  DB  15,40,146,192,195,0,0               ; movaps        0xc3c0(%edx),%xmm2
+  DB  15,40,146,80,196,0,0                ; movaps        0xc450(%edx),%xmm2
   DB  15,92,211                           ; subps         %xmm3,%xmm2
   DB  15,89,213                           ; mulps         %xmm5,%xmm2
   DB  15,88,218                           ; addps         %xmm2,%xmm3
@@ -44160,7 +44295,7 @@
   DB  15,89,202                           ; mulps         %xmm2,%xmm1
   DB  15,88,201                           ; addps         %xmm1,%xmm1
   DB  15,92,233                           ; subps         %xmm1,%xmm5
-  DB  15,40,138,58,195,0,0                ; movaps        0xc33a(%edx),%xmm1
+  DB  15,40,138,202,195,0,0               ; movaps        0xc3ca(%edx),%xmm1
   DB  15,92,203                           ; subps         %xmm3,%xmm1
   DB  15,89,73,64                         ; mulps         0x40(%ecx),%xmm1
   DB  15,88,217                           ; addps         %xmm1,%xmm3
@@ -44199,7 +44334,7 @@
   DB  15,93,198                           ; minps         %xmm6,%xmm0
   DB  15,40,233                           ; movaps        %xmm1,%xmm5
   DB  15,92,232                           ; subps         %xmm0,%xmm5
-  DB  15,40,177,187,194,0,0               ; movaps        0xc2bb(%ecx),%xmm6
+  DB  15,40,177,75,195,0,0                ; movaps        0xc34b(%ecx),%xmm6
   DB  15,40,198                           ; movaps        %xmm6,%xmm0
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,41,69,200                        ; movaps        %xmm0,-0x38(%ebp)
@@ -44314,7 +44449,7 @@
   DB  89                                  ; pop           %ecx
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  15,40,72,16                         ; movaps        0x10(%eax),%xmm1
-  DB  15,40,145,50,193,0,0                ; movaps        0xc132(%ecx),%xmm2
+  DB  15,40,145,194,193,0,0               ; movaps        0xc1c2(%ecx),%xmm2
   DB  15,40,226                           ; movaps        %xmm2,%xmm4
   DB  15,92,214                           ; subps         %xmm6,%xmm2
   DB  15,40,250                           ; movaps        %xmm2,%xmm7
@@ -44429,7 +44564,7 @@
   DB  89                                  ; pop           %ecx
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  15,40,72,64                         ; movaps        0x40(%eax),%xmm1
-  DB  15,40,145,209,191,0,0               ; movaps        0xbfd1(%ecx),%xmm2
+  DB  15,40,145,97,192,0,0                ; movaps        0xc061(%ecx),%xmm2
   DB  15,40,234                           ; movaps        %xmm2,%xmm5
   DB  15,92,233                           ; subps         %xmm1,%xmm5
   DB  15,40,225                           ; movaps        %xmm1,%xmm4
@@ -44537,7 +44672,7 @@
   DB  89                                  ; pop           %ecx
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  15,40,80,64                         ; movaps        0x40(%eax),%xmm2
-  DB  15,40,161,134,190,0,0               ; movaps        0xbe86(%ecx),%xmm4
+  DB  15,40,161,22,191,0,0                ; movaps        0xbf16(%ecx),%xmm4
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  15,92,242                           ; subps         %xmm2,%xmm6
   DB  15,40,206                           ; movaps        %xmm6,%xmm1
@@ -44663,17 +44798,17 @@
   DB  232,0,0,0,0                         ; call          f2a <_sk_softlight_sse2+0x52>
   DB  89                                  ; pop           %ecx
   DB  15,40,194                           ; movaps        %xmm2,%xmm0
-  DB  15,40,137,102,189,0,0               ; movaps        0xbd66(%ecx),%xmm1
+  DB  15,40,137,246,189,0,0               ; movaps        0xbdf6(%ecx),%xmm1
   DB  15,41,141,104,255,255,255           ; movaps        %xmm1,-0x98(%ebp)
   DB  15,88,193                           ; addps         %xmm1,%xmm0
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
-  DB  15,40,185,246,188,0,0               ; movaps        0xbcf6(%ecx),%xmm7
+  DB  15,40,185,134,189,0,0               ; movaps        0xbd86(%ecx),%xmm7
   DB  15,41,125,232                       ; movaps        %xmm7,-0x18(%ebp)
   DB  15,92,250                           ; subps         %xmm2,%xmm7
   DB  15,82,242                           ; rsqrtps       %xmm2,%xmm6
   DB  15,83,206                           ; rcpps         %xmm6,%xmm1
   DB  15,92,202                           ; subps         %xmm2,%xmm1
-  DB  15,40,161,118,189,0,0               ; movaps        0xbd76(%ecx),%xmm4
+  DB  15,40,161,6,190,0,0                 ; movaps        0xbe06(%ecx),%xmm4
   DB  15,41,101,152                       ; movaps        %xmm4,-0x68(%ebp)
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  15,88,208                           ; addps         %xmm0,%xmm2
@@ -44877,7 +45012,7 @@
   DB  15,40,226                           ; movaps        %xmm2,%xmm4
   DB  15,40,72,64                         ; movaps        0x40(%eax),%xmm1
   DB  15,41,77,216                        ; movaps        %xmm1,-0x28(%ebp)
-  DB  15,40,169,53,186,0,0                ; movaps        0xba35(%ecx),%xmm5
+  DB  15,40,169,197,186,0,0               ; movaps        0xbac5(%ecx),%xmm5
   DB  15,92,233                           ; subps         %xmm1,%xmm5
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
   DB  15,41,133,72,255,255,255            ; movaps        %xmm0,-0xb8(%ebp)
@@ -44910,17 +45045,17 @@
   DB  15,89,233                           ; mulps         %xmm1,%xmm5
   DB  15,41,173,120,255,255,255           ; movaps        %xmm5,-0x88(%ebp)
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
-  DB  15,40,153,197,186,0,0               ; movaps        0xbac5(%ecx),%xmm3
+  DB  15,40,153,85,187,0,0                ; movaps        0xbb55(%ecx),%xmm3
   DB  15,41,93,232                        ; movaps        %xmm3,-0x18(%ebp)
   DB  15,40,117,152                       ; movaps        -0x68(%ebp),%xmm6
   DB  15,40,206                           ; movaps        %xmm6,%xmm1
   DB  15,89,203                           ; mulps         %xmm3,%xmm1
-  DB  15,40,153,213,186,0,0               ; movaps        0xbad5(%ecx),%xmm3
+  DB  15,40,153,101,187,0,0               ; movaps        0xbb65(%ecx),%xmm3
   DB  15,40,109,136                       ; movaps        -0x78(%ebp),%xmm5
   DB  15,40,253                           ; movaps        %xmm5,%xmm7
   DB  15,89,251                           ; mulps         %xmm3,%xmm7
   DB  15,88,249                           ; addps         %xmm1,%xmm7
-  DB  15,40,137,53,186,0,0                ; movaps        0xba35(%ecx),%xmm1
+  DB  15,40,137,197,186,0,0               ; movaps        0xbac5(%ecx),%xmm1
   DB  15,92,77,184                        ; subps         -0x48(%ebp),%xmm1
   DB  15,89,241                           ; mulps         %xmm1,%xmm6
   DB  15,41,117,152                       ; movaps        %xmm6,-0x68(%ebp)
@@ -44930,7 +45065,7 @@
   DB  15,40,77,200                        ; movaps        -0x38(%ebp),%xmm1
   DB  15,89,241                           ; mulps         %xmm1,%xmm6
   DB  15,41,117,168                       ; movaps        %xmm6,-0x58(%ebp)
-  DB  15,40,169,229,186,0,0               ; movaps        0xbae5(%ecx),%xmm5
+  DB  15,40,169,117,187,0,0               ; movaps        0xbb75(%ecx),%xmm5
   DB  15,89,205                           ; mulps         %xmm5,%xmm1
   DB  15,88,207                           ; addps         %xmm7,%xmm1
   DB  15,94,212                           ; divps         %xmm4,%xmm2
@@ -45121,17 +45256,17 @@
   DB  15,89,253                           ; mulps         %xmm5,%xmm7
   DB  232,0,0,0,0                         ; call          153f <_sk_saturation_sse2+0xb0>
   DB  89                                  ; pop           %ecx
-  DB  15,40,153,113,183,0,0               ; movaps        0xb771(%ecx),%xmm3
+  DB  15,40,153,1,184,0,0                 ; movaps        0xb801(%ecx),%xmm3
   DB  15,41,157,88,255,255,255            ; movaps        %xmm3,-0xa8(%ebp)
   DB  15,40,77,184                        ; movaps        -0x48(%ebp),%xmm1
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,40,153,129,183,0,0               ; movaps        0xb781(%ecx),%xmm3
+  DB  15,40,153,17,184,0,0                ; movaps        0xb811(%ecx),%xmm3
   DB  15,41,93,232                        ; movaps        %xmm3,-0x18(%ebp)
   DB  15,40,238                           ; movaps        %xmm6,%xmm5
   DB  15,89,235                           ; mulps         %xmm3,%xmm5
   DB  15,88,232                           ; addps         %xmm0,%xmm5
-  DB  15,40,129,225,182,0,0               ; movaps        0xb6e1(%ecx),%xmm0
+  DB  15,40,129,113,183,0,0               ; movaps        0xb771(%ecx),%xmm0
   DB  15,41,133,104,255,255,255           ; movaps        %xmm0,-0x98(%ebp)
   DB  15,92,69,216                        ; subps         -0x28(%ebp),%xmm0
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
@@ -45143,7 +45278,7 @@
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
   DB  15,41,141,120,255,255,255           ; movaps        %xmm1,-0x88(%ebp)
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
-  DB  15,40,129,145,183,0,0               ; movaps        0xb791(%ecx),%xmm0
+  DB  15,40,129,33,184,0,0                ; movaps        0xb821(%ecx),%xmm0
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
   DB  15,88,205                           ; addps         %xmm5,%xmm1
   DB  15,40,109,168                       ; movaps        -0x58(%ebp),%xmm5
@@ -45300,16 +45435,16 @@
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  15,40,80,16                         ; movaps        0x10(%eax),%xmm2
   DB  15,40,72,32                         ; movaps        0x20(%eax),%xmm1
-  DB  15,40,177,22,181,0,0                ; movaps        0xb516(%ecx),%xmm6
+  DB  15,40,177,166,181,0,0               ; movaps        0xb5a6(%ecx),%xmm6
   DB  15,41,117,216                       ; movaps        %xmm6,-0x28(%ebp)
   DB  15,40,194                           ; movaps        %xmm2,%xmm0
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
-  DB  15,40,153,38,181,0,0                ; movaps        0xb526(%ecx),%xmm3
+  DB  15,40,153,182,181,0,0               ; movaps        0xb5b6(%ecx),%xmm3
   DB  15,41,93,184                        ; movaps        %xmm3,-0x48(%ebp)
   DB  15,40,241                           ; movaps        %xmm1,%xmm6
   DB  15,89,243                           ; mulps         %xmm3,%xmm6
   DB  15,88,240                           ; addps         %xmm0,%xmm6
-  DB  15,40,129,134,180,0,0               ; movaps        0xb486(%ecx),%xmm0
+  DB  15,40,129,22,181,0,0                ; movaps        0xb516(%ecx),%xmm0
   DB  15,41,69,168                        ; movaps        %xmm0,-0x58(%ebp)
   DB  15,92,69,200                        ; subps         -0x38(%ebp),%xmm0
   DB  15,89,208                           ; mulps         %xmm0,%xmm2
@@ -45319,7 +45454,7 @@
   DB  15,40,80,48                         ; movaps        0x30(%eax),%xmm2
   DB  15,89,194                           ; mulps         %xmm2,%xmm0
   DB  15,41,133,72,255,255,255            ; movaps        %xmm0,-0xb8(%ebp)
-  DB  15,40,137,54,181,0,0                ; movaps        0xb536(%ecx),%xmm1
+  DB  15,40,137,198,181,0,0               ; movaps        0xb5c6(%ecx),%xmm1
   DB  15,89,209                           ; mulps         %xmm1,%xmm2
   DB  15,88,214                           ; addps         %xmm6,%xmm2
   DB  15,40,88,64                         ; movaps        0x40(%eax),%xmm3
@@ -45476,18 +45611,18 @@
   DB  232,0,0,0,0                         ; call          19fd <_sk_luminosity_sse2+0x11>
   DB  89                                  ; pop           %ecx
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
-  DB  15,40,161,179,178,0,0               ; movaps        0xb2b3(%ecx),%xmm4
+  DB  15,40,161,67,179,0,0                ; movaps        0xb343(%ecx),%xmm4
   DB  15,41,101,232                       ; movaps        %xmm4,-0x18(%ebp)
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
-  DB  15,40,161,195,178,0,0               ; movaps        0xb2c3(%ecx),%xmm4
+  DB  15,40,161,83,179,0,0                ; movaps        0xb353(%ecx),%xmm4
   DB  15,41,101,216                       ; movaps        %xmm4,-0x28(%ebp)
   DB  15,40,233                           ; movaps        %xmm1,%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
   DB  15,88,234                           ; addps         %xmm2,%xmm5
   DB  15,40,80,64                         ; movaps        0x40(%eax),%xmm2
   DB  15,41,85,184                        ; movaps        %xmm2,-0x48(%ebp)
-  DB  15,40,161,35,178,0,0                ; movaps        0xb223(%ecx),%xmm4
+  DB  15,40,161,179,178,0,0               ; movaps        0xb2b3(%ecx),%xmm4
   DB  15,40,252                           ; movaps        %xmm4,%xmm7
   DB  15,92,250                           ; subps         %xmm2,%xmm7
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
@@ -45497,7 +45632,7 @@
   DB  15,89,254                           ; mulps         %xmm6,%xmm7
   DB  15,41,189,104,255,255,255           ; movaps        %xmm7,-0x98(%ebp)
   DB  15,40,214                           ; movaps        %xmm6,%xmm2
-  DB  15,40,137,211,178,0,0               ; movaps        0xb2d3(%ecx),%xmm1
+  DB  15,40,137,99,179,0,0                ; movaps        0xb363(%ecx),%xmm1
   DB  15,89,209                           ; mulps         %xmm1,%xmm2
   DB  15,88,213                           ; addps         %xmm5,%xmm2
   DB  15,40,104,16                        ; movaps        0x10(%eax),%xmm5
@@ -45671,7 +45806,7 @@
   DB  139,49                              ; mov           (%ecx),%esi
   DB  15,133,224,0,0,0                    ; jne           1d6a <_sk_srcover_rgba_8888_sse2+0x119>
   DB  243,15,111,20,178                   ; movdqu        (%edx,%esi,4),%xmm2
-  DB  102,15,111,167,120,176,0,0          ; movdqa        0xb078(%edi),%xmm4
+  DB  102,15,111,167,8,177,0,0            ; movdqa        0xb108(%edi),%xmm4
   DB  102,15,111,234                      ; movdqa        %xmm2,%xmm5
   DB  102,15,219,236                      ; pand          %xmm4,%xmm5
   DB  102,15,111,242                      ; movdqa        %xmm2,%xmm6
@@ -45682,9 +45817,9 @@
   DB  102,15,219,252                      ; pand          %xmm4,%xmm7
   DB  15,91,229                           ; cvtdq2ps      %xmm5,%xmm4
   DB  15,41,97,16                         ; movaps        %xmm4,0x10(%ecx)
-  DB  15,40,175,184,175,0,0               ; movaps        0xafb8(%edi),%xmm5
+  DB  15,40,175,72,176,0,0                ; movaps        0xb048(%edi),%xmm5
   DB  15,92,235                           ; subps         %xmm3,%xmm5
-  DB  15,40,143,136,176,0,0               ; movaps        0xb088(%edi),%xmm1
+  DB  15,40,143,24,177,0,0                ; movaps        0xb118(%edi),%xmm1
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
   DB  15,88,224                           ; addps         %xmm0,%xmm4
@@ -45794,7 +45929,7 @@
   DB  232,0,0,0,0                         ; call          1e14 <_sk_clamp_1_sse2+0xb>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
-  DB  15,40,160,12,174,0,0                ; movaps        0xae0c(%eax),%xmm4
+  DB  15,40,160,156,174,0,0               ; movaps        0xae9c(%eax),%xmm4
   DB  15,93,196                           ; minps         %xmm4,%xmm0
   DB  15,93,204                           ; minps         %xmm4,%xmm1
   DB  15,93,212                           ; minps         %xmm4,%xmm2
@@ -45816,7 +45951,7 @@
   DB  232,0,0,0,0                         ; call          1e47 <_sk_clamp_a_sse2+0xb>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
-  DB  15,93,152,217,173,0,0               ; minps         0xadd9(%eax),%xmm3
+  DB  15,93,152,105,174,0,0               ; minps         0xae69(%eax),%xmm3
   DB  15,93,195                           ; minps         %xmm3,%xmm0
   DB  15,93,203                           ; minps         %xmm3,%xmm1
   DB  15,93,211                           ; minps         %xmm3,%xmm2
@@ -45839,7 +45974,7 @@
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,85,8                            ; mov           0x8(%ebp),%edx
   DB  15,40,98,64                         ; movaps        0x40(%edx),%xmm4
-  DB  15,93,160,169,173,0,0               ; minps         0xada9(%eax),%xmm4
+  DB  15,93,160,57,174,0,0                ; minps         0xae39(%eax),%xmm4
   DB  15,41,98,64                         ; movaps        %xmm4,0x40(%edx)
   DB  15,40,106,16                        ; movaps        0x10(%edx),%xmm5
   DB  15,40,114,32                        ; movaps        0x20(%edx),%xmm6
@@ -45907,7 +46042,7 @@
   DB  232,0,0,0,0                         ; call          1f22 <_sk_invert_sse2+0xb>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
-  DB  15,40,160,254,172,0,0               ; movaps        0xacfe(%eax),%xmm4
+  DB  15,40,160,142,173,0,0               ; movaps        0xad8e(%eax),%xmm4
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,92,232                           ; subps         %xmm0,%xmm5
   DB  15,40,244                           ; movaps        %xmm4,%xmm6
@@ -46020,7 +46155,7 @@
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  15,40,168,0,172,0,0                 ; movaps        0xac00(%eax),%xmm5
+  DB  15,40,168,144,172,0,0               ; movaps        0xac90(%eax),%xmm5
   DB  15,94,235                           ; divps         %xmm3,%xmm5
   DB  15,194,227,4                        ; cmpneqps      %xmm3,%xmm4
   DB  15,84,229                           ; andps         %xmm5,%xmm4
@@ -46049,19 +46184,19 @@
   DB  88                                  ; pop           %eax
   DB  15,40,202                           ; movaps        %xmm2,%xmm1
   DB  15,89,201                           ; mulps         %xmm1,%xmm1
-  DB  15,40,160,70,172,0,0                ; movaps        0xac46(%eax),%xmm4
+  DB  15,40,160,214,172,0,0               ; movaps        0xacd6(%eax),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
-  DB  15,40,176,166,172,0,0               ; movaps        0xaca6(%eax),%xmm6
+  DB  15,40,176,54,173,0,0                ; movaps        0xad36(%eax),%xmm6
   DB  15,41,117,216                       ; movaps        %xmm6,-0x28(%ebp)
   DB  15,88,198                           ; addps         %xmm6,%xmm0
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
-  DB  15,40,176,150,172,0,0               ; movaps        0xac96(%eax),%xmm6
+  DB  15,40,176,38,173,0,0                ; movaps        0xad26(%eax),%xmm6
   DB  15,40,202                           ; movaps        %xmm2,%xmm1
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
-  DB  15,40,184,182,172,0,0               ; movaps        0xacb6(%eax),%xmm7
+  DB  15,40,184,70,173,0,0                ; movaps        0xad46(%eax),%xmm7
   DB  15,41,125,232                       ; movaps        %xmm7,-0x18(%ebp)
   DB  15,88,199                           ; addps         %xmm7,%xmm0
-  DB  15,40,184,198,172,0,0               ; movaps        0xacc6(%eax),%xmm7
+  DB  15,40,184,86,173,0,0                ; movaps        0xad56(%eax),%xmm7
   DB  15,194,215,1                        ; cmpltps       %xmm7,%xmm2
   DB  15,84,202                           ; andps         %xmm2,%xmm1
   DB  15,85,208                           ; andnps        %xmm0,%xmm2
@@ -46119,18 +46254,18 @@
   DB  15,40,72,16                         ; movaps        0x10(%eax),%xmm1
   DB  15,40,233                           ; movaps        %xmm1,%xmm5
   DB  15,89,237                           ; mulps         %xmm5,%xmm5
-  DB  15,40,161,107,171,0,0               ; movaps        0xab6b(%ecx),%xmm4
+  DB  15,40,161,251,171,0,0               ; movaps        0xabfb(%ecx),%xmm4
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
-  DB  15,40,177,203,171,0,0               ; movaps        0xabcb(%ecx),%xmm6
+  DB  15,40,177,91,172,0,0                ; movaps        0xac5b(%ecx),%xmm6
   DB  15,88,198                           ; addps         %xmm6,%xmm0
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
-  DB  15,40,169,187,171,0,0               ; movaps        0xabbb(%ecx),%xmm5
+  DB  15,40,169,75,172,0,0                ; movaps        0xac4b(%ecx),%xmm5
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  15,89,213                           ; mulps         %xmm5,%xmm2
-  DB  15,40,185,219,171,0,0               ; movaps        0xabdb(%ecx),%xmm7
+  DB  15,40,185,107,172,0,0               ; movaps        0xac6b(%ecx),%xmm7
   DB  15,88,199                           ; addps         %xmm7,%xmm0
-  DB  15,40,153,235,171,0,0               ; movaps        0xabeb(%ecx),%xmm3
+  DB  15,40,153,123,172,0,0               ; movaps        0xac7b(%ecx),%xmm3
   DB  15,194,203,1                        ; cmpltps       %xmm3,%xmm1
   DB  15,84,209                           ; andps         %xmm1,%xmm2
   DB  15,85,200                           ; andnps        %xmm0,%xmm1
@@ -46190,25 +46325,25 @@
   DB  232,0,0,0,0                         ; call          2230 <_sk_to_srgb_sse2+0x18>
   DB  88                                  ; pop           %eax
   DB  15,82,218                           ; rsqrtps       %xmm2,%xmm3
-  DB  15,40,160,32,171,0,0                ; movaps        0xab20(%eax),%xmm4
+  DB  15,40,160,176,171,0,0               ; movaps        0xabb0(%eax),%xmm4
   DB  15,40,235                           ; movaps        %xmm3,%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
-  DB  15,40,128,48,171,0,0                ; movaps        0xab30(%eax),%xmm0
+  DB  15,40,128,192,171,0,0               ; movaps        0xabc0(%eax),%xmm0
   DB  15,41,69,232                        ; movaps        %xmm0,-0x18(%ebp)
   DB  15,88,232                           ; addps         %xmm0,%xmm5
   DB  15,89,235                           ; mulps         %xmm3,%xmm5
-  DB  15,40,128,64,171,0,0                ; movaps        0xab40(%eax),%xmm0
+  DB  15,40,128,208,171,0,0               ; movaps        0xabd0(%eax),%xmm0
   DB  15,41,69,200                        ; movaps        %xmm0,-0x38(%ebp)
   DB  15,88,232                           ; addps         %xmm0,%xmm5
-  DB  15,40,128,80,171,0,0                ; movaps        0xab50(%eax),%xmm0
+  DB  15,40,128,224,171,0,0               ; movaps        0xabe0(%eax),%xmm0
   DB  15,41,69,216                        ; movaps        %xmm0,-0x28(%ebp)
   DB  15,88,216                           ; addps         %xmm0,%xmm3
   DB  15,83,195                           ; rcpps         %xmm3,%xmm0
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
-  DB  15,40,168,16,171,0,0                ; movaps        0xab10(%eax),%xmm5
+  DB  15,40,168,160,171,0,0               ; movaps        0xaba0(%eax),%xmm5
   DB  15,40,202                           ; movaps        %xmm2,%xmm1
   DB  15,89,205                           ; mulps         %xmm5,%xmm1
-  DB  15,40,152,96,171,0,0                ; movaps        0xab60(%eax),%xmm3
+  DB  15,40,152,240,171,0,0               ; movaps        0xabf0(%eax),%xmm3
   DB  15,194,211,1                        ; cmpltps       %xmm3,%xmm2
   DB  15,84,202                           ; andps         %xmm2,%xmm1
   DB  15,85,208                           ; andnps        %xmm0,%xmm2
@@ -46277,14 +46412,14 @@
   DB  15,40,195                           ; movaps        %xmm3,%xmm0
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,41,69,216                        ; movaps        %xmm0,-0x28(%ebp)
-  DB  15,40,136,249,168,0,0               ; movaps        0xa8f9(%eax),%xmm1
+  DB  15,40,136,137,169,0,0               ; movaps        0xa989(%eax),%xmm1
   DB  15,94,200                           ; divps         %xmm0,%xmm1
   DB  15,40,199                           ; movaps        %xmm7,%xmm0
   DB  15,92,194                           ; subps         %xmm2,%xmm0
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
   DB  15,40,239                           ; movaps        %xmm7,%xmm5
   DB  15,194,234,1                        ; cmpltps       %xmm2,%xmm5
-  DB  15,84,168,121,170,0,0               ; andps         0xaa79(%eax),%xmm5
+  DB  15,84,168,9,171,0,0                 ; andps         0xab09(%eax),%xmm5
   DB  15,88,232                           ; addps         %xmm0,%xmm5
   DB  15,40,195                           ; movaps        %xmm3,%xmm0
   DB  15,194,196,0                        ; cmpeqps       %xmm4,%xmm0
@@ -46294,9 +46429,9 @@
   DB  15,92,231                           ; subps         %xmm7,%xmm4
   DB  15,89,209                           ; mulps         %xmm1,%xmm2
   DB  15,89,225                           ; mulps         %xmm1,%xmm4
-  DB  15,40,136,137,170,0,0               ; movaps        0xaa89(%eax),%xmm1
+  DB  15,40,136,25,171,0,0                ; movaps        0xab19(%eax),%xmm1
   DB  15,88,209                           ; addps         %xmm1,%xmm2
-  DB  15,88,160,153,170,0,0               ; addps         0xaa99(%eax),%xmm4
+  DB  15,88,160,41,171,0,0                ; addps         0xab29(%eax),%xmm4
   DB  15,84,214                           ; andps         %xmm6,%xmm2
   DB  15,85,244                           ; andnps        %xmm4,%xmm6
   DB  15,86,242                           ; orps          %xmm2,%xmm6
@@ -46308,7 +46443,7 @@
   DB  15,194,226,4                        ; cmpneqps      %xmm2,%xmm4
   DB  15,92,203                           ; subps         %xmm3,%xmm1
   DB  15,88,218                           ; addps         %xmm2,%xmm3
-  DB  15,40,168,233,168,0,0               ; movaps        0xa8e9(%eax),%xmm5
+  DB  15,40,168,121,169,0,0               ; movaps        0xa979(%eax),%xmm5
   DB  15,92,202                           ; subps         %xmm2,%xmm1
   DB  15,40,211                           ; movaps        %xmm3,%xmm2
   DB  15,89,213                           ; mulps         %xmm5,%xmm2
@@ -46318,7 +46453,7 @@
   DB  15,86,233                           ; orps          %xmm1,%xmm5
   DB  15,40,77,216                        ; movaps        -0x28(%ebp),%xmm1
   DB  15,94,205                           ; divps         %xmm5,%xmm1
-  DB  15,89,128,169,170,0,0               ; mulps         0xaaa9(%eax),%xmm0
+  DB  15,89,128,57,171,0,0                ; mulps         0xab39(%eax),%xmm0
   DB  15,84,196                           ; andps         %xmm4,%xmm0
   DB  15,84,204                           ; andps         %xmm4,%xmm1
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
@@ -46341,7 +46476,7 @@
   DB  15,41,69,184                        ; movaps        %xmm0,-0x48(%ebp)
   DB  232,0,0,0,0                         ; call          2422 <_sk_hsl_to_rgb_sse2+0x19>
   DB  88                                  ; pop           %eax
-  DB  15,40,160,238,167,0,0               ; movaps        0xa7ee(%eax),%xmm4
+  DB  15,40,160,126,168,0,0               ; movaps        0xa87e(%eax),%xmm4
   DB  15,40,220                           ; movaps        %xmm4,%xmm3
   DB  15,41,165,104,255,255,255           ; movaps        %xmm4,-0x98(%ebp)
   DB  15,194,218,2                        ; cmpleps       %xmm2,%xmm3
@@ -46354,13 +46489,13 @@
   DB  15,84,243                           ; andps         %xmm3,%xmm6
   DB  15,85,217                           ; andnps        %xmm1,%xmm3
   DB  15,86,222                           ; orps          %xmm6,%xmm3
-  DB  15,40,168,190,169,0,0               ; movaps        0xa9be(%eax),%xmm5
+  DB  15,40,168,78,170,0,0                ; movaps        0xaa4e(%eax),%xmm5
   DB  15,88,232                           ; addps         %xmm0,%xmm5
   DB  243,15,91,205                       ; cvttps2dq     %xmm5,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,194,193,1                        ; cmpltps       %xmm1,%xmm0
-  DB  15,40,176,254,167,0,0               ; movaps        0xa7fe(%eax),%xmm6
+  DB  15,40,176,142,168,0,0               ; movaps        0xa88e(%eax),%xmm6
   DB  15,41,117,136                       ; movaps        %xmm6,-0x78(%ebp)
   DB  15,84,198                           ; andps         %xmm6,%xmm0
   DB  15,92,200                           ; subps         %xmm0,%xmm1
@@ -46370,19 +46505,19 @@
   DB  15,41,93,216                        ; movaps        %xmm3,-0x28(%ebp)
   DB  15,88,210                           ; addps         %xmm2,%xmm2
   DB  15,92,211                           ; subps         %xmm3,%xmm2
-  DB  15,40,184,206,169,0,0               ; movaps        0xa9ce(%eax),%xmm7
+  DB  15,40,184,94,170,0,0                ; movaps        0xaa5e(%eax),%xmm7
   DB  15,41,189,88,255,255,255            ; movaps        %xmm7,-0xa8(%ebp)
   DB  15,194,253,2                        ; cmpleps       %xmm5,%xmm7
   DB  15,92,218                           ; subps         %xmm2,%xmm3
   DB  15,41,93,200                        ; movaps        %xmm3,-0x38(%ebp)
   DB  15,40,204                           ; movaps        %xmm4,%xmm1
   DB  15,194,205,2                        ; cmpleps       %xmm5,%xmm1
-  DB  15,40,160,174,169,0,0               ; movaps        0xa9ae(%eax),%xmm4
+  DB  15,40,160,62,170,0,0                ; movaps        0xaa3e(%eax),%xmm4
   DB  15,41,165,120,255,255,255           ; movaps        %xmm4,-0x88(%ebp)
   DB  15,194,229,2                        ; cmpleps       %xmm5,%xmm4
-  DB  15,40,176,126,169,0,0               ; movaps        0xa97e(%eax),%xmm6
+  DB  15,40,176,14,170,0,0                ; movaps        0xaa0e(%eax),%xmm6
   DB  15,89,238                           ; mulps         %xmm6,%xmm5
-  DB  15,40,128,158,169,0,0               ; movaps        0xa99e(%eax),%xmm0
+  DB  15,40,128,46,170,0,0                ; movaps        0xaa2e(%eax),%xmm0
   DB  15,41,69,168                        ; movaps        %xmm0,-0x58(%ebp)
   DB  15,92,197                           ; subps         %xmm5,%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
@@ -46408,18 +46543,18 @@
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
   DB  15,194,200,1                        ; cmpltps       %xmm0,%xmm1
-  DB  15,84,136,254,167,0,0               ; andps         0xa7fe(%eax),%xmm1
+  DB  15,84,136,142,168,0,0               ; andps         0xa88e(%eax),%xmm1
   DB  15,92,193                           ; subps         %xmm1,%xmm0
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
   DB  15,92,200                           ; subps         %xmm0,%xmm1
-  DB  15,40,128,206,169,0,0               ; movaps        0xa9ce(%eax),%xmm0
+  DB  15,40,128,94,170,0,0                ; movaps        0xaa5e(%eax),%xmm0
   DB  15,194,193,2                        ; cmpleps       %xmm1,%xmm0
-  DB  15,40,152,238,167,0,0               ; movaps        0xa7ee(%eax),%xmm3
+  DB  15,40,152,126,168,0,0               ; movaps        0xa87e(%eax),%xmm3
   DB  15,194,217,2                        ; cmpleps       %xmm1,%xmm3
-  DB  15,40,160,174,169,0,0               ; movaps        0xa9ae(%eax),%xmm4
+  DB  15,40,160,62,170,0,0                ; movaps        0xaa3e(%eax),%xmm4
   DB  15,194,225,2                        ; cmpleps       %xmm1,%xmm4
   DB  15,89,206                           ; mulps         %xmm6,%xmm1
-  DB  15,40,168,158,169,0,0               ; movaps        0xa99e(%eax),%xmm5
+  DB  15,40,168,46,170,0,0                ; movaps        0xaa2e(%eax),%xmm5
   DB  15,92,233                           ; subps         %xmm1,%xmm5
   DB  15,89,239                           ; mulps         %xmm7,%xmm5
   DB  15,88,234                           ; addps         %xmm2,%xmm5
@@ -46439,7 +46574,7 @@
   DB  15,40,125,232                       ; movaps        -0x18(%ebp),%xmm7
   DB  15,85,252                           ; andnps        %xmm4,%xmm7
   DB  15,40,93,184                        ; movaps        -0x48(%ebp),%xmm3
-  DB  15,88,152,222,169,0,0               ; addps         0xa9de(%eax),%xmm3
+  DB  15,88,152,110,170,0,0               ; addps         0xaa6e(%eax),%xmm3
   DB  243,15,91,195                       ; cvttps2dq     %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
   DB  15,40,203                           ; movaps        %xmm3,%xmm1
@@ -46537,9 +46672,9 @@
   DB  102,15,110,36,62                    ; movd          (%esi,%edi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,162,68,166,0,0           ; pand          0xa644(%edx),%xmm4
+  DB  102,15,219,162,212,166,0,0          ; pand          0xa6d4(%edx),%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,162,116,167,0,0               ; mulps         0xa774(%edx),%xmm4
+  DB  15,89,162,4,168,0,0                 ; mulps         0xa804(%edx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
@@ -46603,17 +46738,17 @@
   DB  15,133,157,0,0,0                    ; jne           2814 <_sk_scale_565_sse2+0xd8>
   DB  243,15,126,52,126                   ; movq          (%esi,%edi,2),%xmm6
   DB  102,15,97,240                       ; punpcklwd     %xmm0,%xmm6
-  DB  102,15,111,162,202,166,0,0          ; movdqa        0xa6ca(%edx),%xmm4
+  DB  102,15,111,162,90,167,0,0           ; movdqa        0xa75a(%edx),%xmm4
   DB  102,15,219,230                      ; pand          %xmm6,%xmm4
   DB  15,91,212                           ; cvtdq2ps      %xmm4,%xmm2
-  DB  15,89,146,218,166,0,0               ; mulps         0xa6da(%edx),%xmm2
-  DB  102,15,111,170,234,166,0,0          ; movdqa        0xa6ea(%edx),%xmm5
+  DB  15,89,146,106,167,0,0               ; mulps         0xa76a(%edx),%xmm2
+  DB  102,15,111,170,122,167,0,0          ; movdqa        0xa77a(%edx),%xmm5
   DB  102,15,219,238                      ; pand          %xmm6,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,170,250,166,0,0               ; mulps         0xa6fa(%edx),%xmm5
-  DB  102,15,219,178,10,167,0,0           ; pand          0xa70a(%edx),%xmm6
+  DB  15,89,170,138,167,0,0               ; mulps         0xa78a(%edx),%xmm5
+  DB  102,15,219,178,154,167,0,0          ; pand          0xa79a(%edx),%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,178,26,167,0,0                ; mulps         0xa71a(%edx),%xmm6
+  DB  15,89,178,170,167,0,0               ; mulps         0xa7aa(%edx),%xmm6
   DB  15,40,253                           ; movaps        %xmm5,%xmm7
   DB  15,93,254                           ; minps         %xmm6,%xmm7
   DB  15,40,226                           ; movaps        %xmm2,%xmm4
@@ -46723,9 +46858,9 @@
   DB  102,15,110,36,62                    ; movd          (%esi,%edi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,162,28,164,0,0           ; pand          0xa41c(%edx),%xmm4
+  DB  102,15,219,162,172,164,0,0          ; pand          0xa4ac(%edx),%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,162,76,165,0,0                ; mulps         0xa54c(%edx),%xmm4
+  DB  15,89,162,220,165,0,0               ; mulps         0xa5dc(%edx),%xmm4
   DB  15,40,105,16                        ; movaps        0x10(%ecx),%xmm5
   DB  15,40,113,32                        ; movaps        0x20(%ecx),%xmm6
   DB  15,92,197                           ; subps         %xmm5,%xmm0
@@ -46801,17 +46936,17 @@
   DB  15,133,211,0,0,0                    ; jne           2aa2 <_sk_lerp_565_sse2+0x113>
   DB  243,15,126,44,126                   ; movq          (%esi,%edi,2),%xmm5
   DB  102,15,97,232                       ; punpcklwd     %xmm0,%xmm5
-  DB  102,15,111,162,114,164,0,0          ; movdqa        0xa472(%edx),%xmm4
+  DB  102,15,111,162,2,165,0,0            ; movdqa        0xa502(%edx),%xmm4
   DB  102,15,219,229                      ; pand          %xmm5,%xmm4
   DB  15,91,204                           ; cvtdq2ps      %xmm4,%xmm1
-  DB  15,89,138,130,164,0,0               ; mulps         0xa482(%edx),%xmm1
-  DB  102,15,111,178,146,164,0,0          ; movdqa        0xa492(%edx),%xmm6
+  DB  15,89,138,18,165,0,0                ; mulps         0xa512(%edx),%xmm1
+  DB  102,15,111,178,34,165,0,0           ; movdqa        0xa522(%edx),%xmm6
   DB  102,15,219,245                      ; pand          %xmm5,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,89,178,162,164,0,0               ; mulps         0xa4a2(%edx),%xmm6
-  DB  102,15,219,170,178,164,0,0          ; pand          0xa4b2(%edx),%xmm5
+  DB  15,89,178,50,165,0,0                ; mulps         0xa532(%edx),%xmm6
+  DB  102,15,219,170,66,165,0,0           ; pand          0xa542(%edx),%xmm5
   DB  15,91,213                           ; cvtdq2ps      %xmm5,%xmm2
-  DB  15,89,146,194,164,0,0               ; mulps         0xa4c2(%edx),%xmm2
+  DB  15,89,146,82,165,0,0                ; mulps         0xa552(%edx),%xmm2
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,41,93,200                        ; movaps        %xmm3,-0x38(%ebp)
   DB  15,40,254                           ; movaps        %xmm6,%xmm7
@@ -46897,7 +47032,7 @@
   DB  139,30                              ; mov           (%esi),%ebx
   DB  15,133,22,1,0,0                     ; jne           2c26 <_sk_load_tables_sse2+0x13c>
   DB  243,15,111,28,187                   ; movdqu        (%ebx,%edi,4),%xmm3
-  DB  102,15,111,146,232,161,0,0          ; movdqa        0xa1e8(%edx),%xmm2
+  DB  102,15,111,146,120,162,0,0          ; movdqa        0xa278(%edx),%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
@@ -46953,7 +47088,7 @@
   DB  102,15,20,215                       ; unpcklpd      %xmm7,%xmm2
   DB  102,15,114,211,24                   ; psrld         $0x18,%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,154,24,163,0,0                ; mulps         0xa318(%edx),%xmm3
+  DB  15,89,154,168,163,0,0               ; mulps         0xa3a8(%edx),%xmm3
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  137,194                             ; mov           %eax,%edx
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -47026,7 +47161,7 @@
   DB  242,15,112,192,232                  ; pshuflw       $0xe8,%xmm0,%xmm0
   DB  243,15,112,192,232                  ; pshufhw       $0xe8,%xmm0,%xmm0
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
-  DB  102,15,111,146,23,162,0,0           ; movdqa        0xa217(%edx),%xmm2
+  DB  102,15,111,146,167,162,0,0          ; movdqa        0xa2a7(%edx),%xmm2
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,97,196                       ; punpcklwd     %xmm4,%xmm0
@@ -47098,7 +47233,7 @@
   DB  243,15,126,93,232                   ; movq          -0x18(%ebp),%xmm3
   DB  102,15,97,220                       ; punpcklwd     %xmm4,%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,154,39,162,0,0                ; mulps         0xa227(%edx),%xmm3
+  DB  15,89,154,183,162,0,0               ; mulps         0xa2b7(%edx),%xmm3
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  137,194                             ; mov           %eax,%edx
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -47169,7 +47304,7 @@
   DB  242,15,112,194,232                  ; pshuflw       $0xe8,%xmm2,%xmm0
   DB  243,15,112,192,232                  ; pshufhw       $0xe8,%xmm0,%xmm0
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
-  DB  102,15,111,146,240,159,0,0          ; movdqa        0x9ff0(%edx),%xmm2
+  DB  102,15,111,146,128,160,0,0          ; movdqa        0xa080(%edx),%xmm2
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
@@ -47234,7 +47369,7 @@
   DB  137,198                             ; mov           %eax,%esi
   DB  141,70,8                            ; lea           0x8(%esi),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,154,144,157,0,0               ; movaps        0x9d90(%edx),%xmm3
+  DB  15,40,154,32,158,0,0                ; movaps        0x9e20(%edx),%xmm3
   DB  80                                  ; push          %eax
   DB  81                                  ; push          %ecx
   DB  255,86,4                            ; call          *0x4(%esi)
@@ -47275,7 +47410,7 @@
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
-  DB  15,40,162,51,156,0,0                ; movaps        0x9c33(%edx),%xmm4
+  DB  15,40,162,195,156,0,0               ; movaps        0x9cc3(%edx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  102,15,112,232,78                   ; pshufd        $0x4e,%xmm0,%xmm5
@@ -47297,7 +47432,7 @@
   DB  102,15,110,192                      ; movd          %eax,%xmm0
   DB  139,65,4                            ; mov           0x4(%ecx),%eax
   DB  102,15,196,195,1                    ; pinsrw        $0x1,%ebx,%xmm0
-  DB  15,40,170,83,157,0,0                ; movaps        0x9d53(%edx),%xmm5
+  DB  15,40,170,227,157,0,0               ; movaps        0x9de3(%edx),%xmm5
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
   DB  102,15,112,241,78                   ; pshufd        $0x4e,%xmm1,%xmm6
@@ -47425,7 +47560,7 @@
   DB  102,15,110,199                      ; movd          %edi,%xmm0
   DB  139,121,4                           ; mov           0x4(%ecx),%edi
   DB  102,15,196,198,1                    ; pinsrw        $0x1,%esi,%xmm0
-  DB  15,40,170,87,155,0,0                ; movaps        0x9b57(%edx),%xmm5
+  DB  15,40,170,231,155,0,0               ; movaps        0x9be7(%edx),%xmm5
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
   DB  102,15,91,201                       ; cvtps2dq      %xmm1,%xmm1
   DB  102,15,112,241,78                   ; pshufd        $0x4e,%xmm1,%xmm6
@@ -47671,15 +47806,15 @@
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,88,245                           ; addps         %xmm5,%xmm6
   DB  15,91,238                           ; cvtdq2ps      %xmm6,%xmm5
-  DB  15,89,170,23,153,0,0                ; mulps         0x9917(%edx),%xmm5
-  DB  15,84,178,39,153,0,0                ; andps         0x9927(%edx),%xmm6
-  DB  15,86,178,135,150,0,0               ; orps          0x9687(%edx),%xmm6
-  DB  15,88,170,55,153,0,0                ; addps         0x9937(%edx),%xmm5
-  DB  15,40,186,71,153,0,0                ; movaps        0x9947(%edx),%xmm7
+  DB  15,89,170,167,153,0,0               ; mulps         0x99a7(%edx),%xmm5
+  DB  15,84,178,183,153,0,0               ; andps         0x99b7(%edx),%xmm6
+  DB  15,86,178,23,151,0,0                ; orps          0x9717(%edx),%xmm6
+  DB  15,88,170,199,153,0,0               ; addps         0x99c7(%edx),%xmm5
+  DB  15,40,186,215,153,0,0               ; movaps        0x99d7(%edx),%xmm7
   DB  15,89,254                           ; mulps         %xmm6,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,88,178,87,153,0,0                ; addps         0x9957(%edx),%xmm6
-  DB  15,40,186,103,153,0,0               ; movaps        0x9967(%edx),%xmm7
+  DB  15,88,178,231,153,0,0               ; addps         0x99e7(%edx),%xmm6
+  DB  15,40,186,247,153,0,0               ; movaps        0x99f7(%edx),%xmm7
   DB  15,94,254                           ; divps         %xmm6,%xmm7
   DB  243,15,16,49                        ; movss         (%ecx),%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
@@ -47689,21 +47824,21 @@
   DB  15,91,254                           ; cvtdq2ps      %xmm6,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
-  DB  15,40,178,151,150,0,0               ; movaps        0x9697(%edx),%xmm6
+  DB  15,40,178,39,151,0,0                ; movaps        0x9727(%edx),%xmm6
   DB  15,84,198                           ; andps         %xmm6,%xmm0
   DB  15,92,248                           ; subps         %xmm0,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,92,199                           ; subps         %xmm7,%xmm0
-  DB  15,88,170,119,153,0,0               ; addps         0x9977(%edx),%xmm5
-  DB  15,40,186,135,153,0,0               ; movaps        0x9987(%edx),%xmm7
+  DB  15,88,170,7,154,0,0                 ; addps         0x9a07(%edx),%xmm5
+  DB  15,40,186,23,154,0,0                ; movaps        0x9a17(%edx),%xmm7
   DB  15,89,248                           ; mulps         %xmm0,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,40,186,151,153,0,0               ; movaps        0x9997(%edx),%xmm7
+  DB  15,40,186,39,154,0,0                ; movaps        0x9a27(%edx),%xmm7
   DB  15,92,248                           ; subps         %xmm0,%xmm7
-  DB  15,40,130,167,153,0,0               ; movaps        0x99a7(%edx),%xmm0
+  DB  15,40,130,55,154,0,0                ; movaps        0x9a37(%edx),%xmm0
   DB  15,94,199                           ; divps         %xmm7,%xmm0
   DB  15,88,197                           ; addps         %xmm5,%xmm0
-  DB  15,89,130,183,153,0,0               ; mulps         0x99b7(%edx),%xmm0
+  DB  15,89,130,71,154,0,0                ; mulps         0x9a47(%edx),%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  243,15,16,105,20                    ; movss         0x14(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
@@ -47755,15 +47890,15 @@
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,88,245                           ; addps         %xmm5,%xmm6
   DB  15,91,238                           ; cvtdq2ps      %xmm6,%xmm5
-  DB  15,89,170,224,151,0,0               ; mulps         0x97e0(%edx),%xmm5
-  DB  15,84,178,240,151,0,0               ; andps         0x97f0(%edx),%xmm6
-  DB  15,86,178,80,149,0,0                ; orps          0x9550(%edx),%xmm6
-  DB  15,88,170,0,152,0,0                 ; addps         0x9800(%edx),%xmm5
-  DB  15,40,186,16,152,0,0                ; movaps        0x9810(%edx),%xmm7
+  DB  15,89,170,112,152,0,0               ; mulps         0x9870(%edx),%xmm5
+  DB  15,84,178,128,152,0,0               ; andps         0x9880(%edx),%xmm6
+  DB  15,86,178,224,149,0,0               ; orps          0x95e0(%edx),%xmm6
+  DB  15,88,170,144,152,0,0               ; addps         0x9890(%edx),%xmm5
+  DB  15,40,186,160,152,0,0               ; movaps        0x98a0(%edx),%xmm7
   DB  15,89,254                           ; mulps         %xmm6,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,88,178,32,152,0,0                ; addps         0x9820(%edx),%xmm6
-  DB  15,40,186,48,152,0,0                ; movaps        0x9830(%edx),%xmm7
+  DB  15,88,178,176,152,0,0               ; addps         0x98b0(%edx),%xmm6
+  DB  15,40,186,192,152,0,0               ; movaps        0x98c0(%edx),%xmm7
   DB  15,94,254                           ; divps         %xmm6,%xmm7
   DB  243,15,16,49                        ; movss         (%ecx),%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
@@ -47773,21 +47908,21 @@
   DB  15,91,254                           ; cvtdq2ps      %xmm6,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
-  DB  15,40,178,96,149,0,0                ; movaps        0x9560(%edx),%xmm6
+  DB  15,40,178,240,149,0,0               ; movaps        0x95f0(%edx),%xmm6
   DB  15,84,198                           ; andps         %xmm6,%xmm0
   DB  15,92,248                           ; subps         %xmm0,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,92,199                           ; subps         %xmm7,%xmm0
-  DB  15,88,170,64,152,0,0                ; addps         0x9840(%edx),%xmm5
-  DB  15,40,186,80,152,0,0                ; movaps        0x9850(%edx),%xmm7
+  DB  15,88,170,208,152,0,0               ; addps         0x98d0(%edx),%xmm5
+  DB  15,40,186,224,152,0,0               ; movaps        0x98e0(%edx),%xmm7
   DB  15,89,248                           ; mulps         %xmm0,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,40,186,96,152,0,0                ; movaps        0x9860(%edx),%xmm7
+  DB  15,40,186,240,152,0,0               ; movaps        0x98f0(%edx),%xmm7
   DB  15,92,248                           ; subps         %xmm0,%xmm7
-  DB  15,40,130,112,152,0,0               ; movaps        0x9870(%edx),%xmm0
+  DB  15,40,130,0,153,0,0                 ; movaps        0x9900(%edx),%xmm0
   DB  15,94,199                           ; divps         %xmm7,%xmm0
   DB  15,88,197                           ; addps         %xmm5,%xmm0
-  DB  15,89,130,128,152,0,0               ; mulps         0x9880(%edx),%xmm0
+  DB  15,89,130,16,153,0,0                ; mulps         0x9910(%edx),%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  243,15,16,105,20                    ; movss         0x14(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
@@ -47838,15 +47973,15 @@
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,88,245                           ; addps         %xmm5,%xmm6
   DB  15,91,238                           ; cvtdq2ps      %xmm6,%xmm5
-  DB  15,89,170,172,150,0,0               ; mulps         0x96ac(%edx),%xmm5
-  DB  15,84,178,188,150,0,0               ; andps         0x96bc(%edx),%xmm6
-  DB  15,86,178,28,148,0,0                ; orps          0x941c(%edx),%xmm6
-  DB  15,88,170,204,150,0,0               ; addps         0x96cc(%edx),%xmm5
-  DB  15,40,186,220,150,0,0               ; movaps        0x96dc(%edx),%xmm7
+  DB  15,89,170,60,151,0,0                ; mulps         0x973c(%edx),%xmm5
+  DB  15,84,178,76,151,0,0                ; andps         0x974c(%edx),%xmm6
+  DB  15,86,178,172,148,0,0               ; orps          0x94ac(%edx),%xmm6
+  DB  15,88,170,92,151,0,0                ; addps         0x975c(%edx),%xmm5
+  DB  15,40,186,108,151,0,0               ; movaps        0x976c(%edx),%xmm7
   DB  15,89,254                           ; mulps         %xmm6,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,88,178,236,150,0,0               ; addps         0x96ec(%edx),%xmm6
-  DB  15,40,186,252,150,0,0               ; movaps        0x96fc(%edx),%xmm7
+  DB  15,88,178,124,151,0,0               ; addps         0x977c(%edx),%xmm6
+  DB  15,40,186,140,151,0,0               ; movaps        0x978c(%edx),%xmm7
   DB  15,94,254                           ; divps         %xmm6,%xmm7
   DB  243,15,16,49                        ; movss         (%ecx),%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
@@ -47856,21 +47991,21 @@
   DB  15,91,254                           ; cvtdq2ps      %xmm6,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
-  DB  15,40,178,44,148,0,0                ; movaps        0x942c(%edx),%xmm6
+  DB  15,40,178,188,148,0,0               ; movaps        0x94bc(%edx),%xmm6
   DB  15,84,198                           ; andps         %xmm6,%xmm0
   DB  15,92,248                           ; subps         %xmm0,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,92,199                           ; subps         %xmm7,%xmm0
-  DB  15,88,170,12,151,0,0                ; addps         0x970c(%edx),%xmm5
-  DB  15,40,186,28,151,0,0                ; movaps        0x971c(%edx),%xmm7
+  DB  15,88,170,156,151,0,0               ; addps         0x979c(%edx),%xmm5
+  DB  15,40,186,172,151,0,0               ; movaps        0x97ac(%edx),%xmm7
   DB  15,89,248                           ; mulps         %xmm0,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,40,186,44,151,0,0                ; movaps        0x972c(%edx),%xmm7
+  DB  15,40,186,188,151,0,0               ; movaps        0x97bc(%edx),%xmm7
   DB  15,92,248                           ; subps         %xmm0,%xmm7
-  DB  15,40,130,60,151,0,0                ; movaps        0x973c(%edx),%xmm0
+  DB  15,40,130,204,151,0,0               ; movaps        0x97cc(%edx),%xmm0
   DB  15,94,199                           ; divps         %xmm7,%xmm0
   DB  15,88,197                           ; addps         %xmm5,%xmm0
-  DB  15,89,130,76,151,0,0                ; mulps         0x974c(%edx),%xmm0
+  DB  15,89,130,220,151,0,0               ; mulps         0x97dc(%edx),%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  243,15,16,105,20                    ; movss         0x14(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
@@ -47921,15 +48056,15 @@
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,88,245                           ; addps         %xmm5,%xmm6
   DB  15,91,238                           ; cvtdq2ps      %xmm6,%xmm5
-  DB  15,89,170,120,149,0,0               ; mulps         0x9578(%edx),%xmm5
-  DB  15,84,178,136,149,0,0               ; andps         0x9588(%edx),%xmm6
-  DB  15,86,178,232,146,0,0               ; orps          0x92e8(%edx),%xmm6
-  DB  15,88,170,152,149,0,0               ; addps         0x9598(%edx),%xmm5
-  DB  15,40,186,168,149,0,0               ; movaps        0x95a8(%edx),%xmm7
+  DB  15,89,170,8,150,0,0                 ; mulps         0x9608(%edx),%xmm5
+  DB  15,84,178,24,150,0,0                ; andps         0x9618(%edx),%xmm6
+  DB  15,86,178,120,147,0,0               ; orps          0x9378(%edx),%xmm6
+  DB  15,88,170,40,150,0,0                ; addps         0x9628(%edx),%xmm5
+  DB  15,40,186,56,150,0,0                ; movaps        0x9638(%edx),%xmm7
   DB  15,89,254                           ; mulps         %xmm6,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,88,178,184,149,0,0               ; addps         0x95b8(%edx),%xmm6
-  DB  15,40,186,200,149,0,0               ; movaps        0x95c8(%edx),%xmm7
+  DB  15,88,178,72,150,0,0                ; addps         0x9648(%edx),%xmm6
+  DB  15,40,186,88,150,0,0                ; movaps        0x9658(%edx),%xmm7
   DB  15,94,254                           ; divps         %xmm6,%xmm7
   DB  243,15,16,49                        ; movss         (%ecx),%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
@@ -47939,21 +48074,21 @@
   DB  15,91,254                           ; cvtdq2ps      %xmm6,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,194,199,1                        ; cmpltps       %xmm7,%xmm0
-  DB  15,40,178,248,146,0,0               ; movaps        0x92f8(%edx),%xmm6
+  DB  15,40,178,136,147,0,0               ; movaps        0x9388(%edx),%xmm6
   DB  15,84,198                           ; andps         %xmm6,%xmm0
   DB  15,92,248                           ; subps         %xmm0,%xmm7
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,92,199                           ; subps         %xmm7,%xmm0
-  DB  15,88,170,216,149,0,0               ; addps         0x95d8(%edx),%xmm5
-  DB  15,40,186,232,149,0,0               ; movaps        0x95e8(%edx),%xmm7
+  DB  15,88,170,104,150,0,0               ; addps         0x9668(%edx),%xmm5
+  DB  15,40,186,120,150,0,0               ; movaps        0x9678(%edx),%xmm7
   DB  15,89,248                           ; mulps         %xmm0,%xmm7
   DB  15,92,239                           ; subps         %xmm7,%xmm5
-  DB  15,40,186,248,149,0,0               ; movaps        0x95f8(%edx),%xmm7
+  DB  15,40,186,136,150,0,0               ; movaps        0x9688(%edx),%xmm7
   DB  15,92,248                           ; subps         %xmm0,%xmm7
-  DB  15,40,130,8,150,0,0                 ; movaps        0x9608(%edx),%xmm0
+  DB  15,40,130,152,150,0,0               ; movaps        0x9698(%edx),%xmm0
   DB  15,94,199                           ; divps         %xmm7,%xmm0
   DB  15,88,197                           ; addps         %xmm5,%xmm0
-  DB  15,89,130,24,150,0,0                ; mulps         0x9618(%edx),%xmm0
+  DB  15,89,130,168,150,0,0               ; mulps         0x96a8(%edx),%xmm0
   DB  102,15,91,192                       ; cvtps2dq      %xmm0,%xmm0
   DB  243,15,16,105,20                    ; movss         0x14(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
@@ -47986,15 +48121,15 @@
   DB  232,0,0,0,0                         ; call          3a59 <_sk_gamma_sse2+0x12>
   DB  88                                  ; pop           %eax
   DB  15,91,195                           ; cvtdq2ps      %xmm3,%xmm0
-  DB  15,89,128,71,148,0,0                ; mulps         0x9447(%eax),%xmm0
-  DB  15,84,152,87,148,0,0                ; andps         0x9457(%eax),%xmm3
-  DB  15,86,152,183,145,0,0               ; orps          0x91b7(%eax),%xmm3
-  DB  15,88,128,103,148,0,0               ; addps         0x9467(%eax),%xmm0
+  DB  15,89,128,215,148,0,0               ; mulps         0x94d7(%eax),%xmm0
+  DB  15,84,152,231,148,0,0               ; andps         0x94e7(%eax),%xmm3
+  DB  15,86,152,71,146,0,0                ; orps          0x9247(%eax),%xmm3
+  DB  15,88,128,247,148,0,0               ; addps         0x94f7(%eax),%xmm0
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
-  DB  15,89,160,119,148,0,0               ; mulps         0x9477(%eax),%xmm4
+  DB  15,89,160,7,149,0,0                 ; mulps         0x9507(%eax),%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  15,88,152,135,148,0,0               ; addps         0x9487(%eax),%xmm3
-  DB  15,40,160,151,148,0,0               ; movaps        0x9497(%eax),%xmm4
+  DB  15,88,152,23,149,0,0                ; addps         0x9517(%eax),%xmm3
+  DB  15,40,160,39,149,0,0                ; movaps        0x9527(%eax),%xmm4
   DB  15,94,227                           ; divps         %xmm3,%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
@@ -48007,30 +48142,30 @@
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,194,227,1                        ; cmpltps       %xmm3,%xmm4
-  DB  15,84,160,199,145,0,0               ; andps         0x91c7(%eax),%xmm4
+  DB  15,84,160,87,146,0,0                ; andps         0x9257(%eax),%xmm4
   DB  15,92,220                           ; subps         %xmm4,%xmm3
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
   DB  15,92,227                           ; subps         %xmm3,%xmm4
-  DB  15,88,128,167,148,0,0               ; addps         0x94a7(%eax),%xmm0
-  DB  15,40,176,199,148,0,0               ; movaps        0x94c7(%eax),%xmm6
+  DB  15,88,128,55,149,0,0                ; addps         0x9537(%eax),%xmm0
+  DB  15,40,176,87,149,0,0                ; movaps        0x9557(%eax),%xmm6
   DB  15,92,244                           ; subps         %xmm4,%xmm6
-  DB  15,40,168,183,148,0,0               ; movaps        0x94b7(%eax),%xmm5
+  DB  15,40,168,71,149,0,0                ; movaps        0x9547(%eax),%xmm5
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  15,40,152,215,148,0,0               ; movaps        0x94d7(%eax),%xmm3
+  DB  15,40,152,103,149,0,0               ; movaps        0x9567(%eax),%xmm3
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
   DB  15,94,230                           ; divps         %xmm6,%xmm4
   DB  15,88,224                           ; addps         %xmm0,%xmm4
   DB  15,91,193                           ; cvtdq2ps      %xmm1,%xmm0
-  DB  15,89,128,71,148,0,0                ; mulps         0x9447(%eax),%xmm0
-  DB  15,84,136,87,148,0,0                ; andps         0x9457(%eax),%xmm1
-  DB  15,86,136,183,145,0,0               ; orps          0x91b7(%eax),%xmm1
-  DB  15,88,128,103,148,0,0               ; addps         0x9467(%eax),%xmm0
+  DB  15,89,128,215,148,0,0               ; mulps         0x94d7(%eax),%xmm0
+  DB  15,84,136,231,148,0,0               ; andps         0x94e7(%eax),%xmm1
+  DB  15,86,136,71,146,0,0                ; orps          0x9247(%eax),%xmm1
+  DB  15,88,128,247,148,0,0               ; addps         0x94f7(%eax),%xmm0
   DB  15,40,241                           ; movaps        %xmm1,%xmm6
-  DB  15,89,176,119,148,0,0               ; mulps         0x9477(%eax),%xmm6
+  DB  15,89,176,7,149,0,0                 ; mulps         0x9507(%eax),%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
-  DB  15,88,136,135,148,0,0               ; addps         0x9487(%eax),%xmm1
-  DB  15,40,176,151,148,0,0               ; movaps        0x9497(%eax),%xmm6
+  DB  15,88,136,23,149,0,0                ; addps         0x9517(%eax),%xmm1
+  DB  15,40,176,39,149,0,0                ; movaps        0x9527(%eax),%xmm6
   DB  15,94,241                           ; divps         %xmm1,%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
@@ -48038,12 +48173,12 @@
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  15,194,241,1                        ; cmpltps       %xmm1,%xmm6
-  DB  15,84,176,199,145,0,0               ; andps         0x91c7(%eax),%xmm6
+  DB  15,84,176,87,146,0,0                ; andps         0x9257(%eax),%xmm6
   DB  15,92,206                           ; subps         %xmm6,%xmm1
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  15,92,241                           ; subps         %xmm1,%xmm6
-  DB  15,88,128,167,148,0,0               ; addps         0x94a7(%eax),%xmm0
-  DB  15,40,184,199,148,0,0               ; movaps        0x94c7(%eax),%xmm7
+  DB  15,88,128,55,149,0,0                ; addps         0x9537(%eax),%xmm0
+  DB  15,40,184,87,149,0,0                ; movaps        0x9557(%eax),%xmm7
   DB  15,92,254                           ; subps         %xmm6,%xmm7
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
@@ -48051,15 +48186,15 @@
   DB  15,94,207                           ; divps         %xmm7,%xmm1
   DB  15,88,200                           ; addps         %xmm0,%xmm1
   DB  15,91,194                           ; cvtdq2ps      %xmm2,%xmm0
-  DB  15,89,128,71,148,0,0                ; mulps         0x9447(%eax),%xmm0
-  DB  15,84,144,87,148,0,0                ; andps         0x9457(%eax),%xmm2
-  DB  15,86,144,183,145,0,0               ; orps          0x91b7(%eax),%xmm2
-  DB  15,88,128,103,148,0,0               ; addps         0x9467(%eax),%xmm0
-  DB  15,40,176,119,148,0,0               ; movaps        0x9477(%eax),%xmm6
+  DB  15,89,128,215,148,0,0               ; mulps         0x94d7(%eax),%xmm0
+  DB  15,84,144,231,148,0,0               ; andps         0x94e7(%eax),%xmm2
+  DB  15,86,144,71,146,0,0                ; orps          0x9247(%eax),%xmm2
+  DB  15,88,128,247,148,0,0               ; addps         0x94f7(%eax),%xmm0
+  DB  15,40,176,7,149,0,0                 ; movaps        0x9507(%eax),%xmm6
   DB  15,89,242                           ; mulps         %xmm2,%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
-  DB  15,88,144,135,148,0,0               ; addps         0x9487(%eax),%xmm2
-  DB  15,40,176,151,148,0,0               ; movaps        0x9497(%eax),%xmm6
+  DB  15,88,144,23,149,0,0                ; addps         0x9517(%eax),%xmm2
+  DB  15,40,176,39,149,0,0                ; movaps        0x9527(%eax),%xmm6
   DB  15,94,242                           ; divps         %xmm2,%xmm6
   DB  15,92,198                           ; subps         %xmm6,%xmm0
   DB  15,89,69,232                        ; mulps         -0x18(%ebp),%xmm0
@@ -48067,18 +48202,18 @@
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  15,194,242,1                        ; cmpltps       %xmm2,%xmm6
-  DB  15,84,176,199,145,0,0               ; andps         0x91c7(%eax),%xmm6
+  DB  15,84,176,87,146,0,0                ; andps         0x9257(%eax),%xmm6
   DB  15,92,214                           ; subps         %xmm6,%xmm2
   DB  15,40,240                           ; movaps        %xmm0,%xmm6
   DB  15,92,242                           ; subps         %xmm2,%xmm6
-  DB  15,88,128,167,148,0,0               ; addps         0x94a7(%eax),%xmm0
+  DB  15,88,128,55,149,0,0                ; addps         0x9537(%eax),%xmm0
   DB  15,89,238                           ; mulps         %xmm6,%xmm5
   DB  15,92,197                           ; subps         %xmm5,%xmm0
-  DB  15,40,144,199,148,0,0               ; movaps        0x94c7(%eax),%xmm2
+  DB  15,40,144,87,149,0,0                ; movaps        0x9557(%eax),%xmm2
   DB  15,92,214                           ; subps         %xmm6,%xmm2
   DB  15,94,218                           ; divps         %xmm2,%xmm3
   DB  15,88,216                           ; addps         %xmm0,%xmm3
-  DB  15,40,128,231,148,0,0               ; movaps        0x94e7(%eax),%xmm0
+  DB  15,40,128,119,149,0,0               ; movaps        0x9577(%eax),%xmm0
   DB  15,89,224                           ; mulps         %xmm0,%xmm4
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
   DB  15,89,216                           ; mulps         %xmm0,%xmm3
@@ -48105,29 +48240,29 @@
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  232,0,0,0,0                         ; call          3c41 <_sk_lab_to_xyz_sse2+0x15>
   DB  88                                  ; pop           %eax
-  DB  15,89,144,15,147,0,0                ; mulps         0x930f(%eax),%xmm2
-  DB  15,40,160,175,144,0,0               ; movaps        0x90af(%eax),%xmm4
+  DB  15,89,144,159,147,0,0               ; mulps         0x939f(%eax),%xmm2
+  DB  15,40,160,63,145,0,0                ; movaps        0x913f(%eax),%xmm4
   DB  15,89,204                           ; mulps         %xmm4,%xmm1
-  DB  15,40,168,31,147,0,0                ; movaps        0x931f(%eax),%xmm5
+  DB  15,40,168,175,147,0,0               ; movaps        0x93af(%eax),%xmm5
   DB  15,88,205                           ; addps         %xmm5,%xmm1
   DB  15,89,220                           ; mulps         %xmm4,%xmm3
   DB  15,88,221                           ; addps         %xmm5,%xmm3
-  DB  15,88,144,47,147,0,0                ; addps         0x932f(%eax),%xmm2
-  DB  15,89,144,63,147,0,0                ; mulps         0x933f(%eax),%xmm2
-  DB  15,89,136,79,147,0,0                ; mulps         0x934f(%eax),%xmm1
+  DB  15,88,144,191,147,0,0               ; addps         0x93bf(%eax),%xmm2
+  DB  15,89,144,207,147,0,0               ; mulps         0x93cf(%eax),%xmm2
+  DB  15,89,136,223,147,0,0               ; mulps         0x93df(%eax),%xmm1
   DB  15,88,202                           ; addps         %xmm2,%xmm1
-  DB  15,89,152,95,147,0,0                ; mulps         0x935f(%eax),%xmm3
+  DB  15,89,152,239,147,0,0               ; mulps         0x93ef(%eax),%xmm3
   DB  15,40,234                           ; movaps        %xmm2,%xmm5
   DB  15,92,235                           ; subps         %xmm3,%xmm5
   DB  15,40,193                           ; movaps        %xmm1,%xmm0
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  15,89,193                           ; mulps         %xmm1,%xmm0
-  DB  15,40,152,111,147,0,0               ; movaps        0x936f(%eax),%xmm3
+  DB  15,40,152,255,147,0,0               ; movaps        0x93ff(%eax),%xmm3
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
   DB  15,194,224,1                        ; cmpltps       %xmm0,%xmm4
-  DB  15,40,176,127,147,0,0               ; movaps        0x937f(%eax),%xmm6
+  DB  15,40,176,15,148,0,0                ; movaps        0x940f(%eax),%xmm6
   DB  15,88,206                           ; addps         %xmm6,%xmm1
-  DB  15,40,184,143,147,0,0               ; movaps        0x938f(%eax),%xmm7
+  DB  15,40,184,31,148,0,0                ; movaps        0x941f(%eax),%xmm7
   DB  15,89,207                           ; mulps         %xmm7,%xmm1
   DB  15,84,196                           ; andps         %xmm4,%xmm0
   DB  15,85,225                           ; andnps        %xmm1,%xmm4
@@ -48152,8 +48287,8 @@
   DB  15,85,221                           ; andnps        %xmm5,%xmm3
   DB  15,86,216                           ; orps          %xmm0,%xmm3
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
-  DB  15,89,160,159,147,0,0               ; mulps         0x939f(%eax),%xmm4
-  DB  15,89,152,175,147,0,0               ; mulps         0x93af(%eax),%xmm3
+  DB  15,89,160,47,148,0,0                ; mulps         0x942f(%eax),%xmm4
+  DB  15,89,152,63,148,0,0                ; mulps         0x943f(%eax),%xmm3
   DB  141,65,4                            ; lea           0x4(%ecx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  15,40,196                           ; movaps        %xmm4,%xmm0
@@ -48189,9 +48324,9 @@
   DB  102,15,110,4,62                     ; movd          (%esi,%edi,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  102,15,97,192                       ; punpcklwd     %xmm0,%xmm0
-  DB  102,15,219,130,175,143,0,0          ; pand          0x8faf(%edx),%xmm0
+  DB  102,15,219,130,63,144,0,0           ; pand          0x903f(%edx),%xmm0
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,154,223,144,0,0               ; mulps         0x90df(%edx),%xmm3
+  DB  15,89,154,111,145,0,0               ; mulps         0x916f(%edx),%xmm3
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -48254,9 +48389,9 @@
   DB  102,15,110,36,55                    ; movd          (%edi,%esi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,162,219,142,0,0          ; pand          0x8edb(%edx),%xmm4
+  DB  102,15,219,162,107,143,0,0          ; pand          0x8f6b(%edx),%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,162,11,144,0,0                ; mulps         0x900b(%edx),%xmm4
+  DB  15,89,162,155,144,0,0               ; mulps         0x909b(%edx),%xmm4
   DB  15,41,97,64                         ; movaps        %xmm4,0x40(%ecx)
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -48297,42 +48432,55 @@
   DB  86                                  ; push          %esi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,95,224                           ; maxps         %xmm0,%xmm4
+  DB  15,93,226                           ; minps         %xmm2,%xmm4
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,209                           ; maxps         %xmm1,%xmm2
+  DB  15,93,208                           ; minps         %xmm0,%xmm2
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,194                       ; cvttps2dq     %xmm2,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
-  DB  102,15,112,208,78                   ; pshufd        $0x4e,%xmm0,%xmm2
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,204                       ; cvttps2dq     %xmm4,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,193,229                  ; pshufd        $0xe5,%xmm1,%xmm0
+  DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,15,126,214                      ; movd          %xmm2,%esi
-  DB  102,15,112,192,231                  ; pshufd        $0xe7,%xmm0,%xmm0
-  DB  102,15,126,199                      ; movd          %xmm0,%edi
+  DB  102,15,112,201,231                  ; pshufd        $0xe7,%xmm1,%xmm1
+  DB  102,15,126,207                      ; movd          %xmm1,%edi
   DB  15,182,52,50                        ; movzbl        (%edx,%esi,1),%esi
   DB  15,182,60,58                        ; movzbl        (%edx,%edi,1),%edi
   DB  193,231,8                           ; shl           $0x8,%edi
   DB  9,247                               ; or            %esi,%edi
-  DB  102,15,126,206                      ; movd          %xmm1,%esi
+  DB  102,15,126,198                      ; movd          %xmm0,%esi
   DB  15,182,12,10                        ; movzbl        (%edx,%ecx,1),%ecx
   DB  15,182,20,50                        ; movzbl        (%edx,%esi,1),%edx
   DB  193,226,8                           ; shl           $0x8,%edx
   DB  9,202                               ; or            %ecx,%edx
   DB  102,15,110,194                      ; movd          %edx,%xmm0
   DB  102,15,196,199,1                    ; pinsrw        $0x1,%edi,%xmm0
-  DB  232,0,0,0,0                         ; call          3f02 <_sk_gather_a8_sse2+0x84>
+  DB  232,0,0,0,0                         ; call          3f32 <_sk_gather_a8_sse2+0xb4>
   DB  89                                  ; pop           %ecx
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  102,15,96,193                       ; punpcklbw     %xmm1,%xmm0
   DB  102,15,97,193                       ; punpcklwd     %xmm1,%xmm0
   DB  15,91,216                           ; cvtdq2ps      %xmm0,%xmm3
-  DB  15,89,153,14,143,0,0                ; mulps         0x8f0e(%ecx),%xmm3
+  DB  15,89,153,110,143,0,0               ; mulps         0x8f6e(%ecx),%xmm3
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
@@ -48355,7 +48503,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          3f46 <_sk_store_a8_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          3f76 <_sk_store_a8_sse2+0xe>
   DB  94                                  ; pop           %esi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48364,7 +48512,7 @@
   DB  15,175,81,4                         ; imul          0x4(%ecx),%edx
   DB  3,23                                ; add           (%edi),%edx
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
-  DB  15,40,166,170,141,0,0               ; movaps        0x8daa(%esi),%xmm4
+  DB  15,40,166,10,142,0,0                ; movaps        0x8e0a(%esi),%xmm4
   DB  15,89,227                           ; mulps         %xmm3,%xmm4
   DB  102,15,91,228                       ; cvtps2dq      %xmm4,%xmm4
   DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
@@ -48373,7 +48521,7 @@
   DB  102,15,103,224                      ; packuswb      %xmm0,%xmm4
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,26                              ; jne           3f9b <_sk_store_a8_sse2+0x63>
+  DB  117,26                              ; jne           3fcb <_sk_store_a8_sse2+0x63>
   DB  102,15,126,230                      ; movd          %xmm4,%esi
   DB  137,52,58                           ; mov           %esi,(%edx,%edi,1)
   DB  141,80,8                            ; lea           0x8(%eax),%edx
@@ -48391,24 +48539,24 @@
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,54                              ; je            3fe1 <_sk_store_a8_sse2+0xa9>
+  DB  116,54                              ; je            4011 <_sk_store_a8_sse2+0xa9>
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,14                              ; je            3fbe <_sk_store_a8_sse2+0x86>
+  DB  116,14                              ; je            3fee <_sk_store_a8_sse2+0x86>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,211                             ; jne           3f88 <_sk_store_a8_sse2+0x50>
+  DB  117,211                             ; jne           3fb8 <_sk_store_a8_sse2+0x50>
   DB  102,15,197,220,4                    ; pextrw        $0x4,%xmm4,%ebx
   DB  136,92,58,2                         ; mov           %bl,0x2(%edx,%edi,1)
   DB  102,15,112,228,212                  ; pshufd        $0xd4,%xmm4,%xmm4
-  DB  102,15,219,166,186,144,0,0          ; pand          0x90ba(%esi),%xmm4
+  DB  102,15,219,166,26,145,0,0           ; pand          0x911a(%esi),%xmm4
   DB  102,15,103,228                      ; packuswb      %xmm4,%xmm4
   DB  102,15,103,228                      ; packuswb      %xmm4,%xmm4
   DB  102,15,103,228                      ; packuswb      %xmm4,%xmm4
   DB  102,15,126,230                      ; movd          %xmm4,%esi
   DB  102,137,52,58                       ; mov           %si,(%edx,%edi,1)
-  DB  235,167                             ; jmp           3f88 <_sk_store_a8_sse2+0x50>
+  DB  235,167                             ; jmp           3fb8 <_sk_store_a8_sse2+0x50>
   DB  102,15,126,227                      ; movd          %xmm4,%ebx
   DB  136,28,58                           ; mov           %bl,(%edx,%edi,1)
-  DB  235,158                             ; jmp           3f88 <_sk_store_a8_sse2+0x50>
+  DB  235,158                             ; jmp           3fb8 <_sk_store_a8_sse2+0x50>
 
 PUBLIC _sk_load_g8_sse2
 _sk_load_g8_sse2 LABEL PROC
@@ -48418,7 +48566,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          3ff8 <_sk_load_g8_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4028 <_sk_load_g8_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48429,16 +48577,16 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,63                              ; jne           4052 <_sk_load_g8_sse2+0x68>
+  DB  117,63                              ; jne           4082 <_sk_load_g8_sse2+0x68>
   DB  102,15,110,4,62                     ; movd          (%esi,%edi,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
   DB  102,15,97,192                       ; punpcklwd     %xmm0,%xmm0
-  DB  102,15,219,130,232,140,0,0          ; pand          0x8ce8(%edx),%xmm0
+  DB  102,15,219,130,72,141,0,0           ; pand          0x8d48(%edx),%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,130,24,142,0,0                ; mulps         0x8e18(%edx),%xmm0
+  DB  15,89,130,120,142,0,0               ; mulps         0x8e78(%edx),%xmm0
   DB  141,112,8                           ; lea           0x8(%eax),%esi
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,154,40,140,0,0                ; movaps        0x8c28(%edx),%xmm3
+  DB  15,40,154,136,140,0,0               ; movaps        0x8c88(%edx),%xmm3
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  86                                  ; push          %esi
@@ -48452,12 +48600,12 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,50                              ; je            408c <_sk_load_g8_sse2+0xa2>
+  DB  116,50                              ; je            40bc <_sk_load_g8_sse2+0xa2>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,19                              ; je            4076 <_sk_load_g8_sse2+0x8c>
+  DB  116,19                              ; je            40a6 <_sk_load_g8_sse2+0x8c>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,184                             ; jne           4020 <_sk_load_g8_sse2+0x36>
+  DB  117,184                             ; jne           4050 <_sk_load_g8_sse2+0x36>
   DB  15,182,92,62,2                      ; movzbl        0x2(%esi,%edi,1),%ebx
   DB  102,15,110,195                      ; movd          %ebx,%xmm0
   DB  102,15,112,192,69                   ; pshufd        $0x45,%xmm0,%xmm0
@@ -48466,10 +48614,10 @@
   DB  102,15,96,200                       ; punpcklbw     %xmm0,%xmm1
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  242,15,16,193                       ; movsd         %xmm1,%xmm0
-  DB  235,148                             ; jmp           4020 <_sk_load_g8_sse2+0x36>
+  DB  235,148                             ; jmp           4050 <_sk_load_g8_sse2+0x36>
   DB  15,182,52,62                        ; movzbl        (%esi,%edi,1),%esi
   DB  102,15,110,198                      ; movd          %esi,%xmm0
-  DB  235,138                             ; jmp           4020 <_sk_load_g8_sse2+0x36>
+  DB  235,138                             ; jmp           4050 <_sk_load_g8_sse2+0x36>
 
 PUBLIC _sk_load_g8_dst_sse2
 _sk_load_g8_dst_sse2 LABEL PROC
@@ -48479,7 +48627,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          40a4 <_sk_load_g8_dst_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          40d4 <_sk_load_g8_dst_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48490,17 +48638,17 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,73                              ; jne           4108 <_sk_load_g8_dst_sse2+0x72>
+  DB  117,73                              ; jne           4138 <_sk_load_g8_dst_sse2+0x72>
   DB  102,15,110,36,62                    ; movd          (%esi,%edi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,219,162,60,140,0,0           ; pand          0x8c3c(%edx),%xmm4
+  DB  102,15,219,162,156,140,0,0          ; pand          0x8c9c(%edx),%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,162,108,141,0,0               ; mulps         0x8d6c(%edx),%xmm4
+  DB  15,89,162,204,141,0,0               ; mulps         0x8dcc(%edx),%xmm4
   DB  15,41,97,48                         ; movaps        %xmm4,0x30(%ecx)
   DB  15,41,97,32                         ; movaps        %xmm4,0x20(%ecx)
   DB  15,41,97,16                         ; movaps        %xmm4,0x10(%ecx)
-  DB  15,40,162,124,139,0,0               ; movaps        0x8b7c(%edx),%xmm4
+  DB  15,40,162,220,139,0,0               ; movaps        0x8bdc(%edx),%xmm4
   DB  15,41,97,64                         ; movaps        %xmm4,0x40(%ecx)
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -48515,12 +48663,12 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,50                              ; je            4142 <_sk_load_g8_dst_sse2+0xac>
+  DB  116,50                              ; je            4172 <_sk_load_g8_dst_sse2+0xac>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,19                              ; je            412c <_sk_load_g8_dst_sse2+0x96>
+  DB  116,19                              ; je            415c <_sk_load_g8_dst_sse2+0x96>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,174                             ; jne           40cc <_sk_load_g8_dst_sse2+0x36>
+  DB  117,174                             ; jne           40fc <_sk_load_g8_dst_sse2+0x36>
   DB  15,182,92,62,2                      ; movzbl        0x2(%esi,%edi,1),%ebx
   DB  102,15,110,227                      ; movd          %ebx,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
@@ -48529,10 +48677,10 @@
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  102,15,97,232                       ; punpcklwd     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  235,138                             ; jmp           40cc <_sk_load_g8_dst_sse2+0x36>
+  DB  235,138                             ; jmp           40fc <_sk_load_g8_dst_sse2+0x36>
   DB  15,182,52,62                        ; movzbl        (%esi,%edi,1),%esi
   DB  102,15,110,230                      ; movd          %esi,%xmm4
-  DB  235,128                             ; jmp           40cc <_sk_load_g8_dst_sse2+0x36>
+  DB  235,128                             ; jmp           40fc <_sk_load_g8_dst_sse2+0x36>
 
 PUBLIC _sk_gather_g8_sse2
 _sk_gather_g8_sse2 LABEL PROC
@@ -48542,45 +48690,58 @@
   DB  86                                  ; push          %esi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,95,224                           ; maxps         %xmm0,%xmm4
+  DB  15,93,226                           ; minps         %xmm2,%xmm4
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,209                           ; maxps         %xmm1,%xmm2
+  DB  15,93,208                           ; minps         %xmm0,%xmm2
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,194                       ; cvttps2dq     %xmm2,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
-  DB  102,15,112,208,78                   ; pshufd        $0x4e,%xmm0,%xmm2
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,204                       ; cvttps2dq     %xmm4,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,193,229                  ; pshufd        $0xe5,%xmm1,%xmm0
+  DB  102,15,112,209,78                   ; pshufd        $0x4e,%xmm1,%xmm2
   DB  102,15,126,214                      ; movd          %xmm2,%esi
-  DB  102,15,112,192,231                  ; pshufd        $0xe7,%xmm0,%xmm0
-  DB  102,15,126,199                      ; movd          %xmm0,%edi
+  DB  102,15,112,201,231                  ; pshufd        $0xe7,%xmm1,%xmm1
+  DB  102,15,126,207                      ; movd          %xmm1,%edi
   DB  15,182,52,50                        ; movzbl        (%edx,%esi,1),%esi
   DB  15,182,60,58                        ; movzbl        (%edx,%edi,1),%edi
   DB  193,231,8                           ; shl           $0x8,%edi
   DB  9,247                               ; or            %esi,%edi
-  DB  102,15,126,206                      ; movd          %xmm1,%esi
+  DB  102,15,126,198                      ; movd          %xmm0,%esi
   DB  15,182,12,10                        ; movzbl        (%edx,%ecx,1),%ecx
   DB  15,182,20,50                        ; movzbl        (%edx,%esi,1),%edx
   DB  193,226,8                           ; shl           $0x8,%edx
   DB  9,202                               ; or            %ecx,%edx
   DB  102,15,110,194                      ; movd          %edx,%xmm0
-  DB  232,0,0,0,0                         ; call          41cb <_sk_gather_g8_sse2+0x7f>
+  DB  232,0,0,0,0                         ; call          422b <_sk_gather_g8_sse2+0xaf>
   DB  89                                  ; pop           %ecx
-  DB  102,15,196,199,1                    ; pinsrw        $0x1,%edi,%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
+  DB  102,15,196,199,1                    ; pinsrw        $0x1,%edi,%xmm0
   DB  102,15,96,193                       ; punpcklbw     %xmm1,%xmm0
   DB  102,15,97,193                       ; punpcklwd     %xmm1,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,129,69,140,0,0                ; mulps         0x8c45(%ecx),%xmm0
+  DB  15,89,129,117,140,0,0               ; mulps         0x8c75(%ecx),%xmm0
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,153,85,138,0,0                ; movaps        0x8a55(%ecx),%xmm3
+  DB  15,40,153,133,138,0,0               ; movaps        0x8a85(%ecx),%xmm3
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  82                                  ; push          %edx
@@ -48600,7 +48761,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4216 <_sk_load_565_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4276 <_sk_load_565_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48612,23 +48773,23 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,97                              ; jne           4294 <_sk_load_565_sse2+0x8c>
+  DB  117,97                              ; jne           42f4 <_sk_load_565_sse2+0x8c>
   DB  243,15,126,20,126                   ; movq          (%esi,%edi,2),%xmm2
   DB  102,15,97,208                       ; punpcklwd     %xmm0,%xmm2
-  DB  102,15,111,130,10,140,0,0           ; movdqa        0x8c0a(%edx),%xmm0
+  DB  102,15,111,130,58,140,0,0           ; movdqa        0x8c3a(%edx),%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,130,26,140,0,0                ; mulps         0x8c1a(%edx),%xmm0
-  DB  102,15,111,138,42,140,0,0           ; movdqa        0x8c2a(%edx),%xmm1
+  DB  15,89,130,74,140,0,0                ; mulps         0x8c4a(%edx),%xmm0
+  DB  102,15,111,138,90,140,0,0           ; movdqa        0x8c5a(%edx),%xmm1
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,138,58,140,0,0                ; mulps         0x8c3a(%edx),%xmm1
-  DB  102,15,219,146,74,140,0,0           ; pand          0x8c4a(%edx),%xmm2
+  DB  15,89,138,106,140,0,0               ; mulps         0x8c6a(%edx),%xmm1
+  DB  102,15,219,146,122,140,0,0          ; pand          0x8c7a(%edx),%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,146,90,140,0,0                ; mulps         0x8c5a(%edx),%xmm2
+  DB  15,89,146,138,140,0,0               ; mulps         0x8c8a(%edx),%xmm2
   DB  141,112,8                           ; lea           0x8(%eax),%esi
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,154,10,138,0,0                ; movaps        0x8a0a(%edx),%xmm3
+  DB  15,40,154,58,138,0,0                ; movaps        0x8a3a(%edx),%xmm3
   DB  86                                  ; push          %esi
   DB  81                                  ; push          %ecx
   DB  255,80,4                            ; call          *0x4(%eax)
@@ -48640,22 +48801,22 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,47                              ; je            42cb <_sk_load_565_sse2+0xc3>
+  DB  116,47                              ; je            432b <_sk_load_565_sse2+0xc3>
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,19                              ; je            42b8 <_sk_load_565_sse2+0xb0>
+  DB  116,19                              ; je            4318 <_sk_load_565_sse2+0xb0>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,146                             ; jne           423c <_sk_load_565_sse2+0x34>
+  DB  117,146                             ; jne           429c <_sk_load_565_sse2+0x34>
   DB  15,183,92,126,4                     ; movzwl        0x4(%esi,%edi,2),%ebx
   DB  102,15,110,195                      ; movd          %ebx,%xmm0
   DB  102,15,112,208,69                   ; pshufd        $0x45,%xmm0,%xmm2
   DB  102,15,110,4,126                    ; movd          (%esi,%edi,2),%xmm0
   DB  242,15,112,192,212                  ; pshuflw       $0xd4,%xmm0,%xmm0
   DB  242,15,16,208                       ; movsd         %xmm0,%xmm2
-  DB  233,113,255,255,255                 ; jmp           423c <_sk_load_565_sse2+0x34>
+  DB  233,113,255,255,255                 ; jmp           429c <_sk_load_565_sse2+0x34>
   DB  15,183,52,126                       ; movzwl        (%esi,%edi,2),%esi
   DB  102,15,110,214                      ; movd          %esi,%xmm2
-  DB  233,100,255,255,255                 ; jmp           423c <_sk_load_565_sse2+0x34>
+  DB  233,100,255,255,255                 ; jmp           429c <_sk_load_565_sse2+0x34>
 
 PUBLIC _sk_load_565_dst_sse2
 _sk_load_565_dst_sse2 LABEL PROC
@@ -48665,7 +48826,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          42e6 <_sk_load_565_dst_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4346 <_sk_load_565_dst_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48677,24 +48838,24 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,113                             ; jne           4374 <_sk_load_565_dst_sse2+0x9c>
+  DB  117,113                             ; jne           43d4 <_sk_load_565_dst_sse2+0x9c>
   DB  243,15,126,36,126                   ; movq          (%esi,%edi,2),%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
-  DB  102,15,111,170,58,139,0,0           ; movdqa        0x8b3a(%edx),%xmm5
+  DB  102,15,111,170,106,139,0,0          ; movdqa        0x8b6a(%edx),%xmm5
   DB  102,15,219,236                      ; pand          %xmm4,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,170,74,139,0,0                ; mulps         0x8b4a(%edx),%xmm5
+  DB  15,89,170,122,139,0,0               ; mulps         0x8b7a(%edx),%xmm5
   DB  15,41,105,16                        ; movaps        %xmm5,0x10(%ecx)
-  DB  102,15,111,170,90,139,0,0           ; movdqa        0x8b5a(%edx),%xmm5
+  DB  102,15,111,170,138,139,0,0          ; movdqa        0x8b8a(%edx),%xmm5
   DB  102,15,219,236                      ; pand          %xmm4,%xmm5
   DB  15,91,237                           ; cvtdq2ps      %xmm5,%xmm5
-  DB  15,89,170,106,139,0,0               ; mulps         0x8b6a(%edx),%xmm5
+  DB  15,89,170,154,139,0,0               ; mulps         0x8b9a(%edx),%xmm5
   DB  15,41,105,32                        ; movaps        %xmm5,0x20(%ecx)
-  DB  102,15,219,162,122,139,0,0          ; pand          0x8b7a(%edx),%xmm4
+  DB  102,15,219,162,170,139,0,0          ; pand          0x8baa(%edx),%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
-  DB  15,89,162,138,139,0,0               ; mulps         0x8b8a(%edx),%xmm4
+  DB  15,89,162,186,139,0,0               ; mulps         0x8bba(%edx),%xmm4
   DB  15,41,97,48                         ; movaps        %xmm4,0x30(%ecx)
-  DB  15,40,162,58,137,0,0                ; movaps        0x893a(%edx),%xmm4
+  DB  15,40,162,106,137,0,0               ; movaps        0x896a(%edx),%xmm4
   DB  15,41,97,64                         ; movaps        %xmm4,0x40(%ecx)
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -48709,22 +48870,22 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,47                              ; je            43ab <_sk_load_565_dst_sse2+0xd3>
+  DB  116,47                              ; je            440b <_sk_load_565_dst_sse2+0xd3>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,19                              ; je            4398 <_sk_load_565_dst_sse2+0xc0>
+  DB  116,19                              ; je            43f8 <_sk_load_565_dst_sse2+0xc0>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,130                             ; jne           430c <_sk_load_565_dst_sse2+0x34>
+  DB  117,130                             ; jne           436c <_sk_load_565_dst_sse2+0x34>
   DB  15,183,92,126,4                     ; movzwl        0x4(%esi,%edi,2),%ebx
   DB  102,15,110,227                      ; movd          %ebx,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
   DB  102,15,110,44,126                   ; movd          (%esi,%edi,2),%xmm5
   DB  242,15,112,237,212                  ; pshuflw       $0xd4,%xmm5,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  233,97,255,255,255                  ; jmp           430c <_sk_load_565_dst_sse2+0x34>
+  DB  233,97,255,255,255                  ; jmp           436c <_sk_load_565_dst_sse2+0x34>
   DB  15,183,52,126                       ; movzwl        (%esi,%edi,2),%esi
   DB  102,15,110,230                      ; movd          %esi,%xmm4
-  DB  233,84,255,255,255                  ; jmp           430c <_sk_load_565_dst_sse2+0x34>
+  DB  233,84,255,255,255                  ; jmp           436c <_sk_load_565_dst_sse2+0x34>
 
 PUBLIC _sk_gather_565_sse2
 _sk_gather_565_sse2 LABEL PROC
@@ -48733,36 +48894,49 @@
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,95,224                           ; maxps         %xmm0,%xmm4
+  DB  15,93,226                           ; minps         %xmm2,%xmm4
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,209                           ; maxps         %xmm1,%xmm2
+  DB  15,93,208                           ; minps         %xmm0,%xmm2
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,194                       ; cvttps2dq     %xmm2,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,204                       ; cvttps2dq     %xmm4,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,193,229                  ; pshufd        $0xe5,%xmm1,%xmm0
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,110,209                      ; movd          %ecx,%xmm2
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
+  DB  102,15,126,193                      ; movd          %xmm0,%ecx
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,196,209,1                    ; pinsrw        $0x1,%ecx,%xmm2
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  102,15,112,192,231                  ; pshufd        $0xe7,%xmm0,%xmm0
+  DB  102,15,126,193                      ; movd          %xmm0,%ecx
+  DB  102,15,112,193,231                  ; pshufd        $0xe7,%xmm1,%xmm0
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,196,209,2                    ; pinsrw        $0x2,%ecx,%xmm2
   DB  102,15,126,193                      ; movd          %xmm0,%ecx
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
-  DB  232,0,0,0,0                         ; call          4438 <_sk_gather_565_sse2+0x80>
+  DB  232,0,0,0,0                         ; call          44c8 <_sk_gather_565_sse2+0xb0>
   DB  90                                  ; pop           %edx
-  DB  102,15,196,209,3                    ; pinsrw        $0x3,%ecx,%xmm2
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
+  DB  102,15,196,209,3                    ; pinsrw        $0x3,%ecx,%xmm2
   DB  102,15,97,208                       ; punpcklwd     %xmm0,%xmm2
   DB  102,15,111,130,232,137,0,0          ; movdqa        0x89e8(%edx),%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
@@ -48793,7 +48967,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          44ab <_sk_store_565_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          453b <_sk_store_565_sse2+0xe>
   DB  95                                  ; pop           %edi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48824,7 +48998,7 @@
   DB  102,15,112,236,229                  ; pshufd        $0xe5,%xmm4,%xmm5
   DB  102,15,126,109,236                  ; movd          %xmm5,-0x14(%ebp)
   DB  133,219                             ; test          %ebx,%ebx
-  DB  117,34                              ; jne           453f <_sk_store_565_sse2+0xa2>
+  DB  117,34                              ; jne           45cf <_sk_store_565_sse2+0xa2>
   DB  102,15,126,231                      ; movd          %xmm4,%edi
   DB  102,15,126,235                      ; movd          %xmm5,%ebx
   DB  137,60,114                          ; mov           %edi,(%edx,%esi,2)
@@ -48844,20 +49018,20 @@
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,37                              ; je            4575 <_sk_store_565_sse2+0xd8>
+  DB  116,37                              ; je            4605 <_sk_store_565_sse2+0xd8>
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,15                              ; je            4564 <_sk_store_565_sse2+0xc7>
+  DB  116,15                              ; je            45f4 <_sk_store_565_sse2+0xc7>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,210                             ; jne           452c <_sk_store_565_sse2+0x8f>
+  DB  117,210                             ; jne           45bc <_sk_store_565_sse2+0x8f>
   DB  102,15,197,252,4                    ; pextrw        $0x4,%xmm4,%edi
   DB  102,137,124,114,4                   ; mov           %di,0x4(%edx,%esi,2)
   DB  102,15,112,228,212                  ; pshufd        $0xd4,%xmm4,%xmm4
   DB  242,15,112,228,232                  ; pshuflw       $0xe8,%xmm4,%xmm4
   DB  102,15,126,36,114                   ; movd          %xmm4,(%edx,%esi,2)
-  DB  235,183                             ; jmp           452c <_sk_store_565_sse2+0x8f>
+  DB  235,183                             ; jmp           45bc <_sk_store_565_sse2+0x8f>
   DB  102,15,126,231                      ; movd          %xmm4,%edi
   DB  102,137,60,114                      ; mov           %di,(%edx,%esi,2)
-  DB  235,173                             ; jmp           452c <_sk_store_565_sse2+0x8f>
+  DB  235,173                             ; jmp           45bc <_sk_store_565_sse2+0x8f>
 
 PUBLIC _sk_load_4444_sse2
 _sk_load_4444_sse2 LABEL PROC
@@ -48867,7 +49041,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          458d <_sk_load_4444_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          461d <_sk_load_4444_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48879,7 +49053,7 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,112                             ; jne           461a <_sk_load_4444_sse2+0x9b>
+  DB  117,112                             ; jne           46aa <_sk_load_4444_sse2+0x9b>
   DB  243,15,126,28,126                   ; movq          (%esi,%edi,2),%xmm3
   DB  102,15,97,216                       ; punpcklwd     %xmm0,%xmm3
   DB  102,15,111,130,163,138,0,0          ; movdqa        0x8aa3(%edx),%xmm0
@@ -48910,22 +49084,22 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,47                              ; je            4651 <_sk_load_4444_sse2+0xd2>
+  DB  116,47                              ; je            46e1 <_sk_load_4444_sse2+0xd2>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,19                              ; je            463e <_sk_load_4444_sse2+0xbf>
+  DB  116,19                              ; je            46ce <_sk_load_4444_sse2+0xbf>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,131                             ; jne           45b3 <_sk_load_4444_sse2+0x34>
+  DB  117,131                             ; jne           4643 <_sk_load_4444_sse2+0x34>
   DB  15,183,92,126,4                     ; movzwl        0x4(%esi,%edi,2),%ebx
   DB  102,15,110,195                      ; movd          %ebx,%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,15,110,4,126                    ; movd          (%esi,%edi,2),%xmm0
   DB  242,15,112,192,212                  ; pshuflw       $0xd4,%xmm0,%xmm0
   DB  242,15,16,216                       ; movsd         %xmm0,%xmm3
-  DB  233,98,255,255,255                  ; jmp           45b3 <_sk_load_4444_sse2+0x34>
+  DB  233,98,255,255,255                  ; jmp           4643 <_sk_load_4444_sse2+0x34>
   DB  15,183,52,126                       ; movzwl        (%esi,%edi,2),%esi
   DB  102,15,110,222                      ; movd          %esi,%xmm3
-  DB  233,85,255,255,255                  ; jmp           45b3 <_sk_load_4444_sse2+0x34>
+  DB  233,85,255,255,255                  ; jmp           4643 <_sk_load_4444_sse2+0x34>
 
 PUBLIC _sk_load_4444_dst_sse2
 _sk_load_4444_dst_sse2 LABEL PROC
@@ -48935,7 +49109,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          466c <_sk_load_4444_dst_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          46fc <_sk_load_4444_dst_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -48947,7 +49121,7 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  15,133,128,0,0,0                    ; jne           470d <_sk_load_4444_dst_sse2+0xaf>
+  DB  15,133,128,0,0,0                    ; jne           479d <_sk_load_4444_dst_sse2+0xaf>
   DB  243,15,126,36,126                   ; movq          (%esi,%edi,2),%xmm4
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
   DB  102,15,111,170,196,137,0,0          ; movdqa        0x89c4(%edx),%xmm5
@@ -48982,22 +49156,22 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,51                              ; je            4748 <_sk_load_4444_dst_sse2+0xea>
+  DB  116,51                              ; je            47d8 <_sk_load_4444_dst_sse2+0xea>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,23                              ; je            4735 <_sk_load_4444_dst_sse2+0xd7>
+  DB  116,23                              ; je            47c5 <_sk_load_4444_dst_sse2+0xd7>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  15,133,111,255,255,255              ; jne           4696 <_sk_load_4444_dst_sse2+0x38>
+  DB  15,133,111,255,255,255              ; jne           4726 <_sk_load_4444_dst_sse2+0x38>
   DB  15,183,92,126,4                     ; movzwl        0x4(%esi,%edi,2),%ebx
   DB  102,15,110,227                      ; movd          %ebx,%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
   DB  102,15,110,44,126                   ; movd          (%esi,%edi,2),%xmm5
   DB  242,15,112,237,212                  ; pshuflw       $0xd4,%xmm5,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  233,78,255,255,255                  ; jmp           4696 <_sk_load_4444_dst_sse2+0x38>
+  DB  233,78,255,255,255                  ; jmp           4726 <_sk_load_4444_dst_sse2+0x38>
   DB  15,183,52,126                       ; movzwl        (%esi,%edi,2),%esi
   DB  102,15,110,230                      ; movd          %esi,%xmm4
-  DB  233,65,255,255,255                  ; jmp           4696 <_sk_load_4444_dst_sse2+0x38>
+  DB  233,65,255,255,255                  ; jmp           4726 <_sk_load_4444_dst_sse2+0x38>
 
 PUBLIC _sk_gather_4444_sse2
 _sk_gather_4444_sse2 LABEL PROC
@@ -49006,52 +49180,65 @@
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,95,224                           ; maxps         %xmm0,%xmm4
+  DB  15,93,226                           ; minps         %xmm2,%xmm4
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,209                           ; maxps         %xmm1,%xmm2
+  DB  15,93,208                           ; minps         %xmm0,%xmm2
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,194                       ; cvttps2dq     %xmm2,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,204                       ; cvttps2dq     %xmm4,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,193,229                  ; pshufd        $0xe5,%xmm1,%xmm0
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,110,217                      ; movd          %ecx,%xmm3
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
+  DB  102,15,126,193                      ; movd          %xmm0,%ecx
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,196,217,1                    ; pinsrw        $0x1,%ecx,%xmm3
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  102,15,112,192,231                  ; pshufd        $0xe7,%xmm0,%xmm0
+  DB  102,15,126,193                      ; movd          %xmm0,%ecx
+  DB  102,15,112,193,231                  ; pshufd        $0xe7,%xmm1,%xmm0
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,196,217,2                    ; pinsrw        $0x2,%ecx,%xmm3
   DB  102,15,126,193                      ; movd          %xmm0,%ecx
   DB  15,183,12,74                        ; movzwl        (%edx,%ecx,2),%ecx
   DB  102,15,196,217,3                    ; pinsrw        $0x3,%ecx,%xmm3
-  DB  232,0,0,0,0                         ; call          47da <_sk_gather_4444_sse2+0x85>
+  DB  232,0,0,0,0                         ; call          489a <_sk_gather_4444_sse2+0xb5>
   DB  89                                  ; pop           %ecx
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,97,216                       ; punpcklwd     %xmm0,%xmm3
-  DB  102,15,111,129,86,136,0,0           ; movdqa        0x8856(%ecx),%xmm0
+  DB  102,15,111,129,38,136,0,0           ; movdqa        0x8826(%ecx),%xmm0
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,89,129,102,136,0,0               ; mulps         0x8866(%ecx),%xmm0
-  DB  102,15,111,137,118,136,0,0          ; movdqa        0x8876(%ecx),%xmm1
+  DB  15,89,129,54,136,0,0                ; mulps         0x8836(%ecx),%xmm0
+  DB  102,15,111,137,70,136,0,0           ; movdqa        0x8846(%ecx),%xmm1
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
   DB  15,91,201                           ; cvtdq2ps      %xmm1,%xmm1
-  DB  15,89,137,134,136,0,0               ; mulps         0x8886(%ecx),%xmm1
-  DB  102,15,111,145,150,136,0,0          ; movdqa        0x8896(%ecx),%xmm2
+  DB  15,89,137,86,136,0,0                ; mulps         0x8856(%ecx),%xmm1
+  DB  102,15,111,145,102,136,0,0          ; movdqa        0x8866(%ecx),%xmm2
   DB  102,15,219,211                      ; pand          %xmm3,%xmm2
   DB  15,91,210                           ; cvtdq2ps      %xmm2,%xmm2
-  DB  15,89,145,166,136,0,0               ; mulps         0x88a6(%ecx),%xmm2
-  DB  102,15,219,153,182,136,0,0          ; pand          0x88b6(%ecx),%xmm3
+  DB  15,89,145,118,136,0,0               ; mulps         0x8876(%ecx),%xmm2
+  DB  102,15,219,153,134,136,0,0          ; pand          0x8886(%ecx),%xmm3
   DB  15,91,219                           ; cvtdq2ps      %xmm3,%xmm3
-  DB  15,89,153,198,136,0,0               ; mulps         0x88c6(%ecx),%xmm3
+  DB  15,89,153,150,136,0,0               ; mulps         0x8896(%ecx),%xmm3
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  81                                  ; push          %ecx
@@ -49069,7 +49256,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4857 <_sk_store_4444_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4917 <_sk_store_4444_sse2+0xe>
   DB  95                                  ; pop           %edi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49079,7 +49266,7 @@
   DB  1,210                               ; add           %edx,%edx
   DB  3,22                                ; add           (%esi),%edx
   DB  139,49                              ; mov           (%ecx),%esi
-  DB  15,40,167,89,136,0,0                ; movaps        0x8859(%edi),%xmm4
+  DB  15,40,167,41,136,0,0                ; movaps        0x8829(%edi),%xmm4
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
@@ -49105,7 +49292,7 @@
   DB  102,15,112,236,229                  ; pshufd        $0xe5,%xmm4,%xmm5
   DB  102,15,126,109,236                  ; movd          %xmm5,-0x14(%ebp)
   DB  133,219                             ; test          %ebx,%ebx
-  DB  117,34                              ; jne           48fa <_sk_store_4444_sse2+0xb1>
+  DB  117,34                              ; jne           49ba <_sk_store_4444_sse2+0xb1>
   DB  102,15,126,231                      ; movd          %xmm4,%edi
   DB  102,15,126,235                      ; movd          %xmm5,%ebx
   DB  137,60,114                          ; mov           %edi,(%edx,%esi,2)
@@ -49125,20 +49312,20 @@
   DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,37                              ; je            4930 <_sk_store_4444_sse2+0xe7>
+  DB  116,37                              ; je            49f0 <_sk_store_4444_sse2+0xe7>
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,15                              ; je            491f <_sk_store_4444_sse2+0xd6>
+  DB  116,15                              ; je            49df <_sk_store_4444_sse2+0xd6>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,210                             ; jne           48e7 <_sk_store_4444_sse2+0x9e>
+  DB  117,210                             ; jne           49a7 <_sk_store_4444_sse2+0x9e>
   DB  102,15,197,252,4                    ; pextrw        $0x4,%xmm4,%edi
   DB  102,137,124,114,4                   ; mov           %di,0x4(%edx,%esi,2)
   DB  102,15,112,228,212                  ; pshufd        $0xd4,%xmm4,%xmm4
   DB  242,15,112,228,232                  ; pshuflw       $0xe8,%xmm4,%xmm4
   DB  102,15,126,36,114                   ; movd          %xmm4,(%edx,%esi,2)
-  DB  235,183                             ; jmp           48e7 <_sk_store_4444_sse2+0x9e>
+  DB  235,183                             ; jmp           49a7 <_sk_store_4444_sse2+0x9e>
   DB  102,15,126,231                      ; movd          %xmm4,%edi
   DB  102,137,60,114                      ; mov           %di,(%edx,%esi,2)
-  DB  235,173                             ; jmp           48e7 <_sk_store_4444_sse2+0x9e>
+  DB  235,173                             ; jmp           49a7 <_sk_store_4444_sse2+0x9e>
 
 PUBLIC _sk_load_8888_sse2
 _sk_load_8888_sse2 LABEL PROC
@@ -49148,7 +49335,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4948 <_sk_load_8888_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4a08 <_sk_load_8888_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49160,13 +49347,13 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,102                             ; jne           49cc <_sk_load_8888_sse2+0x92>
+  DB  117,102                             ; jne           4a8c <_sk_load_8888_sse2+0x92>
   DB  243,15,111,28,190                   ; movdqu        (%esi,%edi,4),%xmm3
-  DB  102,15,111,146,152,131,0,0          ; movdqa        0x8398(%edx),%xmm2
+  DB  102,15,111,146,104,131,0,0          ; movdqa        0x8368(%edx),%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,40,162,200,132,0,0               ; movaps        0x84c8(%edx),%xmm4
+  DB  15,40,162,152,132,0,0               ; movaps        0x8498(%edx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -49194,18 +49381,18 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,35                              ; je            49f7 <_sk_load_8888_sse2+0xbd>
+  DB  116,35                              ; je            4ab7 <_sk_load_8888_sse2+0xbd>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,16                              ; je            49ed <_sk_load_8888_sse2+0xb3>
+  DB  116,16                              ; je            4aad <_sk_load_8888_sse2+0xb3>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,137                             ; jne           496b <_sk_load_8888_sse2+0x31>
+  DB  117,137                             ; jne           4a2b <_sk_load_8888_sse2+0x31>
   DB  102,15,110,68,190,8                 ; movd          0x8(%esi,%edi,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,15,18,28,190                    ; movlpd        (%esi,%edi,4),%xmm3
-  DB  233,116,255,255,255                 ; jmp           496b <_sk_load_8888_sse2+0x31>
+  DB  233,116,255,255,255                 ; jmp           4a2b <_sk_load_8888_sse2+0x31>
   DB  102,15,110,28,190                   ; movd          (%esi,%edi,4),%xmm3
-  DB  233,106,255,255,255                 ; jmp           496b <_sk_load_8888_sse2+0x31>
+  DB  233,106,255,255,255                 ; jmp           4a2b <_sk_load_8888_sse2+0x31>
 
 PUBLIC _sk_load_8888_dst_sse2
 _sk_load_8888_dst_sse2 LABEL PROC
@@ -49215,7 +49402,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4a0f <_sk_load_8888_dst_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4acf <_sk_load_8888_dst_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49227,13 +49414,13 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,118                             ; jne           4aa3 <_sk_load_8888_dst_sse2+0xa2>
+  DB  117,118                             ; jne           4b63 <_sk_load_8888_dst_sse2+0xa2>
   DB  243,15,111,36,190                   ; movdqu        (%esi,%edi,4),%xmm4
-  DB  102,15,111,170,209,130,0,0          ; movdqa        0x82d1(%edx),%xmm5
+  DB  102,15,111,170,161,130,0,0          ; movdqa        0x82a1(%edx),%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  102,15,219,245                      ; pand          %xmm5,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,40,186,1,132,0,0                 ; movaps        0x8401(%edx),%xmm7
+  DB  15,40,186,209,131,0,0               ; movaps        0x83d1(%edx),%xmm7
   DB  15,89,247                           ; mulps         %xmm7,%xmm6
   DB  15,41,113,16                        ; movaps        %xmm6,0x10(%ecx)
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
@@ -49265,18 +49452,18 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,39                              ; je            4ad2 <_sk_load_8888_dst_sse2+0xd1>
+  DB  116,39                              ; je            4b92 <_sk_load_8888_dst_sse2+0xd1>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,20                              ; je            4ac8 <_sk_load_8888_dst_sse2+0xc7>
+  DB  116,20                              ; je            4b88 <_sk_load_8888_dst_sse2+0xc7>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  15,133,117,255,255,255              ; jne           4a32 <_sk_load_8888_dst_sse2+0x31>
+  DB  15,133,117,255,255,255              ; jne           4af2 <_sk_load_8888_dst_sse2+0x31>
   DB  102,15,110,100,190,8                ; movd          0x8(%esi,%edi,4),%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
   DB  102,15,18,36,190                    ; movlpd        (%esi,%edi,4),%xmm4
-  DB  233,96,255,255,255                  ; jmp           4a32 <_sk_load_8888_dst_sse2+0x31>
+  DB  233,96,255,255,255                  ; jmp           4af2 <_sk_load_8888_dst_sse2+0x31>
   DB  102,15,110,36,190                   ; movd          (%esi,%edi,4),%xmm4
-  DB  233,86,255,255,255                  ; jmp           4a32 <_sk_load_8888_dst_sse2+0x31>
+  DB  233,86,255,255,255                  ; jmp           4af2 <_sk_load_8888_dst_sse2+0x31>
 
 PUBLIC _sk_gather_8888_sse2
 _sk_gather_8888_sse2 LABEL PROC
@@ -49285,39 +49472,52 @@
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,87,237                           ; xorps         %xmm5,%xmm5
+  DB  15,95,232                           ; maxps         %xmm0,%xmm5
+  DB  15,93,234                           ; minps         %xmm2,%xmm5
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,95,225                           ; maxps         %xmm1,%xmm4
+  DB  15,93,224                           ; minps         %xmm0,%xmm4
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,196                       ; cvttps2dq     %xmm4,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,15,112,208,231                  ; pshufd        $0xe7,%xmm0,%xmm2
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,205                       ; cvttps2dq     %xmm5,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,15,112,209,231                  ; pshufd        $0xe7,%xmm1,%xmm2
   DB  102,15,126,209                      ; movd          %xmm2,%ecx
   DB  102,15,110,20,138                   ; movd          (%edx,%ecx,4),%xmm2
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  102,15,110,12,138                   ; movd          (%edx,%ecx,4),%xmm1
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,192,229                  ; pshufd        $0xe5,%xmm0,%xmm0
-  DB  102,15,110,28,138                   ; movd          (%edx,%ecx,4),%xmm3
   DB  102,15,126,193                      ; movd          %xmm0,%ecx
   DB  102,15,110,4,138                    ; movd          (%edx,%ecx,4),%xmm0
-  DB  232,0,0,0,0                         ; call          4b52 <_sk_gather_8888_sse2+0x76>
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,201,229                  ; pshufd        $0xe5,%xmm1,%xmm1
+  DB  102,15,110,28,138                   ; movd          (%edx,%ecx,4),%xmm3
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,110,12,138                   ; movd          (%edx,%ecx,4),%xmm1
+  DB  232,0,0,0,0                         ; call          4c42 <_sk_gather_8888_sse2+0xa6>
   DB  89                                  ; pop           %ecx
-  DB  102,15,98,202                       ; punpckldq     %xmm2,%xmm1
-  DB  102,15,98,216                       ; punpckldq     %xmm0,%xmm3
-  DB  102,15,108,217                      ; punpcklqdq    %xmm1,%xmm3
-  DB  102,15,111,145,142,129,0,0          ; movdqa        0x818e(%ecx),%xmm2
+  DB  102,15,98,194                       ; punpckldq     %xmm2,%xmm0
+  DB  102,15,98,217                       ; punpckldq     %xmm1,%xmm3
+  DB  102,15,108,216                      ; punpcklqdq    %xmm0,%xmm3
+  DB  102,15,111,145,46,129,0,0           ; movdqa        0x812e(%ecx),%xmm2
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,219,194                      ; pand          %xmm2,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,40,161,190,130,0,0               ; movaps        0x82be(%ecx),%xmm4
+  DB  15,40,161,94,130,0,0                ; movaps        0x825e(%ecx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -49349,7 +49549,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4bcd <_sk_store_8888_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4cbd <_sk_store_8888_sse2+0xe>
   DB  95                                  ; pop           %edi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49359,7 +49559,7 @@
   DB  193,226,2                           ; shl           $0x2,%edx
   DB  3,22                                ; add           (%esi),%edx
   DB  139,49                              ; mov           (%ecx),%esi
-  DB  15,40,167,35,129,0,0                ; movaps        0x8123(%edi),%xmm4
+  DB  15,40,167,195,128,0,0               ; movaps        0x80c3(%edi),%xmm4
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
@@ -49379,7 +49579,7 @@
   DB  102,15,235,229                      ; por           %xmm5,%xmm4
   DB  102,15,235,230                      ; por           %xmm6,%xmm4
   DB  133,219                             ; test          %ebx,%ebx
-  DB  117,24                              ; jne           4c4a <_sk_store_8888_sse2+0x8b>
+  DB  117,24                              ; jne           4d3a <_sk_store_8888_sse2+0x8b>
   DB  243,15,127,36,178                   ; movdqu        %xmm4,(%edx,%esi,4)
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -49394,17 +49594,17 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,28                              ; je            4c6e <_sk_store_8888_sse2+0xaf>
+  DB  116,28                              ; je            4d5e <_sk_store_8888_sse2+0xaf>
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,16                              ; je            4c67 <_sk_store_8888_sse2+0xa8>
+  DB  116,16                              ; je            4d57 <_sk_store_8888_sse2+0xa8>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,219                             ; jne           4c37 <_sk_store_8888_sse2+0x78>
+  DB  117,219                             ; jne           4d27 <_sk_store_8888_sse2+0x78>
   DB  102,15,112,236,78                   ; pshufd        $0x4e,%xmm4,%xmm5
   DB  102,15,126,108,178,8                ; movd          %xmm5,0x8(%edx,%esi,4)
   DB  102,15,214,36,178                   ; movq          %xmm4,(%edx,%esi,4)
-  DB  235,201                             ; jmp           4c37 <_sk_store_8888_sse2+0x78>
+  DB  235,201                             ; jmp           4d27 <_sk_store_8888_sse2+0x78>
   DB  102,15,126,36,178                   ; movd          %xmm4,(%edx,%esi,4)
-  DB  235,194                             ; jmp           4c37 <_sk_store_8888_sse2+0x78>
+  DB  235,194                             ; jmp           4d27 <_sk_store_8888_sse2+0x78>
 
 PUBLIC _sk_load_bgra_sse2
 _sk_load_bgra_sse2 LABEL PROC
@@ -49414,7 +49614,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4c83 <_sk_load_bgra_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4d73 <_sk_load_bgra_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49426,13 +49626,13 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,102                             ; jne           4d07 <_sk_load_bgra_sse2+0x92>
+  DB  117,102                             ; jne           4df7 <_sk_load_bgra_sse2+0x92>
   DB  243,15,111,28,190                   ; movdqu        (%esi,%edi,4),%xmm3
-  DB  102,15,111,130,93,128,0,0           ; movdqa        0x805d(%edx),%xmm0
+  DB  102,15,111,130,253,127,0,0          ; movdqa        0x7ffd(%edx),%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  15,91,209                           ; cvtdq2ps      %xmm1,%xmm2
-  DB  15,40,162,141,129,0,0               ; movaps        0x818d(%edx),%xmm4
+  DB  15,40,162,45,129,0,0                ; movaps        0x812d(%edx),%xmm4
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -49460,18 +49660,18 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,35                              ; je            4d32 <_sk_load_bgra_sse2+0xbd>
+  DB  116,35                              ; je            4e22 <_sk_load_bgra_sse2+0xbd>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,16                              ; je            4d28 <_sk_load_bgra_sse2+0xb3>
+  DB  116,16                              ; je            4e18 <_sk_load_bgra_sse2+0xb3>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,137                             ; jne           4ca6 <_sk_load_bgra_sse2+0x31>
+  DB  117,137                             ; jne           4d96 <_sk_load_bgra_sse2+0x31>
   DB  102,15,110,68,190,8                 ; movd          0x8(%esi,%edi,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,15,18,28,190                    ; movlpd        (%esi,%edi,4),%xmm3
-  DB  233,116,255,255,255                 ; jmp           4ca6 <_sk_load_bgra_sse2+0x31>
+  DB  233,116,255,255,255                 ; jmp           4d96 <_sk_load_bgra_sse2+0x31>
   DB  102,15,110,28,190                   ; movd          (%esi,%edi,4),%xmm3
-  DB  233,106,255,255,255                 ; jmp           4ca6 <_sk_load_bgra_sse2+0x31>
+  DB  233,106,255,255,255                 ; jmp           4d96 <_sk_load_bgra_sse2+0x31>
 
 PUBLIC _sk_load_bgra_dst_sse2
 _sk_load_bgra_dst_sse2 LABEL PROC
@@ -49481,7 +49681,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4d4a <_sk_load_bgra_dst_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          4e3a <_sk_load_bgra_dst_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49493,13 +49693,13 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  117,118                             ; jne           4dde <_sk_load_bgra_dst_sse2+0xa2>
+  DB  117,118                             ; jne           4ece <_sk_load_bgra_dst_sse2+0xa2>
   DB  243,15,111,36,190                   ; movdqu        (%esi,%edi,4),%xmm4
-  DB  102,15,111,170,150,127,0,0          ; movdqa        0x7f96(%edx),%xmm5
+  DB  102,15,111,170,54,127,0,0           ; movdqa        0x7f36(%edx),%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  102,15,219,245                      ; pand          %xmm5,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
-  DB  15,40,186,198,128,0,0               ; movaps        0x80c6(%edx),%xmm7
+  DB  15,40,186,102,128,0,0               ; movaps        0x8066(%edx),%xmm7
   DB  15,89,247                           ; mulps         %xmm7,%xmm6
   DB  15,41,113,48                        ; movaps        %xmm6,0x30(%ecx)
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
@@ -49531,18 +49731,18 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,39                              ; je            4e0d <_sk_load_bgra_dst_sse2+0xd1>
+  DB  116,39                              ; je            4efd <_sk_load_bgra_dst_sse2+0xd1>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,20                              ; je            4e03 <_sk_load_bgra_dst_sse2+0xc7>
+  DB  116,20                              ; je            4ef3 <_sk_load_bgra_dst_sse2+0xc7>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  15,133,117,255,255,255              ; jne           4d6d <_sk_load_bgra_dst_sse2+0x31>
+  DB  15,133,117,255,255,255              ; jne           4e5d <_sk_load_bgra_dst_sse2+0x31>
   DB  102,15,110,100,190,8                ; movd          0x8(%esi,%edi,4),%xmm4
   DB  102,15,112,228,69                   ; pshufd        $0x45,%xmm4,%xmm4
   DB  102,15,18,36,190                    ; movlpd        (%esi,%edi,4),%xmm4
-  DB  233,96,255,255,255                  ; jmp           4d6d <_sk_load_bgra_dst_sse2+0x31>
+  DB  233,96,255,255,255                  ; jmp           4e5d <_sk_load_bgra_dst_sse2+0x31>
   DB  102,15,110,36,190                   ; movd          (%esi,%edi,4),%xmm4
-  DB  233,86,255,255,255                  ; jmp           4d6d <_sk_load_bgra_dst_sse2+0x31>
+  DB  233,86,255,255,255                  ; jmp           4e5d <_sk_load_bgra_dst_sse2+0x31>
 
 PUBLIC _sk_gather_bgra_sse2
 _sk_gather_bgra_sse2 LABEL PROC
@@ -49551,39 +49751,52 @@
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,87,237                           ; xorps         %xmm5,%xmm5
+  DB  15,95,232                           ; maxps         %xmm0,%xmm5
+  DB  15,93,234                           ; minps         %xmm2,%xmm5
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,95,225                           ; maxps         %xmm1,%xmm4
+  DB  15,93,224                           ; minps         %xmm0,%xmm4
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,196                       ; cvttps2dq     %xmm4,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,15,112,208,231                  ; pshufd        $0xe7,%xmm0,%xmm2
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,205                       ; cvttps2dq     %xmm5,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,15,112,209,231                  ; pshufd        $0xe7,%xmm1,%xmm2
   DB  102,15,126,209                      ; movd          %xmm2,%ecx
   DB  102,15,110,20,138                   ; movd          (%edx,%ecx,4),%xmm2
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  102,15,110,12,138                   ; movd          (%edx,%ecx,4),%xmm1
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,192,229                  ; pshufd        $0xe5,%xmm0,%xmm0
-  DB  102,15,110,28,138                   ; movd          (%edx,%ecx,4),%xmm3
   DB  102,15,126,193                      ; movd          %xmm0,%ecx
   DB  102,15,110,4,138                    ; movd          (%edx,%ecx,4),%xmm0
-  DB  232,0,0,0,0                         ; call          4e8d <_sk_gather_bgra_sse2+0x76>
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,201,229                  ; pshufd        $0xe5,%xmm1,%xmm1
+  DB  102,15,110,28,138                   ; movd          (%edx,%ecx,4),%xmm3
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,110,12,138                   ; movd          (%edx,%ecx,4),%xmm1
+  DB  232,0,0,0,0                         ; call          4fad <_sk_gather_bgra_sse2+0xa6>
   DB  89                                  ; pop           %ecx
-  DB  102,15,98,202                       ; punpckldq     %xmm2,%xmm1
-  DB  102,15,98,216                       ; punpckldq     %xmm0,%xmm3
-  DB  102,15,108,217                      ; punpcklqdq    %xmm1,%xmm3
-  DB  102,15,111,129,83,126,0,0           ; movdqa        0x7e53(%ecx),%xmm0
+  DB  102,15,98,194                       ; punpckldq     %xmm2,%xmm0
+  DB  102,15,98,217                       ; punpckldq     %xmm1,%xmm3
+  DB  102,15,108,216                      ; punpcklqdq    %xmm0,%xmm3
+  DB  102,15,111,129,195,125,0,0          ; movdqa        0x7dc3(%ecx),%xmm0
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
   DB  15,91,209                           ; cvtdq2ps      %xmm1,%xmm2
-  DB  15,40,161,131,127,0,0               ; movaps        0x7f83(%ecx),%xmm4
+  DB  15,40,161,243,126,0,0               ; movaps        0x7ef3(%ecx),%xmm4
   DB  15,89,212                           ; mulps         %xmm4,%xmm2
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,114,209,8                    ; psrld         $0x8,%xmm1
@@ -49615,7 +49828,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,12                          ; sub           $0xc,%esp
-  DB  232,0,0,0,0                         ; call          4f08 <_sk_store_bgra_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          5028 <_sk_store_bgra_sse2+0xe>
   DB  95                                  ; pop           %edi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49625,7 +49838,7 @@
   DB  193,226,2                           ; shl           $0x2,%edx
   DB  3,22                                ; add           (%esi),%edx
   DB  139,49                              ; mov           (%ecx),%esi
-  DB  15,40,167,232,125,0,0               ; movaps        0x7de8(%edi),%xmm4
+  DB  15,40,167,88,125,0,0                ; movaps        0x7d58(%edi),%xmm4
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  15,40,234                           ; movaps        %xmm2,%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
@@ -49645,7 +49858,7 @@
   DB  102,15,235,229                      ; por           %xmm5,%xmm4
   DB  102,15,235,230                      ; por           %xmm6,%xmm4
   DB  133,219                             ; test          %ebx,%ebx
-  DB  117,24                              ; jne           4f85 <_sk_store_bgra_sse2+0x8b>
+  DB  117,24                              ; jne           50a5 <_sk_store_bgra_sse2+0x8b>
   DB  243,15,127,36,178                   ; movdqu        %xmm4,(%edx,%esi,4)
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -49660,17 +49873,17 @@
   DB  195                                 ; ret
   DB  128,227,3                           ; and           $0x3,%bl
   DB  128,251,1                           ; cmp           $0x1,%bl
-  DB  116,28                              ; je            4fa9 <_sk_store_bgra_sse2+0xaf>
+  DB  116,28                              ; je            50c9 <_sk_store_bgra_sse2+0xaf>
   DB  128,251,2                           ; cmp           $0x2,%bl
-  DB  116,16                              ; je            4fa2 <_sk_store_bgra_sse2+0xa8>
+  DB  116,16                              ; je            50c2 <_sk_store_bgra_sse2+0xa8>
   DB  128,251,3                           ; cmp           $0x3,%bl
-  DB  117,219                             ; jne           4f72 <_sk_store_bgra_sse2+0x78>
+  DB  117,219                             ; jne           5092 <_sk_store_bgra_sse2+0x78>
   DB  102,15,112,236,78                   ; pshufd        $0x4e,%xmm4,%xmm5
   DB  102,15,126,108,178,8                ; movd          %xmm5,0x8(%edx,%esi,4)
   DB  102,15,214,36,178                   ; movq          %xmm4,(%edx,%esi,4)
-  DB  235,201                             ; jmp           4f72 <_sk_store_bgra_sse2+0x78>
+  DB  235,201                             ; jmp           5092 <_sk_store_bgra_sse2+0x78>
   DB  102,15,126,36,178                   ; movd          %xmm4,(%edx,%esi,4)
-  DB  235,194                             ; jmp           4f72 <_sk_store_bgra_sse2+0x78>
+  DB  235,194                             ; jmp           5092 <_sk_store_bgra_sse2+0x78>
 
 PUBLIC _sk_load_f16_sse2
 _sk_load_f16_sse2 LABEL PROC
@@ -49680,7 +49893,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,108                         ; sub           $0x6c,%esp
-  DB  232,0,0,0,0                         ; call          4fbe <_sk_load_f16_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          50de <_sk_load_f16_sse2+0xe>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49692,7 +49905,7 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  15,133,173,1,0,0                    ; jne           518d <_sk_load_f16_sse2+0x1dd>
+  DB  15,133,173,1,0,0                    ; jne           52ad <_sk_load_f16_sse2+0x1dd>
   DB  102,15,16,4,254                     ; movupd        (%esi,%edi,8),%xmm0
   DB  243,15,111,76,254,16                ; movdqu        0x10(%esi,%edi,8),%xmm1
   DB  102,15,40,216                       ; movapd        %xmm0,%xmm3
@@ -49722,11 +49935,11 @@
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
-  DB  102,15,111,170,2,129,0,0            ; movdqa        0x8102(%edx),%xmm5
+  DB  102,15,111,170,114,128,0,0          ; movdqa        0x8072(%edx),%xmm5
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
   DB  102,15,219,245                      ; pand          %xmm5,%xmm6
-  DB  102,15,219,138,18,129,0,0           ; pand          0x8112(%edx),%xmm1
-  DB  102,15,111,130,34,129,0,0           ; movdqa        0x8122(%edx),%xmm0
+  DB  102,15,219,138,130,128,0,0          ; pand          0x8082(%edx),%xmm1
+  DB  102,15,111,130,146,128,0,0          ; movdqa        0x8092(%edx),%xmm0
   DB  102,15,127,69,184                   ; movdqa        %xmm0,-0x48(%ebp)
   DB  102,15,114,246,16                   ; pslld         $0x10,%xmm6
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
@@ -49738,7 +49951,7 @@
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
   DB  102,15,219,213                      ; pand          %xmm5,%xmm2
-  DB  102,15,111,154,18,129,0,0           ; movdqa        0x8112(%edx),%xmm3
+  DB  102,15,111,154,130,128,0,0          ; movdqa        0x8082(%edx),%xmm3
   DB  102,15,219,227                      ; pand          %xmm3,%xmm4
   DB  102,15,114,242,16                   ; pslld         $0x10,%xmm2
   DB  102,15,102,196                      ; pcmpgtd       %xmm4,%xmm0
@@ -49751,7 +49964,7 @@
   DB  102,15,219,253                      ; pand          %xmm5,%xmm7
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  102,15,114,247,16                   ; pslld         $0x10,%xmm7
-  DB  102,15,111,146,34,129,0,0           ; movdqa        0x8122(%edx),%xmm2
+  DB  102,15,111,146,146,128,0,0          ; movdqa        0x8092(%edx),%xmm2
   DB  102,15,102,208                      ; pcmpgtd       %xmm0,%xmm2
   DB  102,15,114,240,13                   ; pslld         $0xd,%xmm0
   DB  102,15,235,199                      ; por           %xmm7,%xmm0
@@ -49766,7 +49979,7 @@
   DB  102,15,127,93,184                   ; movdqa        %xmm3,-0x48(%ebp)
   DB  102,15,114,247,13                   ; pslld         $0xd,%xmm7
   DB  102,15,235,253                      ; por           %xmm5,%xmm7
-  DB  102,15,111,154,50,129,0,0           ; movdqa        0x8132(%edx),%xmm3
+  DB  102,15,111,154,162,128,0,0          ; movdqa        0x80a2(%edx),%xmm3
   DB  102,15,254,203                      ; paddd         %xmm3,%xmm1
   DB  102,15,254,227                      ; paddd         %xmm3,%xmm4
   DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
@@ -49794,12 +50007,12 @@
   DB  242,15,16,4,254                     ; movsd         (%esi,%edi,8),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  131,251,1                           ; cmp           $0x1,%ebx
-  DB  15,132,76,254,255,255               ; je            4feb <_sk_load_f16_sse2+0x3b>
+  DB  15,132,76,254,255,255               ; je            510b <_sk_load_f16_sse2+0x3b>
   DB  102,15,22,68,254,8                  ; movhpd        0x8(%esi,%edi,8),%xmm0
   DB  131,251,3                           ; cmp           $0x3,%ebx
-  DB  15,130,61,254,255,255               ; jb            4feb <_sk_load_f16_sse2+0x3b>
+  DB  15,130,61,254,255,255               ; jb            510b <_sk_load_f16_sse2+0x3b>
   DB  243,15,126,76,254,16                ; movq          0x10(%esi,%edi,8),%xmm1
-  DB  233,50,254,255,255                  ; jmp           4feb <_sk_load_f16_sse2+0x3b>
+  DB  233,50,254,255,255                  ; jmp           510b <_sk_load_f16_sse2+0x3b>
 
 PUBLIC _sk_load_f16_dst_sse2
 _sk_load_f16_dst_sse2 LABEL PROC
@@ -49813,7 +50026,7 @@
   DB  15,41,85,136                        ; movaps        %xmm2,-0x78(%ebp)
   DB  102,15,127,77,152                   ; movdqa        %xmm1,-0x68(%ebp)
   DB  15,41,69,168                        ; movaps        %xmm0,-0x58(%ebp)
-  DB  232,0,0,0,0                         ; call          51db <_sk_load_f16_dst_sse2+0x22>
+  DB  232,0,0,0,0                         ; call          52fb <_sk_load_f16_dst_sse2+0x22>
   DB  90                                  ; pop           %edx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -49825,7 +50038,7 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  133,219                             ; test          %ebx,%ebx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  15,133,168,1,0,0                    ; jne           53a5 <_sk_load_f16_dst_sse2+0x1ec>
+  DB  15,133,168,1,0,0                    ; jne           54c5 <_sk_load_f16_dst_sse2+0x1ec>
   DB  102,15,16,4,254                     ; movupd        (%esi,%edi,8),%xmm0
   DB  243,15,111,76,254,16                ; movdqu        0x10(%esi,%edi,8),%xmm1
   DB  102,15,40,208                       ; movapd        %xmm0,%xmm2
@@ -49853,18 +50066,18 @@
   DB  102,15,126,85,232                   ; movd          %xmm2,-0x18(%ebp)
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
   DB  102,15,97,202                       ; punpcklwd     %xmm2,%xmm1
-  DB  102,15,111,186,229,126,0,0          ; movdqa        0x7ee5(%edx),%xmm7
+  DB  102,15,111,186,85,126,0,0           ; movdqa        0x7e55(%edx),%xmm7
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,15,219,215                      ; pand          %xmm7,%xmm2
-  DB  102,15,111,154,245,126,0,0          ; movdqa        0x7ef5(%edx),%xmm3
+  DB  102,15,111,154,101,126,0,0          ; movdqa        0x7e65(%edx),%xmm3
   DB  102,15,219,203                      ; pand          %xmm3,%xmm1
-  DB  102,15,111,162,5,127,0,0            ; movdqa        0x7f05(%edx),%xmm4
+  DB  102,15,111,162,117,126,0,0          ; movdqa        0x7e75(%edx),%xmm4
   DB  102,15,114,242,16                   ; pslld         $0x10,%xmm2
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,102,233                      ; pcmpgtd       %xmm1,%xmm5
   DB  102,15,114,241,13                   ; pslld         $0xd,%xmm1
   DB  102,15,235,202                      ; por           %xmm2,%xmm1
-  DB  102,15,111,146,21,127,0,0           ; movdqa        0x7f15(%edx),%xmm2
+  DB  102,15,111,146,133,126,0,0          ; movdqa        0x7e85(%edx),%xmm2
   DB  102,15,127,85,184                   ; movdqa        %xmm2,-0x48(%ebp)
   DB  102,15,254,202                      ; paddd         %xmm2,%xmm1
   DB  102,15,223,233                      ; pandn         %xmm1,%xmm5
@@ -49927,12 +50140,12 @@
   DB  242,15,16,4,254                     ; movsd         (%esi,%edi,8),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  131,251,1                           ; cmp           $0x1,%ebx
-  DB  15,132,81,254,255,255               ; je            5208 <_sk_load_f16_dst_sse2+0x4f>
+  DB  15,132,81,254,255,255               ; je            5328 <_sk_load_f16_dst_sse2+0x4f>
   DB  102,15,22,68,254,8                  ; movhpd        0x8(%esi,%edi,8),%xmm0
   DB  131,251,3                           ; cmp           $0x3,%ebx
-  DB  15,130,66,254,255,255               ; jb            5208 <_sk_load_f16_dst_sse2+0x4f>
+  DB  15,130,66,254,255,255               ; jb            5328 <_sk_load_f16_dst_sse2+0x4f>
   DB  243,15,126,76,254,16                ; movq          0x10(%esi,%edi,8),%xmm1
-  DB  233,55,254,255,255                  ; jmp           5208 <_sk_load_f16_dst_sse2+0x4f>
+  DB  233,55,254,255,255                  ; jmp           5328 <_sk_load_f16_dst_sse2+0x4f>
 
 PUBLIC _sk_gather_f16_sse2
 _sk_gather_f16_sse2 LABEL PROC
@@ -49941,121 +50154,134 @@
   DB  131,236,88                          ; sub           $0x58,%esp
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,8                               ; mov           (%eax),%ecx
+  DB  243,15,16,81,8                      ; movss         0x8(%ecx),%xmm2
+  DB  15,198,210,0                        ; shufps        $0x0,%xmm2,%xmm2
+  DB  102,15,118,219                      ; pcmpeqd       %xmm3,%xmm3
+  DB  102,15,254,211                      ; paddd         %xmm3,%xmm2
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,95,224                           ; maxps         %xmm0,%xmm4
+  DB  15,93,226                           ; minps         %xmm2,%xmm4
+  DB  243,15,16,65,12                     ; movss         0xc(%ecx),%xmm0
+  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
+  DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
+  DB  15,87,210                           ; xorps         %xmm2,%xmm2
+  DB  15,95,209                           ; maxps         %xmm1,%xmm2
+  DB  15,93,208                           ; minps         %xmm0,%xmm2
   DB  139,17                              ; mov           (%ecx),%edx
-  DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
-  DB  102,15,110,81,4                     ; movd          0x4(%ecx),%xmm2
-  DB  102,15,112,210,0                    ; pshufd        $0x0,%xmm2,%xmm2
-  DB  102,15,112,217,245                  ; pshufd        $0xf5,%xmm1,%xmm3
-  DB  102,15,244,218                      ; pmuludq       %xmm2,%xmm3
-  DB  102,15,112,219,232                  ; pshufd        $0xe8,%xmm3,%xmm3
+  DB  243,15,91,194                       ; cvttps2dq     %xmm2,%xmm0
+  DB  102,15,110,73,4                     ; movd          0x4(%ecx),%xmm1
+  DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
+  DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
+  DB  102,15,244,200                      ; pmuludq       %xmm0,%xmm1
+  DB  102,15,112,193,232                  ; pshufd        $0xe8,%xmm1,%xmm0
   DB  102,15,112,202,232                  ; pshufd        $0xe8,%xmm2,%xmm1
-  DB  102,15,98,203                       ; punpckldq     %xmm3,%xmm1
-  DB  243,15,91,192                       ; cvttps2dq     %xmm0,%xmm0
-  DB  102,15,254,193                      ; paddd         %xmm1,%xmm0
-  DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
-  DB  102,15,112,208,231                  ; pshufd        $0xe7,%xmm0,%xmm2
+  DB  102,15,98,193                       ; punpckldq     %xmm1,%xmm0
+  DB  243,15,91,204                       ; cvttps2dq     %xmm4,%xmm1
+  DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
+  DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
+  DB  102,15,112,209,231                  ; pshufd        $0xe7,%xmm1,%xmm2
   DB  102,15,126,209                      ; movd          %xmm2,%ecx
   DB  243,15,126,20,202                   ; movq          (%edx,%ecx,8),%xmm2
-  DB  102,15,126,201                      ; movd          %xmm1,%ecx
-  DB  243,15,126,12,202                   ; movq          (%edx,%ecx,8),%xmm1
-  DB  102,15,126,193                      ; movd          %xmm0,%ecx
-  DB  102,15,112,192,229                  ; pshufd        $0xe5,%xmm0,%xmm0
-  DB  243,15,126,28,202                   ; movq          (%edx,%ecx,8),%xmm3
   DB  102,15,126,193                      ; movd          %xmm0,%ecx
   DB  243,15,126,4,202                    ; movq          (%edx,%ecx,8),%xmm0
-  DB  232,0,0,0,0                         ; call          5447 <_sk_gather_f16_sse2+0x76>
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  102,15,112,201,229                  ; pshufd        $0xe5,%xmm1,%xmm1
+  DB  243,15,126,28,202                   ; movq          (%edx,%ecx,8),%xmm3
+  DB  102,15,126,201                      ; movd          %xmm1,%ecx
+  DB  243,15,126,12,202                   ; movq          (%edx,%ecx,8),%xmm1
+  DB  232,0,0,0,0                         ; call          5597 <_sk_gather_f16_sse2+0xa6>
   DB  89                                  ; pop           %ecx
-  DB  102,15,108,202                      ; punpcklqdq    %xmm2,%xmm1
-  DB  102,15,108,216                      ; punpcklqdq    %xmm0,%xmm3
-  DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  102,15,97,193                       ; punpcklwd     %xmm1,%xmm0
-  DB  102,15,105,217                      ; punpckhwd     %xmm1,%xmm3
-  DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
-  DB  102,15,97,211                       ; punpcklwd     %xmm3,%xmm2
-  DB  102,15,105,195                      ; punpckhwd     %xmm3,%xmm0
-  DB  102,15,126,85,224                   ; movd          %xmm2,-0x20(%ebp)
-  DB  102,15,112,202,229                  ; pshufd        $0xe5,%xmm2,%xmm1
+  DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
+  DB  102,15,108,194                      ; punpcklqdq    %xmm2,%xmm0
+  DB  102,15,108,217                      ; punpcklqdq    %xmm1,%xmm3
+  DB  102,15,111,227                      ; movdqa        %xmm3,%xmm4
+  DB  102,15,97,224                       ; punpcklwd     %xmm0,%xmm4
+  DB  102,15,105,216                      ; punpckhwd     %xmm0,%xmm3
+  DB  102,15,111,196                      ; movdqa        %xmm4,%xmm0
+  DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
+  DB  102,15,105,227                      ; punpckhwd     %xmm3,%xmm4
+  DB  102,15,126,69,224                   ; movd          %xmm0,-0x20(%ebp)
+  DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
   DB  102,15,126,77,228                   ; movd          %xmm1,-0x1c(%ebp)
   DB  243,15,126,77,224                   ; movq          -0x20(%ebp),%xmm1
-  DB  102,15,112,218,231                  ; pshufd        $0xe7,%xmm2,%xmm3
-  DB  102,15,126,93,236                   ; movd          %xmm3,-0x14(%ebp)
-  DB  102,15,112,210,78                   ; pshufd        $0x4e,%xmm2,%xmm2
-  DB  102,15,126,85,232                   ; movd          %xmm2,-0x18(%ebp)
-  DB  243,15,126,101,232                  ; movq          -0x18(%ebp),%xmm4
-  DB  102,15,126,69,240                   ; movd          %xmm0,-0x10(%ebp)
-  DB  102,15,112,216,229                  ; pshufd        $0xe5,%xmm0,%xmm3
-  DB  102,15,126,93,244                   ; movd          %xmm3,-0xc(%ebp)
-  DB  243,15,126,85,240                   ; movq          -0x10(%ebp),%xmm2
-  DB  102,15,127,85,184                   ; movdqa        %xmm2,-0x48(%ebp)
-  DB  102,15,112,216,231                  ; pshufd        $0xe7,%xmm0,%xmm3
-  DB  102,15,126,93,252                   ; movd          %xmm3,-0x4(%ebp)
+  DB  102,15,112,208,231                  ; pshufd        $0xe7,%xmm0,%xmm2
+  DB  102,15,126,85,236                   ; movd          %xmm2,-0x14(%ebp)
   DB  102,15,112,192,78                   ; pshufd        $0x4e,%xmm0,%xmm0
+  DB  102,15,126,69,232                   ; movd          %xmm0,-0x18(%ebp)
+  DB  243,15,126,109,232                  ; movq          -0x18(%ebp),%xmm5
+  DB  102,15,126,101,240                  ; movd          %xmm4,-0x10(%ebp)
+  DB  102,15,112,196,229                  ; pshufd        $0xe5,%xmm4,%xmm0
+  DB  102,15,126,69,244                   ; movd          %xmm0,-0xc(%ebp)
+  DB  242,15,16,69,240                    ; movsd         -0x10(%ebp),%xmm0
+  DB  15,41,69,184                        ; movaps        %xmm0,-0x48(%ebp)
+  DB  102,15,112,196,231                  ; pshufd        $0xe7,%xmm4,%xmm0
+  DB  102,15,126,69,252                   ; movd          %xmm0,-0x4(%ebp)
+  DB  102,15,112,196,78                   ; pshufd        $0x4e,%xmm4,%xmm0
   DB  102,15,126,69,248                   ; movd          %xmm0,-0x8(%ebp)
-  DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  102,15,97,200                       ; punpcklwd     %xmm0,%xmm1
+  DB  102,15,97,206                       ; punpcklwd     %xmm6,%xmm1
   DB  102,15,239,210                      ; pxor          %xmm2,%xmm2
-  DB  102,15,111,169,121,124,0,0          ; movdqa        0x7c79(%ecx),%xmm5
-  DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
-  DB  102,15,219,245                      ; pand          %xmm5,%xmm6
-  DB  102,15,219,137,137,124,0,0          ; pand          0x7c89(%ecx),%xmm1
-  DB  102,15,111,129,153,124,0,0          ; movdqa        0x7c99(%ecx),%xmm0
-  DB  102,15,114,246,16                   ; pslld         $0x10,%xmm6
+  DB  102,15,111,177,185,123,0,0          ; movdqa        0x7bb9(%ecx),%xmm6
+  DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
+  DB  102,15,219,230                      ; pand          %xmm6,%xmm4
+  DB  102,15,219,137,201,123,0,0          ; pand          0x7bc9(%ecx),%xmm1
+  DB  102,15,111,129,217,123,0,0          ; movdqa        0x7bd9(%ecx),%xmm0
+  DB  102,15,114,244,16                   ; pslld         $0x10,%xmm4
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,102,217                      ; pcmpgtd       %xmm1,%xmm3
   DB  102,15,127,93,168                   ; movdqa        %xmm3,-0x58(%ebp)
   DB  102,15,114,241,13                   ; pslld         $0xd,%xmm1
-  DB  102,15,235,206                      ; por           %xmm6,%xmm1
-  DB  102,15,97,226                       ; punpcklwd     %xmm2,%xmm4
+  DB  102,15,235,204                      ; por           %xmm4,%xmm1
+  DB  102,15,97,234                       ; punpcklwd     %xmm2,%xmm5
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
-  DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
-  DB  102,15,219,213                      ; pand          %xmm5,%xmm2
-  DB  102,15,111,153,137,124,0,0          ; movdqa        0x7c89(%ecx),%xmm3
-  DB  102,15,219,227                      ; pand          %xmm3,%xmm4
+  DB  102,15,111,213                      ; movdqa        %xmm5,%xmm2
+  DB  102,15,219,214                      ; pand          %xmm6,%xmm2
+  DB  102,15,111,153,201,123,0,0          ; movdqa        0x7bc9(%ecx),%xmm3
+  DB  102,15,219,235                      ; pand          %xmm3,%xmm5
   DB  102,15,114,242,16                   ; pslld         $0x10,%xmm2
-  DB  102,15,111,240                      ; movdqa        %xmm0,%xmm6
-  DB  102,15,102,244                      ; pcmpgtd       %xmm4,%xmm6
-  DB  102,15,127,117,200                  ; movdqa        %xmm6,-0x38(%ebp)
-  DB  102,15,114,244,13                   ; pslld         $0xd,%xmm4
-  DB  102,15,235,226                      ; por           %xmm2,%xmm4
+  DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
+  DB  102,15,102,229                      ; pcmpgtd       %xmm5,%xmm4
+  DB  102,15,127,101,200                  ; movdqa        %xmm4,-0x38(%ebp)
+  DB  102,15,114,245,13                   ; pslld         $0xd,%xmm5
+  DB  102,15,235,234                      ; por           %xmm2,%xmm5
   DB  102,15,111,69,184                   ; movdqa        -0x48(%ebp),%xmm0
   DB  102,15,97,199                       ; punpcklwd     %xmm7,%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
-  DB  102,15,219,253                      ; pand          %xmm5,%xmm7
+  DB  102,15,219,254                      ; pand          %xmm6,%xmm7
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  102,15,114,247,16                   ; pslld         $0x10,%xmm7
-  DB  102,15,111,145,153,124,0,0          ; movdqa        0x7c99(%ecx),%xmm2
+  DB  102,15,111,145,217,123,0,0          ; movdqa        0x7bd9(%ecx),%xmm2
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
   DB  102,15,102,216                      ; pcmpgtd       %xmm0,%xmm3
   DB  102,15,114,240,13                   ; pslld         $0xd,%xmm0
   DB  102,15,235,199                      ; por           %xmm7,%xmm0
   DB  243,15,126,125,248                  ; movq          -0x8(%ebp),%xmm7
-  DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
-  DB  102,15,97,254                       ; punpcklwd     %xmm6,%xmm7
-  DB  102,15,219,239                      ; pand          %xmm7,%xmm5
-  DB  102,15,219,185,137,124,0,0          ; pand          0x7c89(%ecx),%xmm7
-  DB  102,15,114,245,16                   ; pslld         $0x10,%xmm5
+  DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
+  DB  102,15,97,252                       ; punpcklwd     %xmm4,%xmm7
+  DB  102,15,219,247                      ; pand          %xmm7,%xmm6
+  DB  102,15,219,185,201,123,0,0          ; pand          0x7bc9(%ecx),%xmm7
+  DB  102,15,114,246,16                   ; pslld         $0x10,%xmm6
   DB  102,15,102,215                      ; pcmpgtd       %xmm7,%xmm2
   DB  102,15,114,247,13                   ; pslld         $0xd,%xmm7
-  DB  102,15,235,253                      ; por           %xmm5,%xmm7
-  DB  102,15,111,169,169,124,0,0          ; movdqa        0x7ca9(%ecx),%xmm5
-  DB  102,15,254,205                      ; paddd         %xmm5,%xmm1
-  DB  102,15,254,229                      ; paddd         %xmm5,%xmm4
-  DB  102,15,254,197                      ; paddd         %xmm5,%xmm0
-  DB  102,15,254,253                      ; paddd         %xmm5,%xmm7
-  DB  102,15,111,109,168                  ; movdqa        -0x58(%ebp),%xmm5
-  DB  102,15,223,233                      ; pandn         %xmm1,%xmm5
+  DB  102,15,235,254                      ; por           %xmm6,%xmm7
+  DB  102,15,111,161,233,123,0,0          ; movdqa        0x7be9(%ecx),%xmm4
+  DB  102,15,254,204                      ; paddd         %xmm4,%xmm1
+  DB  102,15,254,236                      ; paddd         %xmm4,%xmm5
+  DB  102,15,254,196                      ; paddd         %xmm4,%xmm0
+  DB  102,15,254,252                      ; paddd         %xmm4,%xmm7
+  DB  102,15,111,117,168                  ; movdqa        -0x58(%ebp),%xmm6
+  DB  102,15,223,241                      ; pandn         %xmm1,%xmm6
   DB  102,15,111,77,200                   ; movdqa        -0x38(%ebp),%xmm1
-  DB  102,15,223,204                      ; pandn         %xmm4,%xmm1
+  DB  102,15,223,205                      ; pandn         %xmm5,%xmm1
   DB  102,15,223,216                      ; pandn         %xmm0,%xmm3
-  DB  102,15,111,226                      ; movdqa        %xmm2,%xmm4
-  DB  102,15,223,231                      ; pandn         %xmm7,%xmm4
+  DB  102,15,111,234                      ; movdqa        %xmm2,%xmm5
+  DB  102,15,223,239                      ; pandn         %xmm7,%xmm5
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  141,80,8                            ; lea           0x8(%eax),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  102,15,111,197                      ; movdqa        %xmm5,%xmm0
+  DB  102,15,111,198                      ; movdqa        %xmm6,%xmm0
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
-  DB  102,15,111,220                      ; movdqa        %xmm4,%xmm3
+  DB  102,15,111,221                      ; movdqa        %xmm5,%xmm3
   DB  82                                  ; push          %edx
   DB  81                                  ; push          %ecx
   DB  255,80,4                            ; call          *0x4(%eax)
@@ -50073,24 +50299,24 @@
   DB  15,41,93,184                        ; movaps        %xmm3,-0x48(%ebp)
   DB  15,41,85,200                        ; movaps        %xmm2,-0x38(%ebp)
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
-  DB  232,0,0,0,0                         ; call          560c <_sk_store_f16_sse2+0x19>
+  DB  232,0,0,0,0                         ; call          575b <_sk_store_f16_sse2+0x19>
   DB  88                                  ; pop           %eax
-  DB  102,15,111,152,244,122,0,0          ; movdqa        0x7af4(%eax),%xmm3
+  DB  102,15,111,152,53,122,0,0           ; movdqa        0x7a35(%eax),%xmm3
   DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
   DB  102,15,219,227                      ; pand          %xmm3,%xmm4
-  DB  102,15,111,136,36,123,0,0           ; movdqa        0x7b24(%eax),%xmm1
+  DB  102,15,111,136,101,122,0,0          ; movdqa        0x7a65(%eax),%xmm1
   DB  102,15,127,77,232                   ; movdqa        %xmm1,-0x18(%ebp)
   DB  102,15,111,240                      ; movdqa        %xmm0,%xmm6
   DB  102,15,114,246,3                    ; pslld         $0x3,%xmm6
   DB  102,15,219,241                      ; pand          %xmm1,%xmm6
   DB  102,15,254,244                      ; paddd         %xmm4,%xmm6
-  DB  102,15,111,184,4,123,0,0            ; movdqa        0x7b04(%eax),%xmm7
+  DB  102,15,111,184,69,122,0,0           ; movdqa        0x7a45(%eax),%xmm7
   DB  102,15,127,69,168                   ; movdqa        %xmm0,-0x58(%ebp)
   DB  102,15,219,199                      ; pand          %xmm7,%xmm0
-  DB  102,15,111,168,20,123,0,0           ; movdqa        0x7b14(%eax),%xmm5
+  DB  102,15,111,168,85,122,0,0           ; movdqa        0x7a55(%eax),%xmm5
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
   DB  102,15,102,200                      ; pcmpgtd       %xmm0,%xmm1
-  DB  102,15,111,128,164,119,0,0          ; movdqa        0x77a4(%eax),%xmm0
+  DB  102,15,111,128,229,118,0,0          ; movdqa        0x76e5(%eax),%xmm0
   DB  102,15,127,69,216                   ; movdqa        %xmm0,-0x28(%ebp)
   DB  102,15,254,240                      ; paddd         %xmm0,%xmm6
   DB  102,15,114,230,16                   ; psrad         $0x10,%xmm6
@@ -50152,7 +50378,7 @@
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,98,198                       ; punpckldq     %xmm6,%xmm0
   DB  133,255                             ; test          %edi,%edi
-  DB  117,48                              ; jne           578d <_sk_store_f16_sse2+0x19a>
+  DB  117,48                              ; jne           58dc <_sk_store_f16_sse2+0x19a>
   DB  15,17,4,214                         ; movups        %xmm0,(%esi,%edx,8)
   DB  102,15,106,206                      ; punpckhdq     %xmm6,%xmm1
   DB  243,15,127,76,214,16                ; movdqu        %xmm1,0x10(%esi,%edx,8)
@@ -50172,13 +50398,13 @@
   DB  195                                 ; ret
   DB  102,15,214,4,214                    ; movq          %xmm0,(%esi,%edx,8)
   DB  131,255,1                           ; cmp           $0x1,%edi
-  DB  116,212                             ; je            576b <_sk_store_f16_sse2+0x178>
+  DB  116,212                             ; je            58ba <_sk_store_f16_sse2+0x178>
   DB  102,15,23,68,214,8                  ; movhpd        %xmm0,0x8(%esi,%edx,8)
   DB  131,255,3                           ; cmp           $0x3,%edi
-  DB  114,201                             ; jb            576b <_sk_store_f16_sse2+0x178>
+  DB  114,201                             ; jb            58ba <_sk_store_f16_sse2+0x178>
   DB  102,15,106,206                      ; punpckhdq     %xmm6,%xmm1
   DB  102,15,214,76,214,16                ; movq          %xmm1,0x10(%esi,%edx,8)
-  DB  235,189                             ; jmp           576b <_sk_store_f16_sse2+0x178>
+  DB  235,189                             ; jmp           58ba <_sk_store_f16_sse2+0x178>
 
 PUBLIC _sk_load_u16_be_sse2
 _sk_load_u16_be_sse2 LABEL PROC
@@ -50199,9 +50425,9 @@
   DB  139,89,8                            ; mov           0x8(%ecx),%ebx
   DB  193,230,2                           ; shl           $0x2,%esi
   DB  133,219                             ; test          %ebx,%ebx
-  DB  232,0,0,0,0                         ; call          57d9 <_sk_load_u16_be_sse2+0x2b>
+  DB  232,0,0,0,0                         ; call          5928 <_sk_load_u16_be_sse2+0x2b>
   DB  90                                  ; pop           %edx
-  DB  15,133,11,1,0,0                     ; jne           58eb <_sk_load_u16_be_sse2+0x13d>
+  DB  15,133,11,1,0,0                     ; jne           5a3a <_sk_load_u16_be_sse2+0x13d>
   DB  102,15,16,4,119                     ; movupd        (%edi,%esi,2),%xmm0
   DB  243,15,111,76,119,16                ; movdqu        0x10(%edi,%esi,2),%xmm1
   DB  102,15,40,208                       ; movapd        %xmm0,%xmm2
@@ -50222,7 +50448,7 @@
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,40,162,183,118,0,0               ; movaps        0x76b7(%edx),%xmm4
+  DB  15,40,162,248,117,0,0               ; movaps        0x75f8(%edx),%xmm4
   DB  15,89,196                           ; mulps         %xmm4,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -50272,12 +50498,12 @@
   DB  242,15,16,4,119                     ; movsd         (%edi,%esi,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  131,251,1                           ; cmp           $0x1,%ebx
-  DB  15,132,238,254,255,255              ; je            57eb <_sk_load_u16_be_sse2+0x3d>
+  DB  15,132,238,254,255,255              ; je            593a <_sk_load_u16_be_sse2+0x3d>
   DB  102,15,22,68,119,8                  ; movhpd        0x8(%edi,%esi,2),%xmm0
   DB  131,251,3                           ; cmp           $0x3,%ebx
-  DB  15,130,223,254,255,255              ; jb            57eb <_sk_load_u16_be_sse2+0x3d>
+  DB  15,130,223,254,255,255              ; jb            593a <_sk_load_u16_be_sse2+0x3d>
   DB  243,15,126,76,119,16                ; movq          0x10(%edi,%esi,2),%xmm1
-  DB  233,212,254,255,255                 ; jmp           57eb <_sk_load_u16_be_sse2+0x3d>
+  DB  233,212,254,255,255                 ; jmp           593a <_sk_load_u16_be_sse2+0x3d>
 
 PUBLIC _sk_load_rgb_u16_be_sse2
 _sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -50297,9 +50523,9 @@
   DB  3,50                                ; add           (%edx),%esi
   DB  107,25,3                            ; imul          $0x3,(%ecx),%ebx
   DB  133,255                             ; test          %edi,%edi
-  DB  232,0,0,0,0                         ; call          5940 <_sk_load_rgb_u16_be_sse2+0x29>
+  DB  232,0,0,0,0                         ; call          5a8f <_sk_load_rgb_u16_be_sse2+0x29>
   DB  90                                  ; pop           %edx
-  DB  15,133,240,0,0,0                    ; jne           5a37 <_sk_load_rgb_u16_be_sse2+0x120>
+  DB  15,133,240,0,0,0                    ; jne           5b86 <_sk_load_rgb_u16_be_sse2+0x120>
   DB  243,15,111,20,94                    ; movdqu        (%esi,%ebx,2),%xmm2
   DB  243,15,111,92,94,8                  ; movdqu        0x8(%esi,%ebx,2),%xmm3
   DB  102,15,115,219,4                    ; psrldq        $0x4,%xmm3
@@ -50324,7 +50550,7 @@
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,97,195                       ; punpcklwd     %xmm3,%xmm0
   DB  15,91,192                           ; cvtdq2ps      %xmm0,%xmm0
-  DB  15,40,170,80,117,0,0                ; movaps        0x7550(%edx),%xmm5
+  DB  15,40,170,145,116,0,0               ; movaps        0x7491(%edx),%xmm5
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
   DB  102,15,111,204                      ; movdqa        %xmm4,%xmm1
   DB  102,15,113,241,8                    ; psllw         $0x8,%xmm1
@@ -50350,7 +50576,7 @@
   DB  15,89,213                           ; mulps         %xmm5,%xmm2
   DB  141,112,8                           ; lea           0x8(%eax),%esi
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,154,224,114,0,0               ; movaps        0x72e0(%edx),%xmm3
+  DB  15,40,154,33,114,0,0                ; movaps        0x7221(%edx),%xmm3
   DB  86                                  ; push          %esi
   DB  81                                  ; push          %ecx
   DB  255,80,4                            ; call          *0x4(%eax)
@@ -50364,20 +50590,20 @@
   DB  102,15,196,84,94,4,2                ; pinsrw        $0x2,0x4(%esi,%ebx,2),%xmm2
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  131,255,1                           ; cmp           $0x1,%edi
-  DB  117,13                              ; jne           5a59 <_sk_load_rgb_u16_be_sse2+0x142>
+  DB  117,13                              ; jne           5ba8 <_sk_load_rgb_u16_be_sse2+0x142>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
-  DB  233,16,255,255,255                  ; jmp           5969 <_sk_load_rgb_u16_be_sse2+0x52>
+  DB  233,16,255,255,255                  ; jmp           5ab8 <_sk_load_rgb_u16_be_sse2+0x52>
   DB  102,15,110,68,94,6                  ; movd          0x6(%esi,%ebx,2),%xmm0
   DB  102,15,196,68,94,10,2               ; pinsrw        $0x2,0xa(%esi,%ebx,2),%xmm0
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  131,255,3                           ; cmp           $0x3,%edi
-  DB  114,18                              ; jb            5a81 <_sk_load_rgb_u16_be_sse2+0x16a>
+  DB  114,18                              ; jb            5bd0 <_sk_load_rgb_u16_be_sse2+0x16a>
   DB  102,15,110,92,94,12                 ; movd          0xc(%esi,%ebx,2),%xmm3
   DB  102,15,196,92,94,16,2               ; pinsrw        $0x2,0x10(%esi,%ebx,2),%xmm3
-  DB  233,232,254,255,255                 ; jmp           5969 <_sk_load_rgb_u16_be_sse2+0x52>
+  DB  233,232,254,255,255                 ; jmp           5ab8 <_sk_load_rgb_u16_be_sse2+0x52>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
-  DB  233,223,254,255,255                 ; jmp           5969 <_sk_load_rgb_u16_be_sse2+0x52>
+  DB  233,223,254,255,255                 ; jmp           5ab8 <_sk_load_rgb_u16_be_sse2+0x52>
 
 PUBLIC _sk_store_u16_be_sse2
 _sk_store_u16_be_sse2 LABEL PROC
@@ -50385,7 +50611,7 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
-  DB  232,0,0,0,0                         ; call          5a94 <_sk_store_u16_be_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          5be3 <_sk_store_u16_be_sse2+0xa>
   DB  95                                  ; pop           %edi
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
@@ -50395,7 +50621,7 @@
   DB  1,210                               ; add           %edx,%edx
   DB  3,22                                ; add           (%esi),%edx
   DB  139,49                              ; mov           (%ecx),%esi
-  DB  15,40,183,172,118,0,0               ; movaps        0x76ac(%edi),%xmm6
+  DB  15,40,183,237,117,0,0               ; movaps        0x75ed(%edi),%xmm6
   DB  139,121,8                           ; mov           0x8(%ecx),%edi
   DB  193,230,2                           ; shl           $0x2,%esi
   DB  15,40,224                           ; movaps        %xmm0,%xmm4
@@ -50442,7 +50668,7 @@
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  102,15,98,245                       ; punpckldq     %xmm5,%xmm6
   DB  133,255                             ; test          %edi,%edi
-  DB  117,32                              ; jne           5b90 <_sk_store_u16_be_sse2+0x106>
+  DB  117,32                              ; jne           5cdf <_sk_store_u16_be_sse2+0x106>
   DB  15,17,52,114                        ; movups        %xmm6,(%edx,%esi,2)
   DB  102,15,106,229                      ; punpckhdq     %xmm5,%xmm4
   DB  243,15,127,100,114,16               ; movdqu        %xmm4,0x10(%edx,%esi,2)
@@ -50458,13 +50684,13 @@
   DB  195                                 ; ret
   DB  102,15,214,52,114                   ; movq          %xmm6,(%edx,%esi,2)
   DB  131,255,1                           ; cmp           $0x1,%edi
-  DB  116,228                             ; je            5b7e <_sk_store_u16_be_sse2+0xf4>
+  DB  116,228                             ; je            5ccd <_sk_store_u16_be_sse2+0xf4>
   DB  102,15,23,116,114,8                 ; movhpd        %xmm6,0x8(%edx,%esi,2)
   DB  131,255,3                           ; cmp           $0x3,%edi
-  DB  114,217                             ; jb            5b7e <_sk_store_u16_be_sse2+0xf4>
+  DB  114,217                             ; jb            5ccd <_sk_store_u16_be_sse2+0xf4>
   DB  102,15,106,229                      ; punpckhdq     %xmm5,%xmm4
   DB  102,15,214,100,114,16               ; movq          %xmm4,0x10(%edx,%esi,2)
-  DB  235,205                             ; jmp           5b7e <_sk_store_u16_be_sse2+0xf4>
+  DB  235,205                             ; jmp           5ccd <_sk_store_u16_be_sse2+0xf4>
 
 PUBLIC _sk_load_f32_sse2
 _sk_load_f32_sse2 LABEL PROC
@@ -50485,7 +50711,7 @@
   DB  15,16,36,23                         ; movups        (%edi,%edx,1),%xmm4
   DB  139,121,8                           ; mov           0x8(%ecx),%edi
   DB  133,255                             ; test          %edi,%edi
-  DB  117,71                              ; jne           5c28 <_sk_load_f32_sse2+0x77>
+  DB  117,71                              ; jne           5d77 <_sk_load_f32_sse2+0x77>
   DB  15,16,84,178,16                     ; movups        0x10(%edx,%esi,4),%xmm2
   DB  15,16,92,178,32                     ; movups        0x20(%edx,%esi,4),%xmm3
   DB  15,16,68,178,48                     ; movups        0x30(%edx,%esi,4),%xmm0
@@ -50513,17 +50739,17 @@
   DB  195                                 ; ret
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  131,255,1                           ; cmp           $0x1,%edi
-  DB  117,8                               ; jne           5c38 <_sk_load_f32_sse2+0x87>
+  DB  117,8                               ; jne           5d87 <_sk_load_f32_sse2+0x87>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
-  DB  235,184                             ; jmp           5bf0 <_sk_load_f32_sse2+0x3f>
+  DB  235,184                             ; jmp           5d3f <_sk_load_f32_sse2+0x3f>
   DB  15,16,84,178,16                     ; movups        0x10(%edx,%esi,4),%xmm2
   DB  131,255,3                           ; cmp           $0x3,%edi
-  DB  114,7                               ; jb            5c49 <_sk_load_f32_sse2+0x98>
+  DB  114,7                               ; jb            5d98 <_sk_load_f32_sse2+0x98>
   DB  15,16,92,178,32                     ; movups        0x20(%edx,%esi,4),%xmm3
-  DB  235,167                             ; jmp           5bf0 <_sk_load_f32_sse2+0x3f>
+  DB  235,167                             ; jmp           5d3f <_sk_load_f32_sse2+0x3f>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,162                             ; jmp           5bf0 <_sk_load_f32_sse2+0x3f>
+  DB  235,162                             ; jmp           5d3f <_sk_load_f32_sse2+0x3f>
 
 PUBLIC _sk_load_f32_dst_sse2
 _sk_load_f32_dst_sse2 LABEL PROC
@@ -50547,7 +50773,7 @@
   DB  15,16,52,23                         ; movups        (%edi,%edx,1),%xmm6
   DB  139,121,8                           ; mov           0x8(%ecx),%edi
   DB  133,255                             ; test          %edi,%edi
-  DB  117,97                              ; jne           5cea <_sk_load_f32_dst_sse2+0x9c>
+  DB  117,97                              ; jne           5e39 <_sk_load_f32_dst_sse2+0x9c>
   DB  15,16,124,178,16                    ; movups        0x10(%edx,%esi,4),%xmm7
   DB  15,16,92,178,32                     ; movups        0x20(%edx,%esi,4),%xmm3
   DB  15,16,84,178,48                     ; movups        0x30(%edx,%esi,4),%xmm2
@@ -50581,17 +50807,17 @@
   DB  195                                 ; ret
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
   DB  131,255,1                           ; cmp           $0x1,%edi
-  DB  117,8                               ; jne           5cfa <_sk_load_f32_dst_sse2+0xac>
+  DB  117,8                               ; jne           5e49 <_sk_load_f32_dst_sse2+0xac>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
-  DB  235,158                             ; jmp           5c98 <_sk_load_f32_dst_sse2+0x4a>
+  DB  235,158                             ; jmp           5de7 <_sk_load_f32_dst_sse2+0x4a>
   DB  15,16,124,178,16                    ; movups        0x10(%edx,%esi,4),%xmm7
   DB  131,255,3                           ; cmp           $0x3,%edi
-  DB  114,7                               ; jb            5d0b <_sk_load_f32_dst_sse2+0xbd>
+  DB  114,7                               ; jb            5e5a <_sk_load_f32_dst_sse2+0xbd>
   DB  15,16,92,178,32                     ; movups        0x20(%edx,%esi,4),%xmm3
-  DB  235,141                             ; jmp           5c98 <_sk_load_f32_dst_sse2+0x4a>
+  DB  235,141                             ; jmp           5de7 <_sk_load_f32_dst_sse2+0x4a>
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,136                             ; jmp           5c98 <_sk_load_f32_dst_sse2+0x4a>
+  DB  235,136                             ; jmp           5de7 <_sk_load_f32_dst_sse2+0x4a>
 
 PUBLIC _sk_store_f32_sse2
 _sk_store_f32_sse2 LABEL PROC
@@ -50627,7 +50853,7 @@
   DB  15,40,238                           ; movaps        %xmm6,%xmm5
   DB  102,15,20,239                       ; unpcklpd      %xmm7,%xmm5
   DB  133,255                             ; test          %edi,%edi
-  DB  117,40                              ; jne           5d96 <_sk_store_f32_sse2+0x86>
+  DB  117,40                              ; jne           5ee5 <_sk_store_f32_sse2+0x86>
   DB  102,15,21,247                       ; unpckhpd      %xmm7,%xmm6
   DB  15,17,100,178,16                    ; movups        %xmm4,0x10(%edx,%esi,4)
   DB  102,15,17,108,178,32                ; movupd        %xmm5,0x20(%edx,%esi,4)
@@ -50644,93 +50870,39 @@
   DB  93                                  ; pop           %ebp
   DB  195                                 ; ret
   DB  131,255,1                           ; cmp           $0x1,%edi
-  DB  116,232                             ; je            5d83 <_sk_store_f32_sse2+0x73>
+  DB  116,232                             ; je            5ed2 <_sk_store_f32_sse2+0x73>
   DB  15,17,100,178,16                    ; movups        %xmm4,0x10(%edx,%esi,4)
   DB  131,255,3                           ; cmp           $0x3,%edi
-  DB  114,222                             ; jb            5d83 <_sk_store_f32_sse2+0x73>
+  DB  114,222                             ; jb            5ed2 <_sk_store_f32_sse2+0x73>
   DB  102,15,17,108,178,32                ; movupd        %xmm5,0x20(%edx,%esi,4)
-  DB  235,214                             ; jmp           5d83 <_sk_store_f32_sse2+0x73>
-
-PUBLIC _sk_clamp_x_sse2
-_sk_clamp_x_sse2 LABEL PROC
-  DB  85                                  ; push          %ebp
-  DB  137,229                             ; mov           %esp,%ebp
-  DB  131,236,8                           ; sub           $0x8,%esp
-  DB  139,69,12                           ; mov           0xc(%ebp),%eax
-  DB  139,8                               ; mov           (%eax),%ecx
-  DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  15,95,224                           ; maxps         %xmm0,%xmm4
-  DB  243,15,16,1                         ; movss         (%ecx),%xmm0
-  DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
-  DB  102,15,118,237                      ; pcmpeqd       %xmm5,%xmm5
-  DB  102,15,254,232                      ; paddd         %xmm0,%xmm5
-  DB  15,93,229                           ; minps         %xmm5,%xmm4
-  DB  141,72,8                            ; lea           0x8(%eax),%ecx
-  DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,196                           ; movaps        %xmm4,%xmm0
-  DB  81                                  ; push          %ecx
-  DB  255,117,8                           ; pushl         0x8(%ebp)
-  DB  255,80,4                            ; call          *0x4(%eax)
-  DB  131,196,24                          ; add           $0x18,%esp
-  DB  93                                  ; pop           %ebp
-  DB  195                                 ; ret
-
-PUBLIC _sk_clamp_y_sse2
-_sk_clamp_y_sse2 LABEL PROC
-  DB  85                                  ; push          %ebp
-  DB  137,229                             ; mov           %esp,%ebp
-  DB  131,236,8                           ; sub           $0x8,%esp
-  DB  139,69,12                           ; mov           0xc(%ebp),%eax
-  DB  139,8                               ; mov           (%eax),%ecx
-  DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  15,95,225                           ; maxps         %xmm1,%xmm4
-  DB  243,15,16,9                         ; movss         (%ecx),%xmm1
-  DB  15,198,201,0                        ; shufps        $0x0,%xmm1,%xmm1
-  DB  102,15,118,237                      ; pcmpeqd       %xmm5,%xmm5
-  DB  102,15,254,233                      ; paddd         %xmm1,%xmm5
-  DB  15,93,229                           ; minps         %xmm5,%xmm4
-  DB  141,72,8                            ; lea           0x8(%eax),%ecx
-  DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,204                           ; movaps        %xmm4,%xmm1
-  DB  81                                  ; push          %ecx
-  DB  255,117,8                           ; pushl         0x8(%ebp)
-  DB  255,80,4                            ; call          *0x4(%eax)
-  DB  131,196,24                          ; add           $0x18,%esp
-  DB  93                                  ; pop           %ebp
-  DB  195                                 ; ret
+  DB  235,214                             ; jmp           5ed2 <_sk_store_f32_sse2+0x73>
 
 PUBLIC _sk_repeat_x_sse2
 _sk_repeat_x_sse2 LABEL PROC
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          5e2a <_sk_repeat_x_sse2+0xb>
-  DB  89                                  ; pop           %ecx
-  DB  139,69,12                           ; mov           0xc(%ebp),%eax
-  DB  139,16                              ; mov           (%eax),%edx
-  DB  243,15,16,42                        ; movss         (%edx),%xmm5
-  DB  243,15,16,114,4                     ; movss         0x4(%edx),%xmm6
-  DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
-  DB  15,89,240                           ; mulps         %xmm0,%xmm6
-  DB  243,15,91,230                       ; cvttps2dq     %xmm6,%xmm4
-  DB  15,91,252                           ; cvtdq2ps      %xmm4,%xmm7
-  DB  15,194,247,1                        ; cmpltps       %xmm7,%xmm6
-  DB  15,84,177,246,109,0,0               ; andps         0x6df6(%ecx),%xmm6
-  DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  15,92,254                           ; subps         %xmm6,%xmm7
+  DB  232,0,0,0,0                         ; call          5f07 <_sk_repeat_x_sse2+0xb>
+  DB  88                                  ; pop           %eax
+  DB  139,77,12                           ; mov           0xc(%ebp),%ecx
+  DB  139,17                              ; mov           (%ecx),%edx
+  DB  243,15,16,34                        ; movss         (%edx),%xmm4
+  DB  243,15,16,106,4                     ; movss         0x4(%edx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
-  DB  15,89,253                           ; mulps         %xmm5,%xmm7
-  DB  15,92,199                           ; subps         %xmm7,%xmm0
-  DB  15,95,224                           ; maxps         %xmm0,%xmm4
-  DB  102,15,118,192                      ; pcmpeqd       %xmm0,%xmm0
-  DB  102,15,254,197                      ; paddd         %xmm5,%xmm0
-  DB  15,93,224                           ; minps         %xmm0,%xmm4
-  DB  141,72,8                            ; lea           0x8(%eax),%ecx
+  DB  15,89,232                           ; mulps         %xmm0,%xmm5
+  DB  243,15,91,245                       ; cvttps2dq     %xmm5,%xmm6
+  DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
+  DB  15,194,238,1                        ; cmpltps       %xmm6,%xmm5
+  DB  15,84,168,169,109,0,0               ; andps         0x6da9(%eax),%xmm5
+  DB  15,92,245                           ; subps         %xmm5,%xmm6
+  DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
+  DB  15,89,230                           ; mulps         %xmm6,%xmm4
+  DB  15,92,196                           ; subps         %xmm4,%xmm0
+  DB  141,65,8                            ; lea           0x8(%ecx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,196                           ; movaps        %xmm4,%xmm0
-  DB  81                                  ; push          %ecx
+  DB  80                                  ; push          %eax
   DB  255,117,8                           ; pushl         0x8(%ebp)
-  DB  255,80,4                            ; call          *0x4(%eax)
+  DB  255,81,4                            ; call          *0x4(%ecx)
   DB  131,196,24                          ; add           $0x18,%esp
   DB  93                                  ; pop           %ebp
   DB  195                                 ; ret
@@ -50740,33 +50912,27 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          5e90 <_sk_repeat_y_sse2+0xb>
-  DB  89                                  ; pop           %ecx
-  DB  139,69,12                           ; mov           0xc(%ebp),%eax
-  DB  139,16                              ; mov           (%eax),%edx
-  DB  243,15,16,42                        ; movss         (%edx),%xmm5
-  DB  243,15,16,114,4                     ; movss         0x4(%edx),%xmm6
-  DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
-  DB  15,89,241                           ; mulps         %xmm1,%xmm6
-  DB  243,15,91,230                       ; cvttps2dq     %xmm6,%xmm4
-  DB  15,91,252                           ; cvtdq2ps      %xmm4,%xmm7
-  DB  15,194,247,1                        ; cmpltps       %xmm7,%xmm6
-  DB  15,84,177,144,109,0,0               ; andps         0x6d90(%ecx),%xmm6
-  DB  15,87,228                           ; xorps         %xmm4,%xmm4
-  DB  15,92,254                           ; subps         %xmm6,%xmm7
+  DB  232,0,0,0,0                         ; call          5f59 <_sk_repeat_y_sse2+0xb>
+  DB  88                                  ; pop           %eax
+  DB  139,77,12                           ; mov           0xc(%ebp),%ecx
+  DB  139,17                              ; mov           (%ecx),%edx
+  DB  243,15,16,34                        ; movss         (%edx),%xmm4
+  DB  243,15,16,106,4                     ; movss         0x4(%edx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
-  DB  15,89,253                           ; mulps         %xmm5,%xmm7
-  DB  15,92,207                           ; subps         %xmm7,%xmm1
-  DB  15,95,225                           ; maxps         %xmm1,%xmm4
-  DB  102,15,118,201                      ; pcmpeqd       %xmm1,%xmm1
-  DB  102,15,254,205                      ; paddd         %xmm5,%xmm1
-  DB  15,93,225                           ; minps         %xmm1,%xmm4
-  DB  141,72,8                            ; lea           0x8(%eax),%ecx
+  DB  15,89,233                           ; mulps         %xmm1,%xmm5
+  DB  243,15,91,245                       ; cvttps2dq     %xmm5,%xmm6
+  DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
+  DB  15,194,238,1                        ; cmpltps       %xmm6,%xmm5
+  DB  15,84,168,87,109,0,0                ; andps         0x6d57(%eax),%xmm5
+  DB  15,92,245                           ; subps         %xmm5,%xmm6
+  DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
+  DB  15,89,230                           ; mulps         %xmm6,%xmm4
+  DB  15,92,204                           ; subps         %xmm4,%xmm1
+  DB  141,65,8                            ; lea           0x8(%ecx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,204                           ; movaps        %xmm4,%xmm1
-  DB  81                                  ; push          %ecx
+  DB  80                                  ; push          %eax
   DB  255,117,8                           ; pushl         0x8(%ebp)
-  DB  255,80,4                            ; call          *0x4(%eax)
+  DB  255,81,4                            ; call          *0x4(%ecx)
   DB  131,196,24                          ; add           $0x18,%esp
   DB  93                                  ; pop           %ebp
   DB  195                                 ; ret
@@ -50776,36 +50942,31 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          5ef6 <_sk_mirror_x_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          5fab <_sk_mirror_x_sse2+0xb>
   DB  89                                  ; pop           %ecx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,16                              ; mov           (%eax),%edx
-  DB  243,15,16,42                        ; movss         (%edx),%xmm5
-  DB  243,15,16,114,4                     ; movss         0x4(%edx),%xmm6
-  DB  15,40,229                           ; movaps        %xmm5,%xmm4
-  DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
-  DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  243,15,89,177,186,116,0,0           ; mulss         0x74ba(%ecx),%xmm6
+  DB  243,15,16,34                        ; movss         (%edx),%xmm4
+  DB  243,15,16,106,4                     ; movss         0x4(%edx),%xmm5
+  DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
-  DB  15,89,240                           ; mulps         %xmm0,%xmm6
-  DB  243,15,91,254                       ; cvttps2dq     %xmm6,%xmm7
-  DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  15,194,247,1                        ; cmpltps       %xmm7,%xmm6
-  DB  15,84,177,42,109,0,0                ; andps         0x6d2a(%ecx),%xmm6
-  DB  15,92,254                           ; subps         %xmm6,%xmm7
-  DB  243,15,88,237                       ; addss         %xmm5,%xmm5
+  DB  15,92,198                           ; subps         %xmm6,%xmm0
+  DB  243,15,89,169,149,116,0,0           ; mulss         0x7495(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
-  DB  15,89,253                           ; mulps         %xmm5,%xmm7
+  DB  15,89,232                           ; mulps         %xmm0,%xmm5
+  DB  243,15,91,253                       ; cvttps2dq     %xmm5,%xmm7
+  DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
+  DB  15,194,239,1                        ; cmpltps       %xmm7,%xmm5
+  DB  15,84,169,5,109,0,0                 ; andps         0x6d05(%ecx),%xmm5
+  DB  15,92,253                           ; subps         %xmm5,%xmm7
+  DB  243,15,88,228                       ; addss         %xmm4,%xmm4
+  DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
+  DB  15,89,252                           ; mulps         %xmm4,%xmm7
   DB  15,92,199                           ; subps         %xmm7,%xmm0
-  DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  15,87,237                           ; xorps         %xmm5,%xmm5
-  DB  15,92,232                           ; subps         %xmm0,%xmm5
-  DB  15,84,232                           ; andps         %xmm0,%xmm5
-  DB  15,87,192                           ; xorps         %xmm0,%xmm0
-  DB  15,95,197                           ; maxps         %xmm5,%xmm0
-  DB  102,15,118,237                      ; pcmpeqd       %xmm5,%xmm5
-  DB  102,15,254,236                      ; paddd         %xmm4,%xmm5
-  DB  15,93,197                           ; minps         %xmm5,%xmm0
+  DB  15,92,198                           ; subps         %xmm6,%xmm0
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,92,224                           ; subps         %xmm0,%xmm4
+  DB  15,84,196                           ; andps         %xmm4,%xmm0
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  81                                  ; push          %ecx
@@ -50820,36 +50981,31 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          5f7b <_sk_mirror_y_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          601f <_sk_mirror_y_sse2+0xb>
   DB  89                                  ; pop           %ecx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,16                              ; mov           (%eax),%edx
-  DB  243,15,16,42                        ; movss         (%edx),%xmm5
-  DB  243,15,16,114,4                     ; movss         0x4(%edx),%xmm6
-  DB  15,40,229                           ; movaps        %xmm5,%xmm4
-  DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
-  DB  15,92,204                           ; subps         %xmm4,%xmm1
-  DB  243,15,89,177,53,116,0,0            ; mulss         0x7435(%ecx),%xmm6
+  DB  243,15,16,34                        ; movss         (%edx),%xmm4
+  DB  243,15,16,106,4                     ; movss         0x4(%edx),%xmm5
+  DB  15,40,244                           ; movaps        %xmm4,%xmm6
   DB  15,198,246,0                        ; shufps        $0x0,%xmm6,%xmm6
-  DB  15,89,241                           ; mulps         %xmm1,%xmm6
-  DB  243,15,91,254                       ; cvttps2dq     %xmm6,%xmm7
-  DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
-  DB  15,194,247,1                        ; cmpltps       %xmm7,%xmm6
-  DB  15,84,177,165,108,0,0               ; andps         0x6ca5(%ecx),%xmm6
-  DB  15,92,254                           ; subps         %xmm6,%xmm7
-  DB  243,15,88,237                       ; addss         %xmm5,%xmm5
+  DB  15,92,206                           ; subps         %xmm6,%xmm1
+  DB  243,15,89,169,33,116,0,0            ; mulss         0x7421(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
-  DB  15,89,253                           ; mulps         %xmm5,%xmm7
+  DB  15,89,233                           ; mulps         %xmm1,%xmm5
+  DB  243,15,91,253                       ; cvttps2dq     %xmm5,%xmm7
+  DB  15,91,255                           ; cvtdq2ps      %xmm7,%xmm7
+  DB  15,194,239,1                        ; cmpltps       %xmm7,%xmm5
+  DB  15,84,169,145,108,0,0               ; andps         0x6c91(%ecx),%xmm5
+  DB  15,92,253                           ; subps         %xmm5,%xmm7
+  DB  243,15,88,228                       ; addss         %xmm4,%xmm4
+  DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
+  DB  15,89,252                           ; mulps         %xmm4,%xmm7
   DB  15,92,207                           ; subps         %xmm7,%xmm1
-  DB  15,92,204                           ; subps         %xmm4,%xmm1
-  DB  15,87,237                           ; xorps         %xmm5,%xmm5
-  DB  15,92,233                           ; subps         %xmm1,%xmm5
-  DB  15,84,233                           ; andps         %xmm1,%xmm5
-  DB  15,87,201                           ; xorps         %xmm1,%xmm1
-  DB  15,95,205                           ; maxps         %xmm5,%xmm1
-  DB  102,15,118,237                      ; pcmpeqd       %xmm5,%xmm5
-  DB  102,15,254,236                      ; paddd         %xmm4,%xmm5
-  DB  15,93,205                           ; minps         %xmm5,%xmm1
+  DB  15,92,206                           ; subps         %xmm6,%xmm1
+  DB  15,87,228                           ; xorps         %xmm4,%xmm4
+  DB  15,92,225                           ; subps         %xmm1,%xmm4
+  DB  15,84,204                           ; andps         %xmm4,%xmm1
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  81                                  ; push          %ecx
@@ -50864,12 +51020,12 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          6000 <_sk_clamp_x_1_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          6093 <_sk_clamp_x_1_sse2+0xb>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,95,224                           ; maxps         %xmm0,%xmm4
-  DB  15,93,160,32,108,0,0                ; minps         0x6c20(%eax),%xmm4
+  DB  15,93,160,29,108,0,0                ; minps         0x6c1d(%eax),%xmm4
   DB  141,65,4                            ; lea           0x4(%ecx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  15,40,196                           ; movaps        %xmm4,%xmm0
@@ -50885,14 +51041,14 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          6030 <_sk_repeat_x_1_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          60c3 <_sk_repeat_x_1_sse2+0xb>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  243,15,91,224                       ; cvttps2dq     %xmm0,%xmm4
   DB  15,91,228                           ; cvtdq2ps      %xmm4,%xmm4
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
   DB  15,194,236,1                        ; cmpltps       %xmm4,%xmm5
-  DB  15,84,168,240,107,0,0               ; andps         0x6bf0(%eax),%xmm5
+  DB  15,84,168,237,107,0,0               ; andps         0x6bed(%eax),%xmm5
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
   DB  141,65,4                            ; lea           0x4(%ecx),%eax
@@ -50909,17 +51065,17 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          606b <_sk_mirror_x_1_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          60fe <_sk_mirror_x_1_sse2+0xb>
   DB  89                                  ; pop           %ecx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
-  DB  15,40,161,37,108,0,0                ; movaps        0x6c25(%ecx),%xmm4
+  DB  15,40,161,34,108,0,0                ; movaps        0x6c22(%ecx),%xmm4
   DB  15,88,196                           ; addps         %xmm4,%xmm0
-  DB  15,40,169,165,107,0,0               ; movaps        0x6ba5(%ecx),%xmm5
+  DB  15,40,169,162,107,0,0               ; movaps        0x6ba2(%ecx),%xmm5
   DB  15,89,232                           ; mulps         %xmm0,%xmm5
   DB  243,15,91,245                       ; cvttps2dq     %xmm5,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  15,194,238,1                        ; cmpltps       %xmm6,%xmm5
-  DB  15,84,169,181,107,0,0               ; andps         0x6bb5(%ecx),%xmm5
+  DB  15,84,169,178,107,0,0               ; andps         0x6bb2(%ecx),%xmm5
   DB  15,87,255                           ; xorps         %xmm7,%xmm7
   DB  15,92,245                           ; subps         %xmm5,%xmm6
   DB  15,88,246                           ; addps         %xmm6,%xmm6
@@ -50942,13 +51098,13 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
-  DB  232,0,0,0,0                         ; call          60c9 <_sk_luminance_to_alpha_sse2+0xe>
+  DB  232,0,0,0,0                         ; call          615c <_sk_luminance_to_alpha_sse2+0xe>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
-  DB  15,89,128,135,112,0,0               ; mulps         0x7087(%eax),%xmm0
-  DB  15,89,136,151,112,0,0               ; mulps         0x7097(%eax),%xmm1
+  DB  15,89,128,132,112,0,0               ; mulps         0x7084(%eax),%xmm0
+  DB  15,89,136,148,112,0,0               ; mulps         0x7094(%eax),%xmm1
   DB  15,88,200                           ; addps         %xmm0,%xmm1
-  DB  15,89,152,167,112,0,0               ; mulps         0x70a7(%eax),%xmm3
+  DB  15,89,152,164,112,0,0               ; mulps         0x70a4(%eax),%xmm3
   DB  15,88,217                           ; addps         %xmm1,%xmm3
   DB  141,65,4                            ; lea           0x4(%ecx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -51322,7 +51478,7 @@
   DB  86                                  ; push          %esi
   DB  131,236,60                          ; sub           $0x3c,%esp
   DB  15,41,69,184                        ; movaps        %xmm0,-0x48(%ebp)
-  DB  232,0,0,0,0                         ; call          6566 <_sk_evenly_spaced_gradient_sse2+0x12>
+  DB  232,0,0,0,0                         ; call          65f9 <_sk_evenly_spaced_gradient_sse2+0x12>
   DB  90                                  ; pop           %edx
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  141,65,4                            ; lea           0x4(%ecx),%eax
@@ -51333,12 +51489,12 @@
   DB  78                                  ; dec           %esi
   DB  102,15,110,206                      ; movd          %esi,%xmm1
   DB  102,15,112,201,0                    ; pshufd        $0x0,%xmm1,%xmm1
-  DB  102,15,111,146,26,108,0,0           ; movdqa        0x6c1a(%edx),%xmm2
+  DB  102,15,111,146,23,108,0,0           ; movdqa        0x6c17(%edx),%xmm2
   DB  102,15,219,209                      ; pand          %xmm1,%xmm2
-  DB  102,15,235,146,218,105,0,0          ; por           0x69da(%edx),%xmm2
+  DB  102,15,235,146,215,105,0,0          ; por           0x69d7(%edx),%xmm2
   DB  102,15,114,209,16                   ; psrld         $0x10,%xmm1
-  DB  102,15,235,138,42,108,0,0           ; por           0x6c2a(%edx),%xmm1
-  DB  15,88,138,58,108,0,0                ; addps         0x6c3a(%edx),%xmm1
+  DB  102,15,235,138,39,108,0,0           ; por           0x6c27(%edx),%xmm1
+  DB  15,88,138,55,108,0,0                ; addps         0x6c37(%edx),%xmm1
   DB  15,88,202                           ; addps         %xmm2,%xmm1
   DB  15,89,200                           ; mulps         %xmm0,%xmm1
   DB  243,15,91,201                       ; cvttps2dq     %xmm1,%xmm1
@@ -51443,18 +51599,18 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          6726 <_sk_gauss_a_to_rgba_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          67b9 <_sk_gauss_a_to_rgba_sse2+0xb>
   DB  88                                  ; pop           %eax
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
-  DB  15,40,128,138,106,0,0               ; movaps        0x6a8a(%eax),%xmm0
+  DB  15,40,128,135,106,0,0               ; movaps        0x6a87(%eax),%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,128,154,106,0,0               ; addps         0x6a9a(%eax),%xmm0
+  DB  15,88,128,151,106,0,0               ; addps         0x6a97(%eax),%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,128,170,106,0,0               ; addps         0x6aaa(%eax),%xmm0
+  DB  15,88,128,167,106,0,0               ; addps         0x6aa7(%eax),%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,128,186,106,0,0               ; addps         0x6aba(%eax),%xmm0
+  DB  15,88,128,183,106,0,0               ; addps         0x6ab7(%eax),%xmm0
   DB  15,89,195                           ; mulps         %xmm3,%xmm0
-  DB  15,88,128,202,106,0,0               ; addps         0x6aca(%eax),%xmm0
+  DB  15,88,128,199,106,0,0               ; addps         0x6ac7(%eax),%xmm0
   DB  141,65,4                            ; lea           0x4(%ecx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
@@ -51482,7 +51638,7 @@
   DB  139,17                              ; mov           (%ecx),%edx
   DB  102,15,239,201                      ; pxor          %xmm1,%xmm1
   DB  131,250,2                           ; cmp           $0x2,%edx
-  DB  114,33                              ; jb            67b3 <_sk_gradient_sse2+0x40>
+  DB  114,33                              ; jb            6846 <_sk_gradient_sse2+0x40>
   DB  139,113,36                          ; mov           0x24(%ecx),%esi
   DB  74                                  ; dec           %edx
   DB  131,198,4                           ; add           $0x4,%esi
@@ -51493,7 +51649,7 @@
   DB  102,15,250,202                      ; psubd         %xmm2,%xmm1
   DB  131,198,4                           ; add           $0x4,%esi
   DB  74                                  ; dec           %edx
-  DB  117,234                             ; jne           679d <_sk_gradient_sse2+0x2a>
+  DB  117,234                             ; jne           6830 <_sk_gradient_sse2+0x2a>
   DB  102,15,126,202                      ; movd          %xmm1,%edx
   DB  102,15,112,209,229                  ; pshufd        $0xe5,%xmm1,%xmm2
   DB  102,15,112,217,78                   ; pshufd        $0x4e,%xmm1,%xmm3
@@ -51641,7 +51797,7 @@
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
   DB  15,40,209                           ; movaps        %xmm1,%xmm2
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          69b8 <_sk_xy_to_unit_angle_sse2+0x18>
+  DB  232,0,0,0,0                         ; call          6a4b <_sk_xy_to_unit_angle_sse2+0x18>
   DB  88                                  ; pop           %eax
   DB  15,87,237                           ; xorps         %xmm5,%xmm5
   DB  15,92,233                           ; subps         %xmm1,%xmm5
@@ -51656,30 +51812,30 @@
   DB  15,94,247                           ; divps         %xmm7,%xmm6
   DB  15,40,254                           ; movaps        %xmm6,%xmm7
   DB  15,89,255                           ; mulps         %xmm7,%xmm7
-  DB  15,40,128,72,104,0,0                ; movaps        0x6848(%eax),%xmm0
+  DB  15,40,128,69,104,0,0                ; movaps        0x6845(%eax),%xmm0
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  15,88,128,88,104,0,0                ; addps         0x6858(%eax),%xmm0
+  DB  15,88,128,85,104,0,0                ; addps         0x6855(%eax),%xmm0
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  15,88,128,104,104,0,0               ; addps         0x6868(%eax),%xmm0
+  DB  15,88,128,101,104,0,0               ; addps         0x6865(%eax),%xmm0
   DB  15,89,199                           ; mulps         %xmm7,%xmm0
-  DB  15,88,128,120,104,0,0               ; addps         0x6878(%eax),%xmm0
+  DB  15,88,128,117,104,0,0               ; addps         0x6875(%eax),%xmm0
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
   DB  15,194,236,1                        ; cmpltps       %xmm4,%xmm5
-  DB  15,40,176,136,104,0,0               ; movaps        0x6888(%eax),%xmm6
+  DB  15,40,176,133,104,0,0               ; movaps        0x6885(%eax),%xmm6
   DB  15,92,240                           ; subps         %xmm0,%xmm6
   DB  15,84,245                           ; andps         %xmm5,%xmm6
   DB  15,85,232                           ; andnps        %xmm0,%xmm5
   DB  15,87,228                           ; xorps         %xmm4,%xmm4
   DB  15,86,238                           ; orps          %xmm6,%xmm5
   DB  15,194,204,1                        ; cmpltps       %xmm4,%xmm1
-  DB  15,40,128,88,98,0,0                 ; movaps        0x6258(%eax),%xmm0
+  DB  15,40,128,85,98,0,0                 ; movaps        0x6255(%eax),%xmm0
   DB  15,92,197                           ; subps         %xmm5,%xmm0
   DB  15,84,193                           ; andps         %xmm1,%xmm0
   DB  15,85,205                           ; andnps        %xmm5,%xmm1
   DB  15,86,200                           ; orps          %xmm0,%xmm1
   DB  15,40,194                           ; movaps        %xmm2,%xmm0
   DB  15,194,196,1                        ; cmpltps       %xmm4,%xmm0
-  DB  15,40,168,104,98,0,0                ; movaps        0x6268(%eax),%xmm5
+  DB  15,40,168,101,98,0,0                ; movaps        0x6265(%eax),%xmm5
   DB  15,92,233                           ; subps         %xmm1,%xmm5
   DB  15,84,232                           ; andps         %xmm0,%xmm5
   DB  15,85,193                           ; andnps        %xmm1,%xmm0
@@ -51736,15 +51892,15 @@
   DB  15,40,241                           ; movaps        %xmm1,%xmm6
   DB  15,89,246                           ; mulps         %xmm6,%xmm6
   DB  15,88,240                           ; addps         %xmm0,%xmm6
-  DB  232,0,0,0,0                         ; call          6ad5 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
+  DB  232,0,0,0,0                         ; call          6b68 <_sk_xy_to_2pt_conical_quadratic_max_sse2+0x31>
   DB  90                                  ; pop           %edx
   DB  243,15,89,237                       ; mulss         %xmm5,%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,92,245                           ; subps         %xmm5,%xmm6
   DB  243,15,16,65,32                     ; movss         0x20(%ecx),%xmm0
   DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
-  DB  15,89,162,123,103,0,0               ; mulps         0x677b(%edx),%xmm4
-  DB  15,89,130,139,103,0,0               ; mulps         0x678b(%edx),%xmm0
+  DB  15,89,162,120,103,0,0               ; mulps         0x6778(%edx),%xmm4
+  DB  15,89,130,136,103,0,0               ; mulps         0x6788(%edx),%xmm0
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,89,237                           ; mulps         %xmm5,%xmm5
@@ -51752,11 +51908,11 @@
   DB  15,81,237                           ; sqrtps        %xmm5,%xmm5
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  15,87,162,43,102,0,0                ; xorps         0x662b(%edx),%xmm4
+  DB  15,87,162,40,102,0,0                ; xorps         0x6628(%edx),%xmm4
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  243,15,16,105,36                    ; movss         0x24(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
-  DB  15,89,170,59,97,0,0                 ; mulps         0x613b(%edx),%xmm5
+  DB  15,89,170,56,97,0,0                 ; mulps         0x6138(%edx),%xmm5
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
   DB  15,95,196                           ; maxps         %xmm4,%xmm0
@@ -51785,15 +51941,15 @@
   DB  15,40,241                           ; movaps        %xmm1,%xmm6
   DB  15,89,246                           ; mulps         %xmm6,%xmm6
   DB  15,88,240                           ; addps         %xmm0,%xmm6
-  DB  232,0,0,0,0                         ; call          6b73 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
+  DB  232,0,0,0,0                         ; call          6c06 <_sk_xy_to_2pt_conical_quadratic_min_sse2+0x31>
   DB  90                                  ; pop           %edx
   DB  243,15,89,237                       ; mulss         %xmm5,%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,92,245                           ; subps         %xmm5,%xmm6
   DB  243,15,16,65,32                     ; movss         0x20(%ecx),%xmm0
   DB  15,198,192,0                        ; shufps        $0x0,%xmm0,%xmm0
-  DB  15,89,162,221,102,0,0               ; mulps         0x66dd(%edx),%xmm4
-  DB  15,89,130,237,102,0,0               ; mulps         0x66ed(%edx),%xmm0
+  DB  15,89,162,218,102,0,0               ; mulps         0x66da(%edx),%xmm4
+  DB  15,89,130,234,102,0,0               ; mulps         0x66ea(%edx),%xmm0
   DB  15,89,198                           ; mulps         %xmm6,%xmm0
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,89,237                           ; mulps         %xmm5,%xmm5
@@ -51801,11 +51957,11 @@
   DB  15,81,237                           ; sqrtps        %xmm5,%xmm5
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  15,87,162,141,101,0,0               ; xorps         0x658d(%edx),%xmm4
+  DB  15,87,162,138,101,0,0               ; xorps         0x658a(%edx),%xmm4
   DB  15,92,229                           ; subps         %xmm5,%xmm4
   DB  243,15,16,105,36                    ; movss         0x24(%ecx),%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
-  DB  15,89,170,157,96,0,0                ; mulps         0x609d(%edx),%xmm5
+  DB  15,89,170,154,96,0,0                ; mulps         0x609a(%edx),%xmm5
   DB  15,89,197                           ; mulps         %xmm5,%xmm0
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
   DB  15,93,196                           ; minps         %xmm4,%xmm0
@@ -51823,7 +51979,7 @@
   DB  85                                  ; push          %ebp
   DB  137,229                             ; mov           %esp,%ebp
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  232,0,0,0,0                         ; call          6beb <_sk_xy_to_2pt_conical_linear_sse2+0xb>
+  DB  232,0,0,0,0                         ; call          6c7e <_sk_xy_to_2pt_conical_linear_sse2+0xb>
   DB  89                                  ; pop           %ecx
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,16                              ; mov           (%eax),%edx
@@ -51832,7 +51988,7 @@
   DB  243,15,89,236                       ; mulss         %xmm4,%xmm5
   DB  15,198,237,0                        ; shufps        $0x0,%xmm5,%xmm5
   DB  15,88,232                           ; addps         %xmm0,%xmm5
-  DB  15,89,169,101,102,0,0               ; mulps         0x6665(%ecx),%xmm5
+  DB  15,89,169,98,102,0,0                ; mulps         0x6662(%ecx),%xmm5
   DB  15,89,192                           ; mulps         %xmm0,%xmm0
   DB  15,40,241                           ; movaps        %xmm1,%xmm6
   DB  15,89,246                           ; mulps         %xmm6,%xmm6
@@ -51840,7 +51996,7 @@
   DB  243,15,89,228                       ; mulss         %xmm4,%xmm4
   DB  15,198,228,0                        ; shufps        $0x0,%xmm4,%xmm4
   DB  15,92,196                           ; subps         %xmm4,%xmm0
-  DB  15,87,129,21,101,0,0                ; xorps         0x6515(%ecx),%xmm0
+  DB  15,87,129,18,101,0,0                ; xorps         0x6512(%ecx),%xmm0
   DB  15,94,197                           ; divps         %xmm5,%xmm0
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -51908,16 +52064,16 @@
   DB  131,236,24                          ; sub           $0x18,%esp
   DB  15,41,93,232                        ; movaps        %xmm3,-0x18(%ebp)
   DB  15,40,218                           ; movaps        %xmm2,%xmm3
-  DB  232,0,0,0,0                         ; call          6cc8 <_sk_save_xy_sse2+0x12>
+  DB  232,0,0,0,0                         ; call          6d5b <_sk_save_xy_sse2+0x12>
   DB  88                                  ; pop           %eax
-  DB  15,40,160,72,95,0,0                 ; movaps        0x5f48(%eax),%xmm4
+  DB  15,40,160,69,95,0,0                 ; movaps        0x5f45(%eax),%xmm4
   DB  15,40,232                           ; movaps        %xmm0,%xmm5
   DB  15,88,236                           ; addps         %xmm4,%xmm5
   DB  243,15,91,245                       ; cvttps2dq     %xmm5,%xmm6
   DB  15,91,246                           ; cvtdq2ps      %xmm6,%xmm6
   DB  15,40,253                           ; movaps        %xmm5,%xmm7
   DB  15,194,254,1                        ; cmpltps       %xmm6,%xmm7
-  DB  15,40,144,88,95,0,0                 ; movaps        0x5f58(%eax),%xmm2
+  DB  15,40,144,85,95,0,0                 ; movaps        0x5f55(%eax),%xmm2
   DB  15,84,250                           ; andps         %xmm2,%xmm7
   DB  15,92,247                           ; subps         %xmm7,%xmm6
   DB  15,92,238                           ; subps         %xmm6,%xmm5
@@ -51988,15 +52144,15 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6daa <_sk_bilinear_nx_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6e3d <_sk_bilinear_nx_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,6                             ; movups        (%esi),%xmm0
   DB  15,16,102,64                        ; movups        0x40(%esi),%xmm4
-  DB  15,88,128,198,100,0,0               ; addps         0x64c6(%eax),%xmm0
-  DB  15,40,168,118,94,0,0                ; movaps        0x5e76(%eax),%xmm5
+  DB  15,88,128,195,100,0,0               ; addps         0x64c3(%eax),%xmm0
+  DB  15,40,168,115,94,0,0                ; movaps        0x5e73(%eax),%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
   DB  15,17,174,128,0,0,0                 ; movups        %xmm5,0x80(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -52015,14 +52171,14 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6ded <_sk_bilinear_px_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6e80 <_sk_bilinear_px_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,6                             ; movups        (%esi),%xmm0
   DB  15,16,102,64                        ; movups        0x40(%esi),%xmm4
-  DB  15,88,128,35,94,0,0                 ; addps         0x5e23(%eax),%xmm0
+  DB  15,88,128,32,94,0,0                 ; addps         0x5e20(%eax),%xmm0
   DB  15,17,166,128,0,0,0                 ; movups        %xmm4,0x80(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -52040,15 +52196,15 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6e26 <_sk_bilinear_ny_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6eb9 <_sk_bilinear_ny_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,78,32                         ; movups        0x20(%esi),%xmm1
   DB  15,16,102,96                        ; movups        0x60(%esi),%xmm4
-  DB  15,88,136,74,100,0,0                ; addps         0x644a(%eax),%xmm1
-  DB  15,40,168,250,93,0,0                ; movaps        0x5dfa(%eax),%xmm5
+  DB  15,88,136,71,100,0,0                ; addps         0x6447(%eax),%xmm1
+  DB  15,40,168,247,93,0,0                ; movaps        0x5df7(%eax),%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
   DB  15,17,174,160,0,0,0                 ; movups        %xmm5,0xa0(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -52067,14 +52223,14 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6e6a <_sk_bilinear_py_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6efd <_sk_bilinear_py_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,78,32                         ; movups        0x20(%esi),%xmm1
   DB  15,16,102,96                        ; movups        0x60(%esi),%xmm4
-  DB  15,88,136,166,93,0,0                ; addps         0x5da6(%eax),%xmm1
+  DB  15,88,136,163,93,0,0                ; addps         0x5da3(%eax),%xmm1
   DB  15,17,166,160,0,0,0                 ; movups        %xmm4,0xa0(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -52092,20 +52248,20 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6ea4 <_sk_bicubic_n3x_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6f37 <_sk_bicubic_n3x_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,6                             ; movups        (%esi),%xmm0
   DB  15,16,102,64                        ; movups        0x40(%esi),%xmm4
-  DB  15,88,128,220,99,0,0                ; addps         0x63dc(%eax),%xmm0
-  DB  15,40,168,124,93,0,0                ; movaps        0x5d7c(%eax),%xmm5
+  DB  15,88,128,217,99,0,0                ; addps         0x63d9(%eax),%xmm0
+  DB  15,40,168,121,93,0,0                ; movaps        0x5d79(%eax),%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
   DB  15,40,229                           ; movaps        %xmm5,%xmm4
   DB  15,89,228                           ; mulps         %xmm4,%xmm4
-  DB  15,89,168,236,99,0,0                ; mulps         0x63ec(%eax),%xmm5
-  DB  15,88,168,92,95,0,0                 ; addps         0x5f5c(%eax),%xmm5
+  DB  15,89,168,233,99,0,0                ; mulps         0x63e9(%eax),%xmm5
+  DB  15,88,168,89,95,0,0                 ; addps         0x5f59(%eax),%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
   DB  15,17,174,128,0,0,0                 ; movups        %xmm5,0x80(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -52124,23 +52280,23 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6efe <_sk_bicubic_n1x_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6f91 <_sk_bicubic_n1x_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,6                             ; movups        (%esi),%xmm0
   DB  15,16,102,64                        ; movups        0x40(%esi),%xmm4
-  DB  15,88,128,114,99,0,0                ; addps         0x6372(%eax),%xmm0
-  DB  15,40,168,34,93,0,0                 ; movaps        0x5d22(%eax),%xmm5
+  DB  15,88,128,111,99,0,0                ; addps         0x636f(%eax),%xmm0
+  DB  15,40,168,31,93,0,0                 ; movaps        0x5d1f(%eax),%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
-  DB  15,40,160,162,99,0,0                ; movaps        0x63a2(%eax),%xmm4
+  DB  15,40,160,159,99,0,0                ; movaps        0x639f(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
-  DB  15,88,160,178,99,0,0                ; addps         0x63b2(%eax),%xmm4
+  DB  15,88,160,175,99,0,0                ; addps         0x63af(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
-  DB  15,88,160,18,93,0,0                 ; addps         0x5d12(%eax),%xmm4
+  DB  15,88,160,15,93,0,0                 ; addps         0x5d0f(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
-  DB  15,88,160,194,99,0,0                ; addps         0x63c2(%eax),%xmm4
+  DB  15,88,160,191,99,0,0                ; addps         0x63bf(%eax),%xmm4
   DB  15,17,166,128,0,0,0                 ; movups        %xmm4,0x80(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -52158,22 +52314,22 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6f66 <_sk_bicubic_p1x_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          6ff9 <_sk_bicubic_p1x_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
-  DB  15,40,160,170,92,0,0                ; movaps        0x5caa(%eax),%xmm4
+  DB  15,40,160,167,92,0,0                ; movaps        0x5ca7(%eax),%xmm4
   DB  15,16,6                             ; movups        (%esi),%xmm0
   DB  15,16,110,64                        ; movups        0x40(%esi),%xmm5
   DB  15,88,196                           ; addps         %xmm4,%xmm0
-  DB  15,40,176,58,99,0,0                 ; movaps        0x633a(%eax),%xmm6
+  DB  15,40,176,55,99,0,0                 ; movaps        0x6337(%eax),%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
-  DB  15,88,176,74,99,0,0                 ; addps         0x634a(%eax),%xmm6
+  DB  15,88,176,71,99,0,0                 ; addps         0x6347(%eax),%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
   DB  15,88,244                           ; addps         %xmm4,%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
-  DB  15,88,176,90,99,0,0                 ; addps         0x635a(%eax),%xmm6
+  DB  15,88,176,87,99,0,0                 ; addps         0x6357(%eax),%xmm6
   DB  15,17,182,128,0,0,0                 ; movups        %xmm6,0x80(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -52191,18 +52347,18 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          6fc3 <_sk_bicubic_p3x_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          7056 <_sk_bicubic_p3x_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,6                             ; movups        (%esi),%xmm0
   DB  15,16,102,64                        ; movups        0x40(%esi),%xmm4
-  DB  15,88,128,237,98,0,0                ; addps         0x62ed(%eax),%xmm0
+  DB  15,88,128,234,98,0,0                ; addps         0x62ea(%eax),%xmm0
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,89,237                           ; mulps         %xmm5,%xmm5
-  DB  15,89,160,205,98,0,0                ; mulps         0x62cd(%eax),%xmm4
-  DB  15,88,160,61,94,0,0                 ; addps         0x5e3d(%eax),%xmm4
+  DB  15,89,160,202,98,0,0                ; mulps         0x62ca(%eax),%xmm4
+  DB  15,88,160,58,94,0,0                 ; addps         0x5e3a(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
   DB  15,17,166,128,0,0,0                 ; movups        %xmm4,0x80(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -52221,20 +52377,20 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          7013 <_sk_bicubic_n3y_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          70a6 <_sk_bicubic_n3y_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,78,32                         ; movups        0x20(%esi),%xmm1
   DB  15,16,102,96                        ; movups        0x60(%esi),%xmm4
-  DB  15,88,136,109,98,0,0                ; addps         0x626d(%eax),%xmm1
-  DB  15,40,168,13,92,0,0                 ; movaps        0x5c0d(%eax),%xmm5
+  DB  15,88,136,106,98,0,0                ; addps         0x626a(%eax),%xmm1
+  DB  15,40,168,10,92,0,0                 ; movaps        0x5c0a(%eax),%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
   DB  15,40,229                           ; movaps        %xmm5,%xmm4
   DB  15,89,228                           ; mulps         %xmm4,%xmm4
-  DB  15,89,168,125,98,0,0                ; mulps         0x627d(%eax),%xmm5
-  DB  15,88,168,237,93,0,0                ; addps         0x5ded(%eax),%xmm5
+  DB  15,89,168,122,98,0,0                ; mulps         0x627a(%eax),%xmm5
+  DB  15,88,168,234,93,0,0                ; addps         0x5dea(%eax),%xmm5
   DB  15,89,236                           ; mulps         %xmm4,%xmm5
   DB  15,17,174,160,0,0,0                 ; movups        %xmm5,0xa0(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -52253,23 +52409,23 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          706e <_sk_bicubic_n1y_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          7101 <_sk_bicubic_n1y_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,78,32                         ; movups        0x20(%esi),%xmm1
   DB  15,16,102,96                        ; movups        0x60(%esi),%xmm4
-  DB  15,88,136,2,98,0,0                  ; addps         0x6202(%eax),%xmm1
-  DB  15,40,168,178,91,0,0                ; movaps        0x5bb2(%eax),%xmm5
+  DB  15,88,136,255,97,0,0                ; addps         0x61ff(%eax),%xmm1
+  DB  15,40,168,175,91,0,0                ; movaps        0x5baf(%eax),%xmm5
   DB  15,92,236                           ; subps         %xmm4,%xmm5
-  DB  15,40,160,50,98,0,0                 ; movaps        0x6232(%eax),%xmm4
+  DB  15,40,160,47,98,0,0                 ; movaps        0x622f(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
-  DB  15,88,160,66,98,0,0                 ; addps         0x6242(%eax),%xmm4
+  DB  15,88,160,63,98,0,0                 ; addps         0x623f(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
-  DB  15,88,160,162,91,0,0                ; addps         0x5ba2(%eax),%xmm4
+  DB  15,88,160,159,91,0,0                ; addps         0x5b9f(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
-  DB  15,88,160,82,98,0,0                 ; addps         0x6252(%eax),%xmm4
+  DB  15,88,160,79,98,0,0                 ; addps         0x624f(%eax),%xmm4
   DB  15,17,166,160,0,0,0                 ; movups        %xmm4,0xa0(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -52287,22 +52443,22 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          70d7 <_sk_bicubic_p1y_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          716a <_sk_bicubic_p1y_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
-  DB  15,40,160,57,91,0,0                 ; movaps        0x5b39(%eax),%xmm4
+  DB  15,40,160,54,91,0,0                 ; movaps        0x5b36(%eax),%xmm4
   DB  15,16,78,32                         ; movups        0x20(%esi),%xmm1
   DB  15,16,110,96                        ; movups        0x60(%esi),%xmm5
   DB  15,88,204                           ; addps         %xmm4,%xmm1
-  DB  15,40,176,201,97,0,0                ; movaps        0x61c9(%eax),%xmm6
+  DB  15,40,176,198,97,0,0                ; movaps        0x61c6(%eax),%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
-  DB  15,88,176,217,97,0,0                ; addps         0x61d9(%eax),%xmm6
+  DB  15,88,176,214,97,0,0                ; addps         0x61d6(%eax),%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
   DB  15,88,244                           ; addps         %xmm4,%xmm6
   DB  15,89,245                           ; mulps         %xmm5,%xmm6
-  DB  15,88,176,233,97,0,0                ; addps         0x61e9(%eax),%xmm6
+  DB  15,88,176,230,97,0,0                ; addps         0x61e6(%eax),%xmm6
   DB  15,17,182,160,0,0,0                 ; movups        %xmm6,0xa0(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
   DB  131,236,8                           ; sub           $0x8,%esp
@@ -52320,18 +52476,18 @@
   DB  137,229                             ; mov           %esp,%ebp
   DB  86                                  ; push          %esi
   DB  80                                  ; push          %eax
-  DB  232,0,0,0,0                         ; call          7135 <_sk_bicubic_p3y_sse2+0xa>
+  DB  232,0,0,0,0                         ; call          71c8 <_sk_bicubic_p3y_sse2+0xa>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,12                           ; mov           0xc(%ebp),%edx
   DB  139,50                              ; mov           (%edx),%esi
   DB  15,16,78,32                         ; movups        0x20(%esi),%xmm1
   DB  15,16,102,96                        ; movups        0x60(%esi),%xmm4
-  DB  15,88,136,123,97,0,0                ; addps         0x617b(%eax),%xmm1
+  DB  15,88,136,120,97,0,0                ; addps         0x6178(%eax),%xmm1
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
   DB  15,89,237                           ; mulps         %xmm5,%xmm5
-  DB  15,89,160,91,97,0,0                 ; mulps         0x615b(%eax),%xmm4
-  DB  15,88,160,203,92,0,0                ; addps         0x5ccb(%eax),%xmm4
+  DB  15,89,160,88,97,0,0                 ; mulps         0x6158(%eax),%xmm4
+  DB  15,88,160,200,92,0,0                ; addps         0x5cc8(%eax),%xmm4
   DB  15,89,229                           ; mulps         %xmm5,%xmm4
   DB  15,17,166,160,0,0,0                 ; movups        %xmm4,0xa0(%esi)
   DB  141,66,8                            ; lea           0x8(%edx),%eax
@@ -52472,7 +52628,7 @@
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
   DB  102,15,98,200                       ; punpckldq     %xmm0,%xmm1
   DB  102,15,127,77,136                   ; movdqa        %xmm1,-0x78(%ebp)
-  DB  232,0,0,0,0                         ; call          7321 <_sk_clut_3D_sse2+0xf7>
+  DB  232,0,0,0,0                         ; call          73b4 <_sk_clut_3D_sse2+0xf7>
   DB  90                                  ; pop           %edx
   DB  243,15,91,196                       ; cvttps2dq     %xmm4,%xmm0
   DB  102,15,127,133,248,254,255,255      ; movdqa        %xmm0,-0x108(%ebp)
@@ -52480,7 +52636,7 @@
   DB  102,15,254,216                      ; paddd         %xmm0,%xmm3
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,254,195                      ; paddd         %xmm3,%xmm0
-  DB  102,15,111,162,191,95,0,0           ; movdqa        0x5fbf(%edx),%xmm4
+  DB  102,15,111,162,188,95,0,0           ; movdqa        0x5fbc(%edx),%xmm4
   DB  102,15,127,165,120,255,255,255      ; movdqa        %xmm4,-0x88(%ebp)
   DB  102,15,112,200,245                  ; pshufd        $0xf5,%xmm0,%xmm1
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
@@ -52520,7 +52676,7 @@
   DB  243,15,16,4,129                     ; movss         (%ecx,%eax,4),%xmm0
   DB  15,20,248                           ; unpcklps      %xmm0,%xmm7
   DB  102,15,20,252                       ; unpcklpd      %xmm4,%xmm7
-  DB  102,15,111,130,63,89,0,0            ; movdqa        0x593f(%edx),%xmm0
+  DB  102,15,111,130,60,89,0,0            ; movdqa        0x593c(%edx),%xmm0
   DB  102,15,127,133,104,255,255,255      ; movdqa        %xmm0,-0x98(%ebp)
   DB  102,15,254,200                      ; paddd         %xmm0,%xmm1
   DB  102,15,112,193,229                  ; pshufd        $0xe5,%xmm1,%xmm0
@@ -52537,7 +52693,7 @@
   DB  243,15,16,4,129                     ; movss         (%ecx,%eax,4),%xmm0
   DB  15,20,240                           ; unpcklps      %xmm0,%xmm6
   DB  102,15,20,241                       ; unpcklpd      %xmm1,%xmm6
-  DB  15,40,130,175,95,0,0                ; movaps        0x5faf(%edx),%xmm0
+  DB  15,40,130,172,95,0,0                ; movaps        0x5fac(%edx),%xmm0
   DB  15,40,141,232,254,255,255           ; movaps        -0x118(%ebp),%xmm1
   DB  15,88,200                           ; addps         %xmm0,%xmm1
   DB  15,41,77,200                        ; movaps        %xmm1,-0x38(%ebp)
@@ -53158,7 +53314,7 @@
   DB  102,15,112,201,232                  ; pshufd        $0xe8,%xmm1,%xmm1
   DB  102,15,98,217                       ; punpckldq     %xmm1,%xmm3
   DB  102,15,127,93,152                   ; movdqa        %xmm3,-0x68(%ebp)
-  DB  232,0,0,0,0                         ; call          7eb7 <_sk_clut_4D_sse2+0x16e>
+  DB  232,0,0,0,0                         ; call          7f4a <_sk_clut_4D_sse2+0x16e>
   DB  89                                  ; pop           %ecx
   DB  15,40,197                           ; movaps        %xmm5,%xmm0
   DB  15,41,133,152,254,255,255           ; movaps        %xmm0,-0x168(%ebp)
@@ -53169,7 +53325,7 @@
   DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
   DB  102,15,254,214                      ; paddd         %xmm6,%xmm2
   DB  102,15,254,218                      ; paddd         %xmm2,%xmm3
-  DB  102,15,111,161,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm4
+  DB  102,15,111,161,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm4
   DB  102,15,112,203,245                  ; pshufd        $0xf5,%xmm3,%xmm1
   DB  102,15,244,220                      ; pmuludq       %xmm4,%xmm3
   DB  102,15,244,204                      ; pmuludq       %xmm4,%xmm1
@@ -53211,7 +53367,7 @@
   DB  15,20,223                           ; unpcklps      %xmm7,%xmm3
   DB  102,15,20,222                       ; unpcklpd      %xmm6,%xmm3
   DB  102,15,41,157,232,254,255,255       ; movapd        %xmm3,-0x118(%ebp)
-  DB  102,15,254,137,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm1
+  DB  102,15,254,137,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm1
   DB  102,15,112,241,229                  ; pshufd        $0xe5,%xmm1,%xmm6
   DB  102,15,126,240                      ; movd          %xmm6,%eax
   DB  102,15,112,241,78                   ; pshufd        $0x4e,%xmm1,%xmm6
@@ -53226,7 +53382,7 @@
   DB  243,15,16,60,130                    ; movss         (%edx,%eax,4),%xmm7
   DB  15,20,223                           ; unpcklps      %xmm7,%xmm3
   DB  102,15,20,222                       ; unpcklpd      %xmm6,%xmm3
-  DB  15,40,185,25,84,0,0                 ; movaps        0x5419(%ecx),%xmm7
+  DB  15,40,185,22,84,0,0                 ; movaps        0x5416(%ecx),%xmm7
   DB  15,88,199                           ; addps         %xmm7,%xmm0
   DB  15,41,133,120,255,255,255           ; movaps        %xmm0,-0x88(%ebp)
   DB  15,40,133,248,254,255,255           ; movaps        -0x108(%ebp),%xmm0
@@ -53247,7 +53403,7 @@
   DB  102,15,127,101,168                  ; movdqa        %xmm4,-0x58(%ebp)
   DB  102,15,254,212                      ; paddd         %xmm4,%xmm2
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,161,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm4
+  DB  102,15,111,161,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm4
   DB  102,15,244,212                      ; pmuludq       %xmm4,%xmm2
   DB  102,15,244,196                      ; pmuludq       %xmm4,%xmm0
   DB  102,15,112,240,232                  ; pshufd        $0xe8,%xmm0,%xmm6
@@ -53283,7 +53439,7 @@
   DB  243,15,16,44,130                    ; movss         (%edx,%eax,4),%xmm5
   DB  15,20,213                           ; unpcklps      %xmm5,%xmm2
   DB  102,15,20,214                       ; unpcklpd      %xmm6,%xmm2
-  DB  102,15,254,129,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm0
+  DB  102,15,254,129,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm0
   DB  102,15,112,232,229                  ; pshufd        $0xe5,%xmm0,%xmm5
   DB  102,15,126,232                      ; movd          %xmm5,%eax
   DB  102,15,112,232,78                   ; pshufd        $0x4e,%xmm0,%xmm5
@@ -53367,7 +53523,7 @@
   DB  243,15,16,44,130                    ; movss         (%edx,%eax,4),%xmm5
   DB  15,20,245                           ; unpcklps      %xmm5,%xmm6
   DB  102,15,20,240                       ; unpcklpd      %xmm0,%xmm6
-  DB  102,15,254,137,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm1
+  DB  102,15,254,137,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm1
   DB  102,15,112,193,229                  ; pshufd        $0xe5,%xmm1,%xmm0
   DB  102,15,126,192                      ; movd          %xmm0,%eax
   DB  102,15,112,193,78                   ; pshufd        $0x4e,%xmm1,%xmm0
@@ -53385,7 +53541,7 @@
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,15,254,77,168                   ; paddd         -0x58(%ebp),%xmm1
   DB  102,15,112,193,245                  ; pshufd        $0xf5,%xmm1,%xmm0
-  DB  102,15,111,145,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm2
+  DB  102,15,111,145,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm2
   DB  102,15,244,202                      ; pmuludq       %xmm2,%xmm1
   DB  102,15,244,194                      ; pmuludq       %xmm2,%xmm0
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
@@ -53421,7 +53577,7 @@
   DB  243,15,16,4,130                     ; movss         (%edx,%eax,4),%xmm0
   DB  15,20,216                           ; unpcklps      %xmm0,%xmm3
   DB  102,15,20,217                       ; unpcklpd      %xmm1,%xmm3
-  DB  102,15,254,169,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm5
+  DB  102,15,254,169,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm5
   DB  102,15,112,197,229                  ; pshufd        $0xe5,%xmm5,%xmm0
   DB  102,15,126,192                      ; movd          %xmm0,%eax
   DB  102,15,112,197,78                   ; pshufd        $0x4e,%xmm5,%xmm0
@@ -53481,7 +53637,7 @@
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,15,254,85,152                   ; paddd         -0x68(%ebp),%xmm2
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,153,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm3
+  DB  102,15,111,153,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm3
   DB  102,15,244,211                      ; pmuludq       %xmm3,%xmm2
   DB  102,15,244,195                      ; pmuludq       %xmm3,%xmm0
   DB  102,15,111,251                      ; movdqa        %xmm3,%xmm7
@@ -53520,7 +53676,7 @@
   DB  243,15,16,44,130                    ; movss         (%edx,%eax,4),%xmm5
   DB  15,20,229                           ; unpcklps      %xmm5,%xmm4
   DB  102,15,20,227                       ; unpcklpd      %xmm3,%xmm4
-  DB  102,15,254,129,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm0
+  DB  102,15,254,129,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm0
   DB  102,15,112,216,229                  ; pshufd        $0xe5,%xmm0,%xmm3
   DB  102,15,126,216                      ; movd          %xmm3,%eax
   DB  102,15,112,216,78                   ; pshufd        $0x4e,%xmm0,%xmm3
@@ -53572,7 +53728,7 @@
   DB  243,15,16,52,130                    ; movss         (%edx,%eax,4),%xmm6
   DB  15,20,238                           ; unpcklps      %xmm6,%xmm5
   DB  102,15,20,235                       ; unpcklpd      %xmm3,%xmm5
-  DB  102,15,111,137,169,77,0,0           ; movdqa        0x4da9(%ecx),%xmm1
+  DB  102,15,111,137,166,77,0,0           ; movdqa        0x4da6(%ecx),%xmm1
   DB  102,15,254,249                      ; paddd         %xmm1,%xmm7
   DB  102,15,112,223,229                  ; pshufd        $0xe5,%xmm7,%xmm3
   DB  102,15,126,216                      ; movd          %xmm3,%eax
@@ -53606,7 +53762,7 @@
   DB  102,15,111,226                      ; movdqa        %xmm2,%xmm4
   DB  102,15,254,69,152                   ; paddd         -0x68(%ebp),%xmm0
   DB  102,15,112,208,245                  ; pshufd        $0xf5,%xmm0,%xmm2
-  DB  102,15,111,153,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm3
+  DB  102,15,111,153,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm3
   DB  102,15,244,195                      ; pmuludq       %xmm3,%xmm0
   DB  102,15,244,211                      ; pmuludq       %xmm3,%xmm2
   DB  102,15,112,218,232                  ; pshufd        $0xe8,%xmm2,%xmm3
@@ -53663,7 +53819,7 @@
   DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
   DB  102,15,254,85,168                   ; paddd         -0x58(%ebp),%xmm2
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,137,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm1
+  DB  102,15,111,137,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm1
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
   DB  102,15,244,193                      ; pmuludq       %xmm1,%xmm0
   DB  102,15,112,240,232                  ; pshufd        $0xe8,%xmm0,%xmm6
@@ -53700,7 +53856,7 @@
   DB  243,15,16,36,130                    ; movss         (%edx,%eax,4),%xmm4
   DB  15,20,212                           ; unpcklps      %xmm4,%xmm2
   DB  102,15,20,214                       ; unpcklpd      %xmm6,%xmm2
-  DB  102,15,254,129,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm0
+  DB  102,15,254,129,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm0
   DB  102,15,112,224,229                  ; pshufd        $0xe5,%xmm0,%xmm4
   DB  102,15,126,224                      ; movd          %xmm4,%eax
   DB  102,15,112,224,78                   ; pshufd        $0x4e,%xmm0,%xmm4
@@ -53768,7 +53924,7 @@
   DB  102,15,111,93,152                   ; movdqa        -0x68(%ebp),%xmm3
   DB  102,15,254,217                      ; paddd         %xmm1,%xmm3
   DB  102,15,112,211,245                  ; pshufd        $0xf5,%xmm3,%xmm2
-  DB  102,15,111,129,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm0
+  DB  102,15,111,129,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm0
   DB  102,15,244,216                      ; pmuludq       %xmm0,%xmm3
   DB  102,15,244,208                      ; pmuludq       %xmm0,%xmm2
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
@@ -53807,7 +53963,7 @@
   DB  243,15,16,28,130                    ; movss         (%edx,%eax,4),%xmm3
   DB  15,20,235                           ; unpcklps      %xmm3,%xmm5
   DB  102,15,20,238                       ; unpcklpd      %xmm6,%xmm5
-  DB  102,15,254,145,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm2
+  DB  102,15,254,145,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm2
   DB  102,15,112,218,229                  ; pshufd        $0xe5,%xmm2,%xmm3
   DB  102,15,126,216                      ; movd          %xmm3,%eax
   DB  102,15,112,218,78                   ; pshufd        $0x4e,%xmm2,%xmm3
@@ -53859,7 +54015,7 @@
   DB  243,15,16,4,130                     ; movss         (%edx,%eax,4),%xmm0
   DB  15,20,208                           ; unpcklps      %xmm0,%xmm2
   DB  102,15,20,215                       ; unpcklpd      %xmm7,%xmm2
-  DB  102,15,111,137,169,77,0,0           ; movdqa        0x4da9(%ecx),%xmm1
+  DB  102,15,111,137,166,77,0,0           ; movdqa        0x4da6(%ecx),%xmm1
   DB  102,15,254,217                      ; paddd         %xmm1,%xmm3
   DB  102,15,112,195,229                  ; pshufd        $0xe5,%xmm3,%xmm0
   DB  102,15,126,192                      ; movd          %xmm0,%eax
@@ -53894,7 +54050,7 @@
   DB  102,15,111,194                      ; movdqa        %xmm2,%xmm0
   DB  102,15,254,69,152                   ; paddd         -0x68(%ebp),%xmm0
   DB  102,15,112,224,245                  ; pshufd        $0xf5,%xmm0,%xmm4
-  DB  102,15,111,169,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm5
+  DB  102,15,111,169,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm5
   DB  102,15,111,221                      ; movdqa        %xmm5,%xmm3
   DB  102,15,244,195                      ; pmuludq       %xmm3,%xmm0
   DB  102,15,244,227                      ; pmuludq       %xmm3,%xmm4
@@ -53950,7 +54106,7 @@
   DB  102,15,111,202                      ; movdqa        %xmm2,%xmm1
   DB  102,15,254,77,168                   ; paddd         -0x58(%ebp),%xmm1
   DB  102,15,112,193,245                  ; pshufd        $0xf5,%xmm1,%xmm0
-  DB  102,15,111,145,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm2
+  DB  102,15,111,145,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm2
   DB  102,15,244,202                      ; pmuludq       %xmm2,%xmm1
   DB  102,15,244,194                      ; pmuludq       %xmm2,%xmm0
   DB  102,15,112,192,232                  ; pshufd        $0xe8,%xmm0,%xmm0
@@ -53986,7 +54142,7 @@
   DB  243,15,16,4,130                     ; movss         (%edx,%eax,4),%xmm0
   DB  15,20,216                           ; unpcklps      %xmm0,%xmm3
   DB  102,15,20,217                       ; unpcklpd      %xmm1,%xmm3
-  DB  102,15,254,185,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm7
+  DB  102,15,254,185,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm7
   DB  102,15,112,199,229                  ; pshufd        $0xe5,%xmm7,%xmm0
   DB  102,15,126,192                      ; movd          %xmm0,%eax
   DB  102,15,112,199,78                   ; pshufd        $0x4e,%xmm7,%xmm0
@@ -54036,7 +54192,7 @@
   DB  102,15,111,233                      ; movdqa        %xmm1,%xmm5
   DB  102,15,254,69,152                   ; paddd         -0x68(%ebp),%xmm0
   DB  102,15,112,200,245                  ; pshufd        $0xf5,%xmm0,%xmm1
-  DB  102,15,111,145,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm2
+  DB  102,15,111,145,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm2
   DB  102,15,244,194                      ; pmuludq       %xmm2,%xmm0
   DB  102,15,244,202                      ; pmuludq       %xmm2,%xmm1
   DB  102,15,111,250                      ; movdqa        %xmm2,%xmm7
@@ -54075,7 +54231,7 @@
   DB  243,15,16,36,130                    ; movss         (%edx,%eax,4),%xmm4
   DB  15,20,204                           ; unpcklps      %xmm4,%xmm1
   DB  102,15,20,203                       ; unpcklpd      %xmm3,%xmm1
-  DB  102,15,254,145,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm2
+  DB  102,15,254,145,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm2
   DB  102,15,112,218,229                  ; pshufd        $0xe5,%xmm2,%xmm3
   DB  102,15,126,216                      ; movd          %xmm3,%eax
   DB  102,15,112,218,78                   ; pshufd        $0x4e,%xmm2,%xmm3
@@ -54129,7 +54285,7 @@
   DB  243,15,16,36,130                    ; movss         (%edx,%eax,4),%xmm4
   DB  15,20,252                           ; unpcklps      %xmm4,%xmm7
   DB  102,15,20,254                       ; unpcklpd      %xmm6,%xmm7
-  DB  102,15,254,153,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm3
+  DB  102,15,254,153,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm3
   DB  102,15,112,227,229                  ; pshufd        $0xe5,%xmm3,%xmm4
   DB  102,15,126,224                      ; movd          %xmm4,%eax
   DB  102,15,112,227,78                   ; pshufd        $0x4e,%xmm3,%xmm4
@@ -54162,7 +54318,7 @@
   DB  102,15,254,208                      ; paddd         %xmm0,%xmm2
   DB  102,15,111,216                      ; movdqa        %xmm0,%xmm3
   DB  102,15,112,194,245                  ; pshufd        $0xf5,%xmm2,%xmm0
-  DB  102,15,111,137,41,84,0,0            ; movdqa        0x5429(%ecx),%xmm1
+  DB  102,15,111,137,38,84,0,0            ; movdqa        0x5426(%ecx),%xmm1
   DB  102,15,244,209                      ; pmuludq       %xmm1,%xmm2
   DB  102,15,244,193                      ; pmuludq       %xmm1,%xmm0
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
@@ -54202,7 +54358,7 @@
   DB  15,20,225                           ; unpcklps      %xmm1,%xmm4
   DB  102,15,20,226                       ; unpcklpd      %xmm2,%xmm4
   DB  102,15,41,165,88,255,255,255        ; movapd        %xmm4,-0xa8(%ebp)
-  DB  102,15,254,129,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm0
+  DB  102,15,254,129,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm0
   DB  102,15,112,200,229                  ; pshufd        $0xe5,%xmm0,%xmm1
   DB  102,15,126,200                      ; movd          %xmm1,%eax
   DB  102,15,112,200,78                   ; pshufd        $0x4e,%xmm0,%xmm1
@@ -54256,7 +54412,7 @@
   DB  243,15,16,52,130                    ; movss         (%edx,%eax,4),%xmm6
   DB  15,20,206                           ; unpcklps      %xmm6,%xmm1
   DB  102,15,20,203                       ; unpcklpd      %xmm3,%xmm1
-  DB  102,15,254,145,169,77,0,0           ; paddd         0x4da9(%ecx),%xmm2
+  DB  102,15,254,145,166,77,0,0           ; paddd         0x4da6(%ecx),%xmm2
   DB  102,15,112,218,229                  ; pshufd        $0xe5,%xmm2,%xmm3
   DB  102,15,126,216                      ; movd          %xmm3,%eax
   DB  102,15,112,218,78                   ; pshufd        $0x4e,%xmm2,%xmm3
@@ -54326,7 +54482,7 @@
   DB  139,117,12                          ; mov           0xc(%ebp),%esi
   DB  141,86,8                            ; lea           0x8(%esi),%edx
   DB  131,236,8                           ; sub           $0x8,%esp
-  DB  15,40,153,105,77,0,0                ; movaps        0x4d69(%ecx),%xmm3
+  DB  15,40,153,102,77,0,0                ; movaps        0x4d66(%ecx),%xmm3
   DB  82                                  ; push          %edx
   DB  80                                  ; push          %eax
   DB  255,86,4                            ; call          *0x4(%esi)
@@ -54338,6 +54494,7 @@
   DB  195                                 ; ret
   DB  144                                 ; nop
   DB  144                                 ; nop
+  DB  144                                 ; nop
 
 PUBLIC _sk_start_pipeline_sse2_lowp
 _sk_start_pipeline_sse2_lowp LABEL PROC
@@ -54350,7 +54507,7 @@
   DB  131,236,96                          ; sub           $0x60,%esp
   DB  139,125,12                          ; mov           0xc(%ebp),%edi
   DB  59,125,20                           ; cmp           0x14(%ebp),%edi
-  DB  15,131,198,0,0,0                    ; jae           93e2 <_sk_start_pipeline_sse2_lowp+0xde>
+  DB  15,131,198,0,0,0                    ; jae           9476 <_sk_start_pipeline_sse2_lowp+0xde>
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  139,117,24                          ; mov           0x18(%ebp),%esi
@@ -54364,7 +54521,7 @@
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  137,223                             ; mov           %ebx,%edi
   DB  137,243                             ; mov           %esi,%ebx
-  DB  119,78                              ; ja            9393 <_sk_start_pipeline_sse2_lowp+0x8f>
+  DB  119,78                              ; ja            9427 <_sk_start_pipeline_sse2_lowp+0x8f>
   DB  139,117,8                           ; mov           0x8(%ebp),%esi
   DB  15,41,68,36,64                      ; movaps        %xmm0,0x40(%esp)
   DB  15,41,68,36,48                      ; movaps        %xmm0,0x30(%esp)
@@ -54386,13 +54543,13 @@
   DB  131,198,16                          ; add           $0x10,%esi
   DB  57,214                              ; cmp           %edx,%esi
   DB  137,198                             ; mov           %eax,%esi
-  DB  118,181                             ; jbe           9348 <_sk_start_pipeline_sse2_lowp+0x44>
+  DB  118,181                             ; jbe           93dc <_sk_start_pipeline_sse2_lowp+0x44>
   DB  137,209                             ; mov           %edx,%ecx
   DB  41,193                              ; sub           %eax,%ecx
   DB  137,222                             ; mov           %ebx,%esi
   DB  137,251                             ; mov           %edi,%ebx
   DB  139,124,36,84                       ; mov           0x54(%esp),%edi
-  DB  116,55                              ; je            93d8 <_sk_start_pipeline_sse2_lowp+0xd4>
+  DB  116,55                              ; je            946c <_sk_start_pipeline_sse2_lowp+0xd4>
   DB  15,41,68,36,64                      ; movaps        %xmm0,0x40(%esp)
   DB  15,41,68,36,48                      ; movaps        %xmm0,0x30(%esp)
   DB  15,41,68,36,32                      ; movaps        %xmm0,0x20(%esp)
@@ -54410,7 +54567,7 @@
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
   DB  71                                  ; inc           %edi
   DB  59,125,20                           ; cmp           0x14(%ebp),%edi
-  DB  15,133,82,255,255,255               ; jne           9334 <_sk_start_pipeline_sse2_lowp+0x30>
+  DB  15,133,82,255,255,255               ; jne           93c8 <_sk_start_pipeline_sse2_lowp+0x30>
   DB  141,101,244                         ; lea           -0xc(%ebp),%esp
   DB  94                                  ; pop           %esi
   DB  95                                  ; pop           %edi
@@ -54476,7 +54633,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,92                          ; sub           $0x5c,%esp
-  DB  232,0,0,0,0                         ; call          9491 <_sk_black_color_sse2_lowp+0xe>
+  DB  232,0,0,0,0                         ; call          9525 <_sk_black_color_sse2_lowp+0xe>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
@@ -54495,7 +54652,7 @@
   DB  137,84,36,8                         ; mov           %edx,0x8(%esp)
   DB  137,92,36,4                         ; mov           %ebx,0x4(%esp)
   DB  137,12,36                           ; mov           %ecx,(%esp)
-  DB  15,40,152,95,62,0,0                 ; movaps        0x3e5f(%eax),%xmm3
+  DB  15,40,152,91,62,0,0                 ; movaps        0x3e5b(%eax),%xmm3
   DB  15,87,192                           ; xorps         %xmm0,%xmm0
   DB  15,87,201                           ; xorps         %xmm1,%xmm1
   DB  15,87,210                           ; xorps         %xmm2,%xmm2
@@ -54515,7 +54672,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,92                          ; sub           $0x5c,%esp
-  DB  232,0,0,0,0                         ; call          94fc <_sk_white_color_sse2_lowp+0xe>
+  DB  232,0,0,0,0                         ; call          9590 <_sk_white_color_sse2_lowp+0xe>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
@@ -54534,7 +54691,7 @@
   DB  137,84,36,8                         ; mov           %edx,0x8(%esp)
   DB  137,92,36,4                         ; mov           %ebx,0x4(%esp)
   DB  137,12,36                           ; mov           %ecx,(%esp)
-  DB  15,40,128,244,61,0,0                ; movaps        0x3df4(%eax),%xmm0
+  DB  15,40,128,240,61,0,0                ; movaps        0x3df0(%eax),%xmm0
   DB  15,40,200                           ; movaps        %xmm0,%xmm1
   DB  15,40,208                           ; movaps        %xmm0,%xmm2
   DB  15,40,216                           ; movaps        %xmm0,%xmm3
@@ -54553,16 +54710,16 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9566 <_sk_set_rgb_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          95fa <_sk_set_rgb_sse2_lowp+0xd>
   DB  94                                  ; pop           %esi
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,57                              ; mov           (%ecx),%edi
-  DB  243,15,16,150,78,62,0,0             ; movss         0x3e4e(%esi),%xmm2
+  DB  243,15,16,150,74,62,0,0             ; movss         0x3e4a(%esi),%xmm2
   DB  243,15,16,7                         ; movss         (%edi),%xmm0
   DB  243,15,89,194                       ; mulss         %xmm2,%xmm0
-  DB  243,15,16,142,74,62,0,0             ; movss         0x3e4a(%esi),%xmm1
+  DB  243,15,16,142,70,62,0,0             ; movss         0x3e46(%esi),%xmm1
   DB  243,15,88,193                       ; addss         %xmm1,%xmm0
   DB  243,15,44,240                       ; cvttss2si     %xmm0,%esi
   DB  102,15,110,198                      ; movd          %esi,%xmm0
@@ -54609,7 +54766,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          962a <_sk_premul_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          96be <_sk_premul_sse2_lowp+0xd>
   DB  90                                  ; pop           %edx
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  139,77,16                           ; mov           0x10(%ebp),%ecx
@@ -54618,7 +54775,7 @@
   DB  15,40,109,40                        ; movaps        0x28(%ebp),%xmm5
   DB  15,40,117,56                        ; movaps        0x38(%ebp),%xmm6
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,15,111,186,198,60,0,0           ; movdqa        0x3cc6(%edx),%xmm7
+  DB  102,15,111,186,194,60,0,0           ; movdqa        0x3cc2(%edx),%xmm7
   DB  102,15,253,199                      ; paddw         %xmm7,%xmm0
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
   DB  102,15,253,207                      ; paddw         %xmm7,%xmm1
@@ -54744,12 +54901,12 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          97a4 <_sk_invert_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9838 <_sk_invert_sse2_lowp+0xd>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
   DB  139,117,20                          ; mov           0x14(%ebp),%esi
-  DB  102,15,111,160,76,59,0,0            ; movdqa        0x3b4c(%eax),%xmm4
+  DB  102,15,111,160,72,59,0,0            ; movdqa        0x3b48(%eax),%xmm4
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,249,232                      ; psubw         %xmm0,%xmm5
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
@@ -54827,11 +54984,11 @@
   DB  102,15,111,234                      ; movdqa        %xmm2,%xmm5
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          989c <_sk_srcatop_sse2_lowp+0x19>
+  DB  232,0,0,0,0                         ; call          9930 <_sk_srcatop_sse2_lowp+0x19>
   DB  88                                  ; pop           %eax
   DB  102,15,111,117,72                   ; movdqa        0x48(%ebp),%xmm6
   DB  102,15,213,206                      ; pmullw        %xmm6,%xmm1
-  DB  102,15,111,128,84,58,0,0            ; movdqa        0x3a54(%eax),%xmm0
+  DB  102,15,111,128,80,58,0,0            ; movdqa        0x3a50(%eax),%xmm0
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
   DB  102,15,213,214                      ; pmullw        %xmm6,%xmm2
   DB  102,15,253,208                      ; paddw         %xmm0,%xmm2
@@ -54887,12 +55044,12 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9970 <_sk_dstatop_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9a04 <_sk_dstatop_sse2_lowp+0xd>
   DB  88                                  ; pop           %eax
   DB  102,15,111,101,40                   ; movdqa        0x28(%ebp),%xmm4
   DB  102,15,111,117,24                   ; movdqa        0x18(%ebp),%xmm6
   DB  102,15,213,243                      ; pmullw        %xmm3,%xmm6
-  DB  102,15,111,184,128,57,0,0           ; movdqa        0x3980(%eax),%xmm7
+  DB  102,15,111,184,124,57,0,0           ; movdqa        0x397c(%eax),%xmm7
   DB  102,15,253,247                      ; paddw         %xmm7,%xmm6
   DB  102,15,213,227                      ; pmullw        %xmm3,%xmm4
   DB  102,15,253,231                      ; paddw         %xmm7,%xmm4
@@ -54943,7 +55100,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9a31 <_sk_srcin_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9ac5 <_sk_srcin_sse2_lowp+0xd>
   DB  94                                  ; pop           %esi
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  139,77,16                           ; mov           0x10(%ebp),%ecx
@@ -54952,7 +55109,7 @@
   DB  15,40,109,40                        ; movaps        0x28(%ebp),%xmm5
   DB  102,15,111,117,72                   ; movdqa        0x48(%ebp),%xmm6
   DB  102,15,213,198                      ; pmullw        %xmm6,%xmm0
-  DB  102,15,111,190,191,56,0,0           ; movdqa        0x38bf(%esi),%xmm7
+  DB  102,15,111,190,187,56,0,0           ; movdqa        0x38bb(%esi),%xmm7
   DB  102,15,253,199                      ; paddw         %xmm7,%xmm0
   DB  102,15,213,206                      ; pmullw        %xmm6,%xmm1
   DB  102,15,253,207                      ; paddw         %xmm7,%xmm1
@@ -54989,14 +55146,14 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9ac8 <_sk_dstin_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9b5c <_sk_dstin_sse2_lowp+0xd>
   DB  88                                  ; pop           %eax
   DB  102,15,111,85,56                    ; movdqa        0x38(%ebp),%xmm2
   DB  102,15,111,109,40                   ; movdqa        0x28(%ebp),%xmm5
   DB  102,15,111,117,24                   ; movdqa        0x18(%ebp),%xmm6
   DB  102,15,111,198                      ; movdqa        %xmm6,%xmm0
   DB  102,15,213,195                      ; pmullw        %xmm3,%xmm0
-  DB  102,15,111,184,40,56,0,0            ; movdqa        0x3828(%eax),%xmm7
+  DB  102,15,111,184,36,56,0,0            ; movdqa        0x3824(%eax),%xmm7
   DB  102,15,253,199                      ; paddw         %xmm7,%xmm0
   DB  102,15,111,205                      ; movdqa        %xmm5,%xmm1
   DB  102,15,213,203                      ; pmullw        %xmm3,%xmm1
@@ -55038,14 +55195,14 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9b70 <_sk_srcout_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9c04 <_sk_srcout_sse2_lowp+0xd>
   DB  94                                  ; pop           %esi
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  139,77,16                           ; mov           0x10(%ebp),%ecx
   DB  139,85,20                           ; mov           0x14(%ebp),%edx
   DB  15,40,101,24                        ; movaps        0x18(%ebp),%xmm4
   DB  102,15,111,109,72                   ; movdqa        0x48(%ebp),%xmm5
-  DB  102,15,111,182,128,55,0,0           ; movdqa        0x3780(%esi),%xmm6
+  DB  102,15,111,182,124,55,0,0           ; movdqa        0x377c(%esi),%xmm6
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,15,249,253                      ; psubw         %xmm5,%xmm7
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
@@ -55087,11 +55244,11 @@
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
-  DB  232,0,0,0,0                         ; call          9c13 <_sk_dstout_sse2_lowp+0x11>
+  DB  232,0,0,0,0                         ; call          9ca7 <_sk_dstout_sse2_lowp+0x11>
   DB  88                                  ; pop           %eax
   DB  102,15,111,109,56                   ; movdqa        0x38(%ebp),%xmm5
   DB  102,15,111,117,24                   ; movdqa        0x18(%ebp),%xmm6
-  DB  102,15,111,184,221,54,0,0           ; movdqa        0x36dd(%eax),%xmm7
+  DB  102,15,111,184,217,54,0,0           ; movdqa        0x36d9(%eax),%xmm7
   DB  102,15,111,223                      ; movdqa        %xmm7,%xmm3
   DB  102,15,249,216                      ; psubw         %xmm0,%xmm3
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
@@ -55141,9 +55298,9 @@
   DB  15,41,85,232                        ; movaps        %xmm2,-0x18(%ebp)
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
-  DB  232,0,0,0,0                         ; call          9ccf <_sk_srcover_sse2_lowp+0x19>
+  DB  232,0,0,0,0                         ; call          9d63 <_sk_srcover_sse2_lowp+0x19>
   DB  88                                  ; pop           %eax
-  DB  102,15,111,136,33,54,0,0            ; movdqa        0x3621(%eax),%xmm1
+  DB  102,15,111,136,29,54,0,0            ; movdqa        0x361d(%eax),%xmm1
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,249,195                      ; psubw         %xmm3,%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
@@ -55200,7 +55357,7 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9d9f <_sk_dstover_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9e33 <_sk_dstover_sse2_lowp+0xd>
   DB  95                                  ; pop           %edi
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
@@ -55208,7 +55365,7 @@
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  102,15,111,101,56                   ; movdqa        0x38(%ebp),%xmm4
   DB  102,15,111,109,72                   ; movdqa        0x48(%ebp),%xmm5
-  DB  102,15,111,183,81,53,0,0            ; movdqa        0x3551(%edi),%xmm6
+  DB  102,15,111,183,77,53,0,0            ; movdqa        0x354d(%edi),%xmm6
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,15,249,253                      ; psubw         %xmm5,%xmm7
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
@@ -55252,12 +55409,12 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9e54 <_sk_modulate_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9ee8 <_sk_modulate_sse2_lowp+0xd>
   DB  88                                  ; pop           %eax
   DB  102,15,111,109,40                   ; movdqa        0x28(%ebp),%xmm5
   DB  102,15,111,117,24                   ; movdqa        0x18(%ebp),%xmm6
   DB  102,15,213,198                      ; pmullw        %xmm6,%xmm0
-  DB  102,15,111,184,156,52,0,0           ; movdqa        0x349c(%eax),%xmm7
+  DB  102,15,111,184,152,52,0,0           ; movdqa        0x3498(%eax),%xmm7
   DB  102,15,253,199                      ; paddw         %xmm7,%xmm0
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
   DB  102,15,253,207                      ; paddw         %xmm7,%xmm1
@@ -55298,10 +55455,10 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          9ef0 <_sk_multiply_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          9f84 <_sk_multiply_sse2_lowp+0xd>
   DB  88                                  ; pop           %eax
   DB  102,15,111,109,24                   ; movdqa        0x18(%ebp),%xmm5
-  DB  102,15,111,160,0,52,0,0             ; movdqa        0x3400(%eax),%xmm4
+  DB  102,15,111,160,252,51,0,0           ; movdqa        0x33fc(%eax),%xmm4
   DB  102,15,111,245                      ; movdqa        %xmm5,%xmm6
   DB  102,15,253,244                      ; paddw         %xmm4,%xmm6
   DB  102,15,249,117,72                   ; psubw         0x48(%ebp),%xmm6
@@ -55369,17 +55526,17 @@
   DB  131,236,96                          ; sub           $0x60,%esp
   DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          9ff1 <_sk_plus__sse2_lowp+0x15>
+  DB  232,0,0,0,0                         ; call          a085 <_sk_plus__sse2_lowp+0x15>
   DB  88                                  ; pop           %eax
   DB  102,15,253,77,24                    ; paddw         0x18(%ebp),%xmm1
-  DB  102,15,111,168,15,51,0,0            ; movdqa        0x330f(%eax),%xmm5
+  DB  102,15,111,168,11,51,0,0            ; movdqa        0x330b(%eax),%xmm5
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,217,197                      ; psubusw       %xmm5,%xmm0
   DB  102,15,127,109,232                  ; movdqa        %xmm5,-0x18(%ebp)
   DB  102,15,239,255                      ; pxor          %xmm7,%xmm7
   DB  102,15,117,199                      ; pcmpeqw       %xmm7,%xmm0
   DB  102,15,219,200                      ; pand          %xmm0,%xmm1
-  DB  102,15,111,176,255,50,0,0           ; movdqa        0x32ff(%eax),%xmm6
+  DB  102,15,111,176,251,50,0,0           ; movdqa        0x32fb(%eax),%xmm6
   DB  102,15,223,198                      ; pandn         %xmm6,%xmm0
   DB  102,15,235,193                      ; por           %xmm1,%xmm0
   DB  102,15,253,101,40                   ; paddw         0x28(%ebp),%xmm4
@@ -55438,14 +55595,14 @@
   DB  131,236,80                          ; sub           $0x50,%esp
   DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          a0e9 <_sk_screen_sse2_lowp+0x15>
+  DB  232,0,0,0,0                         ; call          a17d <_sk_screen_sse2_lowp+0x15>
   DB  88                                  ; pop           %eax
   DB  102,15,111,109,40                   ; movdqa        0x28(%ebp),%xmm5
   DB  102,15,111,117,24                   ; movdqa        0x18(%ebp),%xmm6
   DB  102,15,111,198                      ; movdqa        %xmm6,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,206                      ; pmullw        %xmm6,%xmm1
-  DB  102,15,111,176,7,50,0,0             ; movdqa        0x3207(%eax),%xmm6
+  DB  102,15,111,176,3,50,0,0             ; movdqa        0x3203(%eax),%xmm6
   DB  102,15,253,206                      ; paddw         %xmm6,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
@@ -55501,9 +55658,9 @@
   DB  86                                  ; push          %esi
   DB  131,236,96                          ; sub           $0x60,%esp
   DB  102,15,127,93,232                   ; movdqa        %xmm3,-0x18(%ebp)
-  DB  232,0,0,0,0                         ; call          a1c9 <_sk_xor__sse2_lowp+0x12>
+  DB  232,0,0,0,0                         ; call          a25d <_sk_xor__sse2_lowp+0x12>
   DB  88                                  ; pop           %eax
-  DB  102,15,111,176,39,49,0,0            ; movdqa        0x3127(%eax),%xmm6
+  DB  102,15,111,176,35,49,0,0            ; movdqa        0x3123(%eax),%xmm6
   DB  102,15,111,254                      ; movdqa        %xmm6,%xmm7
   DB  102,15,249,125,72                   ; psubw         0x48(%ebp),%xmm7
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
@@ -55568,7 +55725,7 @@
   DB  15,41,85,200                        ; movaps        %xmm2,-0x38(%ebp)
   DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          a2be <_sk_darken_sse2_lowp+0x25>
+  DB  232,0,0,0,0                         ; call          a352 <_sk_darken_sse2_lowp+0x25>
   DB  88                                  ; pop           %eax
   DB  102,15,111,117,72                   ; movdqa        0x48(%ebp),%xmm6
   DB  102,15,111,109,24                   ; movdqa        0x18(%ebp),%xmm5
@@ -55579,7 +55736,7 @@
   DB  102,15,111,222                      ; movdqa        %xmm6,%xmm3
   DB  102,15,111,197                      ; movdqa        %xmm5,%xmm0
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,15,111,184,82,48,0,0            ; movdqa        0x3052(%eax),%xmm7
+  DB  102,15,111,184,78,48,0,0            ; movdqa        0x304e(%eax),%xmm7
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
   DB  102,15,239,247                      ; pxor          %xmm7,%xmm6
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
@@ -55588,7 +55745,7 @@
   DB  102,15,219,197                      ; pand          %xmm5,%xmm0
   DB  102,15,223,233                      ; pandn         %xmm1,%xmm5
   DB  102,15,235,232                      ; por           %xmm0,%xmm5
-  DB  102,15,111,128,50,48,0,0            ; movdqa        0x3032(%eax),%xmm0
+  DB  102,15,111,128,46,48,0,0            ; movdqa        0x302e(%eax),%xmm0
   DB  102,15,127,69,232                   ; movdqa        %xmm0,-0x18(%ebp)
   DB  102,15,253,232                      ; paddw         %xmm0,%xmm5
   DB  102,15,113,213,8                    ; psrlw         $0x8,%xmm5
@@ -55677,7 +55834,7 @@
   DB  15,41,85,200                        ; movaps        %xmm2,-0x38(%ebp)
   DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          a467 <_sk_lighten_sse2_lowp+0x25>
+  DB  232,0,0,0,0                         ; call          a4fb <_sk_lighten_sse2_lowp+0x25>
   DB  88                                  ; pop           %eax
   DB  102,15,111,109,24                   ; movdqa        0x18(%ebp),%xmm5
   DB  102,15,111,197                      ; movdqa        %xmm5,%xmm0
@@ -55686,7 +55843,7 @@
   DB  102,15,213,77,72                    ; pmullw        0x48(%ebp),%xmm1
   DB  102,15,111,197                      ; movdqa        %xmm5,%xmm0
   DB  102,15,213,198                      ; pmullw        %xmm6,%xmm0
-  DB  102,15,111,184,169,46,0,0           ; movdqa        0x2ea9(%eax),%xmm7
+  DB  102,15,111,184,165,46,0,0           ; movdqa        0x2ea5(%eax),%xmm7
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
   DB  102,15,239,247                      ; pxor          %xmm7,%xmm6
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
@@ -55695,7 +55852,7 @@
   DB  102,15,219,205                      ; pand          %xmm5,%xmm1
   DB  102,15,223,232                      ; pandn         %xmm0,%xmm5
   DB  102,15,235,233                      ; por           %xmm1,%xmm5
-  DB  102,15,111,128,137,46,0,0           ; movdqa        0x2e89(%eax),%xmm0
+  DB  102,15,111,128,133,46,0,0           ; movdqa        0x2e85(%eax),%xmm0
   DB  102,15,253,232                      ; paddw         %xmm0,%xmm5
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  102,15,127,85,232                   ; movdqa        %xmm2,-0x18(%ebp)
@@ -55783,7 +55940,7 @@
   DB  15,41,85,184                        ; movaps        %xmm2,-0x48(%ebp)
   DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          a605 <_sk_difference_sse2_lowp+0x25>
+  DB  232,0,0,0,0                         ; call          a699 <_sk_difference_sse2_lowp+0x25>
   DB  88                                  ; pop           %eax
   DB  102,15,111,117,72                   ; movdqa        0x48(%ebp),%xmm6
   DB  102,15,111,109,24                   ; movdqa        0x18(%ebp),%xmm5
@@ -55794,7 +55951,7 @@
   DB  102,15,111,222                      ; movdqa        %xmm6,%xmm3
   DB  102,15,111,197                      ; movdqa        %xmm5,%xmm0
   DB  102,15,213,199                      ; pmullw        %xmm7,%xmm0
-  DB  102,15,111,184,11,45,0,0            ; movdqa        0x2d0b(%eax),%xmm7
+  DB  102,15,111,184,7,45,0,0             ; movdqa        0x2d07(%eax),%xmm7
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
   DB  102,15,239,247                      ; pxor          %xmm7,%xmm6
   DB  102,15,111,232                      ; movdqa        %xmm0,%xmm5
@@ -55803,11 +55960,11 @@
   DB  102,15,219,205                      ; pand          %xmm5,%xmm1
   DB  102,15,223,232                      ; pandn         %xmm0,%xmm5
   DB  102,15,235,233                      ; por           %xmm1,%xmm5
-  DB  102,15,111,128,235,44,0,0           ; movdqa        0x2ceb(%eax),%xmm0
+  DB  102,15,111,128,231,44,0,0           ; movdqa        0x2ce7(%eax),%xmm0
   DB  102,15,127,69,216                   ; movdqa        %xmm0,-0x28(%ebp)
   DB  102,15,253,232                      ; paddw         %xmm0,%xmm5
   DB  102,15,113,213,7                    ; psrlw         $0x7,%xmm5
-  DB  102,15,111,128,27,45,0,0            ; movdqa        0x2d1b(%eax),%xmm0
+  DB  102,15,111,128,23,45,0,0            ; movdqa        0x2d17(%eax),%xmm0
   DB  102,15,127,69,232                   ; movdqa        %xmm0,-0x18(%ebp)
   DB  102,15,219,232                      ; pand          %xmm0,%xmm5
   DB  102,15,249,213                      ; psubw         %xmm5,%xmm2
@@ -55894,16 +56051,16 @@
   DB  131,236,80                          ; sub           $0x50,%esp
   DB  102,15,111,225                      ; movdqa        %xmm1,%xmm4
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          a7b9 <_sk_exclusion_sse2_lowp+0x15>
+  DB  232,0,0,0,0                         ; call          a84d <_sk_exclusion_sse2_lowp+0x15>
   DB  88                                  ; pop           %eax
   DB  102,15,111,109,24                   ; movdqa        0x18(%ebp),%xmm5
   DB  102,15,111,197                      ; movdqa        %xmm5,%xmm0
   DB  102,15,253,193                      ; paddw         %xmm1,%xmm0
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
-  DB  102,15,111,184,55,43,0,0            ; movdqa        0x2b37(%eax),%xmm7
+  DB  102,15,111,184,51,43,0,0            ; movdqa        0x2b33(%eax),%xmm7
   DB  102,15,253,207                      ; paddw         %xmm7,%xmm1
   DB  102,15,113,209,7                    ; psrlw         $0x7,%xmm1
-  DB  102,15,111,176,103,43,0,0           ; movdqa        0x2b67(%eax),%xmm6
+  DB  102,15,111,176,99,43,0,0            ; movdqa        0x2b63(%eax),%xmm6
   DB  102,15,219,206                      ; pand          %xmm6,%xmm1
   DB  102,15,249,193                      ; psubw         %xmm1,%xmm0
   DB  102,15,111,109,40                   ; movdqa        0x28(%ebp),%xmm5
@@ -55962,9 +56119,9 @@
   DB  15,41,85,152                        ; movaps        %xmm2,-0x68(%ebp)
   DB  102,15,111,233                      ; movdqa        %xmm1,%xmm5
   DB  102,15,111,224                      ; movdqa        %xmm0,%xmm4
-  DB  232,0,0,0,0                         ; call          a8b3 <_sk_hardlight_sse2_lowp+0x1c>
+  DB  232,0,0,0,0                         ; call          a947 <_sk_hardlight_sse2_lowp+0x1c>
   DB  88                                  ; pop           %eax
-  DB  102,15,111,184,61,42,0,0            ; movdqa        0x2a3d(%eax),%xmm7
+  DB  102,15,111,184,57,42,0,0            ; movdqa        0x2a39(%eax),%xmm7
   DB  102,15,127,125,200                  ; movdqa        %xmm7,-0x38(%ebp)
   DB  102,15,111,215                      ; movdqa        %xmm7,%xmm2
   DB  102,15,249,85,72                    ; psubw         0x48(%ebp),%xmm2
@@ -55991,7 +56148,7 @@
   DB  102,15,111,214                      ; movdqa        %xmm6,%xmm2
   DB  102,15,249,209                      ; psubw         %xmm1,%xmm2
   DB  102,15,253,228                      ; paddw         %xmm4,%xmm4
-  DB  102,15,111,128,93,42,0,0            ; movdqa        0x2a5d(%eax),%xmm0
+  DB  102,15,111,128,89,42,0,0            ; movdqa        0x2a59(%eax),%xmm0
   DB  102,15,239,216                      ; pxor          %xmm0,%xmm3
   DB  102,15,127,93,184                   ; movdqa        %xmm3,-0x48(%ebp)
   DB  102,15,111,204                      ; movdqa        %xmm4,%xmm1
@@ -56096,10 +56253,10 @@
   DB  15,41,85,152                        ; movaps        %xmm2,-0x68(%ebp)
   DB  15,41,141,120,255,255,255           ; movaps        %xmm1,-0x88(%ebp)
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          aad5 <_sk_overlay_sse2_lowp+0x1f>
+  DB  232,0,0,0,0                         ; call          ab69 <_sk_overlay_sse2_lowp+0x1f>
   DB  88                                  ; pop           %eax
   DB  102,15,111,69,72                    ; movdqa        0x48(%ebp),%xmm0
-  DB  102,15,111,184,27,40,0,0            ; movdqa        0x281b(%eax),%xmm7
+  DB  102,15,111,184,23,40,0,0            ; movdqa        0x2817(%eax),%xmm7
   DB  102,15,127,125,232                  ; movdqa        %xmm7,-0x18(%ebp)
   DB  102,15,111,215                      ; movdqa        %xmm7,%xmm2
   DB  102,15,249,208                      ; psubw         %xmm0,%xmm2
@@ -56126,7 +56283,7 @@
   DB  102,15,249,234                      ; psubw         %xmm2,%xmm5
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,253,192                      ; paddw         %xmm0,%xmm0
-  DB  102,15,111,144,59,40,0,0            ; movdqa        0x283b(%eax),%xmm2
+  DB  102,15,111,144,55,40,0,0            ; movdqa        0x2837(%eax),%xmm2
   DB  102,15,127,85,184                   ; movdqa        %xmm2,-0x48(%ebp)
   DB  102,15,239,226                      ; pxor          %xmm2,%xmm4
   DB  102,15,239,194                      ; pxor          %xmm2,%xmm0
@@ -56254,10 +56411,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          ad44 <_sk_load_8888_sse2_lowp+0x30>
+  DB  232,0,0,0,0                         ; call          add8 <_sk_load_8888_sse2_lowp+0x30>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,32                              ; ja            ad6a <_sk_load_8888_sse2_lowp+0x56>
+  DB  119,32                              ; ja            adfe <_sk_load_8888_sse2_lowp+0x56>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,52,1,0,0                ; mov           0x134(%edi,%ecx,4),%ecx
@@ -56266,14 +56423,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  243,15,16,28,179                    ; movss         (%ebx,%esi,4),%xmm3
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
-  DB  235,73                              ; jmp           adb3 <_sk_load_8888_sse2_lowp+0x9f>
+  DB  235,73                              ; jmp           ae47 <_sk_load_8888_sse2_lowp+0x9f>
   DB  102,15,16,28,179                    ; movupd        (%ebx,%esi,4),%xmm3
   DB  15,16,116,179,16                    ; movups        0x10(%ebx,%esi,4),%xmm6
-  DB  235,61                              ; jmp           adb3 <_sk_load_8888_sse2_lowp+0x9f>
+  DB  235,61                              ; jmp           ae47 <_sk_load_8888_sse2_lowp+0x9f>
   DB  102,15,110,68,179,8                 ; movd          0x8(%ebx,%esi,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,15,18,28,179                    ; movlpd        (%ebx,%esi,4),%xmm3
-  DB  235,43                              ; jmp           adb3 <_sk_load_8888_sse2_lowp+0x9f>
+  DB  235,43                              ; jmp           ae47 <_sk_load_8888_sse2_lowp+0x9f>
   DB  102,15,110,68,179,24                ; movd          0x18(%ebx,%esi,4),%xmm0
   DB  102,15,112,240,69                   ; pshufd        $0x45,%xmm0,%xmm6
   DB  243,15,16,68,179,20                 ; movss         0x14(%ebx,%esi,4),%xmm0
@@ -56290,7 +56447,7 @@
   DB  102,15,114,240,16                   ; pslld         $0x10,%xmm0
   DB  102,15,114,224,16                   ; psrad         $0x10,%xmm0
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,15,111,175,172,37,0,0           ; movdqa        0x25ac(%edi),%xmm5
+  DB  102,15,111,175,168,37,0,0           ; movdqa        0x25a8(%edi),%xmm5
   DB  102,15,111,193                      ; movdqa        %xmm1,%xmm0
   DB  102,15,219,197                      ; pand          %xmm5,%xmm0
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -56368,10 +56525,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          aed1 <_sk_load_8888_dst_sse2_lowp+0x3d>
+  DB  232,0,0,0,0                         ; call          af65 <_sk_load_8888_dst_sse2_lowp+0x3d>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,32                              ; ja            aef7 <_sk_load_8888_dst_sse2_lowp+0x63>
+  DB  119,32                              ; ja            af8b <_sk_load_8888_dst_sse2_lowp+0x63>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,59,1,0,0                ; mov           0x13b(%edi,%ecx,4),%ecx
@@ -56380,14 +56537,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  243,15,16,60,179                    ; movss         (%ebx,%esi,4),%xmm7
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,73                              ; jmp           af40 <_sk_load_8888_dst_sse2_lowp+0xac>
+  DB  235,73                              ; jmp           afd4 <_sk_load_8888_dst_sse2_lowp+0xac>
   DB  102,15,16,60,179                    ; movupd        (%ebx,%esi,4),%xmm7
   DB  15,16,92,179,16                     ; movups        0x10(%ebx,%esi,4),%xmm3
-  DB  235,61                              ; jmp           af40 <_sk_load_8888_dst_sse2_lowp+0xac>
+  DB  235,61                              ; jmp           afd4 <_sk_load_8888_dst_sse2_lowp+0xac>
   DB  102,15,110,84,179,8                 ; movd          0x8(%ebx,%esi,4),%xmm2
   DB  102,15,112,250,69                   ; pshufd        $0x45,%xmm2,%xmm7
   DB  102,15,18,60,179                    ; movlpd        (%ebx,%esi,4),%xmm7
-  DB  235,43                              ; jmp           af40 <_sk_load_8888_dst_sse2_lowp+0xac>
+  DB  235,43                              ; jmp           afd4 <_sk_load_8888_dst_sse2_lowp+0xac>
   DB  102,15,110,84,179,24                ; movd          0x18(%ebx,%esi,4),%xmm2
   DB  102,15,112,218,69                   ; pshufd        $0x45,%xmm2,%xmm3
   DB  243,15,16,84,179,20                 ; movss         0x14(%ebx,%esi,4),%xmm2
@@ -56404,7 +56561,7 @@
   DB  102,15,114,242,16                   ; pslld         $0x10,%xmm2
   DB  102,15,114,226,16                   ; psrad         $0x10,%xmm2
   DB  102,15,107,242                      ; packssdw      %xmm2,%xmm6
-  DB  102,15,111,151,31,36,0,0            ; movdqa        0x241f(%edi),%xmm2
+  DB  102,15,111,151,27,36,0,0            ; movdqa        0x241b(%edi),%xmm2
   DB  102,15,111,206                      ; movdqa        %xmm6,%xmm1
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  102,15,113,214,8                    ; psrlw         $0x8,%xmm6
@@ -56496,19 +56653,19 @@
   DB  128,227,7                           ; and           $0x7,%bl
   DB  254,203                             ; dec           %bl
   DB  128,251,6                           ; cmp           $0x6,%bl
-  DB  232,0,0,0,0                         ; call          b09c <_sk_store_8888_sse2_lowp+0x74>
+  DB  232,0,0,0,0                         ; call          b130 <_sk_store_8888_sse2_lowp+0x74>
   DB  89                                  ; pop           %ecx
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
   DB  15,40,109,40                        ; movaps        0x28(%ebp),%xmm5
-  DB  119,19                              ; ja            b0b9 <_sk_store_8888_sse2_lowp+0x91>
+  DB  119,19                              ; ja            b14d <_sk_store_8888_sse2_lowp+0x91>
   DB  15,182,219                          ; movzbl        %bl,%ebx
   DB  3,140,153,184,0,0,0                 ; add           0xb8(%ecx,%ebx,4),%ecx
   DB  255,225                             ; jmp           *%ecx
   DB  102,15,126,60,183                   ; movd          %xmm7,(%edi,%esi,4)
-  DB  235,93                              ; jmp           b116 <_sk_store_8888_sse2_lowp+0xee>
+  DB  235,93                              ; jmp           b1aa <_sk_store_8888_sse2_lowp+0xee>
   DB  243,15,127,60,183                   ; movdqu        %xmm7,(%edi,%esi,4)
   DB  243,15,127,116,183,16               ; movdqu        %xmm6,0x10(%edi,%esi,4)
-  DB  235,80                              ; jmp           b116 <_sk_store_8888_sse2_lowp+0xee>
+  DB  235,80                              ; jmp           b1aa <_sk_store_8888_sse2_lowp+0xee>
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
   DB  102,15,112,223,78                   ; pshufd        $0x4e,%xmm7,%xmm3
@@ -56516,7 +56673,7 @@
   DB  15,40,220                           ; movaps        %xmm4,%xmm3
   DB  102,15,111,230                      ; movdqa        %xmm6,%xmm4
   DB  102,15,214,60,183                   ; movq          %xmm7,(%edi,%esi,4)
-  DB  235,48                              ; jmp           b116 <_sk_store_8888_sse2_lowp+0xee>
+  DB  235,48                              ; jmp           b1aa <_sk_store_8888_sse2_lowp+0xee>
   DB  102,15,112,222,78                   ; pshufd        $0x4e,%xmm6,%xmm3
   DB  102,15,126,92,183,24                ; movd          %xmm3,0x18(%edi,%esi,4)
   DB  15,40,93,72                         ; movaps        0x48(%ebp),%xmm3
@@ -56553,7 +56710,7 @@
   DB  0,0                                 ; add           %al,(%eax)
   DB  42,0                                ; sub           (%eax),%al
   DB  0,0                                 ; add           %al,(%eax)
-  DB  117,0                               ; jne           b162 <_sk_store_8888_sse2_lowp+0x13a>
+  DB  117,0                               ; jne           b1f6 <_sk_store_8888_sse2_lowp+0x13a>
   DB  0,0                                 ; add           %al,(%eax)
   DB  111                                 ; outsl         %ds:(%esi),(%dx)
   DB  0,0                                 ; add           %al,(%eax)
@@ -56583,10 +56740,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          b1a0 <_sk_load_bgra_sse2_lowp+0x30>
+  DB  232,0,0,0,0                         ; call          b234 <_sk_load_bgra_sse2_lowp+0x30>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,32                              ; ja            b1c6 <_sk_load_bgra_sse2_lowp+0x56>
+  DB  119,32                              ; ja            b25a <_sk_load_bgra_sse2_lowp+0x56>
   DB  102,15,239,246                      ; pxor          %xmm6,%xmm6
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,52,1,0,0                ; mov           0x134(%edi,%ecx,4),%ecx
@@ -56595,14 +56752,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  243,15,16,28,179                    ; movss         (%ebx,%esi,4),%xmm3
   DB  15,87,246                           ; xorps         %xmm6,%xmm6
-  DB  235,73                              ; jmp           b20f <_sk_load_bgra_sse2_lowp+0x9f>
+  DB  235,73                              ; jmp           b2a3 <_sk_load_bgra_sse2_lowp+0x9f>
   DB  102,15,16,28,179                    ; movupd        (%ebx,%esi,4),%xmm3
   DB  15,16,116,179,16                    ; movups        0x10(%ebx,%esi,4),%xmm6
-  DB  235,61                              ; jmp           b20f <_sk_load_bgra_sse2_lowp+0x9f>
+  DB  235,61                              ; jmp           b2a3 <_sk_load_bgra_sse2_lowp+0x9f>
   DB  102,15,110,68,179,8                 ; movd          0x8(%ebx,%esi,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  102,15,18,28,179                    ; movlpd        (%ebx,%esi,4),%xmm3
-  DB  235,43                              ; jmp           b20f <_sk_load_bgra_sse2_lowp+0x9f>
+  DB  235,43                              ; jmp           b2a3 <_sk_load_bgra_sse2_lowp+0x9f>
   DB  102,15,110,68,179,24                ; movd          0x18(%ebx,%esi,4),%xmm0
   DB  102,15,112,240,69                   ; pshufd        $0x45,%xmm0,%xmm6
   DB  243,15,16,68,179,20                 ; movss         0x14(%ebx,%esi,4),%xmm0
@@ -56619,7 +56776,7 @@
   DB  102,15,114,240,16                   ; pslld         $0x10,%xmm0
   DB  102,15,114,224,16                   ; psrad         $0x10,%xmm0
   DB  102,15,107,200                      ; packssdw      %xmm0,%xmm1
-  DB  102,15,111,175,80,33,0,0            ; movdqa        0x2150(%edi),%xmm5
+  DB  102,15,111,175,76,33,0,0            ; movdqa        0x214c(%edi),%xmm5
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,15,219,213                      ; pand          %xmm5,%xmm2
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
@@ -56697,10 +56854,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          b32d <_sk_load_bgra_dst_sse2_lowp+0x3d>
+  DB  232,0,0,0,0                         ; call          b3c1 <_sk_load_bgra_dst_sse2_lowp+0x3d>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,32                              ; ja            b353 <_sk_load_bgra_dst_sse2_lowp+0x63>
+  DB  119,32                              ; ja            b3e7 <_sk_load_bgra_dst_sse2_lowp+0x63>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,59,1,0,0                ; mov           0x13b(%edi,%ecx,4),%ecx
@@ -56709,14 +56866,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  243,15,16,60,179                    ; movss         (%ebx,%esi,4),%xmm7
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,73                              ; jmp           b39c <_sk_load_bgra_dst_sse2_lowp+0xac>
+  DB  235,73                              ; jmp           b430 <_sk_load_bgra_dst_sse2_lowp+0xac>
   DB  102,15,16,60,179                    ; movupd        (%ebx,%esi,4),%xmm7
   DB  15,16,92,179,16                     ; movups        0x10(%ebx,%esi,4),%xmm3
-  DB  235,61                              ; jmp           b39c <_sk_load_bgra_dst_sse2_lowp+0xac>
+  DB  235,61                              ; jmp           b430 <_sk_load_bgra_dst_sse2_lowp+0xac>
   DB  102,15,110,84,179,8                 ; movd          0x8(%ebx,%esi,4),%xmm2
   DB  102,15,112,250,69                   ; pshufd        $0x45,%xmm2,%xmm7
   DB  102,15,18,60,179                    ; movlpd        (%ebx,%esi,4),%xmm7
-  DB  235,43                              ; jmp           b39c <_sk_load_bgra_dst_sse2_lowp+0xac>
+  DB  235,43                              ; jmp           b430 <_sk_load_bgra_dst_sse2_lowp+0xac>
   DB  102,15,110,84,179,24                ; movd          0x18(%ebx,%esi,4),%xmm2
   DB  102,15,112,218,69                   ; pshufd        $0x45,%xmm2,%xmm3
   DB  243,15,16,84,179,20                 ; movss         0x14(%ebx,%esi,4),%xmm2
@@ -56733,7 +56890,7 @@
   DB  102,15,114,242,16                   ; pslld         $0x10,%xmm2
   DB  102,15,114,226,16                   ; psrad         $0x10,%xmm2
   DB  102,15,107,242                      ; packssdw      %xmm2,%xmm6
-  DB  102,15,111,151,195,31,0,0           ; movdqa        0x1fc3(%edi),%xmm2
+  DB  102,15,111,151,191,31,0,0           ; movdqa        0x1fbf(%edi),%xmm2
   DB  102,15,111,206                      ; movdqa        %xmm6,%xmm1
   DB  102,15,219,202                      ; pand          %xmm2,%xmm1
   DB  102,15,113,214,8                    ; psrlw         $0x8,%xmm6
@@ -56825,19 +56982,19 @@
   DB  128,227,7                           ; and           $0x7,%bl
   DB  254,203                             ; dec           %bl
   DB  128,251,6                           ; cmp           $0x6,%bl
-  DB  232,0,0,0,0                         ; call          b4f8 <_sk_store_bgra_sse2_lowp+0x74>
+  DB  232,0,0,0,0                         ; call          b58c <_sk_store_bgra_sse2_lowp+0x74>
   DB  89                                  ; pop           %ecx
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
   DB  15,40,109,40                        ; movaps        0x28(%ebp),%xmm5
-  DB  119,19                              ; ja            b515 <_sk_store_bgra_sse2_lowp+0x91>
+  DB  119,19                              ; ja            b5a9 <_sk_store_bgra_sse2_lowp+0x91>
   DB  15,182,219                          ; movzbl        %bl,%ebx
   DB  3,140,153,184,0,0,0                 ; add           0xb8(%ecx,%ebx,4),%ecx
   DB  255,225                             ; jmp           *%ecx
   DB  102,15,126,60,183                   ; movd          %xmm7,(%edi,%esi,4)
-  DB  235,93                              ; jmp           b572 <_sk_store_bgra_sse2_lowp+0xee>
+  DB  235,93                              ; jmp           b606 <_sk_store_bgra_sse2_lowp+0xee>
   DB  243,15,127,60,183                   ; movdqu        %xmm7,(%edi,%esi,4)
   DB  243,15,127,116,183,16               ; movdqu        %xmm6,0x10(%edi,%esi,4)
-  DB  235,80                              ; jmp           b572 <_sk_store_bgra_sse2_lowp+0xee>
+  DB  235,80                              ; jmp           b606 <_sk_store_bgra_sse2_lowp+0xee>
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  15,40,227                           ; movaps        %xmm3,%xmm4
   DB  102,15,112,223,78                   ; pshufd        $0x4e,%xmm7,%xmm3
@@ -56845,7 +57002,7 @@
   DB  15,40,220                           ; movaps        %xmm4,%xmm3
   DB  102,15,111,230                      ; movdqa        %xmm6,%xmm4
   DB  102,15,214,60,183                   ; movq          %xmm7,(%edi,%esi,4)
-  DB  235,48                              ; jmp           b572 <_sk_store_bgra_sse2_lowp+0xee>
+  DB  235,48                              ; jmp           b606 <_sk_store_bgra_sse2_lowp+0xee>
   DB  102,15,112,222,78                   ; pshufd        $0x4e,%xmm6,%xmm3
   DB  102,15,126,92,183,24                ; movd          %xmm3,0x18(%edi,%esi,4)
   DB  15,40,93,72                         ; movaps        0x48(%ebp),%xmm3
@@ -56882,7 +57039,7 @@
   DB  0,0                                 ; add           %al,(%eax)
   DB  42,0                                ; sub           (%eax),%al
   DB  0,0                                 ; add           %al,(%eax)
-  DB  117,0                               ; jne           b5be <_sk_store_bgra_sse2_lowp+0x13a>
+  DB  117,0                               ; jne           b652 <_sk_store_bgra_sse2_lowp+0x13a>
   DB  0,0                                 ; add           %al,(%eax)
   DB  111                                 ; outsl         %ds:(%esi),(%dx)
   DB  0,0                                 ; add           %al,(%eax)
@@ -56915,10 +57072,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          b607 <_sk_load_565_sse2_lowp+0x3b>
+  DB  232,0,0,0,0                         ; call          b69b <_sk_load_565_sse2_lowp+0x3b>
   DB  94                                  ; pop           %esi
   DB  139,125,16                          ; mov           0x10(%ebp),%edi
-  DB  119,28                              ; ja            b629 <_sk_load_565_sse2_lowp+0x5d>
+  DB  119,28                              ; ja            b6bd <_sk_load_565_sse2_lowp+0x5d>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,142,245,0,0,0               ; mov           0xf5(%esi,%ecx,4),%ecx
@@ -56926,14 +57083,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,183,12,123                       ; movzwl        (%ebx,%edi,2),%ecx
   DB  102,15,110,193                      ; movd          %ecx,%xmm0
-  DB  235,59                              ; jmp           b664 <_sk_load_565_sse2_lowp+0x98>
+  DB  235,59                              ; jmp           b6f8 <_sk_load_565_sse2_lowp+0x98>
   DB  243,15,111,4,123                    ; movdqu        (%ebx,%edi,2),%xmm0
-  DB  235,52                              ; jmp           b664 <_sk_load_565_sse2_lowp+0x98>
+  DB  235,52                              ; jmp           b6f8 <_sk_load_565_sse2_lowp+0x98>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,68,123,4,2               ; pinsrw        $0x2,0x4(%ebx,%edi,2),%xmm0
   DB  243,15,16,12,123                    ; movss         (%ebx,%edi,2),%xmm1
   DB  243,15,16,193                       ; movss         %xmm1,%xmm0
-  DB  235,30                              ; jmp           b664 <_sk_load_565_sse2_lowp+0x98>
+  DB  235,30                              ; jmp           b6f8 <_sk_load_565_sse2_lowp+0x98>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,68,123,12,6              ; pinsrw        $0x6,0xc(%ebx,%edi,2),%xmm0
   DB  102,15,196,68,123,10,5              ; pinsrw        $0x5,0xa(%ebx,%edi,2),%xmm0
@@ -56941,11 +57098,11 @@
   DB  102,15,18,4,123                     ; movlpd        (%ebx,%edi,2),%xmm0
   DB  102,15,111,248                      ; movdqa        %xmm0,%xmm7
   DB  102,15,113,215,8                    ; psrlw         $0x8,%xmm7
-  DB  102,15,219,190,41,29,0,0            ; pand          0x1d29(%esi),%xmm7
+  DB  102,15,219,190,37,29,0,0            ; pand          0x1d25(%esi),%xmm7
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,113,209,5                    ; psrlw         $0x5,%xmm1
-  DB  102,15,219,142,57,29,0,0            ; pand          0x1d39(%esi),%xmm1
-  DB  102,15,111,150,73,29,0,0            ; movdqa        0x1d49(%esi),%xmm2
+  DB  102,15,219,142,53,29,0,0            ; pand          0x1d35(%esi),%xmm1
+  DB  102,15,111,150,69,29,0,0            ; movdqa        0x1d45(%esi),%xmm2
   DB  102,15,219,208                      ; pand          %xmm0,%xmm2
   DB  102,15,113,208,13                   ; psrlw         $0xd,%xmm0
   DB  102,15,235,199                      ; por           %xmm7,%xmm0
@@ -56967,7 +57124,7 @@
   DB  137,124,36,8                        ; mov           %edi,0x8(%esp)
   DB  137,76,36,4                         ; mov           %ecx,0x4(%esp)
   DB  137,20,36                           ; mov           %edx,(%esp)
-  DB  15,40,158,233,28,0,0                ; movaps        0x1ce9(%esi),%xmm3
+  DB  15,40,158,229,28,0,0                ; movaps        0x1ce5(%esi),%xmm3
   DB  255,80,4                            ; call          *0x4(%eax)
   DB  131,196,92                          ; add           $0x5c,%esp
   DB  94                                  ; pop           %esi
@@ -57011,10 +57168,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          b743 <_sk_load_565_dst_sse2_lowp+0x2b>
+  DB  232,0,0,0,0                         ; call          b7d7 <_sk_load_565_dst_sse2_lowp+0x2b>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            b765 <_sk_load_565_dst_sse2_lowp+0x4d>
+  DB  119,28                              ; ja            b7f9 <_sk_load_565_dst_sse2_lowp+0x4d>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,249,0,0,0               ; mov           0xf9(%edi,%ecx,4),%ecx
@@ -57022,14 +57179,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,183,12,115                       ; movzwl        (%ebx,%esi,2),%ecx
   DB  102,15,110,225                      ; movd          %ecx,%xmm4
-  DB  235,59                              ; jmp           b7a0 <_sk_load_565_dst_sse2_lowp+0x88>
+  DB  235,59                              ; jmp           b834 <_sk_load_565_dst_sse2_lowp+0x88>
   DB  243,15,111,36,115                   ; movdqu        (%ebx,%esi,2),%xmm4
-  DB  235,52                              ; jmp           b7a0 <_sk_load_565_dst_sse2_lowp+0x88>
+  DB  235,52                              ; jmp           b834 <_sk_load_565_dst_sse2_lowp+0x88>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,100,115,4,2              ; pinsrw        $0x2,0x4(%ebx,%esi,2),%xmm4
   DB  243,15,16,44,115                    ; movss         (%ebx,%esi,2),%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,30                              ; jmp           b7a0 <_sk_load_565_dst_sse2_lowp+0x88>
+  DB  235,30                              ; jmp           b834 <_sk_load_565_dst_sse2_lowp+0x88>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,100,115,12,6             ; pinsrw        $0x6,0xc(%ebx,%esi,2),%xmm4
   DB  102,15,196,100,115,10,5             ; pinsrw        $0x5,0xa(%ebx,%esi,2),%xmm4
@@ -57037,11 +57194,11 @@
   DB  102,15,18,36,115                    ; movlpd        (%ebx,%esi,2),%xmm4
   DB  102,15,111,244                      ; movdqa        %xmm4,%xmm6
   DB  102,15,113,214,8                    ; psrlw         $0x8,%xmm6
-  DB  102,15,219,183,237,27,0,0           ; pand          0x1bed(%edi),%xmm6
+  DB  102,15,219,183,233,27,0,0           ; pand          0x1be9(%edi),%xmm6
   DB  102,15,111,236                      ; movdqa        %xmm4,%xmm5
   DB  102,15,113,213,5                    ; psrlw         $0x5,%xmm5
-  DB  102,15,219,175,253,27,0,0           ; pand          0x1bfd(%edi),%xmm5
-  DB  102,15,111,191,13,28,0,0            ; movdqa        0x1c0d(%edi),%xmm7
+  DB  102,15,219,175,249,27,0,0           ; pand          0x1bf9(%edi),%xmm5
+  DB  102,15,111,191,9,28,0,0             ; movdqa        0x1c09(%edi),%xmm7
   DB  102,15,219,252                      ; pand          %xmm4,%xmm7
   DB  102,15,113,212,13                   ; psrlw         $0xd,%xmm4
   DB  102,15,235,230                      ; por           %xmm6,%xmm4
@@ -57054,7 +57211,7 @@
   DB  102,15,113,215,2                    ; psrlw         $0x2,%xmm7
   DB  102,15,235,254                      ; por           %xmm6,%xmm7
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
-  DB  15,40,183,173,27,0,0                ; movaps        0x1bad(%edi),%xmm6
+  DB  15,40,183,169,27,0,0                ; movaps        0x1ba9(%edi),%xmm6
   DB  15,41,116,36,64                     ; movaps        %xmm6,0x40(%esp)
   DB  139,125,20                          ; mov           0x14(%ebp),%edi
   DB  137,124,36,12                       ; mov           %edi,0xc(%esp)
@@ -57097,15 +57254,15 @@
   DB  86                                  ; push          %esi
   DB  131,236,92                          ; sub           $0x5c,%esp
   DB  102,15,111,226                      ; movdqa        %xmm2,%xmm4
-  DB  232,0,0,0,0                         ; call          b86a <_sk_store_565_sse2_lowp+0x12>
+  DB  232,0,0,0,0                         ; call          b8fe <_sk_store_565_sse2_lowp+0x12>
   DB  95                                  ; pop           %edi
   DB  15,40,109,72                        ; movaps        0x48(%ebp),%xmm5
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  102,15,113,242,8                    ; psllw         $0x8,%xmm2
-  DB  102,15,219,151,246,26,0,0           ; pand          0x1af6(%edi),%xmm2
+  DB  102,15,219,151,242,26,0,0           ; pand          0x1af2(%edi),%xmm2
   DB  102,15,111,241                      ; movdqa        %xmm1,%xmm6
   DB  102,15,113,246,3                    ; psllw         $0x3,%xmm6
-  DB  102,15,219,183,6,27,0,0             ; pand          0x1b06(%edi),%xmm6
+  DB  102,15,219,183,2,27,0,0             ; pand          0x1b02(%edi),%xmm6
   DB  102,15,235,242                      ; por           %xmm2,%xmm6
   DB  102,15,111,212                      ; movdqa        %xmm4,%xmm2
   DB  102,15,113,210,3                    ; psrlw         $0x3,%xmm2
@@ -57124,19 +57281,19 @@
   DB  128,249,6                           ; cmp           $0x6,%cl
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
   DB  15,40,125,24                        ; movaps        0x18(%ebp),%xmm7
-  DB  119,22                              ; ja            b8e2 <_sk_store_565_sse2_lowp+0x8a>
+  DB  119,22                              ; ja            b976 <_sk_store_565_sse2_lowp+0x8a>
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  3,188,143,242,0,0,0                 ; add           0xf2(%edi,%ecx,4),%edi
   DB  255,231                             ; jmp           *%edi
   DB  102,15,126,209                      ; movd          %xmm2,%ecx
   DB  102,137,12,115                      ; mov           %cx,(%ebx,%esi,2)
-  DB  235,59                              ; jmp           b91d <_sk_store_565_sse2_lowp+0xc5>
+  DB  235,59                              ; jmp           b9b1 <_sk_store_565_sse2_lowp+0xc5>
   DB  243,15,127,20,115                   ; movdqu        %xmm2,(%ebx,%esi,2)
-  DB  235,52                              ; jmp           b91d <_sk_store_565_sse2_lowp+0xc5>
+  DB  235,52                              ; jmp           b9b1 <_sk_store_565_sse2_lowp+0xc5>
   DB  102,15,197,202,2                    ; pextrw        $0x2,%xmm2,%ecx
   DB  102,137,76,115,4                    ; mov           %cx,0x4(%ebx,%esi,2)
   DB  102,15,126,20,115                   ; movd          %xmm2,(%ebx,%esi,2)
-  DB  235,35                              ; jmp           b91d <_sk_store_565_sse2_lowp+0xc5>
+  DB  235,35                              ; jmp           b9b1 <_sk_store_565_sse2_lowp+0xc5>
   DB  102,15,197,202,6                    ; pextrw        $0x6,%xmm2,%ecx
   DB  102,137,76,115,12                   ; mov           %cx,0xc(%ebx,%esi,2)
   DB  102,15,197,202,5                    ; pextrw        $0x5,%xmm2,%ecx
@@ -57196,10 +57353,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          b9b2 <_sk_load_a8_sse2_lowp+0x3a>
+  DB  232,0,0,0,0                         ; call          ba46 <_sk_load_a8_sse2_lowp+0x3a>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            b9d4 <_sk_load_a8_sse2_lowp+0x5c>
+  DB  119,28                              ; ja            ba68 <_sk_load_a8_sse2_lowp+0x5c>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,198,0,0,0               ; mov           0xc6(%edi,%ecx,4),%ecx
@@ -57207,10 +57364,10 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,182,12,51                        ; movzbl        (%ebx,%esi,1),%ecx
   DB  102,15,110,217                      ; movd          %ecx,%xmm3
-  DB  235,90                              ; jmp           ba2e <_sk_load_a8_sse2_lowp+0xb6>
+  DB  235,90                              ; jmp           bac2 <_sk_load_a8_sse2_lowp+0xb6>
   DB  243,15,126,28,51                    ; movq          (%ebx,%esi,1),%xmm3
   DB  102,15,96,216                       ; punpcklbw     %xmm0,%xmm3
-  DB  235,79                              ; jmp           ba2e <_sk_load_a8_sse2_lowp+0xb6>
+  DB  235,79                              ; jmp           bac2 <_sk_load_a8_sse2_lowp+0xb6>
   DB  15,182,76,51,2                      ; movzbl        0x2(%ebx,%esi,1),%ecx
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,217,2                    ; pinsrw        $0x2,%ecx,%xmm3
@@ -57218,7 +57375,7 @@
   DB  102,15,110,233                      ; movd          %ecx,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,221                       ; movss         %xmm5,%xmm3
-  DB  235,47                              ; jmp           ba2e <_sk_load_a8_sse2_lowp+0xb6>
+  DB  235,47                              ; jmp           bac2 <_sk_load_a8_sse2_lowp+0xb6>
   DB  15,182,76,51,6                      ; movzbl        0x6(%ebx,%esi,1),%ecx
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,217,6                    ; pinsrw        $0x6,%ecx,%xmm3
@@ -57229,7 +57386,7 @@
   DB  102,15,110,44,51                    ; movd          (%ebx,%esi,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,221                       ; movsd         %xmm5,%xmm3
-  DB  102,15,219,159,62,25,0,0            ; pand          0x193e(%edi),%xmm3
+  DB  102,15,219,159,58,25,0,0            ; pand          0x193a(%edi),%xmm3
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  15,41,100,36,64                     ; movaps        %xmm4,0x40(%esp)
   DB  15,41,84,36,48                      ; movaps        %xmm2,0x30(%esp)
@@ -57282,10 +57439,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          babd <_sk_load_a8_dst_sse2_lowp+0x29>
+  DB  232,0,0,0,0                         ; call          bb51 <_sk_load_a8_dst_sse2_lowp+0x29>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            badf <_sk_load_a8_dst_sse2_lowp+0x4b>
+  DB  119,28                              ; ja            bb73 <_sk_load_a8_dst_sse2_lowp+0x4b>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,195,0,0,0               ; mov           0xc3(%edi,%ecx,4),%ecx
@@ -57293,10 +57450,10 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,182,12,51                        ; movzbl        (%ebx,%esi,1),%ecx
   DB  102,15,110,225                      ; movd          %ecx,%xmm4
-  DB  235,90                              ; jmp           bb39 <_sk_load_a8_dst_sse2_lowp+0xa5>
+  DB  235,90                              ; jmp           bbcd <_sk_load_a8_dst_sse2_lowp+0xa5>
   DB  243,15,126,36,51                    ; movq          (%ebx,%esi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
-  DB  235,79                              ; jmp           bb39 <_sk_load_a8_dst_sse2_lowp+0xa5>
+  DB  235,79                              ; jmp           bbcd <_sk_load_a8_dst_sse2_lowp+0xa5>
   DB  15,182,76,51,2                      ; movzbl        0x2(%ebx,%esi,1),%ecx
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,225,2                    ; pinsrw        $0x2,%ecx,%xmm4
@@ -57304,7 +57461,7 @@
   DB  102,15,110,233                      ; movd          %ecx,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,47                              ; jmp           bb39 <_sk_load_a8_dst_sse2_lowp+0xa5>
+  DB  235,47                              ; jmp           bbcd <_sk_load_a8_dst_sse2_lowp+0xa5>
   DB  15,182,76,51,6                      ; movzbl        0x6(%ebx,%esi,1),%ecx
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,225,6                    ; pinsrw        $0x6,%ecx,%xmm4
@@ -57315,7 +57472,7 @@
   DB  102,15,110,44,51                    ; movd          (%ebx,%esi,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  102,15,219,167,51,24,0,0            ; pand          0x1833(%edi),%xmm4
+  DB  102,15,219,167,47,24,0,0            ; pand          0x182f(%edi),%xmm4
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  102,15,127,100,36,64                ; movdqa        %xmm4,0x40(%esp)
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
@@ -57370,32 +57527,32 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          bbd5 <_sk_store_a8_sse2_lowp+0x39>
+  DB  232,0,0,0,0                         ; call          bc69 <_sk_store_a8_sse2_lowp+0x39>
   DB  91                                  ; pop           %ebx
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,26                              ; ja            bbf5 <_sk_store_a8_sse2_lowp+0x59>
+  DB  119,26                              ; ja            bc89 <_sk_store_a8_sse2_lowp+0x59>
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,139,223,0,0,0               ; mov           0xdf(%ebx,%ecx,4),%ecx
   DB  1,217                               ; add           %ebx,%ecx
   DB  255,225                             ; jmp           *%ecx
   DB  102,15,126,217                      ; movd          %xmm3,%ecx
   DB  136,12,55                           ; mov           %cl,(%edi,%esi,1)
-  DB  233,136,0,0,0                       ; jmp           bc7d <_sk_store_a8_sse2_lowp+0xe1>
-  DB  102,15,111,163,27,23,0,0            ; movdqa        0x171b(%ebx),%xmm4
+  DB  233,136,0,0,0                       ; jmp           bd11 <_sk_store_a8_sse2_lowp+0xe1>
+  DB  102,15,111,163,23,23,0,0            ; movdqa        0x1717(%ebx),%xmm4
   DB  102,15,219,227                      ; pand          %xmm3,%xmm4
   DB  102,15,103,228                      ; packuswb      %xmm4,%xmm4
   DB  102,15,214,36,55                    ; movq          %xmm4,(%edi,%esi,1)
   DB  15,40,101,24                        ; movaps        0x18(%ebp),%xmm4
-  DB  235,109                             ; jmp           bc7d <_sk_store_a8_sse2_lowp+0xe1>
+  DB  235,109                             ; jmp           bd11 <_sk_store_a8_sse2_lowp+0xe1>
   DB  102,15,197,203,2                    ; pextrw        $0x2,%xmm3,%ecx
   DB  136,76,55,2                         ; mov           %cl,0x2(%edi,%esi,1)
-  DB  102,15,111,163,27,23,0,0            ; movdqa        0x171b(%ebx),%xmm4
+  DB  102,15,111,163,23,23,0,0            ; movdqa        0x1717(%ebx),%xmm4
   DB  102,15,219,227                      ; pand          %xmm3,%xmm4
   DB  102,15,103,228                      ; packuswb      %xmm4,%xmm4
   DB  102,15,126,225                      ; movd          %xmm4,%ecx
   DB  15,40,101,24                        ; movaps        0x18(%ebp),%xmm4
   DB  102,137,12,55                       ; mov           %cx,(%edi,%esi,1)
-  DB  235,70                              ; jmp           bc7d <_sk_store_a8_sse2_lowp+0xe1>
+  DB  235,70                              ; jmp           bd11 <_sk_store_a8_sse2_lowp+0xe1>
   DB  102,15,197,203,6                    ; pextrw        $0x6,%xmm3,%ecx
   DB  136,76,55,6                         ; mov           %cl,0x6(%edi,%esi,1)
   DB  102,15,197,203,5                    ; pextrw        $0x5,%xmm3,%ecx
@@ -57405,7 +57562,7 @@
   DB  15,40,254                           ; movaps        %xmm6,%xmm7
   DB  15,40,245                           ; movaps        %xmm5,%xmm6
   DB  15,40,236                           ; movaps        %xmm4,%xmm5
-  DB  102,15,111,163,27,23,0,0            ; movdqa        0x171b(%ebx),%xmm4
+  DB  102,15,111,163,23,23,0,0            ; movdqa        0x1717(%ebx),%xmm4
   DB  102,15,219,227                      ; pand          %xmm3,%xmm4
   DB  102,15,103,228                      ; packuswb      %xmm4,%xmm4
   DB  102,15,126,36,55                    ; movd          %xmm4,(%edi,%esi,1)
@@ -57439,7 +57596,7 @@
   DB  0,0                                 ; add           %al,(%eax)
   DB  0,125,0                             ; add           %bh,0x0(%ebp)
   DB  0,0                                 ; add           %al,(%eax)
-  DB  116,0                               ; je            bcc6 <_sk_store_a8_sse2_lowp+0x12a>
+  DB  116,0                               ; je            bd5a <_sk_store_a8_sse2_lowp+0x12a>
   DB  0,0                                 ; add           %al,(%eax)
   DB  107,0,0                             ; imul          $0x0,(%eax),%eax
   DB  0,98,0                              ; add           %ah,0x0(%edx)
@@ -57467,10 +57624,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          bd09 <_sk_load_g8_sse2_lowp+0x39>
+  DB  232,0,0,0,0                         ; call          bd9d <_sk_load_g8_sse2_lowp+0x39>
   DB  94                                  ; pop           %esi
   DB  139,125,16                          ; mov           0x10(%ebp),%edi
-  DB  119,28                              ; ja            bd2b <_sk_load_g8_sse2_lowp+0x5b>
+  DB  119,28                              ; ja            bdbf <_sk_load_g8_sse2_lowp+0x5b>
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,142,199,0,0,0               ; mov           0xc7(%esi,%ecx,4),%ecx
@@ -57478,10 +57635,10 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,182,12,59                        ; movzbl        (%ebx,%edi,1),%ecx
   DB  102,15,110,193                      ; movd          %ecx,%xmm0
-  DB  235,90                              ; jmp           bd85 <_sk_load_g8_sse2_lowp+0xb5>
+  DB  235,90                              ; jmp           be19 <_sk_load_g8_sse2_lowp+0xb5>
   DB  243,15,126,4,59                     ; movq          (%ebx,%edi,1),%xmm0
   DB  102,15,96,192                       ; punpcklbw     %xmm0,%xmm0
-  DB  235,79                              ; jmp           bd85 <_sk_load_g8_sse2_lowp+0xb5>
+  DB  235,79                              ; jmp           be19 <_sk_load_g8_sse2_lowp+0xb5>
   DB  15,182,76,59,2                      ; movzbl        0x2(%ebx,%edi,1),%ecx
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,193,2                    ; pinsrw        $0x2,%ecx,%xmm0
@@ -57489,7 +57646,7 @@
   DB  102,15,110,233                      ; movd          %ecx,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,197                       ; movss         %xmm5,%xmm0
-  DB  235,47                              ; jmp           bd85 <_sk_load_g8_sse2_lowp+0xb5>
+  DB  235,47                              ; jmp           be19 <_sk_load_g8_sse2_lowp+0xb5>
   DB  15,182,76,59,6                      ; movzbl        0x6(%ebx,%edi,1),%ecx
   DB  102,15,239,192                      ; pxor          %xmm0,%xmm0
   DB  102,15,196,193,6                    ; pinsrw        $0x6,%ecx,%xmm0
@@ -57500,7 +57657,7 @@
   DB  102,15,110,44,59                    ; movd          (%ebx,%edi,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,197                       ; movsd         %xmm5,%xmm0
-  DB  102,15,219,134,231,21,0,0           ; pand          0x15e7(%esi),%xmm0
+  DB  102,15,219,134,227,21,0,0           ; pand          0x15e3(%esi),%xmm0
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
   DB  15,41,100,36,64                     ; movaps        %xmm4,0x40(%esp)
   DB  15,41,92,36,48                      ; movaps        %xmm3,0x30(%esp)
@@ -57511,7 +57668,7 @@
   DB  137,124,36,8                        ; mov           %edi,0x8(%esp)
   DB  137,76,36,4                         ; mov           %ecx,0x4(%esp)
   DB  137,20,36                           ; mov           %edx,(%esp)
-  DB  15,40,158,231,21,0,0                ; movaps        0x15e7(%esi),%xmm3
+  DB  15,40,158,227,21,0,0                ; movaps        0x15e3(%esi),%xmm3
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,111,208                      ; movdqa        %xmm0,%xmm2
   DB  255,80,4                            ; call          *0x4(%eax)
@@ -57552,10 +57709,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          be15 <_sk_load_g8_dst_sse2_lowp+0x29>
+  DB  232,0,0,0,0                         ; call          bea9 <_sk_load_g8_dst_sse2_lowp+0x29>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            be37 <_sk_load_g8_dst_sse2_lowp+0x4b>
+  DB  119,28                              ; ja            becb <_sk_load_g8_dst_sse2_lowp+0x4b>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,195,0,0,0               ; mov           0xc3(%edi,%ecx,4),%ecx
@@ -57563,10 +57720,10 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,182,12,51                        ; movzbl        (%ebx,%esi,1),%ecx
   DB  102,15,110,225                      ; movd          %ecx,%xmm4
-  DB  235,90                              ; jmp           be91 <_sk_load_g8_dst_sse2_lowp+0xa5>
+  DB  235,90                              ; jmp           bf25 <_sk_load_g8_dst_sse2_lowp+0xa5>
   DB  243,15,126,36,51                    ; movq          (%ebx,%esi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
-  DB  235,79                              ; jmp           be91 <_sk_load_g8_dst_sse2_lowp+0xa5>
+  DB  235,79                              ; jmp           bf25 <_sk_load_g8_dst_sse2_lowp+0xa5>
   DB  15,182,76,51,2                      ; movzbl        0x2(%ebx,%esi,1),%ecx
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,225,2                    ; pinsrw        $0x2,%ecx,%xmm4
@@ -57574,7 +57731,7 @@
   DB  102,15,110,233                      ; movd          %ecx,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,47                              ; jmp           be91 <_sk_load_g8_dst_sse2_lowp+0xa5>
+  DB  235,47                              ; jmp           bf25 <_sk_load_g8_dst_sse2_lowp+0xa5>
   DB  15,182,76,51,6                      ; movzbl        0x6(%ebx,%esi,1),%ecx
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,225,6                    ; pinsrw        $0x6,%ecx,%xmm4
@@ -57585,9 +57742,9 @@
   DB  102,15,110,44,51                    ; movd          (%ebx,%esi,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  102,15,219,167,219,20,0,0           ; pand          0x14db(%edi),%xmm4
+  DB  102,15,219,167,215,20,0,0           ; pand          0x14d7(%edi),%xmm4
   DB  141,72,8                            ; lea           0x8(%eax),%ecx
-  DB  15,40,175,219,20,0,0                ; movaps        0x14db(%edi),%xmm5
+  DB  15,40,175,215,20,0,0                ; movaps        0x14d7(%edi),%xmm5
   DB  15,41,108,36,64                     ; movaps        %xmm5,0x40(%esp)
   DB  102,15,127,100,36,48                ; movdqa        %xmm4,0x30(%esp)
   DB  102,15,127,100,36,32                ; movdqa        %xmm4,0x20(%esp)
@@ -57626,7 +57783,7 @@
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
-  DB  232,0,0,0,0                         ; call          bf05 <_sk_luminance_to_alpha_sse2_lowp+0x11>
+  DB  232,0,0,0,0                         ; call          bf99 <_sk_luminance_to_alpha_sse2_lowp+0x11>
   DB  88                                  ; pop           %eax
   DB  139,77,8                            ; mov           0x8(%ebp),%ecx
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
@@ -57636,10 +57793,10 @@
   DB  15,40,109,56                        ; movaps        0x38(%ebp),%xmm5
   DB  15,40,117,72                        ; movaps        0x48(%ebp),%xmm6
   DB  139,125,12                          ; mov           0xc(%ebp),%edi
-  DB  102,15,213,128,123,20,0,0           ; pmullw        0x147b(%eax),%xmm0
-  DB  102,15,213,136,139,20,0,0           ; pmullw        0x148b(%eax),%xmm1
+  DB  102,15,213,128,119,20,0,0           ; pmullw        0x1477(%eax),%xmm0
+  DB  102,15,213,136,135,20,0,0           ; pmullw        0x1487(%eax),%xmm1
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
-  DB  102,15,213,152,155,20,0,0           ; pmullw        0x149b(%eax),%xmm3
+  DB  102,15,213,152,151,20,0,0           ; pmullw        0x1497(%eax),%xmm3
   DB  102,15,253,217                      ; paddw         %xmm1,%xmm3
   DB  102,15,113,211,8                    ; psrlw         $0x8,%xmm3
   DB  141,71,4                            ; lea           0x4(%edi),%eax
@@ -57668,15 +57825,15 @@
   DB  87                                  ; push          %edi
   DB  86                                  ; push          %esi
   DB  131,236,80                          ; sub           $0x50,%esp
-  DB  232,0,0,0,0                         ; call          bf8e <_sk_scale_1_float_sse2_lowp+0xd>
+  DB  232,0,0,0,0                         ; call          c022 <_sk_scale_1_float_sse2_lowp+0xd>
   DB  94                                  ; pop           %esi
   DB  139,69,8                            ; mov           0x8(%ebp),%eax
   DB  139,85,16                           ; mov           0x10(%ebp),%edx
   DB  139,77,12                           ; mov           0xc(%ebp),%ecx
   DB  139,57                              ; mov           (%ecx),%edi
   DB  243,15,16,39                        ; movss         (%edi),%xmm4
-  DB  243,15,89,166,38,20,0,0             ; mulss         0x1426(%esi),%xmm4
-  DB  243,15,88,166,34,20,0,0             ; addss         0x1422(%esi),%xmm4
+  DB  243,15,89,166,34,20,0,0             ; mulss         0x1422(%esi),%xmm4
+  DB  243,15,88,166,30,20,0,0             ; addss         0x141e(%esi),%xmm4
   DB  243,15,44,252                       ; cvttss2si     %xmm4,%edi
   DB  102,15,110,239                      ; movd          %edi,%xmm5
   DB  139,125,20                          ; mov           0x14(%ebp),%edi
@@ -57689,7 +57846,7 @@
   DB  102,15,213,205                      ; pmullw        %xmm5,%xmm1
   DB  102,15,213,213                      ; pmullw        %xmm5,%xmm2
   DB  102,15,213,221                      ; pmullw        %xmm5,%xmm3
-  DB  102,15,111,174,98,19,0,0            ; movdqa        0x1362(%esi),%xmm5
+  DB  102,15,111,174,94,19,0,0            ; movdqa        0x135e(%esi),%xmm5
   DB  102,15,253,197                      ; paddw         %xmm5,%xmm0
   DB  102,15,253,205                      ; paddw         %xmm5,%xmm1
   DB  102,15,253,213                      ; paddw         %xmm5,%xmm2
@@ -57726,19 +57883,19 @@
   DB  102,15,111,218                      ; movdqa        %xmm2,%xmm3
   DB  102,15,111,209                      ; movdqa        %xmm1,%xmm2
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
-  DB  232,0,0,0,0                         ; call          c05c <_sk_lerp_1_float_sse2_lowp+0x1d>
+  DB  232,0,0,0,0                         ; call          c0f0 <_sk_lerp_1_float_sse2_lowp+0x1d>
   DB  89                                  ; pop           %ecx
   DB  102,15,111,109,24                   ; movdqa        0x18(%ebp),%xmm5
   DB  139,69,12                           ; mov           0xc(%ebp),%eax
   DB  139,16                              ; mov           (%eax),%edx
   DB  243,15,16,50                        ; movss         (%edx),%xmm6
-  DB  243,15,89,177,88,19,0,0             ; mulss         0x1358(%ecx),%xmm6
-  DB  243,15,88,177,84,19,0,0             ; addss         0x1354(%ecx),%xmm6
+  DB  243,15,89,177,84,19,0,0             ; mulss         0x1354(%ecx),%xmm6
+  DB  243,15,88,177,80,19,0,0             ; addss         0x1350(%ecx),%xmm6
   DB  243,15,44,214                       ; cvttss2si     %xmm6,%edx
   DB  102,15,110,242                      ; movd          %edx,%xmm6
   DB  242,15,112,246,0                    ; pshuflw       $0x0,%xmm6,%xmm6
   DB  102,15,112,246,80                   ; pshufd        $0x50,%xmm6,%xmm6
-  DB  102,15,111,129,148,18,0,0           ; movdqa        0x1294(%ecx),%xmm0
+  DB  102,15,111,129,144,18,0,0           ; movdqa        0x1290(%ecx),%xmm0
   DB  102,15,213,206                      ; pmullw        %xmm6,%xmm1
   DB  102,15,253,200                      ; paddw         %xmm0,%xmm1
   DB  102,15,213,214                      ; pmullw        %xmm6,%xmm2
@@ -57809,10 +57966,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          c185 <_sk_scale_u8_sse2_lowp+0x31>
+  DB  232,0,0,0,0                         ; call          c219 <_sk_scale_u8_sse2_lowp+0x31>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            c1a7 <_sk_scale_u8_sse2_lowp+0x53>
+  DB  119,28                              ; ja            c23b <_sk_scale_u8_sse2_lowp+0x53>
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,3,1,0,0                 ; mov           0x103(%edi,%ecx,4),%ecx
@@ -57820,10 +57977,10 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,182,12,51                        ; movzbl        (%ebx,%esi,1),%ecx
   DB  102,15,110,225                      ; movd          %ecx,%xmm4
-  DB  235,90                              ; jmp           c201 <_sk_scale_u8_sse2_lowp+0xad>
+  DB  235,90                              ; jmp           c295 <_sk_scale_u8_sse2_lowp+0xad>
   DB  243,15,126,36,51                    ; movq          (%ebx,%esi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
-  DB  235,79                              ; jmp           c201 <_sk_scale_u8_sse2_lowp+0xad>
+  DB  235,79                              ; jmp           c295 <_sk_scale_u8_sse2_lowp+0xad>
   DB  15,182,76,51,2                      ; movzbl        0x2(%ebx,%esi,1),%ecx
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,225,2                    ; pinsrw        $0x2,%ecx,%xmm4
@@ -57831,7 +57988,7 @@
   DB  102,15,110,233                      ; movd          %ecx,%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  243,15,16,229                       ; movss         %xmm5,%xmm4
-  DB  235,47                              ; jmp           c201 <_sk_scale_u8_sse2_lowp+0xad>
+  DB  235,47                              ; jmp           c295 <_sk_scale_u8_sse2_lowp+0xad>
   DB  15,182,76,51,6                      ; movzbl        0x6(%ebx,%esi,1),%ecx
   DB  102,15,239,228                      ; pxor          %xmm4,%xmm4
   DB  102,15,196,225,6                    ; pinsrw        $0x6,%ecx,%xmm4
@@ -57842,9 +57999,9 @@
   DB  102,15,110,44,51                    ; movd          (%ebx,%esi,1),%xmm5
   DB  102,15,96,232                       ; punpcklbw     %xmm0,%xmm5
   DB  242,15,16,229                       ; movsd         %xmm5,%xmm4
-  DB  102,15,219,167,107,17,0,0           ; pand          0x116b(%edi),%xmm4
+  DB  102,15,219,167,103,17,0,0           ; pand          0x1167(%edi),%xmm4
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
-  DB  102,15,111,175,107,17,0,0           ; movdqa        0x116b(%edi),%xmm5
+  DB  102,15,111,175,103,17,0,0           ; movdqa        0x1167(%edi),%xmm5
   DB  102,15,253,197                      ; paddw         %xmm5,%xmm0
   DB  102,15,113,208,8                    ; psrlw         $0x8,%xmm0
   DB  102,15,213,204                      ; pmullw        %xmm4,%xmm1
@@ -57909,10 +58066,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          c2d2 <_sk_lerp_u8_sse2_lowp+0x2e>
+  DB  232,0,0,0,0                         ; call          c366 <_sk_lerp_u8_sse2_lowp+0x2e>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            c2f4 <_sk_lerp_u8_sse2_lowp+0x50>
+  DB  119,28                              ; ja            c388 <_sk_lerp_u8_sse2_lowp+0x50>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,74,1,0,0                ; mov           0x14a(%edi,%ecx,4),%ecx
@@ -57920,10 +58077,10 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,182,12,51                        ; movzbl        (%ebx,%esi,1),%ecx
   DB  102,15,110,217                      ; movd          %ecx,%xmm3
-  DB  235,90                              ; jmp           c34e <_sk_lerp_u8_sse2_lowp+0xaa>
+  DB  235,90                              ; jmp           c3e2 <_sk_lerp_u8_sse2_lowp+0xaa>
   DB  243,15,126,28,51                    ; movq          (%ebx,%esi,1),%xmm3
   DB  102,15,96,216                       ; punpcklbw     %xmm0,%xmm3
-  DB  235,79                              ; jmp           c34e <_sk_lerp_u8_sse2_lowp+0xaa>
+  DB  235,79                              ; jmp           c3e2 <_sk_lerp_u8_sse2_lowp+0xaa>
   DB  15,182,76,51,2                      ; movzbl        0x2(%ebx,%esi,1),%ecx
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,217,2                    ; pinsrw        $0x2,%ecx,%xmm3
@@ -57931,7 +58088,7 @@
   DB  102,15,110,225                      ; movd          %ecx,%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  243,15,16,220                       ; movss         %xmm4,%xmm3
-  DB  235,47                              ; jmp           c34e <_sk_lerp_u8_sse2_lowp+0xaa>
+  DB  235,47                              ; jmp           c3e2 <_sk_lerp_u8_sse2_lowp+0xaa>
   DB  15,182,76,51,6                      ; movzbl        0x6(%ebx,%esi,1),%ecx
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,217,6                    ; pinsrw        $0x6,%ecx,%xmm3
@@ -57942,8 +58099,8 @@
   DB  102,15,110,36,51                    ; movd          (%ebx,%esi,1),%xmm4
   DB  102,15,96,224                       ; punpcklbw     %xmm0,%xmm4
   DB  242,15,16,220                       ; movsd         %xmm4,%xmm3
-  DB  102,15,219,159,30,16,0,0            ; pand          0x101e(%edi),%xmm3
-  DB  102,15,111,183,30,16,0,0            ; movdqa        0x101e(%edi),%xmm6
+  DB  102,15,219,159,26,16,0,0            ; pand          0x101a(%edi),%xmm3
+  DB  102,15,111,183,26,16,0,0            ; movdqa        0x101a(%edi),%xmm6
   DB  102,15,111,227                      ; movdqa        %xmm3,%xmm4
   DB  102,15,239,230                      ; pxor          %xmm6,%xmm4
   DB  102,15,111,252                      ; movdqa        %xmm4,%xmm7
@@ -58030,10 +58187,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          c47b <_sk_scale_565_sse2_lowp+0x43>
+  DB  232,0,0,0,0                         ; call          c50f <_sk_scale_565_sse2_lowp+0x43>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            c49d <_sk_scale_565_sse2_lowp+0x65>
+  DB  119,28                              ; ja            c531 <_sk_scale_565_sse2_lowp+0x65>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,249,1,0,0               ; mov           0x1f9(%edi,%ecx,4),%ecx
@@ -58041,14 +58198,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,183,12,115                       ; movzwl        (%ebx,%esi,2),%ecx
   DB  102,15,110,217                      ; movd          %ecx,%xmm3
-  DB  235,59                              ; jmp           c4d8 <_sk_scale_565_sse2_lowp+0xa0>
+  DB  235,59                              ; jmp           c56c <_sk_scale_565_sse2_lowp+0xa0>
   DB  243,15,111,28,115                   ; movdqu        (%ebx,%esi,2),%xmm3
-  DB  235,52                              ; jmp           c4d8 <_sk_scale_565_sse2_lowp+0xa0>
+  DB  235,52                              ; jmp           c56c <_sk_scale_565_sse2_lowp+0xa0>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,92,115,4,2               ; pinsrw        $0x2,0x4(%ebx,%esi,2),%xmm3
   DB  243,15,16,12,115                    ; movss         (%ebx,%esi,2),%xmm1
   DB  243,15,16,217                       ; movss         %xmm1,%xmm3
-  DB  235,30                              ; jmp           c4d8 <_sk_scale_565_sse2_lowp+0xa0>
+  DB  235,30                              ; jmp           c56c <_sk_scale_565_sse2_lowp+0xa0>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,92,115,12,6              ; pinsrw        $0x6,0xc(%ebx,%esi,2),%xmm3
   DB  102,15,196,92,115,10,5              ; pinsrw        $0x5,0xa(%ebx,%esi,2),%xmm3
@@ -58056,11 +58213,11 @@
   DB  102,15,18,28,115                    ; movlpd        (%ebx,%esi,2),%xmm3
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,15,219,143,181,14,0,0           ; pand          0xeb5(%edi),%xmm1
+  DB  102,15,219,143,177,14,0,0           ; pand          0xeb1(%edi),%xmm1
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
   DB  102,15,113,210,5                    ; psrlw         $0x5,%xmm2
-  DB  102,15,219,151,197,14,0,0           ; pand          0xec5(%edi),%xmm2
-  DB  102,15,111,135,213,14,0,0           ; movdqa        0xed5(%edi),%xmm0
+  DB  102,15,219,151,193,14,0,0           ; pand          0xec1(%edi),%xmm2
+  DB  102,15,111,135,209,14,0,0           ; movdqa        0xed1(%edi),%xmm0
   DB  102,15,219,195                      ; pand          %xmm3,%xmm0
   DB  102,15,113,211,13                   ; psrlw         $0xd,%xmm3
   DB  102,15,235,217                      ; por           %xmm1,%xmm3
@@ -58073,7 +58230,7 @@
   DB  102,15,113,208,2                    ; psrlw         $0x2,%xmm0
   DB  102,15,235,193                      ; por           %xmm1,%xmm0
   DB  102,15,127,69,200                   ; movdqa        %xmm0,-0x38(%ebp)
-  DB  102,15,111,167,149,14,0,0           ; movdqa        0xe95(%edi),%xmm4
+  DB  102,15,111,167,145,14,0,0           ; movdqa        0xe91(%edi),%xmm4
   DB  15,41,117,184                       ; movaps        %xmm6,-0x48(%ebp)
   DB  102,15,239,244                      ; pxor          %xmm4,%xmm6
   DB  102,15,239,252                      ; pxor          %xmm4,%xmm7
@@ -58116,7 +58273,7 @@
   DB  102,15,111,229                      ; movdqa        %xmm5,%xmm4
   DB  102,15,213,101,136                  ; pmullw        -0x78(%ebp),%xmm4
   DB  102,15,213,125,184                  ; pmullw        -0x48(%ebp),%xmm7
-  DB  102,15,111,135,117,14,0,0           ; movdqa        0xe75(%edi),%xmm0
+  DB  102,15,111,135,113,14,0,0           ; movdqa        0xe71(%edi),%xmm0
   DB  102,15,253,216                      ; paddw         %xmm0,%xmm3
   DB  102,15,253,208                      ; paddw         %xmm0,%xmm2
   DB  102,15,253,224                      ; paddw         %xmm0,%xmm4
@@ -58191,10 +58348,10 @@
   DB  128,225,7                           ; and           $0x7,%cl
   DB  254,201                             ; dec           %cl
   DB  128,249,6                           ; cmp           $0x6,%cl
-  DB  232,0,0,0,0                         ; call          c6d3 <_sk_lerp_565_sse2_lowp+0x43>
+  DB  232,0,0,0,0                         ; call          c767 <_sk_lerp_565_sse2_lowp+0x43>
   DB  95                                  ; pop           %edi
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
-  DB  119,28                              ; ja            c6f5 <_sk_lerp_565_sse2_lowp+0x65>
+  DB  119,28                              ; ja            c789 <_sk_lerp_565_sse2_lowp+0x65>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  15,182,201                          ; movzbl        %cl,%ecx
   DB  139,140,143,73,2,0,0                ; mov           0x249(%edi,%ecx,4),%ecx
@@ -58202,14 +58359,14 @@
   DB  255,225                             ; jmp           *%ecx
   DB  15,183,12,115                       ; movzwl        (%ebx,%esi,2),%ecx
   DB  102,15,110,217                      ; movd          %ecx,%xmm3
-  DB  235,59                              ; jmp           c730 <_sk_lerp_565_sse2_lowp+0xa0>
+  DB  235,59                              ; jmp           c7c4 <_sk_lerp_565_sse2_lowp+0xa0>
   DB  243,15,111,28,115                   ; movdqu        (%ebx,%esi,2),%xmm3
-  DB  235,52                              ; jmp           c730 <_sk_lerp_565_sse2_lowp+0xa0>
+  DB  235,52                              ; jmp           c7c4 <_sk_lerp_565_sse2_lowp+0xa0>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,92,115,4,2               ; pinsrw        $0x2,0x4(%ebx,%esi,2),%xmm3
   DB  243,15,16,12,115                    ; movss         (%ebx,%esi,2),%xmm1
   DB  243,15,16,217                       ; movss         %xmm1,%xmm3
-  DB  235,30                              ; jmp           c730 <_sk_lerp_565_sse2_lowp+0xa0>
+  DB  235,30                              ; jmp           c7c4 <_sk_lerp_565_sse2_lowp+0xa0>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  102,15,196,92,115,12,6              ; pinsrw        $0x6,0xc(%ebx,%esi,2),%xmm3
   DB  102,15,196,92,115,10,5              ; pinsrw        $0x5,0xa(%ebx,%esi,2),%xmm3
@@ -58217,11 +58374,11 @@
   DB  102,15,18,28,115                    ; movlpd        (%ebx,%esi,2),%xmm3
   DB  102,15,111,203                      ; movdqa        %xmm3,%xmm1
   DB  102,15,113,209,8                    ; psrlw         $0x8,%xmm1
-  DB  102,15,219,143,93,12,0,0            ; pand          0xc5d(%edi),%xmm1
+  DB  102,15,219,143,89,12,0,0            ; pand          0xc59(%edi),%xmm1
   DB  102,15,111,211                      ; movdqa        %xmm3,%xmm2
   DB  102,15,113,210,5                    ; psrlw         $0x5,%xmm2
-  DB  102,15,219,151,109,12,0,0           ; pand          0xc6d(%edi),%xmm2
-  DB  102,15,111,175,125,12,0,0           ; movdqa        0xc7d(%edi),%xmm5
+  DB  102,15,219,151,105,12,0,0           ; pand          0xc69(%edi),%xmm2
+  DB  102,15,111,175,121,12,0,0           ; movdqa        0xc79(%edi),%xmm5
   DB  102,15,219,235                      ; pand          %xmm3,%xmm5
   DB  102,15,113,211,13                   ; psrlw         $0xd,%xmm3
   DB  102,15,235,217                      ; por           %xmm1,%xmm3
@@ -58234,7 +58391,7 @@
   DB  102,15,113,213,2                    ; psrlw         $0x2,%xmm5
   DB  102,15,235,233                      ; por           %xmm1,%xmm5
   DB  102,15,127,109,216                  ; movdqa        %xmm5,-0x28(%ebp)
-  DB  102,15,111,167,61,12,0,0            ; movdqa        0xc3d(%edi),%xmm4
+  DB  102,15,111,167,57,12,0,0            ; movdqa        0xc39(%edi),%xmm4
   DB  102,15,111,198                      ; movdqa        %xmm6,%xmm0
   DB  102,15,111,200                      ; movdqa        %xmm0,%xmm1
   DB  102,15,239,204                      ; pxor          %xmm4,%xmm1
@@ -58275,7 +58432,7 @@
   DB  102,15,235,249                      ; por           %xmm1,%xmm7
   DB  102,15,111,195                      ; movdqa        %xmm3,%xmm0
   DB  102,15,213,93,168                   ; pmullw        -0x58(%ebp),%xmm3
-  DB  102,15,111,143,29,12,0,0            ; movdqa        0xc1d(%edi),%xmm1
+  DB  102,15,111,143,25,12,0,0            ; movdqa        0xc19(%edi),%xmm1
   DB  102,15,239,193                      ; pxor          %xmm1,%xmm0
   DB  102,15,111,101,24                   ; movdqa        0x18(%ebp),%xmm4
   DB  102,15,213,196                      ; pmullw        %xmm4,%xmm0
@@ -58369,11 +58526,11 @@
   DB  128,227,7                           ; and           $0x7,%bl
   DB  254,203                             ; dec           %bl
   DB  128,251,6                           ; cmp           $0x6,%bl
-  DB  232,0,0,0,0                         ; call          c977 <_sk_srcover_rgba_8888_sse2_lowp+0x3f>
+  DB  232,0,0,0,0                         ; call          ca0b <_sk_srcover_rgba_8888_sse2_lowp+0x3f>
   DB  89                                  ; pop           %ecx
   DB  139,117,16                          ; mov           0x10(%ebp),%esi
   DB  15,182,211                          ; movzbl        %bl,%edx
-  DB  119,29                              ; ja            c99d <_sk_srcover_rgba_8888_sse2_lowp+0x65>
+  DB  119,29                              ; ja            ca31 <_sk_srcover_rgba_8888_sse2_lowp+0x65>
   DB  102,15,239,219                      ; pxor          %xmm3,%xmm3
   DB  139,132,145,77,2,0,0                ; mov           0x24d(%ecx,%edx,4),%eax
   DB  1,200                               ; add           %ecx,%eax
@@ -58381,14 +58538,14 @@
   DB  255,224                             ; jmp           *%eax
   DB  243,15,16,52,183                    ; movss         (%edi,%esi,4),%xmm6
   DB  15,87,219                           ; xorps         %xmm3,%xmm3
-  DB  235,73                              ; jmp           c9e6 <_sk_srcover_rgba_8888_sse2_lowp+0xae>
+  DB  235,73                              ; jmp           ca7a <_sk_srcover_rgba_8888_sse2_lowp+0xae>
   DB  102,15,16,52,183                    ; movupd        (%edi,%esi,4),%xmm6
   DB  15,16,92,183,16                     ; movups        0x10(%edi,%esi,4),%xmm3
-  DB  235,61                              ; jmp           c9e6 <_sk_srcover_rgba_8888_sse2_lowp+0xae>
+  DB  235,61                              ; jmp           ca7a <_sk_srcover_rgba_8888_sse2_lowp+0xae>
   DB  102,15,110,68,183,8                 ; movd          0x8(%edi,%esi,4),%xmm0
   DB  102,15,112,240,69                   ; pshufd        $0x45,%xmm0,%xmm6
   DB  102,15,18,52,183                    ; movlpd        (%edi,%esi,4),%xmm6
-  DB  235,43                              ; jmp           c9e6 <_sk_srcover_rgba_8888_sse2_lowp+0xae>
+  DB  235,43                              ; jmp           ca7a <_sk_srcover_rgba_8888_sse2_lowp+0xae>
   DB  102,15,110,68,183,24                ; movd          0x18(%edi,%esi,4),%xmm0
   DB  102,15,112,216,69                   ; pshufd        $0x45,%xmm0,%xmm3
   DB  243,15,16,68,183,20                 ; movss         0x14(%edi,%esi,4),%xmm0
@@ -58414,7 +58571,7 @@
   DB  102,15,114,243,16                   ; pslld         $0x10,%xmm3
   DB  102,15,114,227,16                   ; psrad         $0x10,%xmm3
   DB  102,15,107,243                      ; packssdw      %xmm3,%xmm6
-  DB  102,15,111,153,121,9,0,0            ; movdqa        0x979(%ecx),%xmm3
+  DB  102,15,111,153,117,9,0,0            ; movdqa        0x975(%ecx),%xmm3
   DB  102,15,114,208,16                   ; psrld         $0x10,%xmm0
   DB  102,15,114,210,16                   ; psrld         $0x10,%xmm2
   DB  102,15,114,242,16                   ; pslld         $0x10,%xmm2
@@ -58466,18 +58623,18 @@
   DB  102,15,105,220                      ; punpckhwd     %xmm4,%xmm3
   DB  102,15,235,222                      ; por           %xmm6,%xmm3
   DB  128,251,6                           ; cmp           $0x6,%bl
-  DB  119,16                              ; ja            cb27 <_sk_srcover_rgba_8888_sse2_lowp+0x1ef>
+  DB  119,16                              ; ja            cbbb <_sk_srcover_rgba_8888_sse2_lowp+0x1ef>
   DB  3,140,145,105,2,0,0                 ; add           0x269(%ecx,%edx,4),%ecx
   DB  255,225                             ; jmp           *%ecx
   DB  102,15,126,4,183                    ; movd          %xmm0,(%edi,%esi,4)
-  DB  235,64                              ; jmp           cb67 <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
+  DB  235,64                              ; jmp           cbfb <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
   DB  243,15,127,4,183                    ; movdqu        %xmm0,(%edi,%esi,4)
   DB  243,15,127,92,183,16                ; movdqu        %xmm3,0x10(%edi,%esi,4)
-  DB  235,51                              ; jmp           cb67 <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
+  DB  235,51                              ; jmp           cbfb <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
   DB  102,15,112,208,78                   ; pshufd        $0x4e,%xmm0,%xmm2
   DB  102,15,126,84,183,8                 ; movd          %xmm2,0x8(%edi,%esi,4)
   DB  102,15,214,4,183                    ; movq          %xmm0,(%edi,%esi,4)
-  DB  235,33                              ; jmp           cb67 <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
+  DB  235,33                              ; jmp           cbfb <_sk_srcover_rgba_8888_sse2_lowp+0x22f>
   DB  102,15,112,211,78                   ; pshufd        $0x4e,%xmm3,%xmm2
   DB  102,15,126,84,183,24                ; movd          %xmm2,0x18(%edi,%esi,4)
   DB  102,15,112,211,229                  ; pshufd        $0xe5,%xmm3,%xmm2
@@ -58606,11 +58763,11 @@
   DB  0,128,191,0,0,128                   ; add           %al,-0x7fffff41(%eax)
   DB  191,0,0,224,64                      ; mov           $0x40e00000,%edi
   DB  0,0                                 ; add           %al,(%eax)
-  DB  224,64                              ; loopne        cce8 <.literal16+0xe8>
+  DB  224,64                              ; loopne        cd78 <.literal16+0xe8>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  224,64                              ; loopne        ccec <.literal16+0xec>
+  DB  224,64                              ; loopne        cd7c <.literal16+0xec>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  224,64                              ; loopne        ccf0 <.literal16+0xf0>
+  DB  224,64                              ; loopne        cd80 <.literal16+0xf0>
   DB  154,153,153,62,154,153,153          ; lcall         $0x9999,$0x9a3e9999
   DB  62,154,153,153,62,154,153,153       ; ds            lcall $0x9999,$0x9a3e9999
   DB  62,61,10,23,63,61                   ; ds            cmp $0x3d3f170a,%eax
@@ -58621,16 +58778,16 @@
   DB  63                                  ; aas
   DB  174                                 ; scas          %es:(%edi),%al
   DB  71                                  ; inc           %edi
-  DB  225,61                              ; loope         cd11 <.literal16+0x111>
+  DB  225,61                              ; loope         cda1 <.literal16+0x111>
   DB  174                                 ; scas          %es:(%edi),%al
   DB  71                                  ; inc           %edi
-  DB  225,61                              ; loope         cd15 <.literal16+0x115>
+  DB  225,61                              ; loope         cda5 <.literal16+0x115>
   DB  174                                 ; scas          %es:(%edi),%al
   DB  71                                  ; inc           %edi
-  DB  225,61                              ; loope         cd19 <.literal16+0x119>
+  DB  225,61                              ; loope         cda9 <.literal16+0x119>
   DB  174                                 ; scas          %es:(%edi),%al
   DB  71                                  ; inc           %edi
-  DB  225,61                              ; loope         cd1d <.literal16+0x11d>
+  DB  225,61                              ; loope         cdad <.literal16+0x11d>
   DB  255,0                               ; incl          (%eax)
   DB  0,0                                 ; add           %al,(%eax)
   DB  255,0                               ; incl          (%eax)
@@ -58640,13 +58797,13 @@
   DB  255,0                               ; incl          (%eax)
   DB  0,0                                 ; add           %al,(%eax)
   DB  0,0                                 ; add           %al,(%eax)
-  DB  127,67                              ; jg            cd37 <.literal16+0x137>
+  DB  127,67                              ; jg            cdc7 <.literal16+0x137>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  127,67                              ; jg            cd3b <.literal16+0x13b>
+  DB  127,67                              ; jg            cdcb <.literal16+0x13b>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  127,67                              ; jg            cd3f <.literal16+0x13f>
+  DB  127,67                              ; jg            cdcf <.literal16+0x13f>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  127,67                              ; jg            cd43 <.literal16+0x143>
+  DB  127,67                              ; jg            cdd3 <.literal16+0x143>
   DB  145                                 ; xchg          %eax,%ecx
   DB  131,158,61,145,131,158,61           ; sbbl          $0x3d,-0x617c6ec3(%esi)
   DB  145                                 ; xchg          %eax,%ecx
@@ -58797,13 +58954,13 @@
   DB  132,55                              ; test          %dh,(%edi)
   DB  8,33                                ; or            %ah,(%ecx)
   DB  132,55                              ; test          %dh,(%edi)
-  DB  224,7                               ; loopne        ce49 <.literal16+0x249>
+  DB  224,7                               ; loopne        ced9 <.literal16+0x249>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  224,7                               ; loopne        ce4d <.literal16+0x24d>
+  DB  224,7                               ; loopne        cedd <.literal16+0x24d>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  224,7                               ; loopne        ce51 <.literal16+0x251>
+  DB  224,7                               ; loopne        cee1 <.literal16+0x251>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  224,7                               ; loopne        ce55 <.literal16+0x255>
+  DB  224,7                               ; loopne        cee5 <.literal16+0x255>
   DB  0,0                                 ; add           %al,(%eax)
   DB  33,8                                ; and           %ecx,(%eax)
   DB  2,58                                ; add           (%edx),%bh
@@ -58852,17 +59009,17 @@
   DB  0,0                                 ; add           %al,(%eax)
   DB  52,255                              ; xor           $0xff,%al
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            ceb4 <.literal16+0x2b4>
+  DB  127,0                               ; jg            cf44 <.literal16+0x2b4>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            ceb8 <.literal16+0x2b8>
+  DB  127,0                               ; jg            cf48 <.literal16+0x2b8>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            cebc <.literal16+0x2bc>
+  DB  127,0                               ; jg            cf4c <.literal16+0x2bc>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            cec0 <.literal16+0x2c0>
-  DB  119,115                             ; ja            cf35 <.literal16+0x335>
+  DB  127,0                               ; jg            cf50 <.literal16+0x2c0>
+  DB  119,115                             ; ja            cfc5 <.literal16+0x335>
   DB  248                                 ; clc
   DB  194,119,115                         ; ret           $0x7377
   DB  248                                 ; clc
@@ -58873,7 +59030,7 @@
   DB  194,117,191                         ; ret           $0xbf75
   DB  191,63,117,191,191                  ; mov           $0xbfbf753f,%edi
   DB  63                                  ; aas
-  DB  117,191                             ; jne           ce99 <.literal16+0x299>
+  DB  117,191                             ; jne           cf29 <.literal16+0x299>
   DB  191,63,117,191,191                  ; mov           $0xbfbf753f,%edi
   DB  63                                  ; aas
   DB  249                                 ; stc
@@ -58889,7 +59046,7 @@
   DB  68                                  ; inc           %esp
   DB  180,62                              ; mov           $0x3e,%ah
   DB  163,233,220,63,163                  ; mov           %eax,0xa33fdce9
-  DB  233,220,63,163,233                  ; jmp           e9a40ed6 <_sk_srcover_rgba_8888_sse2_lowp+0xe9a3459e>
+  DB  233,220,63,163,233                  ; jmp           e9a40f66 <_sk_srcover_rgba_8888_sse2_lowp+0xe9a3459a>
   DB  220,63                              ; fdivrl        (%edi)
   DB  163,233,220,63,81                   ; mov           %eax,0x513fdce9
   DB  140,242                             ; mov           %?,%edx
@@ -58985,16 +59142,16 @@
   DB  128,3,62                            ; addb          $0x3e,(%ebx)
   DB  31                                  ; pop           %ds
   DB  215                                 ; xlat          %ds:(%ebx)
-  DB  118,63                              ; jbe           d023 <.literal16+0x423>
+  DB  118,63                              ; jbe           d0b3 <.literal16+0x423>
   DB  31                                  ; pop           %ds
   DB  215                                 ; xlat          %ds:(%ebx)
-  DB  118,63                              ; jbe           d027 <.literal16+0x427>
+  DB  118,63                              ; jbe           d0b7 <.literal16+0x427>
   DB  31                                  ; pop           %ds
   DB  215                                 ; xlat          %ds:(%ebx)
-  DB  118,63                              ; jbe           d02b <.literal16+0x42b>
+  DB  118,63                              ; jbe           d0bb <.literal16+0x42b>
   DB  31                                  ; pop           %ds
   DB  215                                 ; xlat          %ds:(%ebx)
-  DB  118,63                              ; jbe           d02f <.literal16+0x42f>
+  DB  118,63                              ; jbe           d0bf <.literal16+0x42f>
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%eax)
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%eax)
   DB  246,64,83,63                        ; testb         $0x3f,0x53(%eax)
@@ -59020,13 +59177,13 @@
   DB  248                                 ; clc
   DB  65                                  ; inc           %ecx
   DB  0,0                                 ; add           %al,(%eax)
-  DB  124,66                              ; jl            d066 <.literal16+0x466>
+  DB  124,66                              ; jl            d0f6 <.literal16+0x466>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  124,66                              ; jl            d06a <.literal16+0x46a>
+  DB  124,66                              ; jl            d0fa <.literal16+0x46a>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  124,66                              ; jl            d06e <.literal16+0x46e>
+  DB  124,66                              ; jl            d0fe <.literal16+0x46e>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  124,66                              ; jl            d072 <.literal16+0x472>
+  DB  124,66                              ; jl            d102 <.literal16+0x472>
   DB  0,240                               ; add           %dh,%al
   DB  0,0                                 ; add           %al,(%eax)
   DB  0,240                               ; add           %dh,%al
@@ -59072,25 +59229,25 @@
   DB  136,136,61,137,136,136              ; mov           %cl,-0x777776c3(%eax)
   DB  61,137,136,136,61                   ; cmp           $0x3d888889,%eax
   DB  0,0                                 ; add           %al,(%eax)
-  DB  112,65                              ; jo            d0f5 <.literal16+0x4f5>
+  DB  112,65                              ; jo            d185 <.literal16+0x4f5>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  112,65                              ; jo            d0f9 <.literal16+0x4f9>
+  DB  112,65                              ; jo            d189 <.literal16+0x4f9>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  112,65                              ; jo            d0fd <.literal16+0x4fd>
+  DB  112,65                              ; jo            d18d <.literal16+0x4fd>
   DB  0,0                                 ; add           %al,(%eax)
-  DB  112,65                              ; jo            d101 <.literal16+0x501>
+  DB  112,65                              ; jo            d191 <.literal16+0x501>
   DB  0,128,0,0,0,128                     ; add           %al,-0x80000000(%eax)
   DB  0,0                                 ; add           %al,(%eax)
   DB  0,128,0,0,0,128                     ; add           %al,-0x80000000(%eax)
   DB  0,0                                 ; add           %al,(%eax)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            d0d3 <.literal16+0x4d3>
+  DB  127,0                               ; jg            d163 <.literal16+0x4d3>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            d0d7 <.literal16+0x4d7>
+  DB  127,0                               ; jg            d167 <.literal16+0x4d7>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            d0db <.literal16+0x4db>
+  DB  127,0                               ; jg            d16b <.literal16+0x4db>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,0                               ; jg            d0df <.literal16+0x4df>
+  DB  127,0                               ; jg            d16f <.literal16+0x4df>
   DB  0,0                                 ; add           %al,(%eax)
   DB  4,0                                 ; add           $0x0,%al
   DB  0,0                                 ; add           %al,(%eax)
@@ -59116,13 +59273,13 @@
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            d118 <.literal16+0x518>
+  DB  127,255                             ; jg            d1a8 <.literal16+0x518>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,255                             ; jg            d11c <.literal16+0x51c>
+  DB  127,255                             ; jg            d1ac <.literal16+0x51c>
   DB  255                                 ; (bad)
   DB  255                                 ; (bad)
-  DB  127,0                               ; jg            d121 <.literal16+0x521>
+  DB  127,0                               ; jg            d1b1 <.literal16+0x521>
   DB  0,128,56,0,0,128                    ; add           %al,-0x7fffffc8(%eax)
   DB  56,0                                ; cmp           %al,(%eax)
   DB  0,128,56,0,0,128                    ; add           %al,-0x7fffffc8(%eax)
@@ -59136,13 +59293,13 @@
   DB  0,255                               ; add           %bh,%bh
   DB  255,0                               ; incl          (%eax)
   DB  255                                 ; (bad)
-  DB  127,71                              ; jg            d18b <.literal16+0x58b>
+  DB  127,71                              ; jg            d21b <.literal16+0x58b>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            d18f <.literal16+0x58f>
+  DB  127,71                              ; jg            d21f <.literal16+0x58f>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            d193 <.literal16+0x593>
+  DB  127,71                              ; jg            d223 <.literal16+0x593>
   DB  0,255                               ; add           %bh,%bh
-  DB  127,71                              ; jg            d197 <.literal16+0x597>
+  DB  127,71                              ; jg            d227 <.literal16+0x597>
   DB  208                                 ; (bad)
   DB  179,89                              ; mov           $0x59,%bl
   DB  62,208                              ; ds            (bad)
@@ -59195,7 +59352,7 @@
   DB  192,45,16,17,192,45,16              ; shrb          $0x10,0x2dc01110
   DB  17,192                              ; adc           %eax,%eax
   DB  45,16,17,192,18                     ; sub           $0x12c01110,%eax
-  DB  120,57                              ; js            d1fc <.literal16+0x5fc>
+  DB  120,57                              ; js            d28c <.literal16+0x5fc>
   DB  64                                  ; inc           %eax
   DB  18,120,57                           ; adc           0x39(%eax),%bh
   DB  64                                  ; inc           %eax
@@ -59266,13 +59423,13 @@
   DB  192,191,0,0,192,191,0               ; sarb          $0x0,-0x40400000(%edi)
   DB  0,192                               ; add           %al,%al
   DB  191,0,0,192,191                     ; mov           $0xbfc00000,%edi
-  DB  114,28                              ; jb            d2ae <.literal16+0x6ae>
+  DB  114,28                              ; jb            d33e <.literal16+0x6ae>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         d2b2 <.literal16+0x6b2>
+  DB  62,114,28                           ; jb,pt         d342 <.literal16+0x6b2>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         d2b6 <.literal16+0x6b6>
+  DB  62,114,28                           ; jb,pt         d346 <.literal16+0x6b6>
   DB  199                                 ; (bad)
-  DB  62,114,28                           ; jb,pt         d2ba <.literal16+0x6ba>
+  DB  62,114,28                           ; jb,pt         d34a <.literal16+0x6ba>
   DB  199                                 ; (bad)
   DB  62,85                               ; ds            push %ebp
   DB  85                                  ; push          %ebp
@@ -59293,13 +59450,13 @@
   DB  57,142,99,61,57,142                 ; cmp           %ecx,-0x71c6c29d(%esi)
   DB  99,61,57,142,99,61                  ; arpl          %di,0x3d638e39
   DB  57,142,99,61,114,249                ; cmp           %ecx,-0x68dc29d(%esi)
-  DB  127,63                              ; jg            d313 <.literal16+0x713>
-  DB  114,249                             ; jb            d2cf <.literal16+0x6cf>
-  DB  127,63                              ; jg            d317 <.literal16+0x717>
-  DB  114,249                             ; jb            d2d3 <.literal16+0x6d3>
-  DB  127,63                              ; jg            d31b <.literal16+0x71b>
-  DB  114,249                             ; jb            d2d7 <.literal16+0x6d7>
-  DB  127,63                              ; jg            d31f <.literal16+0x71f>
+  DB  127,63                              ; jg            d3a3 <.literal16+0x713>
+  DB  114,249                             ; jb            d35f <.literal16+0x6cf>
+  DB  127,63                              ; jg            d3a7 <.literal16+0x717>
+  DB  114,249                             ; jb            d363 <.literal16+0x6d3>
+  DB  127,63                              ; jg            d3ab <.literal16+0x71b>
+  DB  114,249                             ; jb            d367 <.literal16+0x6d7>
+  DB  127,63                              ; jg            d3af <.literal16+0x71f>
   DB  3,0                                 ; add           (%eax),%eax
   DB  0,0                                 ; add           %al,(%eax)
   DB  3,0                                 ; add           (%eax),%eax
@@ -59367,14 +59524,14 @@
   DB  0,248                               ; add           %bh,%al
   DB  0,248                               ; add           %bh,%al
   DB  0,248                               ; add           %bh,%al
-  DB  224,255                             ; loopne        d371 <.literal16+0x771>
-  DB  224,255                             ; loopne        d373 <.literal16+0x773>
-  DB  224,255                             ; loopne        d375 <.literal16+0x775>
-  DB  224,255                             ; loopne        d377 <.literal16+0x777>
-  DB  224,255                             ; loopne        d379 <.literal16+0x779>
-  DB  224,255                             ; loopne        d37b <.literal16+0x77b>
-  DB  224,255                             ; loopne        d37d <.literal16+0x77d>
-  DB  224,255                             ; loopne        d37f <.literal16+0x77f>
+  DB  224,255                             ; loopne        d401 <.literal16+0x771>
+  DB  224,255                             ; loopne        d403 <.literal16+0x773>
+  DB  224,255                             ; loopne        d405 <.literal16+0x775>
+  DB  224,255                             ; loopne        d407 <.literal16+0x777>
+  DB  224,255                             ; loopne        d409 <.literal16+0x779>
+  DB  224,255                             ; loopne        d40b <.literal16+0x77b>
+  DB  224,255                             ; loopne        d40d <.literal16+0x77d>
+  DB  224,255                             ; loopne        d40f <.literal16+0x77f>
   DB  54,0,54                             ; add           %dh,%ss:(%esi)
   DB  0,54                                ; add           %dh,(%esi)
   DB  0,54                                ; add           %dh,(%esi)
@@ -59398,6 +59555,6 @@
   DB  0,0                                 ; add           %al,(%eax)
   DB  0,63                                ; add           %bh,(%edi)
   DB  0,0                                 ; add           %al,(%eax)
-  DB  127,67                              ; jg            d3fb <_sk_srcover_rgba_8888_sse2_lowp+0xac3>
+  DB  127,67                              ; jg            d48b <_sk_srcover_rgba_8888_sse2_lowp+0xabf>
 ENDIF
 END
diff --git a/src/jumper/SkJumper_stages.cpp b/src/jumper/SkJumper_stages.cpp
index c5b4cd5..a690eb3 100644
--- a/src/jumper/SkJumper_stages.cpp
+++ b/src/jumper/SkJumper_stages.cpp
@@ -210,7 +210,14 @@
 
 // Used by gather_ stages to calculate the base pointer and a vector of indices to load.
 template <typename T>
-SI U32 ix_and_ptr(T** ptr, const SkJumper_MemoryCtx* ctx, F x, F y) {
+SI U32 ix_and_ptr(T** ptr, const SkJumper_GatherCtx* ctx, F x, F y) {
+    auto clamp = [](F v, F limit) {
+        limit = bit_cast<F>( bit_cast<U32>(limit) - 1 );  // Exclusive -> inclusive.
+        return min(max(0, v), limit);
+    };
+    x = clamp(x, ctx->width);
+    y = clamp(y, ctx->height);
+
     *ptr = (const T*)ctx->pixels;
     return trunc_(y)*ctx->stride + trunc_(x);
 }
@@ -1072,30 +1079,17 @@
     store4(ptr,tail, r,g,b,a);
 }
 
-SI F ulp_before(F f) {
-    U32 bits = -1 + unaligned_load<U32>(&f);
-    return unaligned_load<F>(&bits);
-}
-
-// We make sure to funnel all three tilers through exclusive_clamp() so that we're guaranteed
-// to be in [0,ctx->scale), even in the presence of bugs or floating point precision issues.
-SI F exclusive_clamp(F v, const SkJumper_TileCtx* ctx) {
-    v = max(0,v);
-    return min(v, ulp_before(ctx->scale));
-}
 SI F exclusive_repeat(F v, const SkJumper_TileCtx* ctx) {
-    v = v - floor_(v*ctx->invScale)*ctx->scale;
-    return exclusive_clamp(v, ctx);
+    return v - floor_(v*ctx->invScale)*ctx->scale;
 }
 SI F exclusive_mirror(F v, const SkJumper_TileCtx* ctx) {
     auto limit = ctx->scale;
     auto invLimit = ctx->invScale;
-    v = abs_( (v-limit) - (limit+limit)*floor_((v-limit)*(invLimit*0.5f)) - limit );
-    return exclusive_clamp(v, ctx);
+    return abs_( (v-limit) - (limit+limit)*floor_((v-limit)*(invLimit*0.5f)) - limit );
 }
-// Clamp x or y to [0,limit) == [0,limit - 1 ulp] (think, sampling from images).
-STAGE(clamp_x)  { r = exclusive_clamp (r, (const SkJumper_TileCtx*)ctx); }
-STAGE(clamp_y)  { g = exclusive_clamp (g, (const SkJumper_TileCtx*)ctx); }
+// Tile x or y to [0,limit) == [0,limit - 1 ulp] (think, sampling from images).
+// The gather stages will hard clamp the output of these stages to [0,limit)...
+// we just need to do the basic repeat or mirroring.
 STAGE(repeat_x) { r = exclusive_repeat(r, (const SkJumper_TileCtx*)ctx); }
 STAGE(repeat_y) { g = exclusive_repeat(g, (const SkJumper_TileCtx*)ctx); }
 STAGE(mirror_x) { r = exclusive_mirror(r, (const SkJumper_TileCtx*)ctx); }
diff --git a/src/shaders/SkImageShader.cpp b/src/shaders/SkImageShader.cpp
index ded75d4..29d0a11 100644
--- a/src/shaders/SkImageShader.cpp
+++ b/src/shaders/SkImageShader.cpp
@@ -324,9 +324,11 @@
     misc->paint_color = SkColor4f_from_SkColor(rec.fPaint.getColor(), rec.fDstCS);
     p->append_matrix(alloc, matrix);
 
-    auto gather = alloc->make<SkJumper_MemoryCtx>();
+    auto gather = alloc->make<SkJumper_GatherCtx>();
     gather->pixels = pm.writable_addr();  // Don't worry, we won't write to it.
     gather->stride = pm.rowBytesAsPixels();
+    gather->width  = pm.width();
+    gather->height = pm.height();
 
     auto limit_x = alloc->make<SkJumper_TileCtx>(),
          limit_y = alloc->make<SkJumper_TileCtx>();
@@ -337,12 +339,12 @@
 
     auto append_tiling_and_gather = [&] {
         switch (fTileModeX) {
-            case kClamp_TileMode:  p->append(SkRasterPipeline::clamp_x,  limit_x); break;
+            case kClamp_TileMode:  /* The gather_xxx stage will clamp for us. */   break;
             case kMirror_TileMode: p->append(SkRasterPipeline::mirror_x, limit_x); break;
             case kRepeat_TileMode: p->append(SkRasterPipeline::repeat_x, limit_x); break;
         }
         switch (fTileModeY) {
-            case kClamp_TileMode:  p->append(SkRasterPipeline::clamp_y,  limit_y); break;
+            case kClamp_TileMode:  /* The gather_xxx stage will clamp for us. */   break;
             case kMirror_TileMode: p->append(SkRasterPipeline::mirror_y, limit_y); break;
             case kRepeat_TileMode: p->append(SkRasterPipeline::repeat_y, limit_y); break;
         }
diff --git a/tests/SkRasterPipelineTest.cpp b/tests/SkRasterPipelineTest.cpp
index a3b2045..bab3d5b 100644
--- a/tests/SkRasterPipelineTest.cpp
+++ b/tests/SkRasterPipelineTest.cpp
@@ -262,37 +262,3 @@
     REPORTER_ASSERT(r, ((rgba[2] >> 8) & 0xff) == 128);
     REPORTER_ASSERT(r, ((rgba[3] >> 8) & 0xff) == 128);
 }
-
-DEF_TEST(SkRasterPipeline_repeat_tiling, r) {
-    // Repeat tiling works roughly like
-    //    v' = v - floor(v / limit) * limit
-    //
-    // If v = 19133558.0f and limit = 9.0f, that's
-    //
-    //    v' = 19133558.0f - floor(19133558.0f / 9.0f) * 9.0f
-    //
-    // The problem comes with that division term.  In infinite precision,
-    // that'd be 2125950 + 8/9, but the nearest float is 2125951.0f.
-    //
-    // Then 2125951.0f * 9.0f = 19133559.0f, which is greater than v,
-    // so v' becomes negative. :'(
-
-    // Here's a regression test to make sure this doesn't happen.
-    float  in[4 * SkJumper_kMaxStride];
-    float out[4 * SkJumper_kMaxStride];
-    for (float& f : in) {
-        f = 0;
-    }
-    in[0] = 19133558.0f;
-
-    SkJumper_TileCtx tile = { 9.0f, 1/9.0f };
-
-    SkSTArenaAlloc<256> alloc;
-    SkRasterPipeline p(&alloc);
-    p.append(SkRasterPipeline::load_rgba, in);
-    p.append(SkRasterPipeline::repeat_x, &tile);
-    p.append(SkRasterPipeline::store_rgba, out);
-    p.run(0,0,1,1);
-
-    REPORTER_ASSERT(r, 0.0f <= out[0] && out[0] < 9.0f);
-}