aboutsummaryrefslogtreecommitdiffhomepage
path: root/src/jumper
diff options
context:
space:
mode:
authorGravatar Mike Klein <mtklein@chromium.org>2017-08-28 13:58:01 -0400
committerGravatar Skia Commit-Bot <skia-commit-bot@chromium.org>2017-08-28 18:43:06 +0000
commit581e756653c95e0f77b9c85f2726249bd1726c21 (patch)
tree280e3ff36c149d3c8881888038de7cf31f3bb97f /src/jumper
parenta2090e7240c90510dde6296485815e132abeadf5 (diff)
-Fast bot fixes for AVX+ code
1) Replace a couple commas with semicolons. 2) Make sure to zero a couple vectors. 1) has no effect on code generation. 2) does add a bunch of self-vxorps, but they're cheap and we already do the equivalent for <AVX SSE code, and they're in not very performance-critical routines. We could circle back and guard these with !defined(JUMPER_IS_OFFLINE) if we really need the vectors to start uninitialized for speed. CQ_INCLUDE_TRYBOTS=skia.primary:Build-Debian9-Clang-x86_64-Release-Fast Change-Id: I1a13f3eb28d664dbc345d71c3adbc62be5ff7c45 Reviewed-on: https://skia-review.googlesource.com/39661 Reviewed-by: Mike Reed <reed@google.com> Commit-Queue: Mike Klein <mtklein@chromium.org>
Diffstat (limited to 'src/jumper')
-rw-r--r--src/jumper/SkJumper_generated.S6789
-rw-r--r--src/jumper/SkJumper_generated_win.S6798
-rw-r--r--src/jumper/SkJumper_vectors.h11
3 files changed, 7088 insertions, 6510 deletions
diff --git a/src/jumper/SkJumper_generated.S b/src/jumper/SkJumper_generated.S
index 57ae7847ec..eeb3a88d77 100644
--- a/src/jumper/SkJumper_generated.S
+++ b/src/jumper/SkJumper_generated.S
@@ -9353,7 +9353,7 @@ _sk_seed_shader_hsw:
.byte 197,249,110,194 // vmovd %edx,%xmm0
.byte 196,226,125,88,192 // vpbroadcastd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,42,179,2,0 // vbroadcastss 0x2b32a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,90,184,2,0 // vbroadcastss 0x2b85a(%rip),%ymm1 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -9361,7 +9361,7 @@ _sk_seed_shader_hsw:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,10,179,2,0 // vbroadcastss 0x2b30a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,21,58,184,2,0 // vbroadcastss 0x2b83a(%rip),%ymm2 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -9380,13 +9380,13 @@ _sk_dither_hsw:
.byte 197,121,110,201 // vmovd %ecx,%xmm9
.byte 196,66,125,88,201 // vpbroadcastd %xmm9,%ymm9
.byte 196,65,53,239,200 // vpxor %ymm8,%ymm9,%ymm9
- .byte 196,98,125,88,21,209,178,2,0 // vpbroadcastd 0x2b2d1(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,21,1,184,2,0 // vpbroadcastd 0x2b801(%rip),%ymm10 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,53,219,218 // vpand %ymm10,%ymm9,%ymm11
.byte 196,193,37,114,243,5 // vpslld $0x5,%ymm11,%ymm11
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,193,45,114,242,4 // vpslld $0x4,%ymm10,%ymm10
- .byte 196,98,125,88,37,182,178,2,0 // vpbroadcastd 0x2b2b6(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b>
- .byte 196,98,125,88,45,177,178,2,0 // vpbroadcastd 0x2b2b1(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,37,230,183,2,0 // vpbroadcastd 0x2b7e6(%rip),%ymm12 # 2b930 <_sk_overlay_sse2_8bit+0x44b>
+ .byte 196,98,125,88,45,225,183,2,0 // vpbroadcastd 0x2b7e1(%rip),%ymm13 # 2b934 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,65,53,219,245 // vpand %ymm13,%ymm9,%ymm14
.byte 196,193,13,114,246,2 // vpslld $0x2,%ymm14,%ymm14
.byte 196,65,61,219,237 // vpand %ymm13,%ymm8,%ymm13
@@ -9401,8 +9401,8 @@ _sk_dither_hsw:
.byte 196,65,61,235,194 // vpor %ymm10,%ymm8,%ymm8
.byte 196,65,61,235,193 // vpor %ymm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,99,178,2,0 // vbroadcastss 0x2b263(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453>
- .byte 196,98,125,24,21,94,178,2,0 // vbroadcastss 0x2b25e(%rip),%ymm10 # 2b40c <_sk_overlay_sse2_8bit+0x457>
+ .byte 196,98,125,24,13,147,183,2,0 // vbroadcastss 0x2b793(%rip),%ymm9 # 2b938 <_sk_overlay_sse2_8bit+0x453>
+ .byte 196,98,125,24,21,142,183,2,0 // vbroadcastss 0x2b78e(%rip),%ymm10 # 2b93c <_sk_overlay_sse2_8bit+0x457>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 196,98,125,24,0 // vbroadcastss (%rax),%ymm8
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
@@ -9436,7 +9436,7 @@ HIDDEN _sk_black_color_hsw
FUNCTION(_sk_black_color_hsw)
_sk_black_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,230,177,2,0 // vbroadcastss 0x2b1e6(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,22,183,2,0 // vbroadcastss 0x2b716(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -9447,7 +9447,7 @@ HIDDEN _sk_white_color_hsw
FUNCTION(_sk_white_color_hsw)
_sk_white_color_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,205,177,2,0 // vbroadcastss 0x2b1cd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,253,182,2,0 // vbroadcastss 0x2b6fd(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -9493,7 +9493,7 @@ HIDDEN _sk_srcatop_hsw
FUNCTION(_sk_srcatop_hsw)
_sk_srcatop_hsw:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,108,177,2,0 // vbroadcastss 0x2b16c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,156,182,2,0 // vbroadcastss 0x2b69c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,226,61,184,196 // vfmadd231ps %ymm4,%ymm8,%ymm0
.byte 197,244,89,207 // vmulps %ymm7,%ymm1,%ymm1
@@ -9509,7 +9509,7 @@ HIDDEN _sk_dstatop_hsw
.globl _sk_dstatop_hsw
FUNCTION(_sk_dstatop_hsw)
_sk_dstatop_hsw:
- .byte 196,98,125,24,5,59,177,2,0 // vbroadcastss 0x2b13b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,107,182,2,0 // vbroadcastss 0x2b66b(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,226,101,184,196 // vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -9548,7 +9548,7 @@ HIDDEN _sk_srcout_hsw
.globl _sk_srcout_hsw
FUNCTION(_sk_srcout_hsw)
_sk_srcout_hsw:
- .byte 196,98,125,24,5,222,176,2,0 // vbroadcastss 0x2b0de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,14,182,2,0 // vbroadcastss 0x2b60e(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -9561,7 +9561,7 @@ HIDDEN _sk_dstout_hsw
.globl _sk_dstout_hsw
FUNCTION(_sk_dstout_hsw)
_sk_dstout_hsw:
- .byte 196,226,125,24,5,189,176,2,0 // vbroadcastss 0x2b0bd(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,237,181,2,0 // vbroadcastss 0x2b5ed(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -9574,7 +9574,7 @@ HIDDEN _sk_srcover_hsw
.globl _sk_srcover_hsw
FUNCTION(_sk_srcover_hsw)
_sk_srcover_hsw:
- .byte 196,98,125,24,5,156,176,2,0 // vbroadcastss 0x2b09c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,204,181,2,0 // vbroadcastss 0x2b5cc(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,194,85,184,200 // vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -9587,7 +9587,7 @@ HIDDEN _sk_dstover_hsw
.globl _sk_dstover_hsw
FUNCTION(_sk_dstover_hsw)
_sk_dstover_hsw:
- .byte 196,98,125,24,5,119,176,2,0 // vbroadcastss 0x2b077(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,167,181,2,0 // vbroadcastss 0x2b5a7(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
.byte 196,226,61,168,205 // vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -9611,7 +9611,7 @@ HIDDEN _sk_multiply_hsw
.globl _sk_multiply_hsw
FUNCTION(_sk_multiply_hsw)
_sk_multiply_hsw:
- .byte 196,98,125,24,5,62,176,2,0 // vbroadcastss 0x2b03e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,110,181,2,0 // vbroadcastss 0x2b56e(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9634,7 +9634,7 @@ HIDDEN _sk_plus__hsw
FUNCTION(_sk_plus__hsw)
_sk_plus__hsw:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,5,237,175,2,0 // vbroadcastss 0x2afed(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,29,181,2,0 // vbroadcastss 0x2b51d(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
@@ -9664,7 +9664,7 @@ HIDDEN _sk_xor__hsw
.globl _sk_xor__hsw
FUNCTION(_sk_xor__hsw)
_sk_xor__hsw:
- .byte 196,98,125,24,5,152,175,2,0 // vbroadcastss 0x2af98(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,200,180,2,0 // vbroadcastss 0x2b4c8(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9698,7 +9698,7 @@ _sk_darken_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,28,175,2,0 // vbroadcastss 0x2af1c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,76,180,2,0 // vbroadcastss 0x2b44c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9723,7 +9723,7 @@ _sk_lighten_hsw:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,199,174,2,0 // vbroadcastss 0x2aec7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,247,179,2,0 // vbroadcastss 0x2b3f7(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9751,7 +9751,7 @@ _sk_difference_hsw:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,102,174,2,0 // vbroadcastss 0x2ae66(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,150,179,2,0 // vbroadcastss 0x2b396(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9773,7 +9773,7 @@ _sk_exclusion_hsw:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,32,174,2,0 // vbroadcastss 0x2ae20(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,80,179,2,0 // vbroadcastss 0x2b350(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 196,194,69,184,216 // vfmadd231ps %ymm8,%ymm7,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -9783,7 +9783,7 @@ HIDDEN _sk_colorburn_hsw
.globl _sk_colorburn_hsw
FUNCTION(_sk_colorburn_hsw)
_sk_colorburn_hsw:
- .byte 196,98,125,24,5,10,174,2,0 // vbroadcastss 0x2ae0a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,58,179,2,0 // vbroadcastss 0x2b33a(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -9841,7 +9841,7 @@ HIDDEN _sk_colordodge_hsw
FUNCTION(_sk_colordodge_hsw)
_sk_colordodge_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,26,173,2,0 // vbroadcastss 0x2ad1a(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,74,178,2,0 // vbroadcastss 0x2b24a(%rip),%ymm9 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -9894,7 +9894,7 @@ HIDDEN _sk_hardlight_hsw
.globl _sk_hardlight_hsw
FUNCTION(_sk_hardlight_hsw)
_sk_hardlight_hsw:
- .byte 196,98,125,24,5,52,172,2,0 // vbroadcastss 0x2ac34(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,100,177,2,0 // vbroadcastss 0x2b164(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -9945,7 +9945,7 @@ HIDDEN _sk_overlay_hsw
.globl _sk_overlay_hsw
FUNCTION(_sk_overlay_hsw)
_sk_overlay_hsw:
- .byte 196,98,125,24,5,104,171,2,0 // vbroadcastss 0x2ab68(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,176,2,0 // vbroadcastss 0x2b098(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -10006,10 +10006,10 @@ _sk_softlight_hsw:
.byte 196,65,20,88,197 // vaddps %ymm13,%ymm13,%ymm8
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,66,61,168,192 // vfmadd213ps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,29,131,170,2,0 // vbroadcastss 0x2aa83(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,29,179,175,2,0 // vbroadcastss 0x2afb3(%rip),%ymm11 # 2b940 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,65,20,88,227 // vaddps %ymm11,%ymm13,%ymm12
.byte 196,65,28,89,192 // vmulps %ymm8,%ymm12,%ymm8
- .byte 196,98,125,24,37,116,170,2,0 // vbroadcastss 0x2aa74(%rip),%ymm12 # 2b414 <_sk_overlay_sse2_8bit+0x45f>
+ .byte 196,98,125,24,37,164,175,2,0 // vbroadcastss 0x2afa4(%rip),%ymm12 # 2b944 <_sk_overlay_sse2_8bit+0x45f>
.byte 196,66,21,184,196 // vfmadd231ps %ymm12,%ymm13,%ymm8
.byte 196,65,124,82,245 // vrsqrtps %ymm13,%ymm14
.byte 196,65,124,83,246 // vrcpps %ymm14,%ymm14
@@ -10019,7 +10019,7 @@ _sk_softlight_hsw:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,35,170,2,0 // vbroadcastss 0x2aa23(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,83,175,2,0 // vbroadcastss 0x2af53(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,60,92,237 // vsubps %ymm13,%ymm8,%ymm13
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,98,125,168,235 // vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -10132,11 +10132,11 @@ _sk_hue_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,59,168,2,0 // vbroadcastss 0x2a83b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,61,54,168,2,0 // vbroadcastss 0x2a836(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,107,173,2,0 // vbroadcastss 0x2ad6b(%rip),%ymm14 # 2b948 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,61,102,173,2,0 // vbroadcastss 0x2ad66(%rip),%ymm15 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,39,168,2,0 // vbroadcastss 0x2a827(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,87,173,2,0 // vbroadcastss 0x2ad57(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10191,7 +10191,7 @@ _sk_hue_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,232,166,2,0 // vbroadcastss 0x2a6e8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,13,24,172,2,0 // vbroadcastss 0x2ac18(%rip),%ymm1 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10245,11 +10245,11 @@ _sk_saturation_hsw:
.byte 196,65,28,89,210 // vmulps %ymm10,%ymm12,%ymm10
.byte 196,65,44,94,214 // vdivps %ymm14,%ymm10,%ymm10
.byte 196,67,45,74,224,240 // vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- .byte 196,98,125,24,53,27,166,2,0 // vbroadcastss 0x2a61b(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,61,22,166,2,0 // vbroadcastss 0x2a616(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,75,171,2,0 // vbroadcastss 0x2ab4b(%rip),%ymm14 # 2b948 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,61,70,171,2,0 // vbroadcastss 0x2ab46(%rip),%ymm15 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,66,93,184,238 // vfmadd231ps %ymm14,%ymm4,%ymm13
- .byte 196,226,125,24,5,7,166,2,0 // vbroadcastss 0x2a607(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,55,171,2,0 // vbroadcastss 0x2ab37(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,98,77,184,232 // vfmadd231ps %ymm0,%ymm6,%ymm13
.byte 196,65,116,89,215 // vmulps %ymm15,%ymm1,%ymm10
.byte 196,66,53,184,214 // vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -10304,7 +10304,7 @@ _sk_saturation_hsw:
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
.byte 196,65,36,95,200 // vmaxps %ymm8,%ymm11,%ymm9
.byte 196,65,116,95,192 // vmaxps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,13,200,164,2,0 // vbroadcastss 0x2a4c8(%rip),%ymm1 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,13,248,169,2,0 // vbroadcastss 0x2a9f8(%rip),%ymm1 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,116,92,215 // vsubps %ymm7,%ymm1,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,116,92,219 // vsubps %ymm3,%ymm1,%ymm11
@@ -10332,11 +10332,11 @@ _sk_color_hsw:
.byte 197,108,89,199 // vmulps %ymm7,%ymm2,%ymm8
.byte 197,116,89,215 // vmulps %ymm7,%ymm1,%ymm10
.byte 197,52,89,223 // vmulps %ymm7,%ymm9,%ymm11
- .byte 196,98,125,24,45,125,164,2,0 // vbroadcastss 0x2a47d(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,53,120,164,2,0 // vbroadcastss 0x2a478(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,45,173,169,2,0 // vbroadcastss 0x2a9ad(%rip),%ymm13 # 2b948 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,168,169,2,0 // vbroadcastss 0x2a9a8(%rip),%ymm14 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,230 // vmulps %ymm14,%ymm5,%ymm12
.byte 196,66,93,184,229 // vfmadd231ps %ymm13,%ymm4,%ymm12
- .byte 196,98,125,24,61,105,164,2,0 // vbroadcastss 0x2a469(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,153,169,2,0 // vbroadcastss 0x2a999(%rip),%ymm15 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,66,77,184,231 // vfmadd231ps %ymm15,%ymm6,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10392,7 +10392,7 @@ _sk_color_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,31,163,2,0 // vbroadcastss 0x2a31f(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,79,168,2,0 // vbroadcastss 0x2a84f(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10420,11 +10420,11 @@ _sk_luminosity_hsw:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,213 // vmulps %ymm5,%ymm3,%ymm10
.byte 197,100,89,222 // vmulps %ymm6,%ymm3,%ymm11
- .byte 196,98,125,24,45,212,162,2,0 // vbroadcastss 0x2a2d4(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
- .byte 196,98,125,24,53,207,162,2,0 // vbroadcastss 0x2a2cf(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,45,4,168,2,0 // vbroadcastss 0x2a804(%rip),%ymm13 # 2b948 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,255,167,2,0 // vbroadcastss 0x2a7ff(%rip),%ymm14 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,116,89,230 // vmulps %ymm14,%ymm1,%ymm12
.byte 196,66,109,184,229 // vfmadd231ps %ymm13,%ymm2,%ymm12
- .byte 196,98,125,24,61,192,162,2,0 // vbroadcastss 0x2a2c0(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,240,167,2,0 // vbroadcastss 0x2a7f0(%rip),%ymm15 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,66,53,184,231 // vfmadd231ps %ymm15,%ymm9,%ymm12
.byte 196,65,44,89,206 // vmulps %ymm14,%ymm10,%ymm9
.byte 196,66,61,184,205 // vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -10480,7 +10480,7 @@ _sk_luminosity_hsw:
.byte 196,193,116,95,206 // vmaxps %ymm14,%ymm1,%ymm1
.byte 196,65,44,95,198 // vmaxps %ymm14,%ymm10,%ymm8
.byte 196,65,124,95,206 // vmaxps %ymm14,%ymm0,%ymm9
- .byte 196,226,125,24,5,118,161,2,0 // vbroadcastss 0x2a176(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,166,166,2,0 // vbroadcastss 0x2a6a6(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -10512,17 +10512,17 @@ _sk_srcover_rgba_8888_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 15,133,180,0,0,0 // jne 1399 <_sk_srcover_rgba_8888_hsw+0xd5>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,173,162,2,0 // vpand 0x2a2ad(%rip),%ymm7,%ymm4 # 2b5a0 <_sk_overlay_sse2_8bit+0x5eb>
+ .byte 197,197,219,37,237,167,2,0 // vpand 0x2a7ed(%rip),%ymm7,%ymm4 # 2bae0 <_sk_overlay_sse2_8bit+0x5fb>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,69,0,45,192,162,2,0 // vpshufb 0x2a2c0(%rip),%ymm7,%ymm5 # 2b5c0 <_sk_overlay_sse2_8bit+0x60b>
+ .byte 196,226,69,0,45,0,168,2,0 // vpshufb 0x2a800(%rip),%ymm7,%ymm5 # 2bb00 <_sk_overlay_sse2_8bit+0x61b>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,69,0,53,211,162,2,0 // vpshufb 0x2a2d3(%rip),%ymm7,%ymm6 # 2b5e0 <_sk_overlay_sse2_8bit+0x62b>
+ .byte 196,226,69,0,53,19,168,2,0 // vpshufb 0x2a813(%rip),%ymm7,%ymm6 # 2bb20 <_sk_overlay_sse2_8bit+0x63b>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,213,160,2,0 // vbroadcastss 0x2a0d5(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,5,166,2,0 // vbroadcastss 0x2a605(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,244,160,2,0 // vbroadcastss 0x2a0f4(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,13,36,166,2,0 // vbroadcastss 0x2a624(%rip),%ymm9 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,93,184,192 // vfmadd231ps %ymm8,%ymm4,%ymm0
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -10651,7 +10651,7 @@ HIDDEN _sk_clamp_1_hsw
.globl _sk_clamp_1_hsw
FUNCTION(_sk_clamp_1_hsw)
_sk_clamp_1_hsw:
- .byte 196,98,125,24,5,222,158,2,0 // vbroadcastss 0x29ede(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,14,164,2,0 // vbroadcastss 0x2a40e(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -10663,7 +10663,7 @@ HIDDEN _sk_clamp_a_hsw
.globl _sk_clamp_a_hsw
FUNCTION(_sk_clamp_a_hsw)
_sk_clamp_a_hsw:
- .byte 196,98,125,24,5,189,158,2,0 // vbroadcastss 0x29ebd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,237,163,2,0 // vbroadcastss 0x2a3ed(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -10675,7 +10675,7 @@ HIDDEN _sk_clamp_a_dst_hsw
.globl _sk_clamp_a_dst_hsw
FUNCTION(_sk_clamp_a_dst_hsw)
_sk_clamp_a_dst_hsw:
- .byte 196,98,125,24,5,159,158,2,0 // vbroadcastss 0x29e9f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,207,163,2,0 // vbroadcastss 0x2a3cf(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -10708,7 +10708,7 @@ HIDDEN _sk_invert_hsw
.globl _sk_invert_hsw
FUNCTION(_sk_invert_hsw)
_sk_invert_hsw:
- .byte 196,98,125,24,5,90,158,2,0 // vbroadcastss 0x29e5a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,138,163,2,0 // vbroadcastss 0x2a38a(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -10764,7 +10764,7 @@ FUNCTION(_sk_unpremul_hsw)
_sk_unpremul_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,234,157,2,0 // vbroadcastss 0x29dea(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,26,163,2,0 // vbroadcastss 0x2a31a(%rip),%ymm10 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -10777,16 +10777,16 @@ HIDDEN _sk_from_srgb_hsw
.globl _sk_from_srgb_hsw
FUNCTION(_sk_from_srgb_hsw)
_sk_from_srgb_hsw:
- .byte 196,98,125,24,5,247,157,2,0 // vbroadcastss 0x29df7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,39,163,2,0 // vbroadcastss 0x2a327(%rip),%ymm8 # 2b958 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,233,157,2,0 // vbroadcastss 0x29de9(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477>
- .byte 196,98,125,24,37,204,157,2,0 // vbroadcastss 0x29dcc(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,25,163,2,0 // vbroadcastss 0x2a319(%rip),%ymm11 # 2b95c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,37,252,162,2,0 // vbroadcastss 0x2a2fc(%rip),%ymm12 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,125,168,235 // vfmadd213ps %ymm11,%ymm0,%ymm13
- .byte 196,98,125,24,53,209,157,2,0 // vbroadcastss 0x29dd1(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,53,1,163,2,0 // vbroadcastss 0x2a301(%rip),%ymm14 # 2b960 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,199,157,2,0 // vbroadcastss 0x29dc7(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,21,247,162,2,0 // vbroadcastss 0x2a2f7(%rip),%ymm10 # 2b964 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,124,194,194,1 // vcmpltps %ymm10,%ymm0,%ymm0
.byte 196,195,21,74,193,0 // vblendvps %ymm0,%ymm9,%ymm13,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -10809,16 +10809,16 @@ HIDDEN _sk_from_srgb_dst_hsw
.globl _sk_from_srgb_dst_hsw
FUNCTION(_sk_from_srgb_dst_hsw)
_sk_from_srgb_dst_hsw:
- .byte 196,98,125,24,5,95,157,2,0 // vbroadcastss 0x29d5f(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,143,162,2,0 // vbroadcastss 0x2a28f(%rip),%ymm8 # 2b958 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,81,157,2,0 // vbroadcastss 0x29d51(%rip),%ymm11 # 2b42c <_sk_overlay_sse2_8bit+0x477>
- .byte 196,98,125,24,37,52,157,2,0 // vbroadcastss 0x29d34(%rip),%ymm12 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,129,162,2,0 // vbroadcastss 0x2a281(%rip),%ymm11 # 2b95c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,37,100,162,2,0 // vbroadcastss 0x2a264(%rip),%ymm12 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,93,168,235 // vfmadd213ps %ymm11,%ymm4,%ymm13
- .byte 196,98,125,24,53,57,157,2,0 // vbroadcastss 0x29d39(%rip),%ymm14 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,53,105,162,2,0 // vbroadcastss 0x2a269(%rip),%ymm14 # 2b960 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,66,45,168,238 // vfmadd213ps %ymm14,%ymm10,%ymm13
- .byte 196,98,125,24,21,47,157,2,0 // vbroadcastss 0x29d2f(%rip),%ymm10 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,21,95,162,2,0 // vbroadcastss 0x2a25f(%rip),%ymm10 # 2b964 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,92,194,226,1 // vcmpltps %ymm10,%ymm4,%ymm4
.byte 196,195,21,74,225,64 // vblendvps %ymm4,%ymm9,%ymm13,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -10842,19 +10842,19 @@ HIDDEN _sk_to_srgb_hsw
FUNCTION(_sk_to_srgb_hsw)
_sk_to_srgb_hsw:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,211,156,2,0 // vbroadcastss 0x29cd3(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483>
+ .byte 196,98,125,24,5,3,162,2,0 // vbroadcastss 0x2a203(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x483>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,201,156,2,0 // vbroadcastss 0x29cc9(%rip),%ymm11 # 2b43c <_sk_overlay_sse2_8bit+0x487>
- .byte 196,98,125,24,37,196,156,2,0 // vbroadcastss 0x29cc4(%rip),%ymm12 # 2b440 <_sk_overlay_sse2_8bit+0x48b>
+ .byte 196,98,125,24,29,249,161,2,0 // vbroadcastss 0x2a1f9(%rip),%ymm11 # 2b96c <_sk_overlay_sse2_8bit+0x487>
+ .byte 196,98,125,24,37,244,161,2,0 // vbroadcastss 0x2a1f4(%rip),%ymm12 # 2b970 <_sk_overlay_sse2_8bit+0x48b>
.byte 196,65,124,40,236 // vmovaps %ymm12,%ymm13
.byte 196,66,53,168,235 // vfmadd213ps %ymm11,%ymm9,%ymm13
- .byte 196,98,125,24,53,181,156,2,0 // vbroadcastss 0x29cb5(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f>
+ .byte 196,98,125,24,53,229,161,2,0 // vbroadcastss 0x2a1e5(%rip),%ymm14 # 2b974 <_sk_overlay_sse2_8bit+0x48f>
.byte 196,66,53,168,238 // vfmadd213ps %ymm14,%ymm9,%ymm13
- .byte 196,98,125,24,61,171,156,2,0 // vbroadcastss 0x29cab(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493>
+ .byte 196,98,125,24,61,219,161,2,0 // vbroadcastss 0x2a1db(%rip),%ymm15 # 2b978 <_sk_overlay_sse2_8bit+0x493>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,20,89,201 // vmulps %ymm9,%ymm13,%ymm9
- .byte 196,98,125,24,45,151,156,2,0 // vbroadcastss 0x29c97(%rip),%ymm13 # 2b44c <_sk_overlay_sse2_8bit+0x497>
+ .byte 196,98,125,24,45,199,161,2,0 // vbroadcastss 0x2a1c7(%rip),%ymm13 # 2b97c <_sk_overlay_sse2_8bit+0x497>
.byte 196,193,124,194,197,1 // vcmpltps %ymm13,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -10888,26 +10888,26 @@ _sk_rgb_to_hsl_hsw:
.byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
.byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,178,155,2,0 // vbroadcastss 0x29bb2(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,29,226,160,2,0 // vbroadcastss 0x2a0e2(%rip),%ymm11 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 197,116,194,234,1 // vcmpltps %ymm2,%ymm1,%ymm13
- .byte 196,98,125,24,53,243,155,2,0 // vbroadcastss 0x29bf3(%rip),%ymm14 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,53,35,161,2,0 // vbroadcastss 0x2a123(%rip),%ymm14 # 2b980 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,65,4,87,255 // vxorps %ymm15,%ymm15,%ymm15
.byte 196,67,5,74,238,208 // vblendvps %ymm13,%ymm14,%ymm15,%ymm13
.byte 196,66,37,168,229 // vfmadd213ps %ymm13,%ymm11,%ymm12
.byte 197,236,92,208 // vsubps %ymm0,%ymm2,%ymm2
.byte 197,124,92,233 // vsubps %ymm1,%ymm0,%ymm13
- .byte 196,98,125,24,53,218,155,2,0 // vbroadcastss 0x29bda(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,53,10,161,2,0 // vbroadcastss 0x2a10a(%rip),%ymm14 # 2b988 <_sk_overlay_sse2_8bit+0x4a3>
.byte 196,66,37,168,238 // vfmadd213ps %ymm14,%ymm11,%ymm13
- .byte 196,98,125,24,53,200,155,2,0 // vbroadcastss 0x29bc8(%rip),%ymm14 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,53,248,160,2,0 // vbroadcastss 0x2a0f8(%rip),%ymm14 # 2b984 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,194,37,168,214 // vfmadd213ps %ymm14,%ymm11,%ymm2
.byte 197,188,194,201,0 // vcmpeqps %ymm1,%ymm8,%ymm1
.byte 196,227,21,74,202,16 // vblendvps %ymm1,%ymm2,%ymm13,%ymm1
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,195,117,74,196,0 // vblendvps %ymm0,%ymm12,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,29,63,155,2,0 // vbroadcastss 0x29b3f(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,111,160,2,0 // vbroadcastss 0x2a06f(%rip),%ymm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,89,211 // vmulps %ymm11,%ymm1,%ymm2
.byte 197,36,194,218,1 // vcmpltps %ymm2,%ymm11,%ymm11
.byte 196,65,12,92,224 // vsubps %ymm8,%ymm14,%ymm12
@@ -10917,7 +10917,7 @@ _sk_rgb_to_hsl_hsw:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,199,128 // vblendvps %ymm8,%ymm15,%ymm0,%ymm0
.byte 196,195,117,74,207,128 // vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- .byte 196,98,125,24,5,110,155,2,0 // vbroadcastss 0x29b6e(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,5,158,160,2,0 // vbroadcastss 0x2a09e(%rip),%ymm8 # 2b98c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -10934,30 +10934,30 @@ _sk_hsl_to_rgb_hsw:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 197,252,40,224 // vmovaps %ymm0,%ymm4
- .byte 196,98,125,24,5,203,154,2,0 // vbroadcastss 0x29acb(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,251,159,2,0 // vbroadcastss 0x29ffb(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,84,89,210 // vmulps %ymm2,%ymm5,%ymm10
.byte 196,65,84,92,218 // vsubps %ymm10,%ymm5,%ymm11
.byte 196,67,45,74,203,144 // vblendvps %ymm9,%ymm11,%ymm10,%ymm9
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
- .byte 196,98,125,24,13,10,155,2,0 // vbroadcastss 0x29b0a(%rip),%ymm9 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,13,58,160,2,0 // vbroadcastss 0x2a03a(%rip),%ymm9 # 2b984 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,66,109,170,202 // vfmsub213ps %ymm10,%ymm2,%ymm9
- .byte 196,98,125,24,29,8,155,2,0 // vbroadcastss 0x29b08(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab>
+ .byte 196,98,125,24,29,56,160,2,0 // vbroadcastss 0x2a038(%rip),%ymm11 # 2b990 <_sk_overlay_sse2_8bit+0x4ab>
.byte 196,65,92,88,219 // vaddps %ymm11,%ymm4,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,45,218,154,2,0 // vbroadcastss 0x29ada(%rip),%ymm13 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,45,10,160,2,0 // vbroadcastss 0x2a00a(%rip),%ymm13 # 2b980 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,193,4,89,197 // vmulps %ymm13,%ymm15,%ymm0
- .byte 196,98,125,24,53,212,154,2,0 // vbroadcastss 0x29ad4(%rip),%ymm14 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,53,4,160,2,0 // vbroadcastss 0x2a004(%rip),%ymm14 # 2b988 <_sk_overlay_sse2_8bit+0x4a3>
.byte 197,12,92,224 // vsubps %ymm0,%ymm14,%ymm12
.byte 196,66,37,168,225 // vfmadd213ps %ymm9,%ymm11,%ymm12
- .byte 196,226,125,24,29,206,154,2,0 // vbroadcastss 0x29ace(%rip),%ymm3 # 2b464 <_sk_overlay_sse2_8bit+0x4af>
+ .byte 196,226,125,24,29,254,159,2,0 // vbroadcastss 0x29ffe(%rip),%ymm3 # 2b994 <_sk_overlay_sse2_8bit+0x4af>
.byte 196,193,100,194,255,2 // vcmpleps %ymm15,%ymm3,%ymm7
.byte 196,195,29,74,249,112 // vblendvps %ymm7,%ymm9,%ymm12,%ymm7
.byte 196,65,60,194,231,2 // vcmpleps %ymm15,%ymm8,%ymm12
.byte 196,227,45,74,255,192 // vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,37,165,154,2,0 // vbroadcastss 0x29aa5(%rip),%ymm12 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,37,213,159,2,0 // vbroadcastss 0x29fd5(%rip),%ymm12 # 2b98c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,65,28,194,255,2 // vcmpleps %ymm15,%ymm12,%ymm15
.byte 196,194,37,168,193 // vfmadd213ps %ymm9,%ymm11,%ymm0
.byte 196,99,125,74,255,240 // vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -10973,7 +10973,7 @@ _sk_hsl_to_rgb_hsw:
.byte 197,156,194,192,2 // vcmpleps %ymm0,%ymm12,%ymm0
.byte 196,194,37,168,249 // vfmadd213ps %ymm9,%ymm11,%ymm7
.byte 196,227,69,74,201,0 // vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- .byte 196,226,125,24,5,89,154,2,0 // vbroadcastss 0x29a59(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,226,125,24,5,137,159,2,0 // vbroadcastss 0x29f89(%rip),%ymm0 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
.byte 197,220,88,192 // vaddps %ymm0,%ymm4,%ymm0
.byte 196,227,125,8,224,1 // vroundps $0x1,%ymm0,%ymm4
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
@@ -11028,10 +11028,10 @@ _sk_scale_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,59 // jne 1b00 <_sk_scale_u8_hsw+0x54>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,189,162,2,0 // vpand 0x2a2bd(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,57,219,5,253,167,2,0 // vpand 0x2a7fd(%rip),%xmm8,%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,134,153,2,0 // vbroadcastss 0x29986(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,182,158,2,0 // vbroadcastss 0x29eb6(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -11110,20 +11110,20 @@ _sk_scale_565_hsw:
.byte 15,133,162,0,0,0 // jne 1c7a <_sk_scale_565_hsw+0xc2>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,132,152,2,0 // vpbroadcastd 0x29884(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,88,13,180,157,2,0 // vpbroadcastd 0x29db4(%rip),%ymm9 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,117,152,2,0 // vbroadcastss 0x29875(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,165,157,2,0 // vbroadcastss 0x29da5(%rip),%ymm10 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,107,152,2,0 // vpbroadcastd 0x2986b(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,88,21,155,157,2,0 // vpbroadcastd 0x29d9b(%rip),%ymm10 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,92,152,2,0 // vbroadcastss 0x2985c(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,140,157,2,0 // vbroadcastss 0x29d8c(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,82,152,2,0 // vpbroadcastd 0x29852(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,88,29,130,157,2,0 // vpbroadcastd 0x29d82(%rip),%ymm11 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,67,152,2,0 // vbroadcastss 0x29843(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,115,157,2,0 // vbroadcastss 0x29d73(%rip),%ymm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -11214,10 +11214,10 @@ _sk_lerp_u8_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,79 // jne 1db7 <_sk_lerp_u8_hsw+0x68>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,26,160,2,0 // vpand 0x2a01a(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,57,219,5,90,165,2,0 // vpand 0x2a55a(%rip),%xmm8,%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,227,150,2,0 // vbroadcastss 0x296e3(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,19,156,2,0 // vbroadcastss 0x29c13(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,226,61,168,196 // vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -11300,20 +11300,20 @@ _sk_lerp_565_hsw:
.byte 15,133,182,0,0,0 // jne 1f42 <_sk_lerp_565_hsw+0xd6>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,66,125,51,192 // vpmovzxwd %xmm8,%ymm8
- .byte 196,98,125,88,13,208,149,2,0 // vpbroadcastd 0x295d0(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,88,13,0,155,2,0 // vpbroadcastd 0x29b00(%rip),%ymm9 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,61,219,201 // vpand %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,193,149,2,0 // vbroadcastss 0x295c1(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,241,154,2,0 // vbroadcastss 0x29af1(%rip),%ymm10 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,88,21,183,149,2,0 // vpbroadcastd 0x295b7(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,88,21,231,154,2,0 // vpbroadcastd 0x29ae7(%rip),%ymm10 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,61,219,210 // vpand %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,168,149,2,0 // vbroadcastss 0x295a8(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,216,154,2,0 // vbroadcastss 0x29ad8(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,88,29,158,149,2,0 // vpbroadcastd 0x2959e(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,88,29,206,154,2,0 // vpbroadcastd 0x29ace(%rip),%ymm11 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,61,219,195 // vpand %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,143,149,2,0 // vbroadcastss 0x2958f(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,191,154,2,0 // vbroadcastss 0x29abf(%rip),%ymm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -11386,21 +11386,21 @@ _sk_load_tables_hsw:
.byte 77,133,192 // test %r8,%r8
.byte 117,103 // jne 2059 <_sk_load_tables_hsw+0x71>
.byte 196,193,126,111,28,145 // vmovdqu (%r9,%rdx,4),%ymm3
- .byte 197,229,219,13,0,150,2,0 // vpand 0x29600(%rip),%ymm3,%ymm1 # 2b600 <_sk_overlay_sse2_8bit+0x64b>
+ .byte 197,229,219,13,64,155,2,0 // vpand 0x29b40(%rip),%ymm3,%ymm1 # 2bb40 <_sk_overlay_sse2_8bit+0x65b>
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 76,139,80,16 // mov 0x10(%rax),%r10
.byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
.byte 196,194,109,146,4,137 // vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
- .byte 196,226,101,0,21,0,150,2,0 // vpshufb 0x29600(%rip),%ymm3,%ymm2 # 2b620 <_sk_overlay_sse2_8bit+0x66b>
+ .byte 196,226,101,0,21,64,155,2,0 // vpshufb 0x29b40(%rip),%ymm3,%ymm2 # 2bb60 <_sk_overlay_sse2_8bit+0x67b>
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,194,53,146,12,146 // vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
- .byte 196,98,101,0,13,8,150,2,0 // vpshufb 0x29608(%rip),%ymm3,%ymm9 # 2b640 <_sk_overlay_sse2_8bit+0x68b>
+ .byte 196,98,101,0,13,72,155,2,0 // vpshufb 0x29b48(%rip),%ymm3,%ymm9 # 2bb80 <_sk_overlay_sse2_8bit+0x69b>
.byte 196,162,61,146,20,136 // vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,28,148,2,0 // vbroadcastss 0x2941c(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,76,153,2,0 // vbroadcastss 0x2994c(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11482,7 +11482,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,108,200 // vpunpcklqdq %xmm0,%xmm8,%xmm1
.byte 197,185,109,208 // vpunpckhqdq %xmm0,%xmm8,%xmm2
.byte 197,49,108,195 // vpunpcklqdq %xmm3,%xmm9,%xmm8
- .byte 197,121,111,21,9,156,2,0 // vmovdqa 0x29c09(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,121,111,21,73,161,2,0 // vmovdqa 0x2a149(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,193,113,219,194 // vpand %xmm10,%xmm1,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -11504,7 +11504,7 @@ _sk_load_tables_u16_be_hsw:
.byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
.byte 196,226,125,51,219 // vpmovzxwd %xmm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,146,146,2,0 // vbroadcastss 0x29292(%rip),%ymm8 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,5,194,151,2,0 // vbroadcastss 0x297c2(%rip),%ymm8 # 2b9b8 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -11544,85 +11544,113 @@ _sk_load_tables_rgb_u16_be_hsw:
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
.byte 15,133,193,0,0,0 // jne 234e <_sk_load_tables_rgb_u16_be_hsw+0xd3>
- .byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
- .byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
- .byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
- .byte 196,129,122,111,92,81,32 // vmovdqu 0x20(%r9,%r10,2),%xmm3
- .byte 197,225,115,219,4 // vpsrldq $0x4,%xmm3,%xmm3
- .byte 197,185,115,216,6 // vpsrldq $0x6,%xmm0,%xmm8
- .byte 197,177,115,218,6 // vpsrldq $0x6,%xmm2,%xmm9
- .byte 197,161,115,217,6 // vpsrldq $0x6,%xmm1,%xmm11
+ .byte 196,1,122,111,28,81 // vmovdqu (%r9,%r10,2),%xmm11
+ .byte 196,129,122,111,92,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm3
+ .byte 196,129,122,111,84,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm2
+ .byte 196,129,122,111,68,81,32 // vmovdqu 0x20(%r9,%r10,2),%xmm0
+ .byte 197,249,115,216,4 // vpsrldq $0x4,%xmm0,%xmm0
+ .byte 196,193,57,115,219,6 // vpsrldq $0x6,%xmm11,%xmm8
.byte 197,169,115,219,6 // vpsrldq $0x6,%xmm3,%xmm10
- .byte 197,249,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm0
- .byte 196,193,57,97,209 // vpunpcklwd %xmm9,%xmm8,%xmm2
- .byte 197,241,97,203 // vpunpcklwd %xmm3,%xmm1,%xmm1
- .byte 196,193,33,97,218 // vpunpcklwd %xmm10,%xmm11,%xmm3
- .byte 197,121,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm8
+ .byte 197,153,115,218,6 // vpsrldq $0x6,%xmm2,%xmm12
+ .byte 197,177,115,216,6 // vpsrldq $0x6,%xmm0,%xmm9
+ .byte 197,161,97,219 // vpunpcklwd %xmm3,%xmm11,%xmm3
+ .byte 196,193,57,97,202 // vpunpcklwd %xmm10,%xmm8,%xmm1
+ .byte 197,233,97,192 // vpunpcklwd %xmm0,%xmm2,%xmm0
+ .byte 196,193,25,97,209 // vpunpcklwd %xmm9,%xmm12,%xmm2
+ .byte 197,97,97,193 // vpunpcklwd %xmm1,%xmm3,%xmm8
+ .byte 197,225,105,201 // vpunpckhwd %xmm1,%xmm3,%xmm1
+ .byte 197,249,97,218 // vpunpcklwd %xmm2,%xmm0,%xmm3
.byte 197,249,105,194 // vpunpckhwd %xmm2,%xmm0,%xmm0
- .byte 197,241,97,211 // vpunpcklwd %xmm3,%xmm1,%xmm2
- .byte 197,241,105,203 // vpunpckhwd %xmm3,%xmm1,%xmm1
- .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
- .byte 197,185,109,210 // vpunpckhqdq %xmm2,%xmm8,%xmm2
- .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,153,154,2,0 // vmovdqa 0x29a99(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
- .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
+ .byte 197,185,108,211 // vpunpcklqdq %xmm3,%xmm8,%xmm2
+ .byte 197,185,109,219 // vpunpckhqdq %xmm3,%xmm8,%xmm3
+ .byte 197,113,108,192 // vpunpcklqdq %xmm0,%xmm1,%xmm8
+ .byte 197,121,111,13,216,159,2,0 // vmovdqa 0x29fd8(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
+ .byte 196,193,105,219,193 // vpand %xmm9,%xmm2,%xmm0
.byte 196,226,125,51,200 // vpmovzxwd %xmm0,%ymm1
- .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 76,139,80,16 // mov 0x10(%rax),%r10
- .byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
- .byte 196,194,45,146,4,137 // vgatherdps %ymm10,(%r9,%ymm1,4),%ymm0
- .byte 196,193,105,219,201 // vpand %xmm9,%xmm2,%xmm1
+ .byte 197,237,118,210 // vpcmpeqd %ymm2,%ymm2,%ymm2
+ .byte 196,194,109,146,4,137 // vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
+ .byte 196,193,97,219,201 // vpand %xmm9,%xmm3,%xmm1
.byte 196,226,125,51,209 // vpmovzxwd %xmm1,%ymm2
- .byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
- .byte 196,194,45,146,12,146 // vgatherdps %ymm10,(%r10,%ymm2,4),%ymm1
+ .byte 197,229,118,219 // vpcmpeqd %ymm3,%ymm3,%ymm3
+ .byte 196,194,101,146,12,146 // vgatherdps %ymm3,(%r10,%ymm2,4),%ymm1
.byte 72,139,64,24 // mov 0x18(%rax),%rax
.byte 196,193,57,219,209 // vpand %xmm9,%xmm8,%xmm2
- .byte 196,98,125,51,194 // vpmovzxwd %xmm2,%ymm8
- .byte 196,162,101,146,20,128 // vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
+ .byte 196,226,125,51,218 // vpmovzxwd %xmm2,%ymm3
+ .byte 196,226,45,146,20,152 // vgatherdps %ymm10,(%rax,%ymm3,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,172,144,2,0 // vbroadcastss 0x290ac(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,220,149,2,0 // vbroadcastss 0x295dc(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
- .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
+ .byte 196,1,121,196,92,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm11
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 2367 <_sk_load_tables_rgb_u16_be_hsw+0xec>
- .byte 233,90,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
- .byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
+ .byte 117,32 // jne 2387 <_sk_load_tables_rgb_u16_be_hsw+0x10c>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 233,59,255,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 196,129,121,110,68,81,6 // vmovd 0x6(%r9,%r10,2),%xmm0
+ .byte 196,1,121,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm0,%xmm8
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 2396 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
- .byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
- .byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
+ .byte 114,49 // jb 23d2 <_sk_load_tables_rgb_u16_be_hsw+0x157>
+ .byte 196,129,121,110,68,81,12 // vmovd 0xc(%r9,%r10,2),%xmm0
+ .byte 196,129,121,196,92,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm0,%xmm3
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 239b <_sk_load_tables_rgb_u16_be_hsw+0x120>
- .byte 233,43,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,38,255,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
- .byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
+ .byte 117,50 // jne 23ed <_sk_load_tables_rgb_u16_be_hsw+0x172>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 233,240,254,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 233,213,254,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 196,129,121,110,68,81,18 // vmovd 0x12(%r9,%r10,2),%xmm0
+ .byte 196,1,121,196,84,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm0,%xmm10
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 23ca <_sk_load_tables_rgb_u16_be_hsw+0x14f>
- .byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
- .byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
+ .byte 114,40 // jb 242f <_sk_load_tables_rgb_u16_be_hsw+0x1b4>
+ .byte 196,129,121,110,68,81,24 // vmovd 0x18(%r9,%r10,2),%xmm0
+ .byte 196,129,121,196,84,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm0,%xmm2
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 23cf <_sk_load_tables_rgb_u16_be_hsw+0x154>
- .byte 233,247,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,242,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
- .byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
+ .byte 117,32 // jne 2441 <_sk_load_tables_rgb_u16_be_hsw+0x1c6>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 233,147,254,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 233,129,254,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 196,129,121,110,68,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm0
+ .byte 196,1,121,196,100,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm0,%xmm12
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 23f8 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
- .byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
- .byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,201,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
- .byte 233,196,254,255,255 // jmpq 22c1 <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ .byte 114,25 // jb 2474 <_sk_load_tables_rgb_u16_be_hsw+0x1f9>
+ .byte 196,129,121,110,68,81,36 // vmovd 0x24(%r9,%r10,2),%xmm0
+ .byte 196,129,121,196,68,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm0,%xmm0
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
+ .byte 233,78,254,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 233,69,254,255,255 // jmpq 22c2 <_sk_load_tables_rgb_u16_be_hsw+0x47>
HIDDEN _sk_byte_tables_hsw
.globl _sk_byte_tables_hsw
FUNCTION(_sk_byte_tables_hsw)
_sk_byte_tables_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,28,144,2,0 // vbroadcastss 0x2901c(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,204,148,2,0 // vbroadcastss 0x294cc(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -11744,7 +11772,7 @@ _sk_byte_tables_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,5,142,2,0 // vbroadcastss 0x28e05(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,181,146,2,0 // vbroadcastss 0x292b5(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -11860,7 +11888,7 @@ _sk_byte_tables_rgb_hsw:
.byte 67,15,182,4,26 // movzbl (%r10,%r11,1),%eax
.byte 196,194,125,49,193 // vpmovzxbd %xmm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,237,139,2,0 // vbroadcastss 0x28bed(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,157,144,2,0 // vbroadcastss 0x2909d(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
@@ -11959,33 +11987,33 @@ _sk_parametric_r_hsw:
.byte 196,66,125,168,211 // vfmadd213ps %ymm11,%ymm0,%ymm10
.byte 196,226,125,24,0 // vbroadcastss (%rax),%ymm0
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,227,138,2,0 // vbroadcastss 0x28ae3(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,222,138,2,0 // vbroadcastss 0x28ade(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,147,143,2,0 // vbroadcastss 0x28f93(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,142,143,2,0 // vbroadcastss 0x28f8e(%rip),%ymm13 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,52,138,2,0 // vbroadcastss 0x28a34(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,228,142,2,0 // vbroadcastss 0x28ee4(%rip),%ymm13 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,198,138,2,0 // vbroadcastss 0x28ac6(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,118,143,2,0 // vbroadcastss 0x28f76(%rip),%ymm13 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,188,138,2,0 // vbroadcastss 0x28abc(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,108,143,2,0 // vbroadcastss 0x28f6c(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,178,138,2,0 // vbroadcastss 0x28ab2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,98,143,2,0 // vbroadcastss 0x28f62(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,168,138,2,0 // vbroadcastss 0x28aa8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,88,143,2,0 // vbroadcastss 0x28f58(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,137,138,2,0 // vbroadcastss 0x28a89(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,57,143,2,0 // vbroadcastss 0x28f39(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,127,138,2,0 // vbroadcastss 0x28a7f(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,47,143,2,0 // vbroadcastss 0x28f2f(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,216 // vfnmadd213ps %ymm0,%ymm10,%ymm11
- .byte 196,226,125,24,5,117,138,2,0 // vbroadcastss 0x28a75(%rip),%ymm0 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,5,37,143,2,0 // vbroadcastss 0x28f25(%rip),%ymm0 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,124,92,194 // vsubps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,107,138,2,0 // vbroadcastss 0x28a6b(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,27,143,2,0 // vbroadcastss 0x28f1b(%rip),%ymm10 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,192 // vdivps %ymm0,%ymm10,%ymm0
.byte 197,164,88,192 // vaddps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,21,94,138,2,0 // vbroadcastss 0x28a5e(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,14,143,2,0 // vbroadcastss 0x28f0e(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -11993,7 +12021,7 @@ _sk_parametric_r_hsw:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,117,137,2,0 // vbroadcastss 0x28975(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,37,142,2,0 // vbroadcastss 0x28e25(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12013,33 +12041,33 @@ _sk_parametric_g_hsw:
.byte 196,66,117,168,211 // vfmadd213ps %ymm11,%ymm1,%ymm10
.byte 196,226,125,24,8 // vbroadcastss (%rax),%ymm1
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,189,137,2,0 // vbroadcastss 0x289bd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,184,137,2,0 // vbroadcastss 0x289b8(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,109,142,2,0 // vbroadcastss 0x28e6d(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,104,142,2,0 // vbroadcastss 0x28e68(%rip),%ymm13 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,14,137,2,0 // vbroadcastss 0x2890e(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,190,141,2,0 // vbroadcastss 0x28dbe(%rip),%ymm13 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,160,137,2,0 // vbroadcastss 0x289a0(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,80,142,2,0 // vbroadcastss 0x28e50(%rip),%ymm13 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,150,137,2,0 // vbroadcastss 0x28996(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,70,142,2,0 // vbroadcastss 0x28e46(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,140,137,2,0 // vbroadcastss 0x2898c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,60,142,2,0 // vbroadcastss 0x28e3c(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,50,142,2,0 // vbroadcastss 0x28e32(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,99,137,2,0 // vbroadcastss 0x28963(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,19,142,2,0 // vbroadcastss 0x28e13(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,89,137,2,0 // vbroadcastss 0x28959(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,9,142,2,0 // vbroadcastss 0x28e09(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,217 // vfnmadd213ps %ymm1,%ymm10,%ymm11
- .byte 196,226,125,24,13,79,137,2,0 // vbroadcastss 0x2894f(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,13,255,141,2,0 // vbroadcastss 0x28dff(%rip),%ymm1 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,116,92,202 // vsubps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,69,137,2,0 // vbroadcastss 0x28945(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,245,141,2,0 // vbroadcastss 0x28df5(%rip),%ymm10 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 197,164,88,201 // vaddps %ymm1,%ymm11,%ymm1
- .byte 196,98,125,24,21,56,137,2,0 // vbroadcastss 0x28938(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,232,141,2,0 // vbroadcastss 0x28de8(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12047,7 +12075,7 @@ _sk_parametric_g_hsw:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,79,136,2,0 // vbroadcastss 0x2884f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,255,140,2,0 // vbroadcastss 0x28cff(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12067,33 +12095,33 @@ _sk_parametric_b_hsw:
.byte 196,66,109,168,211 // vfmadd213ps %ymm11,%ymm2,%ymm10
.byte 196,226,125,24,16 // vbroadcastss (%rax),%ymm2
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,151,136,2,0 // vbroadcastss 0x28897(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,146,136,2,0 // vbroadcastss 0x28892(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,71,141,2,0 // vbroadcastss 0x28d47(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,66,141,2,0 // vbroadcastss 0x28d42(%rip),%ymm13 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,232,135,2,0 // vbroadcastss 0x287e8(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,152,140,2,0 // vbroadcastss 0x28c98(%rip),%ymm13 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,122,136,2,0 // vbroadcastss 0x2887a(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,42,141,2,0 // vbroadcastss 0x28d2a(%rip),%ymm13 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,112,136,2,0 // vbroadcastss 0x28870(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,32,141,2,0 // vbroadcastss 0x28d20(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,102,136,2,0 // vbroadcastss 0x28866(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,22,141,2,0 // vbroadcastss 0x28d16(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,92,136,2,0 // vbroadcastss 0x2885c(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,12,141,2,0 // vbroadcastss 0x28d0c(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,61,136,2,0 // vbroadcastss 0x2883d(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,237,140,2,0 // vbroadcastss 0x28ced(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,51,136,2,0 // vbroadcastss 0x28833(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,227,140,2,0 // vbroadcastss 0x28ce3(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,218 // vfnmadd213ps %ymm2,%ymm10,%ymm11
- .byte 196,226,125,24,21,41,136,2,0 // vbroadcastss 0x28829(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,21,217,140,2,0 // vbroadcastss 0x28cd9(%rip),%ymm2 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,108,92,210 // vsubps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,31,136,2,0 // vbroadcastss 0x2881f(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,207,140,2,0 // vbroadcastss 0x28ccf(%rip),%ymm10 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,210 // vdivps %ymm2,%ymm10,%ymm2
.byte 197,164,88,210 // vaddps %ymm2,%ymm11,%ymm2
- .byte 196,98,125,24,21,18,136,2,0 // vbroadcastss 0x28812(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,194,140,2,0 // vbroadcastss 0x28cc2(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12101,7 +12129,7 @@ _sk_parametric_b_hsw:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,41,135,2,0 // vbroadcastss 0x28729(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,217,139,2,0 // vbroadcastss 0x28bd9(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12121,33 +12149,33 @@ _sk_parametric_a_hsw:
.byte 196,66,101,168,211 // vfmadd213ps %ymm11,%ymm3,%ymm10
.byte 196,226,125,24,24 // vbroadcastss (%rax),%ymm3
.byte 196,65,124,91,218 // vcvtdq2ps %ymm10,%ymm11
- .byte 196,98,125,24,37,113,135,2,0 // vbroadcastss 0x28771(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,98,125,24,45,108,135,2,0 // vbroadcastss 0x2876c(%rip),%ymm13 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,33,140,2,0 // vbroadcastss 0x28c21(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,45,28,140,2,0 // vbroadcastss 0x28c1c(%rip),%ymm13 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,65,44,84,213 // vandps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,194,134,2,0 // vbroadcastss 0x286c2(%rip),%ymm13 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,45,114,139,2,0 // vbroadcastss 0x28b72(%rip),%ymm13 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,86,213 // vorps %ymm13,%ymm10,%ymm10
- .byte 196,98,125,24,45,84,135,2,0 // vbroadcastss 0x28754(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,4,140,2,0 // vbroadcastss 0x28c04(%rip),%ymm13 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,184,236 // vfmadd231ps %ymm12,%ymm11,%ymm13
- .byte 196,98,125,24,29,74,135,2,0 // vbroadcastss 0x2874a(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,250,139,2,0 // vbroadcastss 0x28bfa(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,45,172,221 // vfnmadd213ps %ymm13,%ymm10,%ymm11
- .byte 196,98,125,24,37,64,135,2,0 // vbroadcastss 0x28740(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,240,139,2,0 // vbroadcastss 0x28bf0(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,54,135,2,0 // vbroadcastss 0x28736(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,230,139,2,0 // vbroadcastss 0x28be6(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,28,94,210 // vdivps %ymm10,%ymm12,%ymm10
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,23,135,2,0 // vbroadcastss 0x28717(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,199,139,2,0 // vbroadcastss 0x28bc7(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,13,135,2,0 // vbroadcastss 0x2870d(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,189,139,2,0 // vbroadcastss 0x28bbd(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,45,172,219 // vfnmadd213ps %ymm3,%ymm10,%ymm11
- .byte 196,226,125,24,29,3,135,2,0 // vbroadcastss 0x28703(%rip),%ymm3 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,29,179,139,2,0 // vbroadcastss 0x28bb3(%rip),%ymm3 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,193,100,92,218 // vsubps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,249,134,2,0 // vbroadcastss 0x286f9(%rip),%ymm10 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,21,169,139,2,0 // vbroadcastss 0x28ba9(%rip),%ymm10 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,172,94,219 // vdivps %ymm3,%ymm10,%ymm3
.byte 197,164,88,219 // vaddps %ymm3,%ymm11,%ymm3
- .byte 196,98,125,24,21,236,134,2,0 // vbroadcastss 0x286ec(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,156,139,2,0 // vbroadcastss 0x28b9c(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -12155,7 +12183,7 @@ _sk_parametric_a_hsw:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,3,134,2,0 // vbroadcastss 0x28603(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,179,138,2,0 // vbroadcastss 0x28ab3(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12174,35 +12202,35 @@ _sk_gamma_hsw:
.byte 197,252,40,241 // vmovaps %ymm1,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,124,91,208 // vcvtdq2ps %ymm0,%ymm10
- .byte 196,98,125,24,29,86,134,2,0 // vbroadcastss 0x28656(%rip),%ymm11 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
- .byte 196,226,125,24,45,81,134,2,0 // vbroadcastss 0x28651(%rip),%ymm5 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,29,6,139,2,0 // vbroadcastss 0x28b06(%rip),%ymm11 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,226,125,24,45,1,139,2,0 // vbroadcastss 0x28b01(%rip),%ymm5 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 197,124,84,205 // vandps %ymm5,%ymm0,%ymm9
- .byte 196,226,125,24,37,168,133,2,0 // vbroadcastss 0x285a8(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,37,88,138,2,0 // vbroadcastss 0x28a58(%rip),%ymm4 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,52,86,228 // vorps %ymm4,%ymm9,%ymm12
- .byte 196,98,125,24,45,59,134,2,0 // vbroadcastss 0x2863b(%rip),%ymm13 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,45,235,138,2,0 // vbroadcastss 0x28aeb(%rip),%ymm13 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,66,37,168,213 // vfmadd213ps %ymm13,%ymm11,%ymm10
- .byte 196,98,125,24,13,49,134,2,0 // vbroadcastss 0x28631(%rip),%ymm9 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,13,225,138,2,0 // vbroadcastss 0x28ae1(%rip),%ymm9 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,66,29,188,209 // vfnmadd231ps %ymm9,%ymm12,%ymm10
.byte 197,124,91,246 // vcvtdq2ps %ymm6,%ymm14
.byte 196,66,37,168,245 // vfmadd213ps %ymm13,%ymm11,%ymm14
.byte 197,124,91,255 // vcvtdq2ps %ymm7,%ymm15
.byte 196,66,37,168,253 // vfmadd213ps %ymm13,%ymm11,%ymm15
- .byte 196,98,125,24,29,21,134,2,0 // vbroadcastss 0x28615(%rip),%ymm11 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,29,197,138,2,0 // vbroadcastss 0x28ac5(%rip),%ymm11 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,65,28,88,227 // vaddps %ymm11,%ymm12,%ymm12
- .byte 196,98,125,24,45,11,134,2,0 // vbroadcastss 0x2860b(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,45,187,138,2,0 // vbroadcastss 0x28abb(%rip),%ymm13 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 196,65,20,94,228 // vdivps %ymm12,%ymm13,%ymm12
.byte 196,65,44,92,212 // vsubps %ymm12,%ymm10,%ymm10
.byte 196,98,125,24,32 // vbroadcastss (%rax),%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
.byte 196,67,125,8,194,1 // vroundps $0x1,%ymm10,%ymm8
.byte 196,65,44,92,192 // vsubps %ymm8,%ymm10,%ymm8
- .byte 196,226,125,24,21,231,133,2,0 // vbroadcastss 0x285e7(%rip),%ymm2 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,226,125,24,21,151,138,2,0 // vbroadcastss 0x28a97(%rip),%ymm2 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 197,44,88,210 // vaddps %ymm2,%ymm10,%ymm10
- .byte 196,226,125,24,29,222,133,2,0 // vbroadcastss 0x285de(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,226,125,24,29,142,138,2,0 // vbroadcastss 0x28a8e(%rip),%ymm3 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,98,61,188,211 // vfnmadd231ps %ymm3,%ymm8,%ymm10
- .byte 196,226,125,24,13,212,133,2,0 // vbroadcastss 0x285d4(%rip),%ymm1 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,13,132,138,2,0 // vbroadcastss 0x28a84(%rip),%ymm1 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,116,92,192 // vsubps %ymm8,%ymm1,%ymm8
- .byte 196,226,125,24,5,202,133,2,0 // vbroadcastss 0x285ca(%rip),%ymm0 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,226,125,24,5,122,138,2,0 // vbroadcastss 0x28a7a(%rip),%ymm0 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,124,94,192 // vdivps %ymm8,%ymm0,%ymm8
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 197,204,84,245 // vandps %ymm5,%ymm6,%ymm6
@@ -12233,7 +12261,7 @@ _sk_gamma_hsw:
.byte 197,244,92,205 // vsubps %ymm5,%ymm1,%ymm1
.byte 197,252,94,193 // vdivps %ymm1,%ymm0,%ymm0
.byte 197,236,88,192 // vaddps %ymm0,%ymm2,%ymm0
- .byte 196,226,125,24,13,59,133,2,0 // vbroadcastss 0x2853b(%rip),%ymm1 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,226,125,24,13,235,137,2,0 // vbroadcastss 0x289eb(%rip),%ymm1 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 197,188,89,209 // vmulps %ymm1,%ymm8,%ymm2
.byte 197,204,89,217 // vmulps %ymm1,%ymm6,%ymm3
.byte 197,252,89,225 // vmulps %ymm1,%ymm0,%ymm4
@@ -12253,26 +12281,26 @@ HIDDEN _sk_lab_to_xyz_hsw
.globl _sk_lab_to_xyz_hsw
FUNCTION(_sk_lab_to_xyz_hsw)
_sk_lab_to_xyz_hsw:
- .byte 196,98,125,24,5,249,132,2,0 // vbroadcastss 0x284f9(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503>
- .byte 196,98,125,24,13,92,132,2,0 // vbroadcastss 0x2845c(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
- .byte 196,98,125,24,21,235,132,2,0 // vbroadcastss 0x284eb(%rip),%ymm10 # 2b4bc <_sk_overlay_sse2_8bit+0x507>
+ .byte 196,98,125,24,5,169,137,2,0 // vbroadcastss 0x289a9(%rip),%ymm8 # 2b9e8 <_sk_overlay_sse2_8bit+0x503>
+ .byte 196,98,125,24,13,12,137,2,0 // vbroadcastss 0x2890c(%rip),%ymm9 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,21,155,137,2,0 // vbroadcastss 0x2899b(%rip),%ymm10 # 2b9ec <_sk_overlay_sse2_8bit+0x507>
.byte 196,194,53,168,202 // vfmadd213ps %ymm10,%ymm9,%ymm1
.byte 196,194,53,168,210 // vfmadd213ps %ymm10,%ymm9,%ymm2
- .byte 196,98,125,24,13,220,132,2,0 // vbroadcastss 0x284dc(%rip),%ymm9 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b>
+ .byte 196,98,125,24,13,140,137,2,0 // vbroadcastss 0x2898c(%rip),%ymm9 # 2b9f0 <_sk_overlay_sse2_8bit+0x50b>
.byte 196,66,125,184,200 // vfmadd231ps %ymm8,%ymm0,%ymm9
- .byte 196,226,125,24,5,210,132,2,0 // vbroadcastss 0x284d2(%rip),%ymm0 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f>
+ .byte 196,226,125,24,5,130,137,2,0 // vbroadcastss 0x28982(%rip),%ymm0 # 2b9f4 <_sk_overlay_sse2_8bit+0x50f>
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
- .byte 196,98,125,24,5,201,132,2,0 // vbroadcastss 0x284c9(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513>
+ .byte 196,98,125,24,5,121,137,2,0 // vbroadcastss 0x28979(%rip),%ymm8 # 2b9f8 <_sk_overlay_sse2_8bit+0x513>
.byte 196,98,117,168,192 // vfmadd213ps %ymm0,%ymm1,%ymm8
- .byte 196,98,125,24,13,191,132,2,0 // vbroadcastss 0x284bf(%rip),%ymm9 # 2b4cc <_sk_overlay_sse2_8bit+0x517>
+ .byte 196,98,125,24,13,111,137,2,0 // vbroadcastss 0x2896f(%rip),%ymm9 # 2b9fc <_sk_overlay_sse2_8bit+0x517>
.byte 196,98,109,172,200 // vfnmadd213ps %ymm0,%ymm2,%ymm9
.byte 196,193,60,89,200 // vmulps %ymm8,%ymm8,%ymm1
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
- .byte 196,226,125,24,21,172,132,2,0 // vbroadcastss 0x284ac(%rip),%ymm2 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b>
+ .byte 196,226,125,24,21,92,137,2,0 // vbroadcastss 0x2895c(%rip),%ymm2 # 2ba00 <_sk_overlay_sse2_8bit+0x51b>
.byte 197,108,194,209,1 // vcmpltps %ymm1,%ymm2,%ymm10
- .byte 196,98,125,24,29,162,132,2,0 // vbroadcastss 0x284a2(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f>
+ .byte 196,98,125,24,29,82,137,2,0 // vbroadcastss 0x28952(%rip),%ymm11 # 2ba04 <_sk_overlay_sse2_8bit+0x51f>
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,37,152,132,2,0 // vbroadcastss 0x28498(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523>
+ .byte 196,98,125,24,37,72,137,2,0 // vbroadcastss 0x28948(%rip),%ymm12 # 2ba08 <_sk_overlay_sse2_8bit+0x523>
.byte 196,65,60,89,196 // vmulps %ymm12,%ymm8,%ymm8
.byte 196,99,61,74,193,160 // vblendvps %ymm10,%ymm1,%ymm8,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -12287,9 +12315,9 @@ _sk_lab_to_xyz_hsw:
.byte 196,65,52,88,203 // vaddps %ymm11,%ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
.byte 196,227,53,74,208,32 // vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- .byte 196,226,125,24,5,77,132,2,0 // vbroadcastss 0x2844d(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527>
+ .byte 196,226,125,24,5,253,136,2,0 // vbroadcastss 0x288fd(%rip),%ymm0 # 2ba0c <_sk_overlay_sse2_8bit+0x527>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,68,132,2,0 // vbroadcastss 0x28444(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b>
+ .byte 196,98,125,24,5,244,136,2,0 // vbroadcastss 0x288f4(%rip),%ymm8 # 2ba10 <_sk_overlay_sse2_8bit+0x52b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -12306,12 +12334,12 @@ _sk_load_a8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 30f3 <_sk_load_a8_hsw+0x4e>
+ .byte 117,53 // jne 3173 <_sk_load_a8_hsw+0x4e>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,196,140,2,0 // vpand 0x28cc4(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,249,219,5,132,145,2,0 // vpand 0x29184(%rip),%xmm0,%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,142,131,2,0 // vbroadcastss 0x2838e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,62,136,2,0 // vbroadcastss 0x2883e(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12324,15 +12352,15 @@ _sk_load_a8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 30c4 <_sk_load_a8_hsw+0x1f>
+ .byte 119,189 // ja 3144 <_sk_load_a8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 318c <_sk_load_a8_hsw+0xe7>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 320c <_sk_load_a8_hsw+0xe7>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,158 // jmp 30c4 <_sk_load_a8_hsw+0x1f>
+ .byte 235,158 // jmp 3144 <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -12340,7 +12368,7 @@ _sk_load_a8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,118,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 3144 <_sk_load_a8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -12351,7 +12379,7 @@ _sk_load_a8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,59,255,255,255 // jmpq 30c4 <_sk_load_a8_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 3144 <_sk_load_a8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -12385,12 +12413,12 @@ _sk_load_a8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,53 // jne 31f6 <_sk_load_a8_dst_hsw+0x4e>
+ .byte 117,53 // jne 3276 <_sk_load_a8_dst_hsw+0x4e>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,193,139,2,0 // vpand 0x28bc1(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,217,219,37,129,144,2,0 // vpand 0x29081(%rip),%xmm4,%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,139,130,2,0 // vbroadcastss 0x2828b(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,59,135,2,0 // vbroadcastss 0x2873b(%rip),%ymm5 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -12403,15 +12431,15 @@ _sk_load_a8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,189 // ja 31c7 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 119,189 // ja 3247 <_sk_load_a8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 328c <_sk_load_a8_dst_hsw+0xe4>
+ .byte 76,141,29,119,0,0,0 // lea 0x77(%rip),%r11 # 330c <_sk_load_a8_dst_hsw+0xe4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,158 // jmp 31c7 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 235,158 // jmp 3247 <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -12419,7 +12447,7 @@ _sk_load_a8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,118,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,118,255,255,255 // jmpq 3247 <_sk_load_a8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -12430,7 +12458,7 @@ _sk_load_a8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,59,255,255,255 // jmpq 31c7 <_sk_load_a8_dst_hsw+0x1f>
+ .byte 233,59,255,255,255 // jmpq 3247 <_sk_load_a8_dst_hsw+0x1f>
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
.byte 255 // (bad)
@@ -12491,7 +12519,7 @@ _sk_gather_a8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,14,129,2,0 // vbroadcastss 0x2810e(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,190,133,2,0 // vbroadcastss 0x285be(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -12510,14 +12538,14 @@ _sk_store_a8_hsw:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,149,128,2,0 // vbroadcastss 0x28095(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,69,133,2,0 // vbroadcastss 0x28545(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 33b9 <_sk_store_a8_hsw+0x47>
+ .byte 117,11 // jne 3439 <_sk_store_a8_hsw+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -12526,25 +12554,25 @@ _sk_store_a8_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 33b4 <_sk_store_a8_hsw+0x42>
+ .byte 119,235 // ja 3434 <_sk_store_a8_hsw+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 3430 <_sk_store_a8_hsw+0xbe>
+ .byte 76,141,29,87,0,0,0 // lea 0x57(%rip),%r11 # 34b0 <_sk_store_a8_hsw+0xbe>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp 33b4 <_sk_store_a8_hsw+0x42>
+ .byte 235,201 // jmp 3434 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,164,137,2,0 // vpshufb 0x289a4(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
+ .byte 196,98,57,0,5,100,142,2,0 // vpshufb 0x28e64(%rip),%xmm8,%xmm8 # 2c2e0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp 33b4 <_sk_store_a8_hsw+0x42>
+ .byte 235,175 // jmp 3434 <_sk_store_a8_hsw+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,138,137,2,0 // vpshufb 0x2898a(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
+ .byte 196,98,57,0,5,74,142,2,0 // vpshufb 0x28e4a(%rip),%xmm8,%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp 33b4 <_sk_store_a8_hsw+0x42>
+ .byte 235,134 // jmp 3434 <_sk_store_a8_hsw+0x42>
.byte 102,144 // xchg %ax,%ax
.byte 178,255 // mov $0xff,%dl
.byte 255 // (bad)
@@ -12578,15 +12606,15 @@ _sk_load_g8_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 349f <_sk_load_g8_hsw+0x53>
+ .byte 117,58 // jne 351f <_sk_load_g8_hsw+0x53>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,29,137,2,0 // vpand 0x2891d(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,249,219,5,221,141,2,0 // vpand 0x28ddd(%rip),%xmm0,%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,231,127,2,0 // vbroadcastss 0x27fe7(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,151,132,2,0 // vbroadcastss 0x28497(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,100,127,2,0 // vbroadcastss 0x27f64(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,20,132,2,0 // vbroadcastss 0x28414(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -12596,15 +12624,15 @@ _sk_load_g8_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 346b <_sk_load_g8_hsw+0x1f>
+ .byte 119,184 // ja 34eb <_sk_load_g8_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3538 <_sk_load_g8_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 35b8 <_sk_load_g8_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 346b <_sk_load_g8_hsw+0x1f>
+ .byte 235,153 // jmp 34eb <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -12612,7 +12640,7 @@ _sk_load_g8_hsw:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,113,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 34eb <_sk_load_g8_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -12623,7 +12651,7 @@ _sk_load_g8_hsw:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,54,255,255,255 // jmpq 346b <_sk_load_g8_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 34eb <_sk_load_g8_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -12657,15 +12685,15 @@ _sk_load_g8_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,58 // jne 35a7 <_sk_load_g8_dst_hsw+0x53>
+ .byte 117,58 // jne 3627 <_sk_load_g8_dst_hsw+0x53>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,21,136,2,0 // vpand 0x28815(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,217,219,37,213,140,2,0 // vpand 0x28cd5(%rip),%xmm4,%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,226,125,51,228 // vpmovzxwd %xmm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,223,126,2,0 // vbroadcastss 0x27edf(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,143,131,2,0 // vbroadcastss 0x2838f(%rip),%ymm5 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,92,126,2,0 // vbroadcastss 0x27e5c(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,12,131,2,0 // vbroadcastss 0x2830c(%rip),%ymm7 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -12675,15 +12703,15 @@ _sk_load_g8_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,184 // ja 3573 <_sk_load_g8_dst_hsw+0x1f>
+ .byte 119,184 // ja 35f3 <_sk_load_g8_dst_hsw+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 3640 <_sk_load_g8_dst_hsw+0xec>
+ .byte 76,141,29,122,0,0,0 // lea 0x7a(%rip),%r11 # 36c0 <_sk_load_g8_dst_hsw+0xec>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,153 // jmp 3573 <_sk_load_g8_dst_hsw+0x1f>
+ .byte 235,153 // jmp 35f3 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -12691,7 +12719,7 @@ _sk_load_g8_dst_hsw:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,113,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,113,255,255,255 // jmpq 35f3 <_sk_load_g8_dst_hsw+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -12702,7 +12730,7 @@ _sk_load_g8_dst_hsw:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,54,255,255,255 // jmpq 3573 <_sk_load_g8_dst_hsw+0x1f>
+ .byte 233,54,255,255,255 // jmpq 35f3 <_sk_load_g8_dst_hsw+0x1f>
.byte 15,31,0 // nopl (%rax)
.byte 143 // (bad)
.byte 255 // (bad)
@@ -12764,10 +12792,10 @@ _sk_gather_g8_hsw:
.byte 196,227,121,32,192,7 // vpinsrb $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,90,125,2,0 // vbroadcastss 0x27d5a(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,10,130,2,0 // vbroadcastss 0x2820a(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,215,124,2,0 // vbroadcastss 0x27cd7(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,135,129,2,0 // vbroadcastss 0x28187(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -12785,26 +12813,26 @@ _sk_load_565_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 37ba <_sk_load_565_hsw+0x8f>
+ .byte 117,115 // jne 383a <_sk_load_565_hsw+0x8f>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,21,125,2,0 // vpbroadcastd 0x27d15(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,5,197,129,2,0 // vpbroadcastd 0x281c5(%rip),%ymm0 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,8,125,2,0 // vbroadcastss 0x27d08(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,184,129,2,0 // vbroadcastss 0x281b8(%rip),%ymm1 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,255,124,2,0 // vpbroadcastd 0x27cff(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,13,175,129,2,0 // vpbroadcastd 0x281af(%rip),%ymm1 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,242,124,2,0 // vbroadcastss 0x27cf2(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,162,129,2,0 // vbroadcastss 0x281a2(%rip),%ymm3 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,233,124,2,0 // vpbroadcastd 0x27ce9(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,29,153,129,2,0 // vpbroadcastd 0x28199(%rip),%ymm3 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,220,124,2,0 // vbroadcastss 0x27cdc(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,140,129,2,0 // vbroadcastss 0x2818c(%rip),%ymm3 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,65,124,2,0 // vbroadcastss 0x27c41(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,241,128,2,0 // vbroadcastss 0x280f1(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -12812,27 +12840,27 @@ _sk_load_565_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 374d <_sk_load_565_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 37cd <_sk_load_565_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 3840 <_sk_load_565_hsw+0x115>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # 38c0 <_sk_load_565_hsw+0x115>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,89,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 37cd <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,60,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 37cd <_sk_load_565_hsw+0x22>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,15,255,255,255 // jmpq 374d <_sk_load_565_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 37cd <_sk_load_565_hsw+0x22>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -12866,26 +12894,26 @@ _sk_load_565_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,115 // jne 38eb <_sk_load_565_dst_hsw+0x8f>
+ .byte 117,115 // jne 396b <_sk_load_565_dst_hsw+0x8f>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,244 // vpmovzxwd %xmm4,%ymm6
- .byte 196,226,125,88,37,228,123,2,0 // vpbroadcastd 0x27be4(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,37,148,128,2,0 // vpbroadcastd 0x28094(%rip),%ymm4 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,205,219,228 // vpand %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,215,123,2,0 // vbroadcastss 0x27bd7(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,45,135,128,2,0 // vbroadcastss 0x28087(%rip),%ymm5 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,206,123,2,0 // vpbroadcastd 0x27bce(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,45,126,128,2,0 // vpbroadcastd 0x2807e(%rip),%ymm5 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,205,219,237 // vpand %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,193,123,2,0 // vbroadcastss 0x27bc1(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,61,113,128,2,0 // vbroadcastss 0x28071(%rip),%ymm7 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,88,61,184,123,2,0 // vpbroadcastd 0x27bb8(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,61,104,128,2,0 // vpbroadcastd 0x28068(%rip),%ymm7 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,205,219,247 // vpand %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,171,123,2,0 // vbroadcastss 0x27bab(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,61,91,128,2,0 // vbroadcastss 0x2805b(%rip),%ymm7 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,16,123,2,0 // vbroadcastss 0x27b10(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,192,127,2,0 // vbroadcastss 0x27fc0(%rip),%ymm7 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -12893,27 +12921,27 @@ _sk_load_565_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,123,255,255,255 // ja 387e <_sk_load_565_dst_hsw+0x22>
+ .byte 15,135,123,255,255,255 // ja 38fe <_sk_load_565_dst_hsw+0x22>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3970 <_sk_load_565_dst_hsw+0x114>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 39f0 <_sk_load_565_dst_hsw+0x114>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,89,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
+ .byte 233,89,255,255,255 // jmpq 38fe <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,60,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
+ .byte 233,60,255,255,255 // jmpq 38fe <_sk_load_565_dst_hsw+0x22>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,15,255,255,255 // jmpq 387e <_sk_load_565_dst_hsw+0x22>
+ .byte 233,15,255,255,255 // jmpq 38fe <_sk_load_565_dst_hsw+0x22>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -12976,23 +13004,23 @@ _sk_gather_565_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,208 // vpmovzxwd %xmm0,%ymm2
- .byte 196,226,125,88,5,51,122,2,0 // vpbroadcastd 0x27a33(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,88,5,227,126,2,0 // vpbroadcastd 0x27ee3(%rip),%ymm0 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,237,219,192 // vpand %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,38,122,2,0 // vbroadcastss 0x27a26(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,214,126,2,0 // vbroadcastss 0x27ed6(%rip),%ymm1 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,29,122,2,0 // vpbroadcastd 0x27a1d(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,88,13,205,126,2,0 // vpbroadcastd 0x27ecd(%rip),%ymm1 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,237,219,201 // vpand %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,16,122,2,0 // vbroadcastss 0x27a10(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,192,126,2,0 // vbroadcastss 0x27ec0(%rip),%ymm3 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,88,29,7,122,2,0 // vpbroadcastd 0x27a07(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,88,29,183,126,2,0 // vpbroadcastd 0x27eb7(%rip),%ymm3 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,237,219,211 // vpand %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,250,121,2,0 // vbroadcastss 0x279fa(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,170,126,2,0 // vbroadcastss 0x27eaa(%rip),%ymm3 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,95,121,2,0 // vbroadcastss 0x2795f(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,15,126,2,0 // vbroadcastss 0x27e0f(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_hsw
@@ -13007,11 +13035,11 @@ _sk_store_565_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,41,122,2,0 // vbroadcastss 0x27a29(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f>
+ .byte 196,98,125,24,5,217,126,2,0 // vbroadcastss 0x27ed9(%rip),%ymm8 # 2ba14 <_sk_overlay_sse2_8bit+0x52f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,11 // vpslld $0xb,%ymm9,%ymm9
- .byte 196,98,125,24,21,20,122,2,0 // vbroadcastss 0x27a14(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533>
+ .byte 196,98,125,24,21,196,126,2,0 // vbroadcastss 0x27ec4(%rip),%ymm10 # 2ba18 <_sk_overlay_sse2_8bit+0x533>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,45,114,242,5 // vpslld $0x5,%ymm10,%ymm10
@@ -13022,7 +13050,7 @@ _sk_store_565_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3b13 <_sk_store_565_hsw+0x78>
+ .byte 117,11 // jne 3b93 <_sk_store_565_hsw+0x78>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13031,22 +13059,22 @@ _sk_store_565_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3b0e <_sk_store_565_hsw+0x73>
+ .byte 119,235 // ja 3b8e <_sk_store_565_hsw+0x73>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3b70 <_sk_store_565_hsw+0xd5>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 3bf0 <_sk_store_565_hsw+0xd5>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3b0e <_sk_store_565_hsw+0x73>
+ .byte 235,206 // jmp 3b8e <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3b0e <_sk_store_565_hsw+0x73>
+ .byte 235,190 // jmp 3b8e <_sk_store_565_hsw+0x73>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3b0e <_sk_store_565_hsw+0x73>
+ .byte 235,158 // jmp 3b8e <_sk_store_565_hsw+0x73>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -13064,7 +13092,7 @@ _sk_store_565_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1003b88 <_sk_overlay_sse2_8bit+0xffffffffe0fd8bd3>
+ .byte 232,255,255,255,224 // callq ffffffffe1003c08 <_sk_overlay_sse2_8bit+0xffffffffe0fd8723>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -13082,28 +13110,28 @@ _sk_load_4444_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3c37 <_sk_load_4444_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3cb7 <_sk_load_4444_hsw+0xab>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,44,121,2,0 // vpbroadcastd 0x2792c(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,5,220,125,2,0 // vpbroadcastd 0x27ddc(%rip),%ymm0 # 2ba1c <_sk_overlay_sse2_8bit+0x537>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,31,121,2,0 // vbroadcastss 0x2791f(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,207,125,2,0 // vbroadcastss 0x27dcf(%rip),%ymm1 # 2ba20 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,22,121,2,0 // vpbroadcastd 0x27916(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,13,198,125,2,0 // vpbroadcastd 0x27dc6(%rip),%ymm1 # 2ba24 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,9,121,2,0 // vbroadcastss 0x27909(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,185,125,2,0 // vbroadcastss 0x27db9(%rip),%ymm2 # 2ba28 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,0,121,2,0 // vpbroadcastd 0x27900(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,21,176,125,2,0 // vpbroadcastd 0x27db0(%rip),%ymm2 # 2ba2c <_sk_overlay_sse2_8bit+0x547>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,243,120,2,0 // vbroadcastss 0x278f3(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,163,125,2,0 // vbroadcastss 0x27da3(%rip),%ymm8 # 2ba30 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,233,120,2,0 // vpbroadcastd 0x278e9(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,153,125,2,0 // vpbroadcastd 0x27d99(%rip),%ymm8 # 2ba34 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,219,120,2,0 // vbroadcastss 0x278db(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,139,125,2,0 // vbroadcastss 0x27d8b(%rip),%ymm8 # 2ba38 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13113,27 +13141,27 @@ _sk_load_4444_hsw:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 3bb2 <_sk_load_4444_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3c32 <_sk_load_4444_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3cbc <_sk_load_4444_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3d3c <_sk_load_4444_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,65,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3c32 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,36,255,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3c32 <_sk_load_4444_hsw+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,247,254,255,255 // jmpq 3bb2 <_sk_load_4444_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3c32 <_sk_load_4444_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -13168,28 +13196,28 @@ _sk_load_4444_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,139,0,0,0 // jne 3d83 <_sk_load_4444_dst_hsw+0xab>
+ .byte 15,133,139,0,0,0 // jne 3e03 <_sk_load_4444_dst_hsw+0xab>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 196,226,125,51,252 // vpmovzxwd %xmm4,%ymm7
- .byte 196,226,125,88,37,224,119,2,0 // vpbroadcastd 0x277e0(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,37,144,124,2,0 // vpbroadcastd 0x27c90(%rip),%ymm4 # 2ba1c <_sk_overlay_sse2_8bit+0x537>
.byte 197,197,219,228 // vpand %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,211,119,2,0 // vbroadcastss 0x277d3(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,45,131,124,2,0 // vbroadcastss 0x27c83(%rip),%ymm5 # 2ba20 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,88,45,202,119,2,0 // vpbroadcastd 0x277ca(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,45,122,124,2,0 // vpbroadcastd 0x27c7a(%rip),%ymm5 # 2ba24 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,197,219,237 // vpand %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,189,119,2,0 // vbroadcastss 0x277bd(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,53,109,124,2,0 // vbroadcastss 0x27c6d(%rip),%ymm6 # 2ba28 <_sk_overlay_sse2_8bit+0x543>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,88,53,180,119,2,0 // vpbroadcastd 0x277b4(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,53,100,124,2,0 // vpbroadcastd 0x27c64(%rip),%ymm6 # 2ba2c <_sk_overlay_sse2_8bit+0x547>
.byte 197,197,219,246 // vpand %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,167,119,2,0 // vbroadcastss 0x277a7(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,87,124,2,0 // vbroadcastss 0x27c57(%rip),%ymm8 # 2ba30 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,88,5,157,119,2,0 // vpbroadcastd 0x2779d(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,77,124,2,0 // vpbroadcastd 0x27c4d(%rip),%ymm8 # 2ba34 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,69,219,248 // vpand %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,143,119,2,0 // vbroadcastss 0x2778f(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,63,124,2,0 // vbroadcastss 0x27c3f(%rip),%ymm8 # 2ba38 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13199,27 +13227,27 @@ _sk_load_4444_dst_hsw:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,99,255,255,255 // ja 3cfe <_sk_load_4444_dst_hsw+0x26>
+ .byte 15,135,99,255,255,255 // ja 3d7e <_sk_load_4444_dst_hsw+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3e08 <_sk_load_4444_dst_hsw+0x130>
+ .byte 76,141,29,98,0,0,0 // lea 0x62(%rip),%r11 # 3e88 <_sk_load_4444_dst_hsw+0x130>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,65,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,65,255,255,255 // jmpq 3d7e <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,36,255,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,36,255,255,255 // jmpq 3d7e <_sk_load_4444_dst_hsw+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,247,254,255,255 // jmpq 3cfe <_sk_load_4444_dst_hsw+0x26>
+ .byte 233,247,254,255,255 // jmpq 3d7e <_sk_load_4444_dst_hsw+0x26>
.byte 144 // nop
.byte 167 // cmpsl %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -13282,25 +13310,25 @@ _sk_gather_4444_hsw:
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 197,249,196,192,7 // vpinsrw $0x7,%eax,%xmm0,%xmm0
.byte 196,226,125,51,216 // vpmovzxwd %xmm0,%ymm3
- .byte 196,226,125,88,5,23,118,2,0 // vpbroadcastd 0x27617(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,88,5,199,122,2,0 // vpbroadcastd 0x27ac7(%rip),%ymm0 # 2ba1c <_sk_overlay_sse2_8bit+0x537>
.byte 197,229,219,192 // vpand %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,10,118,2,0 // vbroadcastss 0x2760a(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,186,122,2,0 // vbroadcastss 0x27aba(%rip),%ymm1 # 2ba20 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,88,13,1,118,2,0 // vpbroadcastd 0x27601(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,88,13,177,122,2,0 // vpbroadcastd 0x27ab1(%rip),%ymm1 # 2ba24 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,229,219,201 // vpand %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,244,117,2,0 // vbroadcastss 0x275f4(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,164,122,2,0 // vbroadcastss 0x27aa4(%rip),%ymm2 # 2ba28 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,88,21,235,117,2,0 // vpbroadcastd 0x275eb(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,88,21,155,122,2,0 // vpbroadcastd 0x27a9b(%rip),%ymm2 # 2ba2c <_sk_overlay_sse2_8bit+0x547>
.byte 197,229,219,210 // vpand %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,222,117,2,0 // vbroadcastss 0x275de(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,142,122,2,0 // vbroadcastss 0x27a8e(%rip),%ymm8 # 2ba30 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,88,5,212,117,2,0 // vpbroadcastd 0x275d4(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,88,5,132,122,2,0 // vpbroadcastd 0x27a84(%rip),%ymm8 # 2ba34 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,101,219,216 // vpand %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,198,117,2,0 // vbroadcastss 0x275c6(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,118,122,2,0 // vbroadcastss 0x27a76(%rip),%ymm8 # 2ba38 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -13317,7 +13345,7 @@ _sk_store_4444_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,161,117,2,0 // vbroadcastss 0x275a1(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557>
+ .byte 196,98,125,24,5,81,122,2,0 // vbroadcastss 0x27a51(%rip),%ymm8 # 2ba3c <_sk_overlay_sse2_8bit+0x557>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,53,114,241,12 // vpslld $0xc,%ymm9,%ymm9
@@ -13335,7 +13363,7 @@ _sk_store_4444_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 3fcf <_sk_store_4444_hsw+0x84>
+ .byte 117,11 // jne 404f <_sk_store_4444_hsw+0x84>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13344,22 +13372,22 @@ _sk_store_4444_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 3fca <_sk_store_4444_hsw+0x7f>
+ .byte 119,235 // ja 404a <_sk_store_4444_hsw+0x7f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 402c <_sk_store_4444_hsw+0xe1>
+ .byte 76,141,29,66,0,0,0 // lea 0x42(%rip),%r11 # 40ac <_sk_store_4444_hsw+0xe1>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp 3fca <_sk_store_4444_hsw+0x7f>
+ .byte 235,206 // jmp 404a <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp 3fca <_sk_store_4444_hsw+0x7f>
+ .byte 235,190 // jmp 404a <_sk_store_4444_hsw+0x7f>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp 3fca <_sk_store_4444_hsw+0x7f>
+ .byte 235,158 // jmp 404a <_sk_store_4444_hsw+0x7f>
.byte 199 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -13377,7 +13405,7 @@ _sk_store_4444_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,224 // callq ffffffffe1004044 <_sk_overlay_sse2_8bit+0xffffffffe0fd908f>
+ .byte 232,255,255,255,224 // callq ffffffffe10040c4 <_sk_overlay_sse2_8bit+0xffffffffe0fd8bdf>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -13395,16 +13423,16 @@ _sk_load_8888_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 40bc <_sk_load_8888_hsw+0x74>
+ .byte 117,87 // jne 413c <_sk_load_8888_hsw+0x74>
.byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3
- .byte 197,229,219,5,237,117,2,0 // vpand 0x275ed(%rip),%ymm3,%ymm0 # 2b660 <_sk_overlay_sse2_8bit+0x6ab>
+ .byte 197,229,219,5,173,122,2,0 // vpand 0x27aad(%rip),%ymm3,%ymm0 # 2bba0 <_sk_overlay_sse2_8bit+0x6bb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,236,115,2,0 // vbroadcastss 0x273ec(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,156,120,2,0 // vbroadcastss 0x2789c(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,242,117,2,0 // vpshufb 0x275f2(%rip),%ymm3,%ymm1 # 2b680 <_sk_overlay_sse2_8bit+0x6cb>
+ .byte 196,226,101,0,13,178,122,2,0 // vpshufb 0x27ab2(%rip),%ymm3,%ymm1 # 2bbc0 <_sk_overlay_sse2_8bit+0x6db>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,0,118,2,0 // vpshufb 0x27600(%rip),%ymm3,%ymm2 # 2b6a0 <_sk_overlay_sse2_8bit+0x6eb>
+ .byte 196,226,101,0,21,192,122,2,0 // vpshufb 0x27ac0(%rip),%ymm3,%ymm2 # 2bbe0 <_sk_overlay_sse2_8bit+0x6fb>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13418,21 +13446,21 @@ _sk_load_8888_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 406b <_sk_load_8888_hsw+0x23>
+ .byte 119,155 // ja 40eb <_sk_load_8888_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4168 <_sk_load_8888_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 41e8 <_sk_load_8888_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3
- .byte 233,124,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 40eb <_sk_load_8888_hsw+0x23>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,85,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 40eb <_sk_load_8888_hsw+0x23>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -13445,9 +13473,9 @@ _sk_load_8888_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,6,255,255,255 // jmpq 406b <_sk_load_8888_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 40eb <_sk_load_8888_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 4169 <_sk_load_8888_hsw+0x121>
+ .byte 124,255 // jl 41e9 <_sk_load_8888_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -13481,16 +13509,16 @@ _sk_load_8888_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 41f8 <_sk_load_8888_dst_hsw+0x74>
+ .byte 117,87 // jne 4278 <_sk_load_8888_dst_hsw+0x74>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,17,117,2,0 // vpand 0x27511(%rip),%ymm7,%ymm4 # 2b6c0 <_sk_overlay_sse2_8bit+0x70b>
+ .byte 197,197,219,37,209,121,2,0 // vpand 0x279d1(%rip),%ymm7,%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0x71b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,176,114,2,0 // vbroadcastss 0x272b0(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,96,119,2,0 // vbroadcastss 0x27760(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
- .byte 196,226,69,0,45,22,117,2,0 // vpshufb 0x27516(%rip),%ymm7,%ymm5 # 2b6e0 <_sk_overlay_sse2_8bit+0x72b>
+ .byte 196,226,69,0,45,214,121,2,0 // vpshufb 0x279d6(%rip),%ymm7,%ymm5 # 2bc20 <_sk_overlay_sse2_8bit+0x73b>
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
.byte 196,193,84,89,232 // vmulps %ymm8,%ymm5,%ymm5
- .byte 196,226,69,0,53,36,117,2,0 // vpshufb 0x27524(%rip),%ymm7,%ymm6 # 2b700 <_sk_overlay_sse2_8bit+0x74b>
+ .byte 196,226,69,0,53,228,121,2,0 // vpshufb 0x279e4(%rip),%ymm7,%ymm6 # 2bc40 <_sk_overlay_sse2_8bit+0x75b>
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -13504,21 +13532,21 @@ _sk_load_8888_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 41a7 <_sk_load_8888_dst_hsw+0x23>
+ .byte 119,155 // ja 4227 <_sk_load_8888_dst_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 42a4 <_sk_load_8888_dst_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4324 <_sk_load_8888_dst_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,124,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 4227 <_sk_load_8888_dst_hsw+0x23>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,85,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 4227 <_sk_load_8888_dst_hsw+0x23>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -13531,9 +13559,9 @@ _sk_load_8888_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,6,255,255,255 // jmpq 41a7 <_sk_load_8888_dst_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 4227 <_sk_load_8888_dst_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 42a5 <_sk_load_8888_dst_hsw+0x121>
+ .byte 124,255 // jl 4325 <_sk_load_8888_dst_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -13567,14 +13595,14 @@ _sk_gather_8888_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,50,116,2,0 // vpand 0x27432(%rip),%ymm3,%ymm0 # 2b720 <_sk_overlay_sse2_8bit+0x76b>
+ .byte 197,229,219,5,242,120,2,0 // vpand 0x278f2(%rip),%ymm3,%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x77b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,113,113,2,0 // vbroadcastss 0x27171(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,33,118,2,0 // vbroadcastss 0x27621(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,226,101,0,13,55,116,2,0 // vpshufb 0x27437(%rip),%ymm3,%ymm1 # 2b740 <_sk_overlay_sse2_8bit+0x78b>
+ .byte 196,226,101,0,13,247,120,2,0 // vpshufb 0x278f7(%rip),%ymm3,%ymm1 # 2bc80 <_sk_overlay_sse2_8bit+0x79b>
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,226,101,0,21,69,116,2,0 // vpshufb 0x27445(%rip),%ymm3,%ymm2 # 2b760 <_sk_overlay_sse2_8bit+0x7ab>
+ .byte 196,226,101,0,21,5,121,2,0 // vpshufb 0x27905(%rip),%ymm3,%ymm2 # 2bca0 <_sk_overlay_sse2_8bit+0x7bb>
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13595,7 +13623,7 @@ _sk_store_8888_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,205,112,2,0 // vbroadcastss 0x270cd(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,125,117,2,0 // vbroadcastss 0x2757d(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -13611,7 +13639,7 @@ _sk_store_8888_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 43b0 <_sk_store_8888_hsw+0x7a>
+ .byte 117,11 // jne 4430 <_sk_store_8888_hsw+0x7a>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13620,17 +13648,17 @@ _sk_store_8888_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 43ab <_sk_store_8888_hsw+0x75>
+ .byte 119,235 // ja 442b <_sk_store_8888_hsw+0x75>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4420 <_sk_store_8888_hsw+0xea>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 44a0 <_sk_store_8888_hsw+0xea>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp 43ab <_sk_store_8888_hsw+0x75>
+ .byte 235,207 // jmp 442b <_sk_store_8888_hsw+0x75>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp 43ab <_sk_store_8888_hsw+0x75>
+ .byte 235,191 // jmp 442b <_sk_store_8888_hsw+0x75>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -13638,7 +13666,7 @@ _sk_store_8888_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp 43ab <_sk_store_8888_hsw+0x75>
+ .byte 235,142 // jmp 442b <_sk_store_8888_hsw+0x75>
.byte 15,31,0 // nopl (%rax)
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
@@ -13650,7 +13678,7 @@ _sk_store_8888_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,218 // callq ffffffffdb004434 <_sk_overlay_sse2_8bit+0xffffffffdafd947f>
+ .byte 232,255,255,255,218 // callq ffffffffdb0044b4 <_sk_overlay_sse2_8bit+0xffffffffdafd8fcf>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,204 // dec %esp
@@ -13671,16 +13699,16 @@ _sk_load_bgra_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 44b0 <_sk_load_bgra_hsw+0x74>
+ .byte 117,87 // jne 4530 <_sk_load_bgra_hsw+0x74>
.byte 196,193,126,111,28,153 // vmovdqu (%r9,%rbx,4),%ymm3
- .byte 197,229,219,5,25,115,2,0 // vpand 0x27319(%rip),%ymm3,%ymm0 # 2b780 <_sk_overlay_sse2_8bit+0x7cb>
+ .byte 197,229,219,5,217,119,2,0 // vpand 0x277d9(%rip),%ymm3,%ymm0 # 2bcc0 <_sk_overlay_sse2_8bit+0x7db>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,248,111,2,0 // vbroadcastss 0x26ff8(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,168,116,2,0 // vbroadcastss 0x274a8(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,30,115,2,0 // vpshufb 0x2731e(%rip),%ymm3,%ymm0 # 2b7a0 <_sk_overlay_sse2_8bit+0x7eb>
+ .byte 196,226,101,0,5,222,119,2,0 // vpshufb 0x277de(%rip),%ymm3,%ymm0 # 2bce0 <_sk_overlay_sse2_8bit+0x7fb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,44,115,2,0 // vpshufb 0x2732c(%rip),%ymm3,%ymm0 # 2b7c0 <_sk_overlay_sse2_8bit+0x80b>
+ .byte 196,226,101,0,5,236,119,2,0 // vpshufb 0x277ec(%rip),%ymm3,%ymm0 # 2bd00 <_sk_overlay_sse2_8bit+0x81b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13694,21 +13722,21 @@ _sk_load_bgra_hsw:
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 445f <_sk_load_bgra_hsw+0x23>
+ .byte 119,155 // ja 44df <_sk_load_bgra_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 455c <_sk_load_bgra_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 45dc <_sk_load_bgra_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,28,153 // vmovd (%r9,%rbx,4),%xmm3
- .byte 233,124,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 44df <_sk_load_bgra_hsw+0x23>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
.byte 196,227,117,2,216,4 // vpblendd $0x4,%ymm0,%ymm1,%ymm3
.byte 196,193,122,126,4,153 // vmovq (%r9,%rbx,4),%xmm0
.byte 196,227,101,2,216,3 // vpblendd $0x3,%ymm0,%ymm3,%ymm3
- .byte 233,85,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 44df <_sk_load_bgra_hsw+0x23>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -13721,9 +13749,9 @@ _sk_load_bgra_hsw:
.byte 196,227,101,56,216,1 // vinserti128 $0x1,%xmm0,%ymm3,%ymm3
.byte 196,193,122,111,4,153 // vmovdqu (%r9,%rbx,4),%xmm0
.byte 196,227,125,2,219,240 // vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- .byte 233,6,255,255,255 // jmpq 445f <_sk_load_bgra_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 44df <_sk_load_bgra_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 455d <_sk_load_bgra_hsw+0x121>
+ .byte 124,255 // jl 45dd <_sk_load_bgra_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -13757,16 +13785,16 @@ _sk_load_bgra_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,87 // jne 45ec <_sk_load_bgra_dst_hsw+0x74>
+ .byte 117,87 // jne 466c <_sk_load_bgra_dst_hsw+0x74>
.byte 196,193,126,111,60,153 // vmovdqu (%r9,%rbx,4),%ymm7
- .byte 197,197,219,37,61,114,2,0 // vpand 0x2723d(%rip),%ymm7,%ymm4 # 2b7e0 <_sk_overlay_sse2_8bit+0x82b>
+ .byte 197,197,219,37,253,118,2,0 // vpand 0x276fd(%rip),%ymm7,%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0x83b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,188,110,2,0 // vbroadcastss 0x26ebc(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,108,115,2,0 // vbroadcastss 0x2736c(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,240 // vmulps %ymm8,%ymm4,%ymm6
- .byte 196,226,69,0,37,66,114,2,0 // vpshufb 0x27242(%rip),%ymm7,%ymm4 # 2b800 <_sk_overlay_sse2_8bit+0x84b>
+ .byte 196,226,69,0,37,2,119,2,0 // vpshufb 0x27702(%rip),%ymm7,%ymm4 # 2bd40 <_sk_overlay_sse2_8bit+0x85b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,232 // vmulps %ymm8,%ymm4,%ymm5
- .byte 196,226,69,0,37,80,114,2,0 // vpshufb 0x27250(%rip),%ymm7,%ymm4 # 2b820 <_sk_overlay_sse2_8bit+0x86b>
+ .byte 196,226,69,0,37,16,119,2,0 // vpshufb 0x27710(%rip),%ymm7,%ymm4 # 2bd60 <_sk_overlay_sse2_8bit+0x87b>
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 197,197,114,215,24 // vpsrld $0x18,%ymm7,%ymm7
@@ -13780,21 +13808,21 @@ _sk_load_bgra_dst_hsw:
.byte 197,197,239,255 // vpxor %ymm7,%ymm7,%ymm7
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,155 // ja 459b <_sk_load_bgra_dst_hsw+0x23>
+ .byte 119,155 // ja 461b <_sk_load_bgra_dst_hsw+0x23>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4698 <_sk_load_bgra_dst_hsw+0x120>
+ .byte 76,141,29,141,0,0,0 // lea 0x8d(%rip),%r11 # 4718 <_sk_load_bgra_dst_hsw+0x120>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,60,153 // vmovd (%r9,%rbx,4),%xmm7
- .byte 233,124,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,124,255,255,255 // jmpq 461b <_sk_load_bgra_dst_hsw+0x23>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
.byte 196,227,85,2,252,4 // vpblendd $0x4,%ymm4,%ymm5,%ymm7
.byte 196,193,122,126,36,153 // vmovq (%r9,%rbx,4),%xmm4
.byte 196,227,69,2,252,3 // vpblendd $0x3,%ymm4,%ymm7,%ymm7
- .byte 233,85,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,85,255,255,255 // jmpq 461b <_sk_load_bgra_dst_hsw+0x23>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -13807,9 +13835,9 @@ _sk_load_bgra_dst_hsw:
.byte 196,227,69,56,252,1 // vinserti128 $0x1,%xmm4,%ymm7,%ymm7
.byte 196,193,122,111,36,153 // vmovdqu (%r9,%rbx,4),%xmm4
.byte 196,227,93,2,255,240 // vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- .byte 233,6,255,255,255 // jmpq 459b <_sk_load_bgra_dst_hsw+0x23>
+ .byte 233,6,255,255,255 // jmpq 461b <_sk_load_bgra_dst_hsw+0x23>
.byte 15,31,0 // nopl (%rax)
- .byte 124,255 // jl 4699 <_sk_load_bgra_dst_hsw+0x121>
+ .byte 124,255 // jl 4719 <_sk_load_bgra_dst_hsw+0x121>
.byte 255 // (bad)
.byte 255,157,255,255,255,135 // lcall *-0x78000001(%rbp)
.byte 255 // (bad)
@@ -13843,14 +13871,14 @@ _sk_gather_bgra_hsw:
.byte 197,245,254,192 // vpaddd %ymm0,%ymm1,%ymm0
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,194,117,144,28,129 // vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- .byte 197,229,219,5,94,113,2,0 // vpand 0x2715e(%rip),%ymm3,%ymm0 # 2b840 <_sk_overlay_sse2_8bit+0x88b>
+ .byte 197,229,219,5,30,118,2,0 // vpand 0x2761e(%rip),%ymm3,%ymm0 # 2bd80 <_sk_overlay_sse2_8bit+0x89b>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,125,109,2,0 // vbroadcastss 0x26d7d(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,45,114,2,0 // vbroadcastss 0x2722d(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,208 // vmulps %ymm8,%ymm0,%ymm2
- .byte 196,226,101,0,5,99,113,2,0 // vpshufb 0x27163(%rip),%ymm3,%ymm0 # 2b860 <_sk_overlay_sse2_8bit+0x8ab>
+ .byte 196,226,101,0,5,35,118,2,0 // vpshufb 0x27623(%rip),%ymm3,%ymm0 # 2bda0 <_sk_overlay_sse2_8bit+0x8bb>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,200 // vmulps %ymm8,%ymm0,%ymm1
- .byte 196,226,101,0,5,113,113,2,0 // vpshufb 0x27171(%rip),%ymm3,%ymm0 # 2b880 <_sk_overlay_sse2_8bit+0x8cb>
+ .byte 196,226,101,0,5,49,118,2,0 // vpshufb 0x27631(%rip),%ymm3,%ymm0 # 2bdc0 <_sk_overlay_sse2_8bit+0x8db>
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,229,114,211,24 // vpsrld $0x18,%ymm3,%ymm3
@@ -13871,7 +13899,7 @@ _sk_store_bgra_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,217,108,2,0 // vbroadcastss 0x26cd9(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,137,113,2,0 // vbroadcastss 0x27189(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -13887,7 +13915,7 @@ _sk_store_bgra_hsw:
.byte 196,65,45,235,192 // vpor %ymm8,%ymm10,%ymm8
.byte 196,65,53,235,192 // vpor %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne 47a4 <_sk_store_bgra_hsw+0x7a>
+ .byte 117,11 // jne 4824 <_sk_store_bgra_hsw+0x7a>
.byte 196,65,126,127,4,153 // vmovdqu %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -13896,17 +13924,17 @@ _sk_store_bgra_hsw:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja 479f <_sk_store_bgra_hsw+0x75>
+ .byte 119,235 // ja 481f <_sk_store_bgra_hsw+0x75>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4814 <_sk_store_bgra_hsw+0xea>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # 4894 <_sk_store_bgra_hsw+0xea>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp 479f <_sk_store_bgra_hsw+0x75>
+ .byte 235,207 // jmp 481f <_sk_store_bgra_hsw+0x75>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp 479f <_sk_store_bgra_hsw+0x75>
+ .byte 235,191 // jmp 481f <_sk_store_bgra_hsw+0x75>
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
@@ -13914,7 +13942,7 @@ _sk_store_bgra_hsw:
.byte 196,67,125,57,193,1 // vextracti128 $0x1,%ymm8,%xmm9
.byte 196,65,121,126,76,153,16 // vmovd %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,122,127,4,153 // vmovdqu %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp 479f <_sk_store_bgra_hsw+0x75>
+ .byte 235,142 // jmp 481f <_sk_store_bgra_hsw+0x75>
.byte 15,31,0 // nopl (%rax)
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
@@ -13926,7 +13954,7 @@ _sk_store_bgra_hsw:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,218 // callq ffffffffdb004828 <_sk_overlay_sse2_8bit+0xffffffffdafd9873>
+ .byte 232,255,255,255,218 // callq ffffffffdb0048a8 <_sk_overlay_sse2_8bit+0xffffffffdafd93c3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,204 // dec %esp
@@ -13946,7 +13974,7 @@ _sk_load_f16_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 48b1 <_sk_load_f16_hsw+0x81>
+ .byte 117,101 // jne 4931 <_sk_load_f16_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,92,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -13972,29 +14000,29 @@ _sk_load_f16_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4917 <_sk_load_f16_hsw+0xe7>
+ .byte 116,85 // je 4997 <_sk_load_f16_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4917 <_sk_load_f16_hsw+0xe7>
+ .byte 114,72 // jb 4997 <_sk_load_f16_hsw+0xe7>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4924 <_sk_load_f16_hsw+0xf4>
+ .byte 116,72 // je 49a4 <_sk_load_f16_hsw+0xf4>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4924 <_sk_load_f16_hsw+0xf4>
+ .byte 114,59 // jb 49a4 <_sk_load_f16_hsw+0xf4>
.byte 196,193,123,16,92,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 4867 <_sk_load_f16_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 48e7 <_sk_load_f16_hsw+0x37>
.byte 196,193,97,22,92,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 4867 <_sk_load_f16_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 48e7 <_sk_load_f16_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 48e7 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,67,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 48e7 <_sk_load_f16_hsw+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,58,255,255,255 // jmpq 4867 <_sk_load_f16_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 48e7 <_sk_load_f16_hsw+0x37>
HIDDEN _sk_load_f16_dst_hsw
.globl _sk_load_f16_dst_hsw
@@ -14008,7 +14036,7 @@ _sk_load_f16_dst_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,101 // jne 49ae <_sk_load_f16_dst_hsw+0x81>
+ .byte 117,101 // jne 4a2e <_sk_load_f16_dst_hsw+0x81>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,124,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -14034,29 +14062,29 @@ _sk_load_f16_dst_hsw:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4a14 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 116,85 // je 4a94 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4a14 <_sk_load_f16_dst_hsw+0xe7>
+ .byte 114,72 // jb 4a94 <_sk_load_f16_dst_hsw+0xe7>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4a21 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 116,72 // je 4aa1 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4a21 <_sk_load_f16_dst_hsw+0xf4>
+ .byte 114,59 // jb 4aa1 <_sk_load_f16_dst_hsw+0xf4>
.byte 196,193,123,16,124,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm7
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,109,255,255,255 // je 4964 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,132,109,255,255,255 // je 49e4 <_sk_load_f16_dst_hsw+0x37>
.byte 196,193,65,22,124,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,92,255,255,255 // jb 4964 <_sk_load_f16_dst_hsw+0x37>
+ .byte 15,130,92,255,255,255 // jb 49e4 <_sk_load_f16_dst_hsw+0x37>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,80,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,80,255,255,255 // jmpq 49e4 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,67,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,67,255,255,255 // jmpq 49e4 <_sk_load_f16_dst_hsw+0x37>
.byte 197,193,87,255 // vxorpd %xmm7,%xmm7,%xmm7
- .byte 233,58,255,255,255 // jmpq 4964 <_sk_load_f16_dst_hsw+0x37>
+ .byte 233,58,255,255,255 // jmpq 49e4 <_sk_load_f16_dst_hsw+0x37>
HIDDEN _sk_gather_f16_hsw
.globl _sk_gather_f16_hsw
@@ -14119,7 +14147,7 @@ _sk_store_f16_hsw:
.byte 196,65,57,98,205 // vpunpckldq %xmm13,%xmm8,%xmm9
.byte 196,65,57,106,197 // vpunpckhdq %xmm13,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4b2f <_sk_store_f16_hsw+0x7b>
+ .byte 117,31 // jne 4baf <_sk_store_f16_hsw+0x7b>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -14128,22 +14156,22 @@ _sk_store_f16_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 116,240 // je 4bab <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 114,227 // jb 4bab <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,218 // je 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 116,218 // je 4bab <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 114,205 // jb 4bab <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,196 // je 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 116,196 // je 4bab <_sk_store_f16_hsw+0x77>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 114,183 // jb 4bab <_sk_store_f16_hsw+0x77>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,174 // jmp 4b2b <_sk_store_f16_hsw+0x77>
+ .byte 235,174 // jmp 4bab <_sk_store_f16_hsw+0x77>
HIDDEN _sk_load_u16_be_hsw
.globl _sk_load_u16_be_hsw
@@ -14158,7 +14186,7 @@ _sk_load_u16_be_hsw:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 4c70 <_sk_load_u16_be_hsw+0xf3>
+ .byte 15,133,204,0,0,0 // jne 4cf0 <_sk_load_u16_be_hsw+0xf3>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -14177,7 +14205,7 @@ _sk_load_u16_be_hsw:
.byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,131,104,2,0 // vbroadcastss 0x26883(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,21,51,109,2,0 // vbroadcastss 0x26d33(%rip),%ymm10 # 2b9b8 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -14205,29 +14233,29 @@ _sk_load_u16_be_hsw:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 4cd6 <_sk_load_u16_be_hsw+0x159>
+ .byte 116,85 // je 4d56 <_sk_load_u16_be_hsw+0x159>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 4cd6 <_sk_load_u16_be_hsw+0x159>
+ .byte 114,72 // jb 4d56 <_sk_load_u16_be_hsw+0x159>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 4ce3 <_sk_load_u16_be_hsw+0x166>
+ .byte 116,72 // je 4d63 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 4ce3 <_sk_load_u16_be_hsw+0x166>
+ .byte 114,59 // jb 4d63 <_sk_load_u16_be_hsw+0x166>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,6,255,255,255 // je 4bbf <_sk_load_u16_be_hsw+0x42>
+ .byte 15,132,6,255,255,255 // je 4c3f <_sk_load_u16_be_hsw+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,245,254,255,255 // jb 4bbf <_sk_load_u16_be_hsw+0x42>
+ .byte 15,130,245,254,255,255 // jb 4c3f <_sk_load_u16_be_hsw+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,233,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
+ .byte 233,233,254,255,255 // jmpq 4c3f <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,220,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
+ .byte 233,220,254,255,255 // jmpq 4c3f <_sk_load_u16_be_hsw+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,211,254,255,255 // jmpq 4bbf <_sk_load_u16_be_hsw+0x42>
+ .byte 233,211,254,255,255 // jmpq 4c3f <_sk_load_u16_be_hsw+0x42>
HIDDEN _sk_load_rgb_u16_be_hsw
.globl _sk_load_rgb_u16_be_hsw
@@ -14244,82 +14272,110 @@ _sk_load_rgb_u16_be_hsw:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,204,0,0,0 // jne 4de3 <_sk_load_rgb_u16_be_hsw+0xf7>
- .byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
- .byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
- .byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
- .byte 196,193,122,111,92,65,32 // vmovdqu 0x20(%r9,%rax,2),%xmm3
- .byte 197,225,115,219,4 // vpsrldq $0x4,%xmm3,%xmm3
- .byte 197,185,115,216,6 // vpsrldq $0x6,%xmm0,%xmm8
- .byte 197,177,115,218,6 // vpsrldq $0x6,%xmm2,%xmm9
- .byte 197,161,115,217,6 // vpsrldq $0x6,%xmm1,%xmm11
+ .byte 15,133,203,0,0,0 // jne 4e62 <_sk_load_rgb_u16_be_hsw+0xf6>
+ .byte 196,65,122,111,28,65 // vmovdqu (%r9,%rax,2),%xmm11
+ .byte 196,193,122,111,92,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm3
+ .byte 196,193,122,111,84,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm2
+ .byte 196,193,122,111,68,65,32 // vmovdqu 0x20(%r9,%rax,2),%xmm0
+ .byte 197,249,115,216,4 // vpsrldq $0x4,%xmm0,%xmm0
+ .byte 196,193,57,115,219,6 // vpsrldq $0x6,%xmm11,%xmm8
.byte 197,169,115,219,6 // vpsrldq $0x6,%xmm3,%xmm10
- .byte 197,249,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm0
- .byte 196,193,57,97,209 // vpunpcklwd %xmm9,%xmm8,%xmm2
- .byte 197,241,97,203 // vpunpcklwd %xmm3,%xmm1,%xmm1
- .byte 196,193,33,97,218 // vpunpcklwd %xmm10,%xmm11,%xmm3
- .byte 197,121,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm8
- .byte 197,121,105,202 // vpunpckhwd %xmm2,%xmm0,%xmm9
- .byte 197,241,97,211 // vpunpcklwd %xmm3,%xmm1,%xmm2
- .byte 197,241,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm3
- .byte 197,185,108,194 // vpunpcklqdq %xmm2,%xmm8,%xmm0
- .byte 197,241,113,240,8 // vpsllw $0x8,%xmm0,%xmm1
+ .byte 197,153,115,218,6 // vpsrldq $0x6,%xmm2,%xmm12
+ .byte 197,177,115,216,6 // vpsrldq $0x6,%xmm0,%xmm9
+ .byte 197,161,97,219 // vpunpcklwd %xmm3,%xmm11,%xmm3
+ .byte 196,193,57,97,202 // vpunpcklwd %xmm10,%xmm8,%xmm1
+ .byte 197,233,97,192 // vpunpcklwd %xmm0,%xmm2,%xmm0
+ .byte 196,193,25,97,209 // vpunpcklwd %xmm9,%xmm12,%xmm2
+ .byte 197,97,97,193 // vpunpcklwd %xmm1,%xmm3,%xmm8
+ .byte 197,97,105,201 // vpunpckhwd %xmm1,%xmm3,%xmm9
+ .byte 197,249,97,202 // vpunpcklwd %xmm2,%xmm0,%xmm1
+ .byte 197,121,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm10
+ .byte 197,185,108,193 // vpunpcklqdq %xmm1,%xmm8,%xmm0
+ .byte 197,225,113,240,8 // vpsllw $0x8,%xmm0,%xmm3
.byte 197,249,113,208,8 // vpsrlw $0x8,%xmm0,%xmm0
- .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
+ .byte 197,225,235,192 // vpor %xmm0,%xmm3,%xmm0
.byte 196,226,125,51,192 // vpmovzxwd %xmm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,247,102,2,0 // vbroadcastss 0x266f7(%rip),%ymm10 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
- .byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
- .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
+ .byte 196,226,125,24,29,166,107,2,0 // vbroadcastss 0x26ba6(%rip),%ymm3 # 2b9b8 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
+ .byte 197,185,109,201 // vpunpckhqdq %xmm1,%xmm8,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
.byte 197,241,113,209,8 // vpsrlw $0x8,%xmm1,%xmm1
.byte 197,233,235,201 // vpor %xmm1,%xmm2,%xmm1
.byte 196,226,125,51,201 // vpmovzxwd %xmm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
- .byte 197,177,108,211 // vpunpcklqdq %xmm3,%xmm9,%xmm2
- .byte 197,225,113,242,8 // vpsllw $0x8,%xmm2,%xmm3
+ .byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
+ .byte 196,193,49,108,210 // vpunpcklqdq %xmm10,%xmm9,%xmm2
+ .byte 197,185,113,242,8 // vpsllw $0x8,%xmm2,%xmm8
.byte 197,233,113,210,8 // vpsrlw $0x8,%xmm2,%xmm2
- .byte 197,225,235,210 // vpor %xmm2,%xmm3,%xmm2
+ .byte 197,185,235,210 // vpor %xmm2,%xmm8,%xmm2
.byte 196,226,125,51,210 // vpmovzxwd %xmm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
+ .byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,23,102,2,0 // vbroadcastss 0x26617(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,200,106,2,0 // vbroadcastss 0x26ac8(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
- .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
+ .byte 196,65,121,196,92,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm11
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 4dfc <_sk_load_rgb_u16_be_hsw+0x110>
- .byte 233,79,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
- .byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
+ .byte 117,32 // jne 4e9b <_sk_load_rgb_u16_be_hsw+0x12f>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 233,49,255,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 196,193,121,110,68,65,6 // vmovd 0x6(%r9,%rax,2),%xmm0
+ .byte 196,65,121,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm0,%xmm8
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 4e2b <_sk_load_rgb_u16_be_hsw+0x13f>
- .byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
- .byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
+ .byte 114,49 // jb 4ee6 <_sk_load_rgb_u16_be_hsw+0x17a>
+ .byte 196,193,121,110,68,65,12 // vmovd 0xc(%r9,%rax,2),%xmm0
+ .byte 196,193,121,196,92,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm0,%xmm3
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 4e30 <_sk_load_rgb_u16_be_hsw+0x144>
- .byte 233,32,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,27,255,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
- .byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
+ .byte 117,50 // jne 4f01 <_sk_load_rgb_u16_be_hsw+0x195>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 233,230,254,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 233,203,254,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 196,193,121,110,68,65,18 // vmovd 0x12(%r9,%rax,2),%xmm0
+ .byte 196,65,121,196,84,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm0,%xmm10
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 4e5f <_sk_load_rgb_u16_be_hsw+0x173>
- .byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
- .byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
+ .byte 114,40 // jb 4f43 <_sk_load_rgb_u16_be_hsw+0x1d7>
+ .byte 196,193,121,110,68,65,24 // vmovd 0x18(%r9,%rax,2),%xmm0
+ .byte 196,193,121,196,84,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm0,%xmm2
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 4e64 <_sk_load_rgb_u16_be_hsw+0x178>
- .byte 233,236,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,231,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
- .byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
+ .byte 117,32 // jne 4f55 <_sk_load_rgb_u16_be_hsw+0x1e9>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 233,137,254,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 233,119,254,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 196,193,121,110,68,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm0
+ .byte 196,65,121,196,100,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm0,%xmm12
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 4e8d <_sk_load_rgb_u16_be_hsw+0x1a1>
- .byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
- .byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,190,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
- .byte 233,185,254,255,255 // jmpq 4d4b <_sk_load_rgb_u16_be_hsw+0x5f>
+ .byte 114,25 // jb 4f88 <_sk_load_rgb_u16_be_hsw+0x21c>
+ .byte 196,193,121,110,68,65,36 // vmovd 0x24(%r9,%rax,2),%xmm0
+ .byte 196,193,121,196,68,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm0,%xmm0
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
+ .byte 233,68,254,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 233,59,254,255,255 // jmpq 4dcc <_sk_load_rgb_u16_be_hsw+0x60>
HIDDEN _sk_store_u16_be_hsw
.globl _sk_store_u16_be_hsw
@@ -14333,7 +14389,7 @@ _sk_store_u16_be_hsw:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,87,102,2,0 // vbroadcastss 0x26657(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b>
+ .byte 196,98,125,24,5,136,106,2,0 // vbroadcastss 0x26a88(%rip),%ymm8 # 2ba40 <_sk_overlay_sse2_8bit+0x55b>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -14371,7 +14427,7 @@ _sk_store_u16_be_hsw:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne 4f9d <_sk_store_u16_be_hsw+0x10b>
+ .byte 117,31 // jne 509c <_sk_store_u16_be_hsw+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -14380,30 +14436,36 @@ _sk_store_u16_be_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,240 // je 5098 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,227 // jb 5098 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,218 // je 5098 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,205 // jb 5098 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 116,196 // je 5098 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 114,183 // jb 5098 <_sk_store_u16_be_hsw+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp 4f99 <_sk_store_u16_be_hsw+0x107>
+ .byte 235,174 // jmp 5098 <_sk_store_u16_be_hsw+0x107>
HIDDEN _sk_load_f32_hsw
.globl _sk_load_f32_hsw
FUNCTION(_sk_load_f32_hsw)
_sk_load_f32_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 5077 <_sk_load_f32_hsw+0x8c>
+ .byte 15,135,97,1,0,0 // ja 525b <_sk_load_f32_hsw+0x171>
+ .byte 72,131,236,24 // sub $0x18,%rsp
+ .byte 197,253,17,100,36,128 // vmovupd %ymm4,-0x80(%rsp)
+ .byte 197,253,17,108,36,160 // vmovupd %ymm5,-0x60(%rsp)
+ .byte 197,253,17,116,36,192 // vmovupd %ymm6,-0x40(%rsp)
+ .byte 197,253,17,124,36,224 // vmovupd %ymm7,-0x20(%rsp)
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -14411,45 +14473,83 @@ _sk_load_f32_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,133,0,0,0 // lea 0x85(%rip),%r11 # 50a0 <_sk_load_f32_hsw+0xb5>
+ .byte 76,141,29,50,1,0,0 // lea 0x132(%rip),%r11 # 526c <_sk_load_f32_hsw+0x182>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
- .byte 255,224 // jmpq *%rax
- .byte 196,3,125,24,68,145,112,1 // vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- .byte 196,131,125,24,92,145,96,1 // vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm3
- .byte 196,131,125,24,76,145,80,1 // vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm1
- .byte 196,131,125,24,84,145,64,1 // vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm2
- .byte 196,129,121,16,68,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm0
- .byte 196,195,125,13,192,12 // vblendpd $0xc,%ymm8,%ymm0,%ymm0
- .byte 196,1,121,16,68,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm8
- .byte 196,99,61,13,203,12 // vblendpd $0xc,%ymm3,%ymm8,%ymm9
- .byte 196,129,121,16,92,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm3
- .byte 196,99,101,13,209,12 // vblendpd $0xc,%ymm1,%ymm3,%ymm10
+ .byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
+ .byte 196,65,53,87,201 // vxorpd %ymm9,%ymm9,%ymm9
+ .byte 197,237,87,210 // vxorpd %ymm2,%ymm2,%ymm2
+ .byte 196,65,37,87,219 // vxorpd %ymm11,%ymm11,%ymm11
+ .byte 196,65,29,87,228 // vxorpd %ymm12,%ymm12,%ymm12
+ .byte 196,65,61,87,192 // vxorpd %ymm8,%ymm8,%ymm8
+ .byte 196,65,13,87,246 // vxorpd %ymm14,%ymm14,%ymm14
+ .byte 197,205,87,246 // vxorpd %ymm6,%ymm6,%ymm6
+ .byte 196,65,5,87,255 // vxorpd %ymm15,%ymm15,%ymm15
+ .byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
+ .byte 196,65,21,87,237 // vxorpd %ymm13,%ymm13,%ymm13
+ .byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
+ .byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
+ .byte 255,224 // jmpq *%rax
+ .byte 196,129,121,16,68,145,112 // vmovupd 0x70(%r9,%r10,4),%xmm0
+ .byte 196,227,125,6,192,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ .byte 196,129,121,16,76,145,96 // vmovupd 0x60(%r9,%r10,4),%xmm1
+ .byte 196,227,125,6,225,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm4
+ .byte 196,129,121,16,76,145,80 // vmovupd 0x50(%r9,%r10,4),%xmm1
+ .byte 196,227,125,6,209,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm2
+ .byte 197,125,40,204 // vmovapd %ymm4,%ymm9
+ .byte 196,129,121,16,76,145,64 // vmovupd 0x40(%r9,%r10,4),%xmm1
+ .byte 196,99,125,6,193,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm8
+ .byte 196,65,125,40,217 // vmovapd %ymm9,%ymm11
+ .byte 197,125,40,226 // vmovapd %ymm2,%ymm12
+ .byte 196,129,121,16,76,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm1
+ .byte 196,227,117,13,192,12 // vblendpd $0xc,%ymm0,%ymm1,%ymm0
+ .byte 196,65,125,40,243 // vmovapd %ymm11,%ymm14
+ .byte 197,125,41,230 // vmovapd %ymm12,%ymm6
+ .byte 196,65,125,40,248 // vmovapd %ymm8,%ymm15
+ .byte 196,129,121,16,76,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm1
+ .byte 196,195,117,13,206,12 // vblendpd $0xc,%ymm14,%ymm1,%ymm1
+ .byte 197,125,40,238 // vmovapd %ymm6,%ymm13
+ .byte 197,125,41,253 // vmovapd %ymm15,%ymm5
+ .byte 196,129,121,16,84,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm2
+ .byte 196,67,109,13,213,12 // vblendpd $0xc,%ymm13,%ymm2,%ymm10
+ .byte 197,253,40,217 // vmovapd %ymm1,%ymm3
+ .byte 197,253,40,253 // vmovapd %ymm5,%ymm7
.byte 196,129,121,16,12,145 // vmovupd (%r9,%r10,4),%xmm1
- .byte 196,227,117,13,202,12 // vblendpd $0xc,%ymm2,%ymm1,%ymm1
+ .byte 196,227,117,13,207,12 // vblendpd $0xc,%ymm7,%ymm1,%ymm1
+ .byte 197,252,16,124,36,224 // vmovups -0x20(%rsp),%ymm7
+ .byte 197,252,16,116,36,192 // vmovups -0x40(%rsp),%ymm6
+ .byte 197,252,16,108,36,160 // vmovups -0x60(%rsp),%ymm5
+ .byte 197,252,16,100,36,128 // vmovups -0x80(%rsp),%ymm4
+ .byte 72,131,196,24 // add $0x18,%rsp
.byte 196,193,116,20,210 // vunpcklps %ymm10,%ymm1,%ymm2
- .byte 196,193,116,21,218 // vunpckhps %ymm10,%ymm1,%ymm3
- .byte 197,180,20,200 // vunpcklps %ymm0,%ymm9,%ymm1
- .byte 197,52,21,192 // vunpckhps %ymm0,%ymm9,%ymm8
+ .byte 196,65,116,21,194 // vunpckhps %ymm10,%ymm1,%ymm8
+ .byte 197,228,20,200 // vunpcklps %ymm0,%ymm3,%ymm1
+ .byte 197,228,21,216 // vunpckhps %ymm0,%ymm3,%ymm3
.byte 197,237,20,193 // vunpcklpd %ymm1,%ymm2,%ymm0
.byte 197,237,21,201 // vunpckhpd %ymm1,%ymm2,%ymm1
- .byte 196,193,101,20,208 // vunpcklpd %ymm8,%ymm3,%ymm2
- .byte 196,193,101,21,216 // vunpckhpd %ymm8,%ymm3,%ymm3
+ .byte 197,189,20,211 // vunpcklpd %ymm3,%ymm8,%ymm2
+ .byte 197,189,21,219 // vunpckhpd %ymm3,%ymm8,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
- .byte 144 // nop
- .byte 132,255 // test %bh,%bh
- .byte 255 // (bad)
- .byte 255,203 // dec %ebx
+ .byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
+ .byte 235,203 // jmp 5235 <_sk_load_f32_hsw+0x14b>
+ .byte 102,144 // xchg %ax,%ax
+ .byte 27,255 // sbb %edi,%edi
.byte 255 // (bad)
+ .byte 255,161,255,255,255,140 // jmpq *-0x73000001(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 190,255,255,255,177 // mov $0xb1ffffff,%esi
+ .byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
+ .byte 255,92,255,255 // lcall *-0x1(%rdi,%rdi,8)
+ .byte 255,70,255 // incl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,164,255,255,255,156,255 // jmpq *-0x630001(%rdi,%rdi,8)
+ .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 29005288 <_sk_overlay_sse2_8bit+0x28fd9da3>
.byte 255 // (bad)
- .byte 255,148,255,255,255,140,255 // callq *-0x730001(%rdi,%rdi,8)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -14458,8 +14558,14 @@ HIDDEN _sk_load_f32_dst_hsw
FUNCTION(_sk_load_f32_dst_hsw)
_sk_load_f32_dst_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja 514c <_sk_load_f32_dst_hsw+0x8c>
+ .byte 15,135,97,1,0,0 // ja 53fd <_sk_load_f32_dst_hsw+0x171>
+ .byte 72,131,236,24 // sub $0x18,%rsp
+ .byte 197,253,17,68,36,128 // vmovupd %ymm0,-0x80(%rsp)
+ .byte 197,253,17,76,36,160 // vmovupd %ymm1,-0x60(%rsp)
+ .byte 197,253,17,84,36,192 // vmovupd %ymm2,-0x40(%rsp)
+ .byte 197,253,17,92,36,224 // vmovupd %ymm3,-0x20(%rsp)
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -14467,45 +14573,84 @@ _sk_load_f32_dst_hsw:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # 5174 <_sk_load_f32_dst_hsw+0xb4>
+ .byte 76,141,29,48,1,0,0 // lea 0x130(%rip),%r11 # 540c <_sk_load_f32_dst_hsw+0x180>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
- .byte 255,224 // jmpq *%rax
- .byte 196,3,125,24,68,145,112,1 // vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- .byte 196,131,125,24,124,145,96,1 // vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm7
- .byte 196,131,125,24,108,145,80,1 // vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm5
- .byte 196,131,125,24,116,145,64,1 // vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm6
- .byte 196,129,121,16,100,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm4
- .byte 196,195,93,13,224,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm4
- .byte 196,1,121,16,68,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm8
- .byte 196,99,61,13,207,12 // vblendpd $0xc,%ymm7,%ymm8,%ymm9
- .byte 196,129,121,16,124,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm7
- .byte 196,99,69,13,213,12 // vblendpd $0xc,%ymm5,%ymm7,%ymm10
- .byte 196,129,121,16,44,145 // vmovupd (%r9,%r10,4),%xmm5
- .byte 196,227,85,13,238,12 // vblendpd $0xc,%ymm6,%ymm5,%ymm5
+ .byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
+ .byte 196,65,53,87,201 // vxorpd %ymm9,%ymm9,%ymm9
+ .byte 197,205,87,246 // vxorpd %ymm6,%ymm6,%ymm6
+ .byte 196,65,37,87,219 // vxorpd %ymm11,%ymm11,%ymm11
+ .byte 196,65,29,87,228 // vxorpd %ymm12,%ymm12,%ymm12
+ .byte 196,65,61,87,192 // vxorpd %ymm8,%ymm8,%ymm8
+ .byte 196,65,13,87,246 // vxorpd %ymm14,%ymm14,%ymm14
+ .byte 197,237,87,210 // vxorpd %ymm2,%ymm2,%ymm2
+ .byte 196,65,5,87,255 // vxorpd %ymm15,%ymm15,%ymm15
+ .byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
+ .byte 196,65,21,87,237 // vxorpd %ymm13,%ymm13,%ymm13
+ .byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
+ .byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
+ .byte 255,224 // jmpq *%rax
+ .byte 196,129,121,16,68,145,112 // vmovupd 0x70(%r9,%r10,4),%xmm0
+ .byte 196,227,125,6,224,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm4
+ .byte 196,129,121,16,68,145,96 // vmovupd 0x60(%r9,%r10,4),%xmm0
+ .byte 196,227,125,6,192,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ .byte 196,129,121,16,76,145,80 // vmovupd 0x50(%r9,%r10,4),%xmm1
+ .byte 196,227,125,6,241,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm6
+ .byte 197,125,40,200 // vmovapd %ymm0,%ymm9
+ .byte 196,129,121,16,68,145,64 // vmovupd 0x40(%r9,%r10,4),%xmm0
+ .byte 196,99,125,6,192,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm8
+ .byte 196,65,125,40,217 // vmovapd %ymm9,%ymm11
+ .byte 197,125,40,230 // vmovapd %ymm6,%ymm12
+ .byte 196,129,121,16,68,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm0
+ .byte 196,227,125,13,228,12 // vblendpd $0xc,%ymm4,%ymm0,%ymm4
+ .byte 196,65,125,40,243 // vmovapd %ymm11,%ymm14
+ .byte 197,125,41,226 // vmovapd %ymm12,%ymm2
+ .byte 196,65,125,40,248 // vmovapd %ymm8,%ymm15
+ .byte 196,129,121,16,68,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm0
+ .byte 196,195,125,13,238,12 // vblendpd $0xc,%ymm14,%ymm0,%ymm5
+ .byte 197,125,40,234 // vmovapd %ymm2,%ymm13
+ .byte 197,125,41,249 // vmovapd %ymm15,%ymm1
+ .byte 196,129,121,16,68,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm0
+ .byte 196,67,125,13,213,12 // vblendpd $0xc,%ymm13,%ymm0,%ymm10
+ .byte 197,253,40,253 // vmovapd %ymm5,%ymm7
+ .byte 197,253,40,217 // vmovapd %ymm1,%ymm3
+ .byte 196,129,121,16,4,145 // vmovupd (%r9,%r10,4),%xmm0
+ .byte 196,227,125,13,235,12 // vblendpd $0xc,%ymm3,%ymm0,%ymm5
+ .byte 197,252,16,92,36,224 // vmovups -0x20(%rsp),%ymm3
+ .byte 197,252,16,84,36,192 // vmovups -0x40(%rsp),%ymm2
+ .byte 197,252,16,76,36,160 // vmovups -0x60(%rsp),%ymm1
+ .byte 197,252,16,68,36,128 // vmovups -0x80(%rsp),%ymm0
+ .byte 72,131,196,24 // add $0x18,%rsp
.byte 196,193,84,20,242 // vunpcklps %ymm10,%ymm5,%ymm6
- .byte 196,193,84,21,250 // vunpckhps %ymm10,%ymm5,%ymm7
- .byte 197,180,20,236 // vunpcklps %ymm4,%ymm9,%ymm5
- .byte 197,52,21,196 // vunpckhps %ymm4,%ymm9,%ymm8
+ .byte 196,65,84,21,194 // vunpckhps %ymm10,%ymm5,%ymm8
+ .byte 197,196,20,236 // vunpcklps %ymm4,%ymm7,%ymm5
+ .byte 197,196,21,252 // vunpckhps %ymm4,%ymm7,%ymm7
.byte 197,205,20,229 // vunpcklpd %ymm5,%ymm6,%ymm4
.byte 197,205,21,237 // vunpckhpd %ymm5,%ymm6,%ymm5
- .byte 196,193,69,20,240 // vunpcklpd %ymm8,%ymm7,%ymm6
- .byte 196,193,69,21,248 // vunpckhpd %ymm8,%ymm7,%ymm7
+ .byte 197,189,20,247 // vunpcklpd %ymm7,%ymm8,%ymm6
+ .byte 197,189,21,255 // vunpckhpd %ymm7,%ymm8,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
- .byte 133,255 // test %edi,%edi
+ .byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
+ .byte 235,203 // jmp 53d7 <_sk_load_f32_dst_hsw+0x14b>
+ .byte 29,255,255,255,163 // sbb $0xa3ffffff,%eax
.byte 255 // (bad)
- .byte 255,204 // dec %esp
.byte 255 // (bad)
+ .byte 255,142,255,255,255,121 // decl 0x79ffffff(%rsi)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 191,255,255,255,178 // mov $0xb2ffffff,%edi
+ .byte 255,94,255 // lcall *-0x1(%rsi)
.byte 255 // (bad)
+ .byte 255,72,255 // decl -0x1(%rax)
.byte 255 // (bad)
- .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
+ .byte 255,55 // pushq (%rdi)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,149,255,255,255,141 // callq *-0x72000001(%rbp)
+ .byte 255,42 // ljmp *(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -14531,7 +14676,7 @@ _sk_store_f32_hsw:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne 5213 <_sk_store_f32_hsw+0x7f>
+ .byte 117,55 // jne 54ab <_sk_store_f32_hsw+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -14544,22 +14689,22 @@ _sk_store_f32_hsw:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 520f <_sk_store_f32_hsw+0x7b>
+ .byte 116,240 // je 54a7 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 520f <_sk_store_f32_hsw+0x7b>
+ .byte 114,227 // jb 54a7 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je 520f <_sk_store_f32_hsw+0x7b>
+ .byte 116,218 // je 54a7 <_sk_store_f32_hsw+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb 520f <_sk_store_f32_hsw+0x7b>
+ .byte 114,205 // jb 54a7 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je 520f <_sk_store_f32_hsw+0x7b>
+ .byte 116,195 // je 54a7 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb 520f <_sk_store_f32_hsw+0x7b>
+ .byte 114,181 // jb 54a7 <_sk_store_f32_hsw+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp 520f <_sk_store_f32_hsw+0x7b>
+ .byte 235,171 // jmp 54a7 <_sk_store_f32_hsw+0x7b>
HIDDEN _sk_clamp_x_hsw
.globl _sk_clamp_x_hsw
@@ -14636,7 +14781,7 @@ _sk_mirror_x_hsw:
.byte 196,65,124,92,218 // vsubps %ymm10,%ymm0,%ymm11
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,98,125,24,192 // vbroadcastss %xmm0,%ymm8
- .byte 197,178,89,5,179,96,2,0 // vmulss 0x260b3(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,5,75,99,2,0 // vmulss 0x2634b(%rip),%xmm9,%xmm0 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
.byte 196,227,125,8,192,1 // vroundps $0x1,%ymm0,%ymm0
@@ -14663,7 +14808,7 @@ _sk_mirror_y_hsw:
.byte 196,65,116,92,218 // vsubps %ymm10,%ymm1,%ymm11
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,98,125,24,193 // vbroadcastss %xmm1,%ymm8
- .byte 197,178,89,13,79,96,2,0 // vmulss 0x2604f(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,13,231,98,2,0 // vmulss 0x262e7(%rip),%xmm9,%xmm1 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,226,125,24,201 // vbroadcastss %xmm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
.byte 196,227,125,8,201,1 // vroundps $0x1,%ymm1,%ymm1
@@ -14685,7 +14830,7 @@ FUNCTION(_sk_clamp_x_1_hsw)
_sk_clamp_x_1_hsw:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,4,96,2,0 // vbroadcastss 0x26004(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,156,98,2,0 // vbroadcastss 0x2629c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -14703,9 +14848,9 @@ HIDDEN _sk_mirror_x_1_hsw
.globl _sk_mirror_x_1_hsw
FUNCTION(_sk_mirror_x_1_hsw)
_sk_mirror_x_1_hsw:
- .byte 196,98,125,24,5,251,95,2,0 // vbroadcastss 0x25ffb(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,5,147,98,2,0 // vbroadcastss 0x26293(%rip),%ymm8 # 2b940 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,209,95,2,0 // vbroadcastss 0x25fd1(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,105,98,2,0 // vbroadcastss 0x26269(%rip),%ymm9 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -14721,11 +14866,11 @@ HIDDEN _sk_luminance_to_alpha_hsw
.globl _sk_luminance_to_alpha_hsw
FUNCTION(_sk_luminance_to_alpha_hsw)
_sk_luminance_to_alpha_hsw:
- .byte 196,226,125,24,29,189,96,2,0 // vbroadcastss 0x260bd(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f>
- .byte 196,98,125,24,5,184,96,2,0 // vbroadcastss 0x260b8(%rip),%ymm8 # 2b518 <_sk_overlay_sse2_8bit+0x563>
+ .byte 196,226,125,24,29,85,99,2,0 // vbroadcastss 0x26355(%rip),%ymm3 # 2ba44 <_sk_overlay_sse2_8bit+0x55f>
+ .byte 196,98,125,24,5,80,99,2,0 // vbroadcastss 0x26350(%rip),%ymm8 # 2ba48 <_sk_overlay_sse2_8bit+0x563>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 196,226,125,184,203 // vfmadd231ps %ymm3,%ymm0,%ymm1
- .byte 196,226,125,24,29,169,96,2,0 // vbroadcastss 0x260a9(%rip),%ymm3 # 2b51c <_sk_overlay_sse2_8bit+0x567>
+ .byte 196,226,125,24,29,65,99,2,0 // vbroadcastss 0x26341(%rip),%ymm3 # 2ba4c <_sk_overlay_sse2_8bit+0x567>
.byte 196,226,109,168,217 // vfmadd213ps %ymm1,%ymm2,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -14925,9 +15070,9 @@ _sk_evenly_spaced_gradient_hsw:
.byte 76,139,72,8 // mov 0x8(%rax),%r9
.byte 77,137,211 // mov %r10,%r11
.byte 73,255,203 // dec %r11
- .byte 120,7 // js 576c <_sk_evenly_spaced_gradient_hsw+0x19>
+ .byte 120,7 // js 5a04 <_sk_evenly_spaced_gradient_hsw+0x19>
.byte 196,193,242,42,203 // vcvtsi2ss %r11,%xmm1,%xmm1
- .byte 235,22 // jmp 5782 <_sk_evenly_spaced_gradient_hsw+0x2f>
+ .byte 235,22 // jmp 5a1a <_sk_evenly_spaced_gradient_hsw+0x2f>
.byte 76,137,219 // mov %r11,%rbx
.byte 72,209,235 // shr %rbx
.byte 65,131,227,1 // and $0x1,%r11d
@@ -14938,7 +15083,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 197,244,89,200 // vmulps %ymm0,%ymm1,%ymm1
.byte 197,126,91,217 // vcvttps2dq %ymm1,%ymm11
.byte 73,131,250,8 // cmp $0x8,%r10
- .byte 119,70 // ja 57db <_sk_evenly_spaced_gradient_hsw+0x88>
+ .byte 119,70 // ja 5a73 <_sk_evenly_spaced_gradient_hsw+0x88>
.byte 196,66,37,22,1 // vpermps (%r9),%ymm11,%ymm8
.byte 72,139,88,40 // mov 0x28(%rax),%rbx
.byte 196,98,37,22,11 // vpermps (%rbx),%ymm11,%ymm9
@@ -14954,7 +15099,7 @@ _sk_evenly_spaced_gradient_hsw:
.byte 196,226,37,22,27 // vpermps (%rbx),%ymm11,%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,98,37,22,40 // vpermps (%rax),%ymm11,%ymm13
- .byte 235,110 // jmp 5849 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ .byte 235,110 // jmp 5ae1 <_sk_evenly_spaced_gradient_hsw+0xf6>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,153 // vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -14991,14 +15136,14 @@ HIDDEN _sk_gauss_a_to_rgba_hsw
.globl _sk_gauss_a_to_rgba_hsw
FUNCTION(_sk_gauss_a_to_rgba_hsw)
_sk_gauss_a_to_rgba_hsw:
- .byte 196,226,125,24,5,177,92,2,0 // vbroadcastss 0x25cb1(%rip),%ymm0 # 2b520 <_sk_overlay_sse2_8bit+0x56b>
- .byte 196,226,125,24,13,172,92,2,0 // vbroadcastss 0x25cac(%rip),%ymm1 # 2b524 <_sk_overlay_sse2_8bit+0x56f>
+ .byte 196,226,125,24,5,73,95,2,0 // vbroadcastss 0x25f49(%rip),%ymm0 # 2ba50 <_sk_overlay_sse2_8bit+0x56b>
+ .byte 196,226,125,24,13,68,95,2,0 // vbroadcastss 0x25f44(%rip),%ymm1 # 2ba54 <_sk_overlay_sse2_8bit+0x56f>
.byte 196,226,101,168,200 // vfmadd213ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,162,92,2,0 // vbroadcastss 0x25ca2(%rip),%ymm0 # 2b528 <_sk_overlay_sse2_8bit+0x573>
+ .byte 196,226,125,24,5,58,95,2,0 // vbroadcastss 0x25f3a(%rip),%ymm0 # 2ba58 <_sk_overlay_sse2_8bit+0x573>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
- .byte 196,226,125,24,13,152,92,2,0 // vbroadcastss 0x25c98(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577>
+ .byte 196,226,125,24,13,48,95,2,0 // vbroadcastss 0x25f30(%rip),%ymm1 # 2ba5c <_sk_overlay_sse2_8bit+0x577>
.byte 196,226,101,184,200 // vfmadd231ps %ymm0,%ymm3,%ymm1
- .byte 196,226,125,24,5,142,92,2,0 // vbroadcastss 0x25c8e(%rip),%ymm0 # 2b530 <_sk_overlay_sse2_8bit+0x57b>
+ .byte 196,226,125,24,5,38,95,2,0 // vbroadcastss 0x25f26(%rip),%ymm0 # 2ba60 <_sk_overlay_sse2_8bit+0x57b>
.byte 196,226,101,184,193 // vfmadd231ps %ymm1,%ymm3,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -15013,11 +15158,11 @@ _sk_gradient_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 73,131,249,1 // cmp $0x1,%r9
- .byte 15,134,180,0,0,0 // jbe 597a <_sk_gradient_hsw+0xc3>
+ .byte 15,134,180,0,0,0 // jbe 5c12 <_sk_gradient_hsw+0xc3>
.byte 76,139,80,72 // mov 0x48(%rax),%r10
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 65,187,1,0,0,0 // mov $0x1,%r11d
- .byte 196,226,125,24,21,31,91,2,0 // vbroadcastss 0x25b1f(%rip),%ymm2 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,226,125,24,21,183,93,2,0 // vbroadcastss 0x25db7(%rip),%ymm2 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
.byte 196,130,125,24,28,154 // vbroadcastss (%r10,%r11,4),%ymm3
.byte 197,228,194,216,2 // vcmpleps %ymm0,%ymm3,%ymm3
@@ -15025,10 +15170,10 @@ _sk_gradient_hsw:
.byte 196,65,101,254,201 // vpaddd %ymm9,%ymm3,%ymm9
.byte 73,255,195 // inc %r11
.byte 77,57,217 // cmp %r11,%r9
- .byte 117,226 // jne 58e2 <_sk_gradient_hsw+0x2b>
+ .byte 117,226 // jne 5b7a <_sk_gradient_hsw+0x2b>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 73,131,249,8 // cmp $0x8,%r9
- .byte 118,121 // jbe 5983 <_sk_gradient_hsw+0xcc>
+ .byte 118,121 // jbe 5c1b <_sk_gradient_hsw+0xcc>
.byte 196,65,13,118,246 // vpcmpeqd %ymm14,%ymm14,%ymm14
.byte 197,245,118,201 // vpcmpeqd %ymm1,%ymm1,%ymm1
.byte 196,2,117,146,4,138 // vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -15052,7 +15197,7 @@ _sk_gradient_hsw:
.byte 196,130,21,146,28,137 // vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
.byte 72,139,64,64 // mov 0x40(%rax),%rax
.byte 196,34,13,146,44,136 // vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- .byte 235,77 // jmp 59c7 <_sk_gradient_hsw+0x110>
+ .byte 235,77 // jmp 5c5f <_sk_gradient_hsw+0x110>
.byte 76,139,80,8 // mov 0x8(%rax),%r10
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 196,66,53,22,2 // vpermps (%r10),%ymm9,%ymm8
@@ -15112,24 +15257,24 @@ _sk_xy_to_unit_angle_hsw:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,210,90,2,0 // vbroadcastss 0x25ad2(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f>
- .byte 196,98,125,24,53,205,90,2,0 // vbroadcastss 0x25acd(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583>
+ .byte 196,98,125,24,45,106,93,2,0 // vbroadcastss 0x25d6a(%rip),%ymm13 # 2ba64 <_sk_overlay_sse2_8bit+0x57f>
+ .byte 196,98,125,24,53,101,93,2,0 // vbroadcastss 0x25d65(%rip),%ymm14 # 2ba68 <_sk_overlay_sse2_8bit+0x583>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
- .byte 196,98,125,24,45,195,90,2,0 // vbroadcastss 0x25ac3(%rip),%ymm13 # 2b53c <_sk_overlay_sse2_8bit+0x587>
+ .byte 196,98,125,24,45,91,93,2,0 // vbroadcastss 0x25d5b(%rip),%ymm13 # 2ba6c <_sk_overlay_sse2_8bit+0x587>
.byte 196,66,29,184,238 // vfmadd231ps %ymm14,%ymm12,%ymm13
- .byte 196,98,125,24,53,185,90,2,0 // vbroadcastss 0x25ab9(%rip),%ymm14 # 2b540 <_sk_overlay_sse2_8bit+0x58b>
+ .byte 196,98,125,24,53,81,93,2,0 // vbroadcastss 0x25d51(%rip),%ymm14 # 2ba70 <_sk_overlay_sse2_8bit+0x58b>
.byte 196,66,29,184,245 // vfmadd231ps %ymm13,%ymm12,%ymm14
.byte 196,65,36,89,222 // vmulps %ymm14,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,164,90,2,0 // vbroadcastss 0x25aa4(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f>
+ .byte 196,98,125,24,21,60,93,2,0 // vbroadcastss 0x25d3c(%rip),%ymm10 # 2ba74 <_sk_overlay_sse2_8bit+0x58f>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,58,89,2,0 // vbroadcastss 0x2593a(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,210,91,2,0 // vbroadcastss 0x25bd2(%rip),%ymm10 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,36,89,2,0 // vbroadcastss 0x25924(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,188,91,2,0 // vbroadcastss 0x25bbc(%rip),%ymm10 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -15157,23 +15302,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,36,90,2,0 // vbroadcastss 0x25a24(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,188,92,2,0 // vbroadcastss 0x25cbc(%rip),%ymm11 # 2ba78 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,3,90,2,0 // vbroadcastss 0x25a03(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,155,92,2,0 // vbroadcastss 0x25c9b(%rip),%ymm9 # 2ba7c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,230,89,2,0 // vbroadcastss 0x259e6(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,126,92,2,0 // vbroadcastss 0x25c7e(%rip),%ymm9 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,119,88,2,0 // vbroadcastss 0x25877(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,15,91,2,0 // vbroadcastss 0x25b0f(%rip),%ymm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -15192,23 +15337,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw:
.byte 197,50,89,80,44 // vmulss 0x2c(%rax),%xmm9,%xmm10
.byte 196,66,125,24,210 // vbroadcastss %xmm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,140,89,2,0 // vbroadcastss 0x2598c(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,36,92,2,0 // vbroadcastss 0x25c24(%rip),%ymm11 # 2ba78 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
.byte 196,98,125,184,216 // vfmadd231ps %ymm0,%ymm0,%ymm11
.byte 196,193,50,89,193 // vmulss %xmm9,%xmm9,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,107,89,2,0 // vbroadcastss 0x2596b(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,3,92,2,0 // vbroadcastss 0x25c03(%rip),%ymm9 # 2ba7c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,194,45,184,194 // vfmadd231ps %ymm10,%ymm10,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,78,89,2,0 // vbroadcastss 0x2594e(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,230,91,2,0 // vbroadcastss 0x25be6(%rip),%ymm9 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,223,87,2,0 // vbroadcastss 0x257df(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,119,90,2,0 // vbroadcastss 0x25a77(%rip),%ymm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,44,89,208 // vmulps %ymm8,%ymm10,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -15226,14 +15371,14 @@ _sk_xy_to_2pt_conical_linear_hsw:
.byte 197,58,89,72,44 // vmulss 0x2c(%rax),%xmm8,%xmm9
.byte 196,66,125,24,201 // vbroadcastss %xmm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,250,88,2,0 // vbroadcastss 0x258fa(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,21,146,91,2,0 // vbroadcastss 0x25b92(%rip),%ymm10 # 2ba78 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
.byte 196,98,125,184,208 // vfmadd231ps %ymm0,%ymm0,%ymm10
.byte 196,193,58,89,192 // vmulss %xmm8,%xmm8,%xmm0
.byte 196,226,125,24,192 // vbroadcastss %xmm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,221,88,2,0 // vbroadcastss 0x258dd(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,5,117,91,2,0 // vbroadcastss 0x25b75(%rip),%ymm8 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15273,7 +15418,7 @@ HIDDEN _sk_save_xy_hsw
FUNCTION(_sk_save_xy_hsw)
_sk_save_xy_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,29,87,2,0 // vbroadcastss 0x2571d(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,181,89,2,0 // vbroadcastss 0x259b5(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -15307,9 +15452,9 @@ HIDDEN _sk_bilinear_nx_hsw
FUNCTION(_sk_bilinear_nx_hsw)
_sk_bilinear_nx_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,13,88,2,0 // vbroadcastss 0x2580d(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,165,90,2,0 // vbroadcastss 0x25aa5(%rip),%ymm0 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,164,86,2,0 // vbroadcastss 0x256a4(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,60,89,2,0 // vbroadcastss 0x2593c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15320,7 +15465,7 @@ HIDDEN _sk_bilinear_px_hsw
FUNCTION(_sk_bilinear_px_hsw)
_sk_bilinear_px_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,132,86,2,0 // vbroadcastss 0x25684(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,5,28,89,2,0 // vbroadcastss 0x2591c(%rip),%ymm0 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15332,9 +15477,9 @@ HIDDEN _sk_bilinear_ny_hsw
FUNCTION(_sk_bilinear_ny_hsw)
_sk_bilinear_ny_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,196,87,2,0 // vbroadcastss 0x257c4(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,92,90,2,0 // vbroadcastss 0x25a5c(%rip),%ymm1 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,90,86,2,0 // vbroadcastss 0x2565a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,242,88,2,0 // vbroadcastss 0x258f2(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15345,7 +15490,7 @@ HIDDEN _sk_bilinear_py_hsw
FUNCTION(_sk_bilinear_py_hsw)
_sk_bilinear_py_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,58,86,2,0 // vbroadcastss 0x2563a(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,210,88,2,0 // vbroadcastss 0x258d2(%rip),%ymm1 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15357,13 +15502,13 @@ HIDDEN _sk_bicubic_n3x_hsw
FUNCTION(_sk_bicubic_n3x_hsw)
_sk_bicubic_n3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,125,87,2,0 // vbroadcastss 0x2577d(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,5,21,90,2,0 // vbroadcastss 0x25a15(%rip),%ymm0 # 2ba88 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,16,86,2,0 // vbroadcastss 0x25610(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,168,88,2,0 // vbroadcastss 0x258a8(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,109,86,2,0 // vbroadcastss 0x2566d(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,88,87,2,0 // vbroadcastss 0x25758(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,5,89,2,0 // vbroadcastss 0x25905(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,240,89,2,0 // vbroadcastss 0x259f0(%rip),%ymm11 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15375,16 +15520,16 @@ HIDDEN _sk_bicubic_n1x_hsw
FUNCTION(_sk_bicubic_n1x_hsw)
_sk_bicubic_n1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,47,87,2,0 // vbroadcastss 0x2572f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,199,89,2,0 // vbroadcastss 0x259c7(%rip),%ymm0 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,198,85,2,0 // vbroadcastss 0x255c6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,94,88,2,0 // vbroadcastss 0x2585e(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,32,87,2,0 // vbroadcastss 0x25720(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,21,27,87,2,0 // vbroadcastss 0x2571b(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,184,89,2,0 // vbroadcastss 0x259b8(%rip),%ymm9 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,179,89,2,0 // vbroadcastss 0x259b3(%rip),%ymm10 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,157,85,2,0 // vbroadcastss 0x2559d(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,53,88,2,0 // vbroadcastss 0x25835(%rip),%ymm9 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,3,87,2,0 // vbroadcastss 0x25703(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,21,155,89,2,0 // vbroadcastss 0x2599b(%rip),%ymm10 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,128,0,0,0 // vmovups %ymm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15395,14 +15540,14 @@ HIDDEN _sk_bicubic_p1x_hsw
FUNCTION(_sk_bicubic_p1x_hsw)
_sk_bicubic_p1x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,115,85,2,0 // vbroadcastss 0x25573(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,11,88,2,0 // vbroadcastss 0x2580b(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,205,86,2,0 // vbroadcastss 0x256cd(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,29,200,86,2,0 // vbroadcastss 0x256c8(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,101,89,2,0 // vbroadcastss 0x25965(%rip),%ymm10 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,96,89,2,0 // vbroadcastss 0x25960(%rip),%ymm11 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,185,86,2,0 // vbroadcastss 0x256b9(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,5,81,89,2,0 // vbroadcastss 0x25951(%rip),%ymm8 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15413,12 +15558,12 @@ HIDDEN _sk_bicubic_p3x_hsw
FUNCTION(_sk_bicubic_p3x_hsw)
_sk_bicubic_p3x_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,149,86,2,0 // vbroadcastss 0x25695(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,5,45,89,2,0 // vbroadcastss 0x2592d(%rip),%ymm0 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,134,85,2,0 // vbroadcastss 0x25586(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,113,86,2,0 // vbroadcastss 0x25671(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,30,88,2,0 // vbroadcastss 0x2581e(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,9,89,2,0 // vbroadcastss 0x25909(%rip),%ymm11 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -15430,13 +15575,13 @@ HIDDEN _sk_bicubic_n3y_hsw
FUNCTION(_sk_bicubic_n3y_hsw)
_sk_bicubic_n3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,76,86,2,0 // vbroadcastss 0x2564c(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,13,228,88,2,0 // vbroadcastss 0x258e4(%rip),%ymm1 # 2ba88 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,222,84,2,0 // vbroadcastss 0x254de(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,118,87,2,0 // vbroadcastss 0x25776(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,59,85,2,0 // vbroadcastss 0x2553b(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,38,86,2,0 // vbroadcastss 0x25626(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,211,87,2,0 // vbroadcastss 0x257d3(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,190,88,2,0 // vbroadcastss 0x258be(%rip),%ymm11 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,36,89,193 // vmulps %ymm9,%ymm11,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15448,16 +15593,16 @@ HIDDEN _sk_bicubic_n1y_hsw
FUNCTION(_sk_bicubic_n1y_hsw)
_sk_bicubic_n1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,253,85,2,0 // vbroadcastss 0x255fd(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,149,88,2,0 // vbroadcastss 0x25895(%rip),%ymm1 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,147,84,2,0 // vbroadcastss 0x25493(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,43,87,2,0 // vbroadcastss 0x2572b(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,237,85,2,0 // vbroadcastss 0x255ed(%rip),%ymm9 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,21,232,85,2,0 // vbroadcastss 0x255e8(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,133,88,2,0 // vbroadcastss 0x25885(%rip),%ymm9 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,128,88,2,0 // vbroadcastss 0x25880(%rip),%ymm10 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,61,168,209 // vfmadd213ps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,13,106,84,2,0 // vbroadcastss 0x2546a(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,2,87,2,0 // vbroadcastss 0x25702(%rip),%ymm9 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,66,61,184,202 // vfmadd231ps %ymm10,%ymm8,%ymm9
- .byte 196,98,125,24,21,208,85,2,0 // vbroadcastss 0x255d0(%rip),%ymm10 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,21,104,88,2,0 // vbroadcastss 0x25868(%rip),%ymm10 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,61,184,209 // vfmadd231ps %ymm9,%ymm8,%ymm10
.byte 197,124,17,144,160,0,0,0 // vmovups %ymm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15468,14 +15613,14 @@ HIDDEN _sk_bicubic_p1y_hsw
FUNCTION(_sk_bicubic_p1y_hsw)
_sk_bicubic_p1y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,64,84,2,0 // vbroadcastss 0x25440(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,216,86,2,0 // vbroadcastss 0x256d8(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,153,85,2,0 // vbroadcastss 0x25599(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
- .byte 196,98,125,24,29,148,85,2,0 // vbroadcastss 0x25594(%rip),%ymm11 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,49,88,2,0 // vbroadcastss 0x25831(%rip),%ymm10 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,44,88,2,0 // vbroadcastss 0x2582c(%rip),%ymm11 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,66,53,168,218 // vfmadd213ps %ymm10,%ymm9,%ymm11
.byte 196,66,53,168,216 // vfmadd213ps %ymm8,%ymm9,%ymm11
- .byte 196,98,125,24,5,133,85,2,0 // vbroadcastss 0x25585(%rip),%ymm8 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,5,29,88,2,0 // vbroadcastss 0x2581d(%rip),%ymm8 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,66,53,184,195 // vfmadd231ps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -15486,12 +15631,12 @@ HIDDEN _sk_bicubic_p3y_hsw
FUNCTION(_sk_bicubic_p3y_hsw)
_sk_bicubic_p3y_hsw:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,97,85,2,0 // vbroadcastss 0x25561(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,13,249,87,2,0 // vbroadcastss 0x257f9(%rip),%ymm1 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,81,84,2,0 // vbroadcastss 0x25451(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
- .byte 196,98,125,24,29,60,85,2,0 // vbroadcastss 0x2553c(%rip),%ymm11 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,233,86,2,0 // vbroadcastss 0x256e9(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,29,212,87,2,0 // vbroadcastss 0x257d4(%rip),%ymm11 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,66,61,168,218 // vfmadd213ps %ymm10,%ymm8,%ymm11
.byte 196,65,52,89,195 // vmulps %ymm11,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -15631,19 +15776,19 @@ _sk_clut_3D_hsw:
.byte 197,254,127,76,36,160 // vmovdqu %ymm1,-0x60(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,117,254,204 // vpaddd %ymm12,%ymm1,%ymm1
- .byte 196,226,125,88,61,249,82,2,0 // vpbroadcastd 0x252f9(%rip),%ymm7 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,226,125,88,61,145,85,2,0 // vpbroadcastd 0x25591(%rip),%ymm7 # 2baa0 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,226,117,64,207 // vpmulld %ymm7,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,98,77,146,4,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- .byte 196,98,125,88,21,109,81,2,0 // vpbroadcastd 0x2516d(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,21,5,84,2,0 // vpbroadcastd 0x25405(%rip),%ymm10 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,193,117,254,242 // vpaddd %ymm10,%ymm1,%ymm6
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
.byte 196,226,37,146,28,176 // vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- .byte 196,98,125,88,29,92,81,2,0 // vpbroadcastd 0x2515c(%rip),%ymm11 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,29,244,83,2,0 // vpbroadcastd 0x253f4(%rip),%ymm11 # 2b934 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,117,254,203 // vpaddd %ymm11,%ymm1,%ymm1
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
.byte 196,226,77,146,36,136 // vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- .byte 196,98,125,24,45,172,82,2,0 // vbroadcastss 0x252ac(%rip),%ymm13 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,98,125,24,45,68,85,2,0 // vbroadcastss 0x25544(%rip),%ymm13 # 2ba9c <_sk_overlay_sse2_8bit+0x5b7>
.byte 196,193,124,88,245 // vaddps %ymm13,%ymm0,%ymm6
.byte 197,254,91,246 // vcvttps2dq %ymm6,%ymm6
.byte 196,226,77,64,205 // vpmulld %ymm5,%ymm6,%ymm1
@@ -15863,19 +16008,19 @@ _sk_clut_4D_hsw:
.byte 197,126,91,245 // vcvttps2dq %ymm5,%ymm14
.byte 196,98,13,64,233 // vpmulld %ymm1,%ymm14,%ymm13
.byte 197,149,254,198 // vpaddd %ymm6,%ymm13,%ymm0
- .byte 196,98,125,88,21,66,78,2,0 // vpbroadcastd 0x24e42(%rip),%ymm10 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,125,88,21,218,80,2,0 // vpbroadcastd 0x250da(%rip),%ymm10 # 2baa0 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,125,64,194 // vpmulld %ymm10,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,98,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- .byte 196,98,125,88,29,181,76,2,0 // vpbroadcastd 0x24cb5(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,88,29,77,79,2,0 // vpbroadcastd 0x24f4d(%rip),%ymm11 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,125,254,195 // vpaddd %ymm11,%ymm0,%ymm8
.byte 196,65,53,118,201 // vpcmpeqd %ymm9,%ymm9,%ymm9
.byte 196,162,53,146,20,128 // vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- .byte 196,98,125,88,37,164,76,2,0 // vpbroadcastd 0x24ca4(%rip),%ymm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,88,37,60,79,2,0 // vpbroadcastd 0x24f3c(%rip),%ymm12 # 2b934 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,125,254,196 // vpaddd %ymm12,%ymm0,%ymm0
.byte 196,65,61,118,192 // vpcmpeqd %ymm8,%ymm8,%ymm8
.byte 196,226,61,146,60,128 // vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- .byte 196,98,125,24,13,243,77,2,0 // vbroadcastss 0x24df3(%rip),%ymm9 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,98,125,24,13,139,80,2,0 // vbroadcastss 0x2508b(%rip),%ymm9 # 2ba9c <_sk_overlay_sse2_8bit+0x5b7>
.byte 196,65,84,88,193 // vaddps %ymm9,%ymm5,%ymm8
.byte 196,65,126,91,192 // vcvttps2dq %ymm8,%ymm8
.byte 196,226,61,64,193 // vpmulld %ymm1,%ymm8,%ymm0
@@ -16200,7 +16345,7 @@ _sk_clut_4D_hsw:
.byte 197,196,92,214 // vsubps %ymm6,%ymm7,%ymm2
.byte 196,226,61,168,214 // vfmadd213ps %ymm6,%ymm8,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,161,69,2,0 // vbroadcastss 0x245a1(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,57,72,2,0 // vbroadcastss 0x24839(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,164,36,32,3,0,0 // vmovups 0x320(%rsp),%ymm4
.byte 197,252,16,172,36,64,3,0,0 // vmovups 0x340(%rsp),%ymm5
.byte 197,252,16,180,36,96,3,0,0 // vmovups 0x360(%rsp),%ymm6
@@ -16228,7 +16373,7 @@ _sk_start_pipeline_avx:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 6f25 <_sk_start_pipeline_avx+0xa1>
+ .byte 115,117 // jae 71bd <_sk_start_pipeline_avx+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -16238,7 +16383,7 @@ _sk_start_pipeline_avx:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
- .byte 119,45 // ja 6f01 <_sk_start_pipeline_avx+0x7d>
+ .byte 119,45 // ja 7199 <_sk_start_pipeline_avx+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -16252,10 +16397,10 @@ _sk_start_pipeline_avx:
.byte 73,131,199,16 // add $0x10,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 6ed8 <_sk_start_pipeline_avx+0x54>
+ .byte 118,215 // jbe 7170 <_sk_start_pipeline_avx+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 6f1c <_sk_start_pipeline_avx+0x98>
+ .byte 116,19 // je 71b4 <_sk_start_pipeline_avx+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -16264,7 +16409,7 @@ _sk_start_pipeline_avx:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 6eca <_sk_start_pipeline_avx+0x46>
+ .byte 117,165 // jne 7162 <_sk_start_pipeline_avx+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -16289,7 +16434,7 @@ _sk_seed_shader_avx:
.byte 197,249,112,192,0 // vpshufd $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,160,68,2,0 // vbroadcastss 0x244a0(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,56,71,2,0 // vbroadcastss 0x24738(%rip),%ymm1 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,88,7 // vaddps (%rdi),%ymm0,%ymm0
.byte 197,249,110,209 // vmovd %ecx,%xmm2
@@ -16298,7 +16443,7 @@ _sk_seed_shader_avx:
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
.byte 197,236,88,201 // vaddps %ymm1,%ymm2,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,21,122,68,2,0 // vbroadcastss 0x2447a(%rip),%ymm2 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,21,18,71,2,0 // vbroadcastss 0x24712(%rip),%ymm2 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,228,87,219 // vxorps %ymm3,%ymm3,%ymm3
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
@@ -16322,7 +16467,7 @@ _sk_dither_avx:
.byte 196,65,121,112,201,0 // vpshufd $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 196,65,52,87,208 // vxorps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,35,68,2,0 // vbroadcastss 0x24423(%rip),%ymm11 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,24,29,187,70,2,0 // vbroadcastss 0x246bb(%rip),%ymm11 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,44,84,203 // vandps %ymm11,%ymm10,%ymm9
.byte 196,193,25,114,241,5 // vpslld $0x5,%xmm9,%xmm12
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
@@ -16333,8 +16478,8 @@ _sk_dither_avx:
.byte 196,67,125,25,219,1 // vextractf128 $0x1,%ymm11,%xmm11
.byte 196,193,33,114,243,4 // vpslld $0x4,%xmm11,%xmm11
.byte 196,67,29,24,219,1 // vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- .byte 196,98,125,24,37,228,67,2,0 // vbroadcastss 0x243e4(%rip),%ymm12 # 2b400 <_sk_overlay_sse2_8bit+0x44b>
- .byte 196,98,125,24,45,223,67,2,0 // vbroadcastss 0x243df(%rip),%ymm13 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,125,24,37,124,70,2,0 // vbroadcastss 0x2467c(%rip),%ymm12 # 2b930 <_sk_overlay_sse2_8bit+0x44b>
+ .byte 196,98,125,24,45,119,70,2,0 // vbroadcastss 0x24677(%rip),%ymm13 # 2b934 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,65,44,84,245 // vandps %ymm13,%ymm10,%ymm14
.byte 196,193,1,114,246,2 // vpslld $0x2,%xmm14,%xmm15
.byte 196,67,125,25,246,1 // vextractf128 $0x1,%ymm14,%xmm14
@@ -16361,9 +16506,9 @@ _sk_dither_avx:
.byte 196,65,60,86,193 // vorps %ymm9,%ymm8,%ymm8
.byte 196,65,60,86,194 // vorps %ymm10,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,74,67,2,0 // vbroadcastss 0x2434a(%rip),%ymm9 # 2b408 <_sk_overlay_sse2_8bit+0x453>
+ .byte 196,98,125,24,13,226,69,2,0 // vbroadcastss 0x245e2(%rip),%ymm9 # 2b938 <_sk_overlay_sse2_8bit+0x453>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,64,67,2,0 // vbroadcastss 0x24340(%rip),%ymm9 # 2b40c <_sk_overlay_sse2_8bit+0x457>
+ .byte 196,98,125,24,13,216,69,2,0 // vbroadcastss 0x245d8(%rip),%ymm9 # 2b93c <_sk_overlay_sse2_8bit+0x457>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 196,98,125,24,8 // vbroadcastss (%rax),%ymm9
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
@@ -16397,7 +16542,7 @@ HIDDEN _sk_black_color_avx
FUNCTION(_sk_black_color_avx)
_sk_black_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,200,66,2,0 // vbroadcastss 0x242c8(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,96,69,2,0 // vbroadcastss 0x24560(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 197,236,87,210 // vxorps %ymm2,%ymm2,%ymm2
@@ -16408,7 +16553,7 @@ HIDDEN _sk_white_color_avx
FUNCTION(_sk_white_color_avx)
_sk_white_color_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,175,66,2,0 // vbroadcastss 0x242af(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,71,69,2,0 // vbroadcastss 0x24547(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
@@ -16454,7 +16599,7 @@ HIDDEN _sk_srcatop_avx
FUNCTION(_sk_srcatop_avx)
_sk_srcatop_avx:
.byte 197,252,89,199 // vmulps %ymm7,%ymm0,%ymm0
- .byte 196,98,125,24,5,78,66,2,0 // vbroadcastss 0x2424e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,230,68,2,0 // vbroadcastss 0x244e6(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16475,7 +16620,7 @@ HIDDEN _sk_dstatop_avx
FUNCTION(_sk_dstatop_avx)
_sk_dstatop_avx:
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
- .byte 196,98,125,24,13,12,66,2,0 // vbroadcastss 0x2420c(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,164,68,2,0 // vbroadcastss 0x244a4(%rip),%ymm9 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,207 // vsubps %ymm7,%ymm9,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,188,88,192 // vaddps %ymm0,%ymm8,%ymm0
@@ -16517,7 +16662,7 @@ HIDDEN _sk_srcout_avx
.globl _sk_srcout_avx
FUNCTION(_sk_srcout_avx)
_sk_srcout_avx:
- .byte 196,98,125,24,5,167,65,2,0 // vbroadcastss 0x241a7(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,63,68,2,0 // vbroadcastss 0x2443f(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -16530,7 +16675,7 @@ HIDDEN _sk_dstout_avx
.globl _sk_dstout_avx
FUNCTION(_sk_dstout_avx)
_sk_dstout_avx:
- .byte 196,226,125,24,5,134,65,2,0 // vbroadcastss 0x24186(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,30,68,2,0 // vbroadcastss 0x2441e(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,92,219 // vsubps %ymm3,%ymm0,%ymm3
.byte 197,228,89,196 // vmulps %ymm4,%ymm3,%ymm0
.byte 197,228,89,205 // vmulps %ymm5,%ymm3,%ymm1
@@ -16543,7 +16688,7 @@ HIDDEN _sk_srcover_avx
.globl _sk_srcover_avx
FUNCTION(_sk_srcover_avx)
_sk_srcover_avx:
- .byte 196,98,125,24,5,101,65,2,0 // vbroadcastss 0x24165(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,253,67,2,0 // vbroadcastss 0x243fd(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,204 // vmulps %ymm4,%ymm8,%ymm9
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -16560,7 +16705,7 @@ HIDDEN _sk_dstover_avx
.globl _sk_dstover_avx
FUNCTION(_sk_dstover_avx)
_sk_dstover_avx:
- .byte 196,98,125,24,5,52,65,2,0 // vbroadcastss 0x24134(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,204,67,2,0 // vbroadcastss 0x243cc(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,199 // vsubps %ymm7,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
@@ -16588,7 +16733,7 @@ HIDDEN _sk_multiply_avx
.globl _sk_multiply_avx
FUNCTION(_sk_multiply_avx)
_sk_multiply_avx:
- .byte 196,98,125,24,5,239,64,2,0 // vbroadcastss 0x240ef(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,135,67,2,0 // vbroadcastss 0x24387(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,208 // vmulps %ymm0,%ymm9,%ymm10
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16619,7 +16764,7 @@ HIDDEN _sk_plus__avx
FUNCTION(_sk_plus__avx)
_sk_plus__avx:
.byte 197,252,88,196 // vaddps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,5,126,64,2,0 // vbroadcastss 0x2407e(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,22,67,2,0 // vbroadcastss 0x24316(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 197,244,88,205 // vaddps %ymm5,%ymm1,%ymm1
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
@@ -16653,7 +16798,7 @@ HIDDEN _sk_xor__avx
.globl _sk_xor__avx
FUNCTION(_sk_xor__avx)
_sk_xor__avx:
- .byte 196,98,125,24,5,29,64,2,0 // vbroadcastss 0x2401d(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,181,66,2,0 // vbroadcastss 0x242b5(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,192 // vmulps %ymm0,%ymm9,%ymm0
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16690,7 +16835,7 @@ _sk_darken_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,95,209 // vmaxps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,153,63,2,0 // vbroadcastss 0x23f99(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,49,66,2,0 // vbroadcastss 0x24231(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16716,7 +16861,7 @@ _sk_lighten_avx:
.byte 197,100,89,206 // vmulps %ymm6,%ymm3,%ymm9
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,65,63,2,0 // vbroadcastss 0x23f41(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,217,65,2,0 // vbroadcastss 0x241d9(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16745,7 +16890,7 @@ _sk_difference_avx:
.byte 196,193,108,93,209 // vminps %ymm9,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,221,62,2,0 // vbroadcastss 0x23edd(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,117,65,2,0 // vbroadcastss 0x24175(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16768,7 +16913,7 @@ _sk_exclusion_avx:
.byte 197,236,89,214 // vmulps %ymm6,%ymm2,%ymm2
.byte 197,236,88,210 // vaddps %ymm2,%ymm2,%ymm2
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
- .byte 196,98,125,24,5,148,62,2,0 // vbroadcastss 0x23e94(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,44,65,2,0 // vbroadcastss 0x2412c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
.byte 197,60,89,199 // vmulps %ymm7,%ymm8,%ymm8
.byte 197,188,88,219 // vaddps %ymm3,%ymm8,%ymm3
@@ -16779,7 +16924,7 @@ HIDDEN _sk_colorburn_avx
.globl _sk_colorburn_avx
FUNCTION(_sk_colorburn_avx)
_sk_colorburn_avx:
- .byte 196,98,125,24,5,123,62,2,0 // vbroadcastss 0x23e7b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,19,65,2,0 // vbroadcastss 0x24113(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,52,89,216 // vmulps %ymm0,%ymm9,%ymm11
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
@@ -16841,7 +16986,7 @@ HIDDEN _sk_colordodge_avx
FUNCTION(_sk_colordodge_avx)
_sk_colordodge_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
- .byte 196,98,125,24,13,127,61,2,0 // vbroadcastss 0x23d7f(%rip),%ymm9 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,13,23,64,2,0 // vbroadcastss 0x24017(%rip),%ymm9 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,52,92,215 // vsubps %ymm7,%ymm9,%ymm10
.byte 197,44,89,216 // vmulps %ymm0,%ymm10,%ymm11
.byte 197,52,92,203 // vsubps %ymm3,%ymm9,%ymm9
@@ -16898,7 +17043,7 @@ HIDDEN _sk_hardlight_avx
.globl _sk_hardlight_avx
FUNCTION(_sk_hardlight_avx)
_sk_hardlight_avx:
- .byte 196,98,125,24,5,138,60,2,0 // vbroadcastss 0x23c8a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,34,63,2,0 // vbroadcastss 0x23f22(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -16953,7 +17098,7 @@ HIDDEN _sk_overlay_avx
.globl _sk_overlay_avx
FUNCTION(_sk_overlay_avx)
_sk_overlay_avx:
- .byte 196,98,125,24,5,175,59,2,0 // vbroadcastss 0x23baf(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,71,62,2,0 // vbroadcastss 0x23e47(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,215 // vsubps %ymm7,%ymm8,%ymm10
.byte 197,44,89,200 // vmulps %ymm0,%ymm10,%ymm9
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17019,10 +17164,10 @@ _sk_softlight_avx:
.byte 196,65,60,88,192 // vaddps %ymm8,%ymm8,%ymm8
.byte 196,65,60,89,216 // vmulps %ymm8,%ymm8,%ymm11
.byte 196,65,60,88,195 // vaddps %ymm11,%ymm8,%ymm8
- .byte 196,98,125,24,29,182,58,2,0 // vbroadcastss 0x23ab6(%rip),%ymm11 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,29,78,61,2,0 // vbroadcastss 0x23d4e(%rip),%ymm11 # 2b940 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,65,28,88,235 // vaddps %ymm11,%ymm12,%ymm13
.byte 196,65,20,89,192 // vmulps %ymm8,%ymm13,%ymm8
- .byte 196,98,125,24,45,167,58,2,0 // vbroadcastss 0x23aa7(%rip),%ymm13 # 2b414 <_sk_overlay_sse2_8bit+0x45f>
+ .byte 196,98,125,24,45,63,61,2,0 // vbroadcastss 0x23d3f(%rip),%ymm13 # 2b944 <_sk_overlay_sse2_8bit+0x45f>
.byte 196,65,28,89,245 // vmulps %ymm13,%ymm12,%ymm14
.byte 196,65,12,88,192 // vaddps %ymm8,%ymm14,%ymm8
.byte 196,65,124,82,244 // vrsqrtps %ymm12,%ymm14
@@ -17033,7 +17178,7 @@ _sk_softlight_avx:
.byte 197,4,194,255,2 // vcmpleps %ymm7,%ymm15,%ymm15
.byte 196,67,13,74,240,240 // vblendvps %ymm15,%ymm8,%ymm14,%ymm14
.byte 197,116,88,249 // vaddps %ymm1,%ymm1,%ymm15
- .byte 196,98,125,24,5,81,58,2,0 // vbroadcastss 0x23a51(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,233,60,2,0 // vbroadcastss 0x23ce9(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,60,92,228 // vsubps %ymm12,%ymm8,%ymm12
.byte 197,132,92,195 // vsubps %ymm3,%ymm15,%ymm0
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
@@ -17160,12 +17305,12 @@ _sk_hue_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,52,56,2,0 // vbroadcastss 0x23834(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,204,58,2,0 // vbroadcastss 0x23acc(%rip),%ymm14 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,42,56,2,0 // vbroadcastss 0x2382a(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,61,194,58,2,0 // vbroadcastss 0x23ac2(%rip),%ymm15 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,27,56,2,0 // vbroadcastss 0x2381b(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,179,58,2,0 // vbroadcastss 0x23ab3(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -17226,7 +17371,7 @@ _sk_hue_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,200,54,2,0 // vbroadcastss 0x236c8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,96,57,2,0 // vbroadcastss 0x23960(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17283,12 +17428,12 @@ _sk_saturation_avx:
.byte 196,65,28,89,219 // vmulps %ymm11,%ymm12,%ymm11
.byte 196,65,36,94,222 // vdivps %ymm14,%ymm11,%ymm11
.byte 196,67,37,74,224,240 // vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- .byte 196,98,125,24,53,242,53,2,0 // vbroadcastss 0x235f2(%rip),%ymm14 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,53,138,56,2,0 // vbroadcastss 0x2388a(%rip),%ymm14 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,222 // vmulps %ymm14,%ymm4,%ymm11
- .byte 196,98,125,24,61,232,53,2,0 // vbroadcastss 0x235e8(%rip),%ymm15 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,61,128,56,2,0 // vbroadcastss 0x23880(%rip),%ymm15 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,239 // vmulps %ymm15,%ymm5,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
- .byte 196,226,125,24,5,217,53,2,0 // vbroadcastss 0x235d9(%rip),%ymm0 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,226,125,24,5,113,56,2,0 // vbroadcastss 0x23871(%rip),%ymm0 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 197,76,89,232 // vmulps %ymm0,%ymm6,%ymm13
.byte 196,65,36,88,221 // vaddps %ymm13,%ymm11,%ymm11
.byte 196,65,52,89,238 // vmulps %ymm14,%ymm9,%ymm13
@@ -17349,7 +17494,7 @@ _sk_saturation_avx:
.byte 196,65,36,95,208 // vmaxps %ymm8,%ymm11,%ymm10
.byte 196,195,109,74,209,240 // vblendvps %ymm15,%ymm9,%ymm2,%ymm2
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,134,52,2,0 // vbroadcastss 0x23486(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,30,55,2,0 // vbroadcastss 0x2371e(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,207 // vsubps %ymm7,%ymm8,%ymm9
.byte 197,180,89,201 // vmulps %ymm1,%ymm9,%ymm1
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
@@ -17378,12 +17523,12 @@ _sk_color_avx:
.byte 197,252,17,68,36,168 // vmovups %ymm0,-0x58(%rsp)
.byte 197,124,89,199 // vmulps %ymm7,%ymm0,%ymm8
.byte 197,116,89,207 // vmulps %ymm7,%ymm1,%ymm9
- .byte 196,98,125,24,45,56,52,2,0 // vbroadcastss 0x23438(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,45,208,54,2,0 // vbroadcastss 0x236d0(%rip),%ymm13 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,213 // vmulps %ymm13,%ymm4,%ymm10
- .byte 196,98,125,24,53,46,52,2,0 // vbroadcastss 0x2342e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,198,54,2,0 // vbroadcastss 0x236c6(%rip),%ymm14 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,84,89,222 // vmulps %ymm14,%ymm5,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,31,52,2,0 // vbroadcastss 0x2341f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,183,54,2,0 // vbroadcastss 0x236b7(%rip),%ymm15 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,65,76,89,223 // vmulps %ymm15,%ymm6,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -17446,7 +17591,7 @@ _sk_color_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,186,50,2,0 // vbroadcastss 0x232ba(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,82,53,2,0 // vbroadcastss 0x23552(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,84,36,168 // vmulps -0x58(%rsp),%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17476,12 +17621,12 @@ _sk_luminosity_avx:
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 197,100,89,196 // vmulps %ymm4,%ymm3,%ymm8
.byte 197,100,89,205 // vmulps %ymm5,%ymm3,%ymm9
- .byte 196,98,125,24,45,104,50,2,0 // vbroadcastss 0x23268(%rip),%ymm13 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,45,0,53,2,0 // vbroadcastss 0x23500(%rip),%ymm13 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,108,89,213 // vmulps %ymm13,%ymm2,%ymm10
- .byte 196,98,125,24,53,94,50,2,0 // vbroadcastss 0x2325e(%rip),%ymm14 # 2b41c <_sk_overlay_sse2_8bit+0x467>
+ .byte 196,98,125,24,53,246,52,2,0 // vbroadcastss 0x234f6(%rip),%ymm14 # 2b94c <_sk_overlay_sse2_8bit+0x467>
.byte 196,65,116,89,222 // vmulps %ymm14,%ymm1,%ymm11
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,61,79,50,2,0 // vbroadcastss 0x2324f(%rip),%ymm15 # 2b420 <_sk_overlay_sse2_8bit+0x46b>
+ .byte 196,98,125,24,61,231,52,2,0 // vbroadcastss 0x234e7(%rip),%ymm15 # 2b950 <_sk_overlay_sse2_8bit+0x46b>
.byte 196,65,28,89,223 // vmulps %ymm15,%ymm12,%ymm11
.byte 196,193,44,88,195 // vaddps %ymm11,%ymm10,%ymm0
.byte 196,65,60,89,221 // vmulps %ymm13,%ymm8,%ymm11
@@ -17544,7 +17689,7 @@ _sk_luminosity_avx:
.byte 196,65,44,95,207 // vmaxps %ymm15,%ymm10,%ymm9
.byte 196,195,37,74,192,0 // vblendvps %ymm0,%ymm8,%ymm11,%ymm0
.byte 196,65,124,95,199 // vmaxps %ymm15,%ymm0,%ymm8
- .byte 196,226,125,24,5,234,48,2,0 // vbroadcastss 0x230ea(%rip),%ymm0 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,5,130,51,2,0 // vbroadcastss 0x23382(%rip),%ymm0 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,124,92,215 // vsubps %ymm7,%ymm0,%ymm10
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 197,124,92,219 // vsubps %ymm3,%ymm0,%ymm11
@@ -17577,9 +17722,9 @@ _sk_srcover_rgba_8888_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,43,1,0,0 // jne 84a5 <_sk_srcover_rgba_8888_avx+0x14c>
+ .byte 15,133,43,1,0,0 // jne 873d <_sk_srcover_rgba_8888_avx+0x14c>
.byte 196,65,125,16,4,153 // vmovupd (%r9,%rbx,4),%ymm8
- .byte 197,125,40,13,24,53,2,0 // vmovapd 0x23518(%rip),%ymm9 # 2b8a0 <_sk_overlay_sse2_8bit+0x8eb>
+ .byte 197,125,40,13,192,55,2,0 // vmovapd 0x237c0(%rip),%ymm9 # 2bde0 <_sk_overlay_sse2_8bit+0x8fb>
.byte 196,193,61,84,225 // vandpd %ymm9,%ymm8,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
.byte 196,193,81,114,208,8 // vpsrld $0x8,%xmm8,%xmm5
@@ -17597,9 +17742,9 @@ _sk_srcover_rgba_8888_avx:
.byte 197,193,114,215,24 // vpsrld $0x18,%xmm7,%xmm7
.byte 196,227,61,24,255,1 // vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,15,48,2,0 // vbroadcastss 0x2300f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,167,50,2,0 // vbroadcastss 0x232a7(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,195 // vsubps %ymm3,%ymm8,%ymm8
- .byte 196,98,125,24,13,46,48,2,0 // vbroadcastss 0x2302e(%rip),%ymm9 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,13,198,50,2,0 // vbroadcastss 0x232c6(%rip),%ymm9 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,60,89,212 // vmulps %ymm4,%ymm8,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
@@ -17632,7 +17777,7 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,53,86,202 // vorpd %ymm10,%ymm9,%ymm9
.byte 196,65,61,86,193 // vorpd %ymm9,%ymm8,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne 84dd <_sk_srcover_rgba_8888_avx+0x184>
+ .byte 117,67 // jne 8775 <_sk_srcover_rgba_8888_avx+0x184>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -17642,33 +17787,33 @@ _sk_srcover_rgba_8888_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,194,254,255,255 // ja 8380 <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 15,135,194,254,255,255 // ja 8618 <_sk_srcover_rgba_8888_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,3,1,0,0 // lea 0x103(%rip),%r11 # 85cc <_sk_srcover_rgba_8888_avx+0x273>
+ .byte 76,141,29,3,1,0,0 // lea 0x103(%rip),%r11 # 8864 <_sk_srcover_rgba_8888_avx+0x273>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,4,153 // vmovss (%r9,%rbx,4),%xmm8
- .byte 233,163,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,163,254,255,255 // jmpq 8618 <_sk_srcover_rgba_8888_avx+0x27>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,179 // ja 84a0 <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 119,179 // ja 8738 <_sk_srcover_rgba_8888_avx+0x147>
.byte 65,15,182,194 // movzbl %r10b,%eax
- .byte 76,141,21,240,0,0,0 // lea 0xf0(%rip),%r10 # 85e8 <_sk_srcover_rgba_8888_avx+0x28f>
+ .byte 76,141,21,240,0,0,0 // lea 0xf0(%rip),%r10 # 8880 <_sk_srcover_rgba_8888_avx+0x28f>
.byte 73,99,4,130 // movslq (%r10,%rax,4),%rax
.byte 76,1,208 // add %r10,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,151 // jmp 84a0 <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 235,151 // jmp 8738 <_sk_srcover_rgba_8888_avx+0x147>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,196,4 // vblendps $0x4,%ymm4,%ymm5,%ymm8
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,61,13,196,1 // vblendpd $0x1,%ymm4,%ymm8,%ymm8
- .byte 233,80,254,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,80,254,255,255 // jmpq 8618 <_sk_srcover_rgba_8888_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -17682,10 +17827,10 @@ _sk_srcover_rgba_8888_avx:
.byte 196,99,61,24,196,1 // vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,192,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm8
- .byte 233,251,253,255,255 // jmpq 8380 <_sk_srcover_rgba_8888_avx+0x27>
+ .byte 233,251,253,255,255 // jmpq 8618 <_sk_srcover_rgba_8888_avx+0x27>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 233,8,255,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 233,8,255,255,255 // jmpq 8738 <_sk_srcover_rgba_8888_avx+0x147>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -17693,7 +17838,7 @@ _sk_srcover_rgba_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 233,212,254,255,255 // jmpq 84a0 <_sk_srcover_rgba_8888_avx+0x147>
+ .byte 233,212,254,255,255 // jmpq 8738 <_sk_srcover_rgba_8888_avx+0x147>
.byte 6 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
@@ -17740,7 +17885,7 @@ HIDDEN _sk_clamp_1_avx
.globl _sk_clamp_1_avx
FUNCTION(_sk_clamp_1_avx)
_sk_clamp_1_avx:
- .byte 196,98,125,24,5,206,45,2,0 // vbroadcastss 0x22dce(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,102,48,2,0 // vbroadcastss 0x23066(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
@@ -17752,7 +17897,7 @@ HIDDEN _sk_clamp_a_avx
.globl _sk_clamp_a_avx
FUNCTION(_sk_clamp_a_avx)
_sk_clamp_a_avx:
- .byte 196,98,125,24,5,173,45,2,0 // vbroadcastss 0x22dad(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,69,48,2,0 // vbroadcastss 0x23045(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 197,252,93,195 // vminps %ymm3,%ymm0,%ymm0
.byte 197,244,93,203 // vminps %ymm3,%ymm1,%ymm1
@@ -17764,7 +17909,7 @@ HIDDEN _sk_clamp_a_dst_avx
.globl _sk_clamp_a_dst_avx
FUNCTION(_sk_clamp_a_dst_avx)
_sk_clamp_a_dst_avx:
- .byte 196,98,125,24,5,143,45,2,0 // vbroadcastss 0x22d8f(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,39,48,2,0 // vbroadcastss 0x23027(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,68,93,248 // vminps %ymm8,%ymm7,%ymm7
.byte 197,220,93,231 // vminps %ymm7,%ymm4,%ymm4
.byte 197,212,93,239 // vminps %ymm7,%ymm5,%ymm5
@@ -17797,7 +17942,7 @@ HIDDEN _sk_invert_avx
.globl _sk_invert_avx
FUNCTION(_sk_invert_avx)
_sk_invert_avx:
- .byte 196,98,125,24,5,74,45,2,0 // vbroadcastss 0x22d4a(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,226,47,2,0 // vbroadcastss 0x22fe2(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,188,92,192 // vsubps %ymm0,%ymm8,%ymm0
.byte 197,188,92,201 // vsubps %ymm1,%ymm8,%ymm1
.byte 197,188,92,210 // vsubps %ymm2,%ymm8,%ymm2
@@ -17853,7 +17998,7 @@ FUNCTION(_sk_unpremul_avx)
_sk_unpremul_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,65,100,194,200,0 // vcmpeqps %ymm8,%ymm3,%ymm9
- .byte 196,98,125,24,21,218,44,2,0 // vbroadcastss 0x22cda(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,114,47,2,0 // vbroadcastss 0x22f72(%rip),%ymm10 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,94,211 // vdivps %ymm3,%ymm10,%ymm10
.byte 196,67,45,74,192,144 // vblendvps %ymm9,%ymm8,%ymm10,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
@@ -17866,17 +18011,17 @@ HIDDEN _sk_from_srgb_avx
.globl _sk_from_srgb_avx
FUNCTION(_sk_from_srgb_avx)
_sk_from_srgb_avx:
- .byte 196,98,125,24,5,231,44,2,0 // vbroadcastss 0x22ce7(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,127,47,2,0 // vbroadcastss 0x22f7f(%rip),%ymm8 # 2b958 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 197,124,89,208 // vmulps %ymm0,%ymm0,%ymm10
- .byte 196,98,125,24,29,197,44,2,0 // vbroadcastss 0x22cc5(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,93,47,2,0 // vbroadcastss 0x22f5d(%rip),%ymm11 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,124,89,227 // vmulps %ymm11,%ymm0,%ymm12
- .byte 196,98,125,24,45,203,44,2,0 // vbroadcastss 0x22ccb(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,45,99,47,2,0 // vbroadcastss 0x22f63(%rip),%ymm13 # 2b95c <_sk_overlay_sse2_8bit+0x477>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,188,44,2,0 // vbroadcastss 0x22cbc(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,37,84,47,2,0 // vbroadcastss 0x22f54(%rip),%ymm12 # 2b960 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,178,44,2,0 // vbroadcastss 0x22cb2(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,53,74,47,2,0 // vbroadcastss 0x22f4a(%rip),%ymm14 # 2b964 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,124,194,198,1 // vcmpltps %ymm14,%ymm0,%ymm0
.byte 196,195,45,74,193,0 // vblendvps %ymm0,%ymm9,%ymm10,%ymm0
.byte 196,65,116,89,200 // vmulps %ymm8,%ymm1,%ymm9
@@ -17902,17 +18047,17 @@ HIDDEN _sk_from_srgb_dst_avx
.globl _sk_from_srgb_dst_avx
FUNCTION(_sk_from_srgb_dst_avx)
_sk_from_srgb_dst_avx:
- .byte 196,98,125,24,5,59,44,2,0 // vbroadcastss 0x22c3b(%rip),%ymm8 # 2b428 <_sk_overlay_sse2_8bit+0x473>
+ .byte 196,98,125,24,5,211,46,2,0 // vbroadcastss 0x22ed3(%rip),%ymm8 # 2b958 <_sk_overlay_sse2_8bit+0x473>
.byte 196,65,92,89,200 // vmulps %ymm8,%ymm4,%ymm9
.byte 197,92,89,212 // vmulps %ymm4,%ymm4,%ymm10
- .byte 196,98,125,24,29,25,44,2,0 // vbroadcastss 0x22c19(%rip),%ymm11 # 2b418 <_sk_overlay_sse2_8bit+0x463>
+ .byte 196,98,125,24,29,177,46,2,0 // vbroadcastss 0x22eb1(%rip),%ymm11 # 2b948 <_sk_overlay_sse2_8bit+0x463>
.byte 196,65,92,89,227 // vmulps %ymm11,%ymm4,%ymm12
- .byte 196,98,125,24,45,31,44,2,0 // vbroadcastss 0x22c1f(%rip),%ymm13 # 2b42c <_sk_overlay_sse2_8bit+0x477>
+ .byte 196,98,125,24,45,183,46,2,0 // vbroadcastss 0x22eb7(%rip),%ymm13 # 2b95c <_sk_overlay_sse2_8bit+0x477>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,44,89,212 // vmulps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,37,16,44,2,0 // vbroadcastss 0x22c10(%rip),%ymm12 # 2b430 <_sk_overlay_sse2_8bit+0x47b>
+ .byte 196,98,125,24,37,168,46,2,0 // vbroadcastss 0x22ea8(%rip),%ymm12 # 2b960 <_sk_overlay_sse2_8bit+0x47b>
.byte 196,65,44,88,212 // vaddps %ymm12,%ymm10,%ymm10
- .byte 196,98,125,24,53,6,44,2,0 // vbroadcastss 0x22c06(%rip),%ymm14 # 2b434 <_sk_overlay_sse2_8bit+0x47f>
+ .byte 196,98,125,24,53,158,46,2,0 // vbroadcastss 0x22e9e(%rip),%ymm14 # 2b964 <_sk_overlay_sse2_8bit+0x47f>
.byte 196,193,92,194,230,1 // vcmpltps %ymm14,%ymm4,%ymm4
.byte 196,195,45,74,225,64 // vblendvps %ymm4,%ymm9,%ymm10,%ymm4
.byte 196,65,84,89,200 // vmulps %ymm8,%ymm5,%ymm9
@@ -17939,20 +18084,20 @@ HIDDEN _sk_to_srgb_avx
FUNCTION(_sk_to_srgb_avx)
_sk_to_srgb_avx:
.byte 197,124,82,200 // vrsqrtps %ymm0,%ymm9
- .byte 196,98,125,24,5,155,43,2,0 // vbroadcastss 0x22b9b(%rip),%ymm8 # 2b438 <_sk_overlay_sse2_8bit+0x483>
+ .byte 196,98,125,24,5,51,46,2,0 // vbroadcastss 0x22e33(%rip),%ymm8 # 2b968 <_sk_overlay_sse2_8bit+0x483>
.byte 196,65,124,89,208 // vmulps %ymm8,%ymm0,%ymm10
- .byte 196,98,125,24,29,149,43,2,0 // vbroadcastss 0x22b95(%rip),%ymm11 # 2b440 <_sk_overlay_sse2_8bit+0x48b>
+ .byte 196,98,125,24,29,45,46,2,0 // vbroadcastss 0x22e2d(%rip),%ymm11 # 2b970 <_sk_overlay_sse2_8bit+0x48b>
.byte 196,65,52,89,227 // vmulps %ymm11,%ymm9,%ymm12
- .byte 196,98,125,24,45,131,43,2,0 // vbroadcastss 0x22b83(%rip),%ymm13 # 2b43c <_sk_overlay_sse2_8bit+0x487>
+ .byte 196,98,125,24,45,27,46,2,0 // vbroadcastss 0x22e1b(%rip),%ymm13 # 2b96c <_sk_overlay_sse2_8bit+0x487>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,52,89,228 // vmulps %ymm12,%ymm9,%ymm12
- .byte 196,98,125,24,53,120,43,2,0 // vbroadcastss 0x22b78(%rip),%ymm14 # 2b444 <_sk_overlay_sse2_8bit+0x48f>
+ .byte 196,98,125,24,53,16,46,2,0 // vbroadcastss 0x22e10(%rip),%ymm14 # 2b974 <_sk_overlay_sse2_8bit+0x48f>
.byte 196,65,28,88,230 // vaddps %ymm14,%ymm12,%ymm12
- .byte 196,98,125,24,61,110,43,2,0 // vbroadcastss 0x22b6e(%rip),%ymm15 # 2b448 <_sk_overlay_sse2_8bit+0x493>
+ .byte 196,98,125,24,61,6,46,2,0 // vbroadcastss 0x22e06(%rip),%ymm15 # 2b978 <_sk_overlay_sse2_8bit+0x493>
.byte 196,65,52,88,207 // vaddps %ymm15,%ymm9,%ymm9
.byte 196,65,124,83,201 // vrcpps %ymm9,%ymm9
.byte 196,65,52,89,204 // vmulps %ymm12,%ymm9,%ymm9
- .byte 196,98,125,24,37,90,43,2,0 // vbroadcastss 0x22b5a(%rip),%ymm12 # 2b44c <_sk_overlay_sse2_8bit+0x497>
+ .byte 196,98,125,24,37,242,45,2,0 // vbroadcastss 0x22df2(%rip),%ymm12 # 2b97c <_sk_overlay_sse2_8bit+0x497>
.byte 196,193,124,194,196,1 // vcmpltps %ymm12,%ymm0,%ymm0
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 197,124,82,201 // vrsqrtps %ymm1,%ymm9
@@ -17989,7 +18134,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,116,93,202 // vminps %ymm2,%ymm1,%ymm9
.byte 196,65,124,93,201 // vminps %ymm9,%ymm0,%ymm9
.byte 196,65,60,92,209 // vsubps %ymm9,%ymm8,%ymm10
- .byte 196,98,125,24,29,102,42,2,0 // vbroadcastss 0x22a66(%rip),%ymm11 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,29,254,44,2,0 // vbroadcastss 0x22cfe(%rip),%ymm11 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,65,36,94,218 // vdivps %ymm10,%ymm11,%ymm11
.byte 197,116,92,226 // vsubps %ymm2,%ymm1,%ymm12
.byte 196,65,28,89,227 // vmulps %ymm11,%ymm12,%ymm12
@@ -17999,19 +18144,19 @@ _sk_rgb_to_hsl_avx:
.byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
.byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,147,42,2,0 // vbroadcastss 0x22a93(%rip),%ymm11 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,29,43,45,2,0 // vbroadcastss 0x22d2b(%rip),%ymm11 # 2b988 <_sk_overlay_sse2_8bit+0x4a3>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,129,42,2,0 // vbroadcastss 0x22a81(%rip),%ymm11 # 2b454 <_sk_overlay_sse2_8bit+0x49f>
+ .byte 196,98,125,24,29,25,45,2,0 // vbroadcastss 0x22d19(%rip),%ymm11 # 2b984 <_sk_overlay_sse2_8bit+0x49f>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,227,117,74,202,224 // vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,105,42,2,0 // vbroadcastss 0x22a69(%rip),%ymm2 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,226,125,24,21,1,45,2,0 // vbroadcastss 0x22d01(%rip),%ymm2 # 2b980 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,65,12,87,246 // vxorps %ymm14,%ymm14,%ymm14
.byte 196,227,13,74,210,208 // vblendvps %ymm13,%ymm2,%ymm14,%ymm2
.byte 197,188,194,192,0 // vcmpeqps %ymm0,%ymm8,%ymm0
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
.byte 196,227,117,74,194,0 // vblendvps %ymm0,%ymm2,%ymm1,%ymm0
.byte 196,193,60,88,201 // vaddps %ymm9,%ymm8,%ymm1
- .byte 196,98,125,24,37,228,41,2,0 // vbroadcastss 0x229e4(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,124,44,2,0 // vbroadcastss 0x22c7c(%rip),%ymm12 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,89,212 // vmulps %ymm12,%ymm1,%ymm2
.byte 197,28,194,226,1 // vcmpltps %ymm2,%ymm12,%ymm12
.byte 196,65,36,92,216 // vsubps %ymm8,%ymm11,%ymm11
@@ -18021,7 +18166,7 @@ _sk_rgb_to_hsl_avx:
.byte 197,172,94,201 // vdivps %ymm1,%ymm10,%ymm1
.byte 196,195,125,74,198,128 // vblendvps %ymm8,%ymm14,%ymm0,%ymm0
.byte 196,195,117,74,206,128 // vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- .byte 196,98,125,24,5,19,42,2,0 // vbroadcastss 0x22a13(%rip),%ymm8 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,5,171,44,2,0 // vbroadcastss 0x22cab(%rip),%ymm8 # 2b98c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -18038,7 +18183,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,252,17,92,36,128 // vmovups %ymm3,-0x80(%rsp)
.byte 197,252,40,225 // vmovaps %ymm1,%ymm4
.byte 197,252,40,216 // vmovaps %ymm0,%ymm3
- .byte 196,98,125,24,5,112,41,2,0 // vbroadcastss 0x22970(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,8,44,2,0 // vbroadcastss 0x22c08(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,60,194,202,2 // vcmpleps %ymm2,%ymm8,%ymm9
.byte 197,92,89,210 // vmulps %ymm2,%ymm4,%ymm10
.byte 196,65,92,92,218 // vsubps %ymm10,%ymm4,%ymm11
@@ -18046,23 +18191,23 @@ _sk_hsl_to_rgb_avx:
.byte 197,52,88,210 // vaddps %ymm2,%ymm9,%ymm10
.byte 197,108,88,202 // vaddps %ymm2,%ymm2,%ymm9
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,29,178,41,2,0 // vbroadcastss 0x229b2(%rip),%ymm11 # 2b460 <_sk_overlay_sse2_8bit+0x4ab>
+ .byte 196,98,125,24,29,74,44,2,0 // vbroadcastss 0x22c4a(%rip),%ymm11 # 2b990 <_sk_overlay_sse2_8bit+0x4ab>
.byte 196,65,100,88,219 // vaddps %ymm11,%ymm3,%ymm11
.byte 196,67,125,8,227,1 // vroundps $0x1,%ymm11,%ymm12
.byte 196,65,36,92,252 // vsubps %ymm12,%ymm11,%ymm15
.byte 196,65,44,92,217 // vsubps %ymm9,%ymm10,%ymm11
- .byte 196,98,125,24,37,132,41,2,0 // vbroadcastss 0x22984(%rip),%ymm12 # 2b450 <_sk_overlay_sse2_8bit+0x49b>
+ .byte 196,98,125,24,37,28,44,2,0 // vbroadcastss 0x22c1c(%rip),%ymm12 # 2b980 <_sk_overlay_sse2_8bit+0x49b>
.byte 196,193,4,89,196 // vmulps %ymm12,%ymm15,%ymm0
- .byte 196,98,125,24,45,126,41,2,0 // vbroadcastss 0x2297e(%rip),%ymm13 # 2b458 <_sk_overlay_sse2_8bit+0x4a3>
+ .byte 196,98,125,24,45,22,44,2,0 // vbroadcastss 0x22c16(%rip),%ymm13 # 2b988 <_sk_overlay_sse2_8bit+0x4a3>
.byte 197,20,92,240 // vsubps %ymm0,%ymm13,%ymm14
.byte 196,65,36,89,246 // vmulps %ymm14,%ymm11,%ymm14
.byte 196,65,52,88,246 // vaddps %ymm14,%ymm9,%ymm14
- .byte 196,226,125,24,13,115,41,2,0 // vbroadcastss 0x22973(%rip),%ymm1 # 2b464 <_sk_overlay_sse2_8bit+0x4af>
+ .byte 196,226,125,24,13,11,44,2,0 // vbroadcastss 0x22c0b(%rip),%ymm1 # 2b994 <_sk_overlay_sse2_8bit+0x4af>
.byte 196,193,116,194,255,2 // vcmpleps %ymm15,%ymm1,%ymm7
.byte 196,195,13,74,249,112 // vblendvps %ymm7,%ymm9,%ymm14,%ymm7
.byte 196,65,60,194,247,2 // vcmpleps %ymm15,%ymm8,%ymm14
.byte 196,227,45,74,255,224 // vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- .byte 196,98,125,24,53,74,41,2,0 // vbroadcastss 0x2294a(%rip),%ymm14 # 2b45c <_sk_overlay_sse2_8bit+0x4a7>
+ .byte 196,98,125,24,53,226,43,2,0 // vbroadcastss 0x22be2(%rip),%ymm14 # 2b98c <_sk_overlay_sse2_8bit+0x4a7>
.byte 196,65,12,194,255,2 // vcmpleps %ymm15,%ymm14,%ymm15
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,180,88,192 // vaddps %ymm0,%ymm9,%ymm0
@@ -18081,7 +18226,7 @@ _sk_hsl_to_rgb_avx:
.byte 197,164,89,247 // vmulps %ymm7,%ymm11,%ymm6
.byte 197,180,88,246 // vaddps %ymm6,%ymm9,%ymm6
.byte 196,227,77,74,237,0 // vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- .byte 196,226,125,24,5,244,40,2,0 // vbroadcastss 0x228f4(%rip),%ymm0 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,226,125,24,5,140,43,2,0 // vbroadcastss 0x22b8c(%rip),%ymm0 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
.byte 197,228,88,192 // vaddps %ymm0,%ymm3,%ymm0
.byte 196,227,125,8,216,1 // vroundps $0x1,%ymm0,%ymm3
.byte 197,252,92,195 // vsubps %ymm3,%ymm0,%ymm0
@@ -18136,15 +18281,15 @@ _sk_scale_u8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,75 // jne 8c7b <_sk_scale_u8_avx+0x64>
+ .byte 117,75 // jne 8f13 <_sk_scale_u8_avx+0x64>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,82,49,2,0 // vpand 0x23152(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,57,219,5,250,51,2,0 // vpand 0x233fa(%rip),%xmm8,%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,11,40,2,0 // vbroadcastss 0x2280b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,163,42,2,0 // vbroadcastss 0x22aa3(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 197,188,89,201 // vmulps %ymm1,%ymm8,%ymm1
@@ -18158,15 +18303,15 @@ _sk_scale_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,166 // ja 8c36 <_sk_scale_u8_avx+0x1f>
+ .byte 119,166 // ja 8ece <_sk_scale_u8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 8d14 <_sk_scale_u8_avx+0xfd>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # 8fac <_sk_scale_u8_avx+0xfd>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 235,135 // jmp 8c36 <_sk_scale_u8_avx+0x1f>
+ .byte 235,135 // jmp 8ece <_sk_scale_u8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18174,7 +18319,7 @@ _sk_scale_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,94,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f>
+ .byte 233,94,255,255,255 // jmpq 8ece <_sk_scale_u8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18185,7 +18330,7 @@ _sk_scale_u8_avx:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,34,255,255,255 // jmpq 8c36 <_sk_scale_u8_avx+0x1f>
+ .byte 233,34,255,255,255 // jmpq 8ece <_sk_scale_u8_avx+0x1f>
.byte 144 // nop
.byte 255 // (bad)
.byte 255 // (bad)
@@ -18220,26 +18365,26 @@ _sk_scale_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,178,0,0,0 // jne 8e02 <_sk_scale_565_avx+0xd2>
+ .byte 15,133,178,0,0,0 // jne 909a <_sk_scale_565_avx+0xd2>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,252,38,2,0 // vbroadcastss 0x226fc(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,24,13,148,41,2,0 // vbroadcastss 0x22994(%rip),%ymm9 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,237,38,2,0 // vbroadcastss 0x226ed(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,133,41,2,0 // vbroadcastss 0x22985(%rip),%ymm10 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,227,38,2,0 // vbroadcastss 0x226e3(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,24,21,123,41,2,0 // vbroadcastss 0x2297b(%rip),%ymm10 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,212,38,2,0 // vbroadcastss 0x226d4(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,108,41,2,0 // vbroadcastss 0x2296c(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,202,38,2,0 // vbroadcastss 0x226ca(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,24,29,98,41,2,0 // vbroadcastss 0x22962(%rip),%ymm11 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,187,38,2,0 // vbroadcastss 0x226bb(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,83,41,2,0 // vbroadcastss 0x22953(%rip),%ymm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -18259,27 +18404,27 @@ _sk_scale_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,59,255,255,255 // ja 8d56 <_sk_scale_565_avx+0x26>
+ .byte 15,135,59,255,255,255 // ja 8fee <_sk_scale_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 8e8c <_sk_scale_565_avx+0x15c>
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 9124 <_sk_scale_565_avx+0x15c>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,25,255,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 233,25,255,255,255 // jmpq 8fee <_sk_scale_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,251,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 233,251,254,255,255 // jmpq 8fee <_sk_scale_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,205,254,255,255 // jmpq 8d56 <_sk_scale_565_avx+0x26>
+ .byte 233,205,254,255,255 // jmpq 8fee <_sk_scale_565_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
@@ -18332,15 +18477,15 @@ _sk_lerp_u8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,111 // jne 8f6f <_sk_lerp_u8_avx+0x88>
+ .byte 117,111 // jne 9207 <_sk_lerp_u8_avx+0x88>
.byte 196,66,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm8
- .byte 197,57,219,5,130,46,2,0 // vpand 0x22e82(%rip),%xmm8,%xmm8 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,57,219,5,42,49,2,0 // vpand 0x2312a(%rip),%xmm8,%xmm8 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,13,59,37,2,0 // vbroadcastss 0x2253b(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,211,39,2,0 // vbroadcastss 0x227d3(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,252,92,196 // vsubps %ymm4,%ymm0,%ymm0
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
@@ -18362,15 +18507,15 @@ _sk_lerp_u8_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,130 // ja 8f06 <_sk_lerp_u8_avx+0x1f>
+ .byte 119,130 // ja 919e <_sk_lerp_u8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 900c <_sk_lerp_u8_avx+0x125>
+ .byte 76,141,29,125,0,0,0 // lea 0x7d(%rip),%r11 # 92a4 <_sk_lerp_u8_avx+0x125>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,96,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
+ .byte 233,96,255,255,255 // jmpq 919e <_sk_lerp_u8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,2 // vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -18378,7 +18523,7 @@ _sk_lerp_u8_avx:
.byte 197,121,110,200 // vmovd %eax,%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,55,255,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
+ .byte 233,55,255,255,255 // jmpq 919e <_sk_lerp_u8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 197,57,196,192,6 // vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -18389,7 +18534,7 @@ _sk_lerp_u8_avx:
.byte 196,65,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm9
.byte 196,66,121,48,201 // vpmovzxbw %xmm9,%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,251,254,255,255 // jmpq 8f06 <_sk_lerp_u8_avx+0x1f>
+ .byte 233,251,254,255,255 // jmpq 919e <_sk_lerp_u8_avx+0x1f>
.byte 144 // nop
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -18397,7 +18542,7 @@ _sk_lerp_u8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00901c <_sk_overlay_sse2_8bit+0xffffffffdefde067>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0092b4 <_sk_overlay_sse2_8bit+0xffffffffdefdddcf>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -18421,26 +18566,26 @@ _sk_lerp_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,214,0,0,0 // jne 911e <_sk_lerp_565_avx+0xf6>
+ .byte 15,133,214,0,0,0 // jne 93b6 <_sk_lerp_565_avx+0xf6>
.byte 196,65,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,65,57,105,201 // vpunpckhwd %xmm9,%xmm8,%xmm9
.byte 196,66,121,51,192 // vpmovzxwd %xmm8,%xmm8
.byte 196,67,61,24,193,1 // vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,4,36,2,0 // vbroadcastss 0x22404(%rip),%ymm9 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,98,125,24,13,156,38,2,0 // vbroadcastss 0x2269c(%rip),%ymm9 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 196,65,60,84,201 // vandps %ymm9,%ymm8,%ymm9
.byte 196,65,124,91,201 // vcvtdq2ps %ymm9,%ymm9
- .byte 196,98,125,24,21,245,35,2,0 // vbroadcastss 0x223f5(%rip),%ymm10 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,98,125,24,21,141,38,2,0 // vbroadcastss 0x2268d(%rip),%ymm10 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,235,35,2,0 // vbroadcastss 0x223eb(%rip),%ymm10 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,98,125,24,21,131,38,2,0 // vbroadcastss 0x22683(%rip),%ymm10 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 196,65,60,84,210 // vandps %ymm10,%ymm8,%ymm10
.byte 196,65,124,91,210 // vcvtdq2ps %ymm10,%ymm10
- .byte 196,98,125,24,29,220,35,2,0 // vbroadcastss 0x223dc(%rip),%ymm11 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,98,125,24,29,116,38,2,0 // vbroadcastss 0x22674(%rip),%ymm11 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
- .byte 196,98,125,24,29,210,35,2,0 // vbroadcastss 0x223d2(%rip),%ymm11 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,98,125,24,29,106,38,2,0 // vbroadcastss 0x2266a(%rip),%ymm11 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 196,65,60,84,195 // vandps %ymm11,%ymm8,%ymm8
.byte 196,65,124,91,192 // vcvtdq2ps %ymm8,%ymm8
- .byte 196,98,125,24,29,195,35,2,0 // vbroadcastss 0x223c3(%rip),%ymm11 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,98,125,24,29,91,38,2,0 // vbroadcastss 0x2265b(%rip),%ymm11 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 197,100,194,223,1 // vcmpltps %ymm7,%ymm3,%ymm11
.byte 196,65,44,93,224 // vminps %ymm8,%ymm10,%ymm12
@@ -18468,27 +18613,27 @@ _sk_lerp_565_avx:
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,23,255,255,255 // ja 904e <_sk_lerp_565_avx+0x26>
+ .byte 15,135,23,255,255,255 // ja 92e6 <_sk_lerp_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 91a8 <_sk_lerp_565_avx+0x180>
+ .byte 76,141,29,102,0,0,0 // lea 0x66(%rip),%r11 # 9440 <_sk_lerp_565_avx+0x180>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,121,110,192 // vmovd %eax,%xmm8
- .byte 233,245,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
+ .byte 233,245,254,255,255 // jmpq 92e6 <_sk_lerp_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm9
.byte 196,67,57,14,193,3 // vpblendw $0x3,%xmm9,%xmm8,%xmm8
- .byte 233,215,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
+ .byte 233,215,254,255,255 // jmpq 92e6 <_sk_lerp_565_avx+0x26>
.byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
.byte 196,65,57,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,57,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
.byte 196,65,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm9
.byte 196,67,49,14,192,240 // vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- .byte 233,169,254,255,255 // jmpq 904e <_sk_lerp_565_avx+0x26>
+ .byte 233,169,254,255,255 // jmpq 92e6 <_sk_lerp_565_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 163,255,255,255,190,255,255,255,177 // movabs %eax,0xb1ffffffbeffffff
.byte 255 // (bad)
@@ -18516,9 +18661,9 @@ _sk_load_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,4,2,0,0 // jne 93dc <_sk_load_tables_avx+0x218>
+ .byte 15,133,4,2,0,0 // jne 9674 <_sk_load_tables_avx+0x218>
.byte 196,65,125,16,20,145 // vmovupd (%r9,%rdx,4),%ymm10
- .byte 197,125,40,13,218,38,2,0 // vmovapd 0x226da(%rip),%ymm9 # 2b8c0 <_sk_overlay_sse2_8bit+0x90b>
+ .byte 197,125,40,13,130,41,2,0 // vmovapd 0x22982(%rip),%ymm9 # 2be00 <_sk_overlay_sse2_8bit+0x91b>
.byte 196,193,45,84,201 // vandpd %ymm9,%ymm10,%ymm1
.byte 196,227,125,25,200,1 // vextractf128 $0x1,%ymm1,%xmm0
.byte 196,193,249,126,193 // vmovq %xmm0,%r9
@@ -18610,7 +18755,7 @@ _sk_load_tables_avx:
.byte 196,193,65,114,213,24 // vpsrld $0x18,%xmm13,%xmm7
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,158,32,2,0 // vbroadcastss 0x2209e(%rip),%ymm7 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,61,54,35,2,0 // vbroadcastss 0x22336(%rip),%ymm7 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -18620,21 +18765,21 @@ _sk_load_tables_avx:
.byte 196,65,44,87,210 // vxorps %ymm10,%ymm10,%ymm10
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,233,253,255,255 // ja 91de <_sk_load_tables_avx+0x1a>
+ .byte 15,135,233,253,255,255 // ja 9476 <_sk_load_tables_avx+0x1a>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 9494 <_sk_load_tables_avx+0x2d0>
+ .byte 76,141,29,148,0,0,0 // lea 0x94(%rip),%r11 # 972c <_sk_load_tables_avx+0x2d0>
.byte 79,99,20,147 // movslq (%r11,%r10,4),%r10
.byte 77,1,218 // add %r11,%r10
.byte 65,255,226 // jmpq *%r10
.byte 196,65,122,16,20,145 // vmovss (%r9,%rdx,4),%xmm10
- .byte 233,201,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
+ .byte 233,201,253,255,255 // jmpq 9476 <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,145,8 // vmovd 0x8(%r9,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,208,4 // vblendps $0x4,%ymm0,%ymm1,%ymm10
.byte 196,193,123,16,4,145 // vmovsd (%r9,%rdx,4),%xmm0
.byte 196,99,45,13,208,1 // vblendpd $0x1,%ymm0,%ymm10,%ymm10
- .byte 233,162,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
+ .byte 233,162,253,255,255 // jmpq 9476 <_sk_load_tables_avx+0x1a>
.byte 196,193,121,110,68,145,24 // vmovd 0x18(%r9,%rdx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -18648,9 +18793,9 @@ _sk_load_tables_avx:
.byte 196,99,45,24,208,1 // vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
.byte 196,193,121,16,4,145 // vmovupd (%r9,%rdx,4),%xmm0
.byte 196,67,125,13,210,12 // vblendpd $0xc,%ymm10,%ymm0,%ymm10
- .byte 233,77,253,255,255 // jmpq 91de <_sk_load_tables_avx+0x1a>
+ .byte 233,77,253,255,255 // jmpq 9476 <_sk_load_tables_avx+0x1a>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe 9495 <_sk_load_tables_avx+0x2d1>
+ .byte 118,255 // jbe 972d <_sk_load_tables_avx+0x2d1>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -18679,7 +18824,7 @@ _sk_load_tables_u16_be_avx:
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
- .byte 15,133,84,2,0,0 // jne 9720 <_sk_load_tables_u16_be_avx+0x270>
+ .byte 15,133,84,2,0,0 // jne 99b8 <_sk_load_tables_u16_be_avx+0x270>
.byte 196,1,121,16,4,81 // vmovupd (%r9,%r10,2),%xmm8
.byte 196,129,121,16,84,81,16 // vmovupd 0x10(%r9,%r10,2),%xmm2
.byte 196,129,121,16,92,81,32 // vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -18694,7 +18839,7 @@ _sk_load_tables_u16_be_avx:
.byte 197,113,105,219 // vpunpckhwd %xmm3,%xmm1,%xmm11
.byte 197,177,108,200 // vpunpcklqdq %xmm0,%xmm9,%xmm1
.byte 197,49,109,224 // vpunpckhqdq %xmm0,%xmm9,%xmm12
- .byte 197,121,111,21,119,40,2,0 // vmovdqa 0x22877(%rip),%xmm10 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,121,111,21,31,43,2,0 // vmovdqa 0x22b1f(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 196,193,113,219,202 // vpand %xmm10,%xmm1,%xmm1
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 196,193,113,105,209 // vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -18792,7 +18937,7 @@ _sk_load_tables_u16_be_avx:
.byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
.byte 196,227,101,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,226,125,24,61,118,29,2,0 // vbroadcastss 0x21d76(%rip),%ymm7 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,226,125,24,61,14,32,2,0 // vbroadcastss 0x2200e(%rip),%ymm7 # 2b9b8 <_sk_overlay_sse2_8bit+0x4d3>
.byte 197,228,89,223 // vmulps %ymm7,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
@@ -18800,29 +18945,29 @@ _sk_load_tables_u16_be_avx:
.byte 196,1,123,16,4,81 // vmovsd (%r9,%r10,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je 9786 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 116,85 // je 9a1e <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,1,57,22,68,81,8 // vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb 9786 <_sk_load_tables_u16_be_avx+0x2d6>
+ .byte 114,72 // jb 9a1e <_sk_load_tables_u16_be_avx+0x2d6>
.byte 196,129,123,16,84,81,16 // vmovsd 0x10(%r9,%r10,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je 9793 <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 116,72 // je 9a2b <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,105,22,84,81,24 // vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb 9793 <_sk_load_tables_u16_be_avx+0x2e3>
+ .byte 114,59 // jb 9a2b <_sk_load_tables_u16_be_avx+0x2e3>
.byte 196,129,123,16,92,81,32 // vmovsd 0x20(%r9,%r10,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,126,253,255,255 // je 94e7 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,132,126,253,255,255 // je 977f <_sk_load_tables_u16_be_avx+0x37>
.byte 196,129,97,22,92,81,40 // vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,109,253,255,255 // jb 94e7 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 15,130,109,253,255,255 // jb 977f <_sk_load_tables_u16_be_avx+0x37>
.byte 196,1,122,126,76,81,48 // vmovq 0x30(%r9,%r10,2),%xmm9
- .byte 233,97,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,97,253,255,255 // jmpq 977f <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,84,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,84,253,255,255 // jmpq 977f <_sk_load_tables_u16_be_avx+0x37>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,75,253,255,255 // jmpq 94e7 <_sk_load_tables_u16_be_avx+0x37>
+ .byte 233,75,253,255,255 // jmpq 977f <_sk_load_tables_u16_be_avx+0x37>
HIDDEN _sk_load_tables_rgb_u16_be_avx
.globl _sk_load_tables_rgb_u16_be_avx
@@ -18834,29 +18979,29 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 77,133,192 // test %r8,%r8
.byte 197,252,17,124,36,200 // vmovups %ymm7,-0x38(%rsp)
.byte 197,252,17,116,36,168 // vmovups %ymm6,-0x58(%rsp)
- .byte 15,133,71,2,0,0 // jne 9a01 <_sk_load_tables_rgb_u16_be_avx+0x265>
- .byte 196,129,122,111,4,81 // vmovdqu (%r9,%r10,2),%xmm0
- .byte 196,129,122,111,84,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm2
- .byte 196,129,122,111,76,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm1
- .byte 196,129,122,111,92,81,32 // vmovdqu 0x20(%r9,%r10,2),%xmm3
- .byte 197,225,115,219,4 // vpsrldq $0x4,%xmm3,%xmm3
- .byte 197,185,115,216,6 // vpsrldq $0x6,%xmm0,%xmm8
- .byte 197,177,115,218,6 // vpsrldq $0x6,%xmm2,%xmm9
- .byte 197,161,115,217,6 // vpsrldq $0x6,%xmm1,%xmm11
+ .byte 15,133,72,2,0,0 // jne 9c9a <_sk_load_tables_rgb_u16_be_avx+0x266>
+ .byte 196,1,122,111,28,81 // vmovdqu (%r9,%r10,2),%xmm11
+ .byte 196,129,122,111,92,81,12 // vmovdqu 0xc(%r9,%r10,2),%xmm3
+ .byte 196,129,122,111,84,81,24 // vmovdqu 0x18(%r9,%r10,2),%xmm2
+ .byte 196,129,122,111,68,81,32 // vmovdqu 0x20(%r9,%r10,2),%xmm0
+ .byte 197,249,115,216,4 // vpsrldq $0x4,%xmm0,%xmm0
+ .byte 196,193,57,115,219,6 // vpsrldq $0x6,%xmm11,%xmm8
.byte 197,169,115,219,6 // vpsrldq $0x6,%xmm3,%xmm10
- .byte 197,249,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm0
- .byte 196,193,57,97,209 // vpunpcklwd %xmm9,%xmm8,%xmm2
- .byte 197,241,97,203 // vpunpcklwd %xmm3,%xmm1,%xmm1
- .byte 196,193,33,97,218 // vpunpcklwd %xmm10,%xmm11,%xmm3
- .byte 197,121,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm8
+ .byte 197,153,115,218,6 // vpsrldq $0x6,%xmm2,%xmm12
+ .byte 197,177,115,216,6 // vpsrldq $0x6,%xmm0,%xmm9
+ .byte 197,161,97,219 // vpunpcklwd %xmm3,%xmm11,%xmm3
+ .byte 196,193,57,97,202 // vpunpcklwd %xmm10,%xmm8,%xmm1
+ .byte 197,233,97,192 // vpunpcklwd %xmm0,%xmm2,%xmm0
+ .byte 196,193,25,97,209 // vpunpcklwd %xmm9,%xmm12,%xmm2
+ .byte 197,97,97,193 // vpunpcklwd %xmm1,%xmm3,%xmm8
+ .byte 197,225,105,201 // vpunpckhwd %xmm1,%xmm3,%xmm1
+ .byte 197,249,97,218 // vpunpcklwd %xmm2,%xmm0,%xmm3
.byte 197,249,105,194 // vpunpckhwd %xmm2,%xmm0,%xmm0
- .byte 197,241,97,211 // vpunpcklwd %xmm3,%xmm1,%xmm2
- .byte 197,241,105,203 // vpunpckhwd %xmm3,%xmm1,%xmm1
- .byte 197,185,108,218 // vpunpcklqdq %xmm2,%xmm8,%xmm3
- .byte 197,57,109,218 // vpunpckhqdq %xmm2,%xmm8,%xmm11
- .byte 197,121,108,193 // vpunpcklqdq %xmm1,%xmm0,%xmm8
- .byte 197,121,111,13,108,37,2,0 // vmovdqa 0x2256c(%rip),%xmm9 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
- .byte 196,193,97,219,193 // vpand %xmm9,%xmm3,%xmm0
+ .byte 197,185,108,211 // vpunpcklqdq %xmm3,%xmm8,%xmm2
+ .byte 197,57,109,219 // vpunpckhqdq %xmm3,%xmm8,%xmm11
+ .byte 197,113,108,192 // vpunpcklqdq %xmm0,%xmm1,%xmm8
+ .byte 197,121,111,13,19,40,2,0 // vmovdqa 0x22813(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
+ .byte 196,193,105,219,193 // vpand %xmm9,%xmm2,%xmm0
.byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
.byte 196,193,121,105,202 // vpunpckhwd %xmm10,%xmm0,%xmm1
.byte 196,193,249,126,201 // vmovq %xmm1,%r9
@@ -18945,50 +19090,78 @@ _sk_load_tables_rgb_u16_be_avx:
.byte 196,195,105,33,211,48 // vinsertps $0x30,%xmm11,%xmm2,%xmm2
.byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,5,26,2,0 // vbroadcastss 0x21a05(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,156,28,2,0 // vbroadcastss 0x21c9c(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,116,36,168 // vmovups -0x58(%rsp),%ymm6
.byte 197,252,16,124,36,200 // vmovups -0x38(%rsp),%ymm7
.byte 255,224 // jmpq *%rax
.byte 196,129,121,110,4,81 // vmovd (%r9,%r10,2),%xmm0
- .byte 196,129,121,196,68,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
+ .byte 196,1,121,196,92,81,4,2 // vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm11
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne 9a1a <_sk_load_tables_rgb_u16_be_avx+0x27e>
- .byte 233,212,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 196,129,121,110,76,81,6 // vmovd 0x6(%r9,%r10,2),%xmm1
- .byte 196,1,113,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
+ .byte 117,32 // jne 9cd3 <_sk_load_tables_rgb_u16_be_avx+0x29f>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 233,180,253,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 196,129,121,110,68,81,6 // vmovd 0x6(%r9,%r10,2),%xmm0
+ .byte 196,1,121,196,68,81,10,2 // vpinsrw $0x2,0xa(%r9,%r10,2),%xmm0,%xmm8
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb 9a49 <_sk_load_tables_rgb_u16_be_avx+0x2ad>
- .byte 196,129,121,110,76,81,12 // vmovd 0xc(%r9,%r10,2),%xmm1
- .byte 196,129,113,196,84,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
+ .byte 114,49 // jb 9d1e <_sk_load_tables_rgb_u16_be_avx+0x2ea>
+ .byte 196,129,121,110,68,81,12 // vmovd 0xc(%r9,%r10,2),%xmm0
+ .byte 196,129,121,196,92,81,16,2 // vpinsrw $0x2,0x10(%r9,%r10,2),%xmm0,%xmm3
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne 9a4e <_sk_load_tables_rgb_u16_be_avx+0x2b2>
- .byte 233,165,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,160,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 196,129,121,110,76,81,18 // vmovd 0x12(%r9,%r10,2),%xmm1
- .byte 196,1,113,196,76,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
+ .byte 117,50 // jne 9d39 <_sk_load_tables_rgb_u16_be_avx+0x305>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 233,105,253,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 233,78,253,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 196,129,121,110,68,81,18 // vmovd 0x12(%r9,%r10,2),%xmm0
+ .byte 196,1,121,196,84,81,22,2 // vpinsrw $0x2,0x16(%r9,%r10,2),%xmm0,%xmm10
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb 9a7d <_sk_load_tables_rgb_u16_be_avx+0x2e1>
- .byte 196,129,121,110,76,81,24 // vmovd 0x18(%r9,%r10,2),%xmm1
- .byte 196,129,113,196,76,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
+ .byte 114,40 // jb 9d7b <_sk_load_tables_rgb_u16_be_avx+0x347>
+ .byte 196,129,121,110,68,81,24 // vmovd 0x18(%r9,%r10,2),%xmm0
+ .byte 196,129,121,196,84,81,28,2 // vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm0,%xmm2
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne 9a82 <_sk_load_tables_rgb_u16_be_avx+0x2e6>
- .byte 233,113,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,108,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 196,129,121,110,92,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm3
- .byte 196,1,97,196,92,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
+ .byte 117,32 // jne 9d8d <_sk_load_tables_rgb_u16_be_avx+0x359>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 233,12,253,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 233,250,252,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 196,129,121,110,68,81,30 // vmovd 0x1e(%r9,%r10,2),%xmm0
+ .byte 196,1,121,196,100,81,34,2 // vpinsrw $0x2,0x22(%r9,%r10,2),%xmm0,%xmm12
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb 9aab <_sk_load_tables_rgb_u16_be_avx+0x30f>
- .byte 196,129,121,110,92,81,36 // vmovd 0x24(%r9,%r10,2),%xmm3
- .byte 196,129,97,196,92,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- .byte 233,67,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
- .byte 233,62,253,255,255 // jmpq 97ee <_sk_load_tables_rgb_u16_be_avx+0x52>
+ .byte 114,25 // jb 9dc0 <_sk_load_tables_rgb_u16_be_avx+0x38c>
+ .byte 196,129,121,110,68,81,36 // vmovd 0x24(%r9,%r10,2),%xmm0
+ .byte 196,129,121,196,68,81,40,2 // vpinsrw $0x2,0x28(%r9,%r10,2),%xmm0,%xmm0
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
+ .byte 233,199,252,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 233,190,252,255,255 // jmpq 9a87 <_sk_load_tables_rgb_u16_be_avx+0x53>
HIDDEN _sk_byte_tables_avx
.globl _sk_byte_tables_avx
FUNCTION(_sk_byte_tables_avx)
_sk_byte_tables_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,105,25,2,0 // vbroadcastss 0x21969(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,128,27,2,0 // vbroadcastss 0x21b80(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 197,125,91,200 // vcvtps2dq %ymm0,%ymm9
.byte 196,65,249,126,201 // vmovq %xmm9,%r9
@@ -19107,7 +19280,7 @@ _sk_byte_tables_avx:
.byte 196,194,121,49,204 // vpmovzxbd %xmm12,%xmm1
.byte 196,194,121,49,213 // vpmovzxbd %xmm13,%xmm2
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- .byte 196,98,125,24,13,87,23,2,0 // vbroadcastss 0x21757(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,110,25,2,0 // vbroadcastss 0x2196e(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
.byte 196,193,116,89,201 // vmulps %ymm9,%ymm1,%ymm1
@@ -19223,7 +19396,7 @@ _sk_byte_tables_rgb_avx:
.byte 196,194,121,49,203 // vpmovzxbd %xmm11,%xmm1
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,52,21,2,0 // vbroadcastss 0x21534(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,75,23,2,0 // vbroadcastss 0x2174b(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,194,121,49,202 // vpmovzxbd %xmm10,%xmm1
.byte 196,194,121,49,212 // vpmovzxbd %xmm12,%xmm2
@@ -19428,36 +19601,36 @@ _sk_parametric_r_avx:
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,216 // vcvtdq2ps %ymm0,%ymm11
- .byte 196,98,125,24,37,253,17,2,0 // vbroadcastss 0x211fd(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,20,20,2,0 // vbroadcastss 0x21414(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,243,17,2,0 // vbroadcastss 0x211f3(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,10,20,2,0 // vbroadcastss 0x2140a(%rip),%ymm12 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,124,84,196 // vandps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,73,17,2,0 // vbroadcastss 0x21149(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,96,19,2,0 // vbroadcastss 0x21360(%rip),%ymm12 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,124,86,196 // vorps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,219,17,2,0 // vbroadcastss 0x211db(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,242,19,2,0 // vbroadcastss 0x213f2(%rip),%ymm12 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,209,17,2,0 // vbroadcastss 0x211d1(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,232,19,2,0 // vbroadcastss 0x213e8(%rip),%ymm12 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,124,89,228 // vmulps %ymm12,%ymm0,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,194,17,2,0 // vbroadcastss 0x211c2(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,217,19,2,0 // vbroadcastss 0x213d9(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,37,184,17,2,0 // vbroadcastss 0x211b8(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,207,19,2,0 // vbroadcastss 0x213cf(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,192 // vdivps %ymm0,%ymm12,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
.byte 197,172,89,192 // vmulps %ymm0,%ymm10,%ymm0
.byte 196,99,125,8,208,1 // vroundps $0x1,%ymm0,%ymm10
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,156,17,2,0 // vbroadcastss 0x2119c(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,179,19,2,0 // vbroadcastss 0x213b3(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,195 // vaddps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,146,17,2,0 // vbroadcastss 0x21192(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,169,19,2,0 // vbroadcastss 0x213a9(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,124,92,195 // vsubps %ymm11,%ymm0,%ymm0
- .byte 196,98,125,24,29,131,17,2,0 // vbroadcastss 0x21183(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,154,19,2,0 // vbroadcastss 0x2139a(%rip),%ymm11 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,121,17,2,0 // vbroadcastss 0x21179(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,144,19,2,0 // vbroadcastss 0x21390(%rip),%ymm11 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,124,88,194 // vaddps %ymm10,%ymm0,%ymm0
- .byte 196,98,125,24,21,106,17,2,0 // vbroadcastss 0x2116a(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,129,19,2,0 // vbroadcastss 0x21381(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,124,89,194 // vmulps %ymm10,%ymm0,%ymm0
.byte 197,253,91,192 // vcvtps2dq %ymm0,%ymm0
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19465,7 +19638,7 @@ _sk_parametric_r_avx:
.byte 196,195,125,74,193,128 // vblendvps %ymm8,%ymm9,%ymm0,%ymm0
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,124,95,192 // vmaxps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,129,16,2,0 // vbroadcastss 0x21081(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,18,2,0 // vbroadcastss 0x21298(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19487,36 +19660,36 @@ _sk_parametric_g_avx:
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,217 // vcvtdq2ps %ymm1,%ymm11
- .byte 196,98,125,24,37,194,16,2,0 // vbroadcastss 0x210c2(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,217,18,2,0 // vbroadcastss 0x212d9(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,184,16,2,0 // vbroadcastss 0x210b8(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,207,18,2,0 // vbroadcastss 0x212cf(%rip),%ymm12 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,116,84,204 // vandps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,14,16,2,0 // vbroadcastss 0x2100e(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,37,18,2,0 // vbroadcastss 0x21225(%rip),%ymm12 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,116,86,204 // vorps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,160,16,2,0 // vbroadcastss 0x210a0(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,183,18,2,0 // vbroadcastss 0x212b7(%rip),%ymm12 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,150,16,2,0 // vbroadcastss 0x21096(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,173,18,2,0 // vbroadcastss 0x212ad(%rip),%ymm12 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,116,89,228 // vmulps %ymm12,%ymm1,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,135,16,2,0 // vbroadcastss 0x21087(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,158,18,2,0 // vbroadcastss 0x2129e(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,116,88,204 // vaddps %ymm12,%ymm1,%ymm1
- .byte 196,98,125,24,37,125,16,2,0 // vbroadcastss 0x2107d(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,148,18,2,0 // vbroadcastss 0x21294(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,201 // vdivps %ymm1,%ymm12,%ymm1
.byte 197,164,92,201 // vsubps %ymm1,%ymm11,%ymm1
.byte 197,172,89,201 // vmulps %ymm1,%ymm10,%ymm1
.byte 196,99,125,8,209,1 // vroundps $0x1,%ymm1,%ymm10
.byte 196,65,116,92,210 // vsubps %ymm10,%ymm1,%ymm10
- .byte 196,98,125,24,29,97,16,2,0 // vbroadcastss 0x21061(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,120,18,2,0 // vbroadcastss 0x21278(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,87,16,2,0 // vbroadcastss 0x21057(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,110,18,2,0 // vbroadcastss 0x2126e(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,116,92,203 // vsubps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,29,72,16,2,0 // vbroadcastss 0x21048(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,95,18,2,0 // vbroadcastss 0x2125f(%rip),%ymm11 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,62,16,2,0 // vbroadcastss 0x2103e(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,85,18,2,0 // vbroadcastss 0x21255(%rip),%ymm11 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,21,47,16,2,0 // vbroadcastss 0x2102f(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,70,18,2,0 // vbroadcastss 0x21246(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,116,89,202 // vmulps %ymm10,%ymm1,%ymm1
.byte 197,253,91,201 // vcvtps2dq %ymm1,%ymm1
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19524,7 +19697,7 @@ _sk_parametric_g_avx:
.byte 196,195,117,74,201,128 // vblendvps %ymm8,%ymm9,%ymm1,%ymm1
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,116,95,200 // vmaxps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,5,70,15,2,0 // vbroadcastss 0x20f46(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,93,17,2,0 // vbroadcastss 0x2115d(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,116,93,200 // vminps %ymm8,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19546,36 +19719,36 @@ _sk_parametric_b_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,218 // vcvtdq2ps %ymm2,%ymm11
- .byte 196,98,125,24,37,135,15,2,0 // vbroadcastss 0x20f87(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,158,17,2,0 // vbroadcastss 0x2119e(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,125,15,2,0 // vbroadcastss 0x20f7d(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,148,17,2,0 // vbroadcastss 0x21194(%rip),%ymm12 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,108,84,212 // vandps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,211,14,2,0 // vbroadcastss 0x20ed3(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,234,16,2,0 // vbroadcastss 0x210ea(%rip),%ymm12 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,108,86,212 // vorps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,101,15,2,0 // vbroadcastss 0x20f65(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,124,17,2,0 // vbroadcastss 0x2117c(%rip),%ymm12 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,91,15,2,0 // vbroadcastss 0x20f5b(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,114,17,2,0 // vbroadcastss 0x21172(%rip),%ymm12 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,108,89,228 // vmulps %ymm12,%ymm2,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,76,15,2,0 // vbroadcastss 0x20f4c(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,99,17,2,0 // vbroadcastss 0x21163(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,108,88,212 // vaddps %ymm12,%ymm2,%ymm2
- .byte 196,98,125,24,37,66,15,2,0 // vbroadcastss 0x20f42(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,89,17,2,0 // vbroadcastss 0x21159(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,210 // vdivps %ymm2,%ymm12,%ymm2
.byte 197,164,92,210 // vsubps %ymm2,%ymm11,%ymm2
.byte 197,172,89,210 // vmulps %ymm2,%ymm10,%ymm2
.byte 196,99,125,8,210,1 // vroundps $0x1,%ymm2,%ymm10
.byte 196,65,108,92,210 // vsubps %ymm10,%ymm2,%ymm10
- .byte 196,98,125,24,29,38,15,2,0 // vbroadcastss 0x20f26(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,61,17,2,0 // vbroadcastss 0x2113d(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,28,15,2,0 // vbroadcastss 0x20f1c(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,51,17,2,0 // vbroadcastss 0x21133(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,108,92,211 // vsubps %ymm11,%ymm2,%ymm2
- .byte 196,98,125,24,29,13,15,2,0 // vbroadcastss 0x20f0d(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,36,17,2,0 // vbroadcastss 0x21124(%rip),%ymm11 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,3,15,2,0 // vbroadcastss 0x20f03(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,26,17,2,0 // vbroadcastss 0x2111a(%rip),%ymm11 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,108,88,210 // vaddps %ymm10,%ymm2,%ymm2
- .byte 196,98,125,24,21,244,14,2,0 // vbroadcastss 0x20ef4(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,11,17,2,0 // vbroadcastss 0x2110b(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,108,89,210 // vmulps %ymm10,%ymm2,%ymm2
.byte 197,253,91,210 // vcvtps2dq %ymm2,%ymm2
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19583,7 +19756,7 @@ _sk_parametric_b_avx:
.byte 196,195,109,74,209,128 // vblendvps %ymm8,%ymm9,%ymm2,%ymm2
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,108,95,208 // vmaxps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,11,14,2,0 // vbroadcastss 0x20e0b(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,34,16,2,0 // vbroadcastss 0x21022(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,108,93,208 // vminps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19605,36 +19778,36 @@ _sk_parametric_a_avx:
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
.byte 196,98,125,24,16 // vbroadcastss (%rax),%ymm10
.byte 197,124,91,219 // vcvtdq2ps %ymm3,%ymm11
- .byte 196,98,125,24,37,76,14,2,0 // vbroadcastss 0x20e4c(%rip),%ymm12 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,37,99,16,2,0 // vbroadcastss 0x21063(%rip),%ymm12 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,66,14,2,0 // vbroadcastss 0x20e42(%rip),%ymm12 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,37,89,16,2,0 // vbroadcastss 0x21059(%rip),%ymm12 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,100,84,220 // vandps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,152,13,2,0 // vbroadcastss 0x20d98(%rip),%ymm12 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,37,175,15,2,0 // vbroadcastss 0x20faf(%rip),%ymm12 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,193,100,86,220 // vorps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,42,14,2,0 // vbroadcastss 0x20e2a(%rip),%ymm12 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,37,65,16,2,0 // vbroadcastss 0x21041(%rip),%ymm12 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,65,36,88,220 // vaddps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,32,14,2,0 // vbroadcastss 0x20e20(%rip),%ymm12 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,37,55,16,2,0 // vbroadcastss 0x21037(%rip),%ymm12 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,65,100,89,228 // vmulps %ymm12,%ymm3,%ymm12
.byte 196,65,36,92,220 // vsubps %ymm12,%ymm11,%ymm11
- .byte 196,98,125,24,37,17,14,2,0 // vbroadcastss 0x20e11(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,40,16,2,0 // vbroadcastss 0x21028(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,100,88,220 // vaddps %ymm12,%ymm3,%ymm3
- .byte 196,98,125,24,37,7,14,2,0 // vbroadcastss 0x20e07(%rip),%ymm12 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,37,30,16,2,0 // vbroadcastss 0x2101e(%rip),%ymm12 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,156,94,219 // vdivps %ymm3,%ymm12,%ymm3
.byte 197,164,92,219 // vsubps %ymm3,%ymm11,%ymm3
.byte 197,172,89,219 // vmulps %ymm3,%ymm10,%ymm3
.byte 196,99,125,8,211,1 // vroundps $0x1,%ymm3,%ymm10
.byte 196,65,100,92,210 // vsubps %ymm10,%ymm3,%ymm10
- .byte 196,98,125,24,29,235,13,2,0 // vbroadcastss 0x20deb(%rip),%ymm11 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,29,2,16,2,0 // vbroadcastss 0x21002(%rip),%ymm11 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,100,88,219 // vaddps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,225,13,2,0 // vbroadcastss 0x20de1(%rip),%ymm11 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,98,125,24,29,248,15,2,0 // vbroadcastss 0x20ff8(%rip),%ymm11 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 196,65,44,89,219 // vmulps %ymm11,%ymm10,%ymm11
.byte 196,193,100,92,219 // vsubps %ymm11,%ymm3,%ymm3
- .byte 196,98,125,24,29,210,13,2,0 // vbroadcastss 0x20dd2(%rip),%ymm11 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,98,125,24,29,233,15,2,0 // vbroadcastss 0x20fe9(%rip),%ymm11 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 196,65,36,92,210 // vsubps %ymm10,%ymm11,%ymm10
- .byte 196,98,125,24,29,200,13,2,0 // vbroadcastss 0x20dc8(%rip),%ymm11 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,98,125,24,29,223,15,2,0 // vbroadcastss 0x20fdf(%rip),%ymm11 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 196,65,36,94,210 // vdivps %ymm10,%ymm11,%ymm10
.byte 196,193,100,88,218 // vaddps %ymm10,%ymm3,%ymm3
- .byte 196,98,125,24,21,185,13,2,0 // vbroadcastss 0x20db9(%rip),%ymm10 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,98,125,24,21,208,15,2,0 // vbroadcastss 0x20fd0(%rip),%ymm10 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 196,193,100,89,218 // vmulps %ymm10,%ymm3,%ymm3
.byte 197,253,91,219 // vcvtps2dq %ymm3,%ymm3
.byte 196,98,125,24,80,20 // vbroadcastss 0x14(%rax),%ymm10
@@ -19642,7 +19815,7 @@ _sk_parametric_a_avx:
.byte 196,195,101,74,217,128 // vblendvps %ymm8,%ymm9,%ymm3,%ymm3
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 196,193,100,95,216 // vmaxps %ymm8,%ymm3,%ymm3
- .byte 196,98,125,24,5,208,12,2,0 // vbroadcastss 0x20cd0(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,231,14,2,0 // vbroadcastss 0x20ee7(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,100,93,216 // vminps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19661,34 +19834,34 @@ _sk_gamma_avx:
.byte 197,252,40,233 // vmovaps %ymm1,%ymm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,91,200 // vcvtdq2ps %ymm0,%ymm1
- .byte 196,98,125,24,5,35,13,2,0 // vbroadcastss 0x20d23(%rip),%ymm8 # 2b48c <_sk_overlay_sse2_8bit+0x4d7>
+ .byte 196,98,125,24,5,58,15,2,0 // vbroadcastss 0x20f3a(%rip),%ymm8 # 2b9bc <_sk_overlay_sse2_8bit+0x4d7>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,25,13,2,0 // vbroadcastss 0x20d19(%rip),%ymm9 # 2b490 <_sk_overlay_sse2_8bit+0x4db>
+ .byte 196,98,125,24,13,48,15,2,0 // vbroadcastss 0x20f30(%rip),%ymm9 # 2b9c0 <_sk_overlay_sse2_8bit+0x4db>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
- .byte 196,226,125,24,37,111,12,2,0 // vbroadcastss 0x20c6f(%rip),%ymm4 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,37,134,14,2,0 // vbroadcastss 0x20e86(%rip),%ymm4 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,86,196 // vorps %ymm4,%ymm0,%ymm0
- .byte 196,98,125,24,21,2,13,2,0 // vbroadcastss 0x20d02(%rip),%ymm10 # 2b494 <_sk_overlay_sse2_8bit+0x4df>
+ .byte 196,98,125,24,21,25,15,2,0 // vbroadcastss 0x20f19(%rip),%ymm10 # 2b9c4 <_sk_overlay_sse2_8bit+0x4df>
.byte 196,193,116,88,202 // vaddps %ymm10,%ymm1,%ymm1
- .byte 196,98,125,24,29,248,12,2,0 // vbroadcastss 0x20cf8(%rip),%ymm11 # 2b498 <_sk_overlay_sse2_8bit+0x4e3>
+ .byte 196,98,125,24,29,15,15,2,0 // vbroadcastss 0x20f0f(%rip),%ymm11 # 2b9c8 <_sk_overlay_sse2_8bit+0x4e3>
.byte 196,193,124,89,211 // vmulps %ymm11,%ymm0,%ymm2
.byte 197,244,92,202 // vsubps %ymm2,%ymm1,%ymm1
- .byte 196,98,125,24,37,234,12,2,0 // vbroadcastss 0x20cea(%rip),%ymm12 # 2b49c <_sk_overlay_sse2_8bit+0x4e7>
+ .byte 196,98,125,24,37,1,15,2,0 // vbroadcastss 0x20f01(%rip),%ymm12 # 2b9cc <_sk_overlay_sse2_8bit+0x4e7>
.byte 196,193,124,88,196 // vaddps %ymm12,%ymm0,%ymm0
- .byte 196,98,125,24,45,224,12,2,0 // vbroadcastss 0x20ce0(%rip),%ymm13 # 2b4a0 <_sk_overlay_sse2_8bit+0x4eb>
+ .byte 196,98,125,24,45,247,14,2,0 // vbroadcastss 0x20ef7(%rip),%ymm13 # 2b9d0 <_sk_overlay_sse2_8bit+0x4eb>
.byte 197,148,94,192 // vdivps %ymm0,%ymm13,%ymm0
.byte 197,244,92,192 // vsubps %ymm0,%ymm1,%ymm0
.byte 196,98,125,24,48 // vbroadcastss (%rax),%ymm14
.byte 196,193,124,89,198 // vmulps %ymm14,%ymm0,%ymm0
.byte 196,227,125,8,200,1 // vroundps $0x1,%ymm0,%ymm1
.byte 197,252,92,241 // vsubps %ymm1,%ymm0,%ymm6
- .byte 196,98,125,24,61,191,12,2,0 // vbroadcastss 0x20cbf(%rip),%ymm15 # 2b4a4 <_sk_overlay_sse2_8bit+0x4ef>
+ .byte 196,98,125,24,61,214,14,2,0 // vbroadcastss 0x20ed6(%rip),%ymm15 # 2b9d4 <_sk_overlay_sse2_8bit+0x4ef>
.byte 196,193,124,88,199 // vaddps %ymm15,%ymm0,%ymm0
- .byte 196,226,125,24,29,181,12,2,0 // vbroadcastss 0x20cb5(%rip),%ymm3 # 2b4a8 <_sk_overlay_sse2_8bit+0x4f3>
+ .byte 196,226,125,24,29,204,14,2,0 // vbroadcastss 0x20ecc(%rip),%ymm3 # 2b9d8 <_sk_overlay_sse2_8bit+0x4f3>
.byte 197,204,89,203 // vmulps %ymm3,%ymm6,%ymm1
.byte 197,252,92,201 // vsubps %ymm1,%ymm0,%ymm1
- .byte 196,226,125,24,21,168,12,2,0 // vbroadcastss 0x20ca8(%rip),%ymm2 # 2b4ac <_sk_overlay_sse2_8bit+0x4f7>
+ .byte 196,226,125,24,21,191,14,2,0 // vbroadcastss 0x20ebf(%rip),%ymm2 # 2b9dc <_sk_overlay_sse2_8bit+0x4f7>
.byte 197,236,92,198 // vsubps %ymm6,%ymm2,%ymm0
- .byte 196,226,125,24,53,159,12,2,0 // vbroadcastss 0x20c9f(%rip),%ymm6 # 2b4b0 <_sk_overlay_sse2_8bit+0x4fb>
+ .byte 196,226,125,24,53,182,14,2,0 // vbroadcastss 0x20eb6(%rip),%ymm6 # 2b9e0 <_sk_overlay_sse2_8bit+0x4fb>
.byte 197,204,94,192 // vdivps %ymm0,%ymm6,%ymm0
.byte 197,244,88,192 // vaddps %ymm0,%ymm1,%ymm0
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
@@ -19730,7 +19903,7 @@ _sk_gamma_avx:
.byte 197,236,92,212 // vsubps %ymm4,%ymm2,%ymm2
.byte 197,204,94,210 // vdivps %ymm2,%ymm6,%ymm2
.byte 197,244,88,202 // vaddps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,226,11,2,0 // vbroadcastss 0x20be2(%rip),%ymm2 # 2b4b4 <_sk_overlay_sse2_8bit+0x4ff>
+ .byte 196,226,125,24,21,249,13,2,0 // vbroadcastss 0x20df9(%rip),%ymm2 # 2b9e4 <_sk_overlay_sse2_8bit+0x4ff>
.byte 197,236,89,92,36,128 // vmulps -0x80(%rsp),%ymm2,%ymm3
.byte 197,252,89,226 // vmulps %ymm2,%ymm0,%ymm4
.byte 197,244,89,210 // vmulps %ymm2,%ymm1,%ymm2
@@ -19750,31 +19923,31 @@ HIDDEN _sk_lab_to_xyz_avx
.globl _sk_lab_to_xyz_avx
FUNCTION(_sk_lab_to_xyz_avx)
_sk_lab_to_xyz_avx:
- .byte 196,98,125,24,5,158,11,2,0 // vbroadcastss 0x20b9e(%rip),%ymm8 # 2b4b8 <_sk_overlay_sse2_8bit+0x503>
+ .byte 196,98,125,24,5,181,13,2,0 // vbroadcastss 0x20db5(%rip),%ymm8 # 2b9e8 <_sk_overlay_sse2_8bit+0x503>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,252,10,2,0 // vbroadcastss 0x20afc(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,19,13,2,0 // vbroadcastss 0x20d13(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
- .byte 196,98,125,24,13,134,11,2,0 // vbroadcastss 0x20b86(%rip),%ymm9 # 2b4bc <_sk_overlay_sse2_8bit+0x507>
+ .byte 196,98,125,24,13,157,13,2,0 // vbroadcastss 0x20d9d(%rip),%ymm9 # 2b9ec <_sk_overlay_sse2_8bit+0x507>
.byte 196,193,116,88,201 // vaddps %ymm9,%ymm1,%ymm1
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 196,193,108,88,209 // vaddps %ymm9,%ymm2,%ymm2
- .byte 196,98,125,24,5,114,11,2,0 // vbroadcastss 0x20b72(%rip),%ymm8 # 2b4c0 <_sk_overlay_sse2_8bit+0x50b>
+ .byte 196,98,125,24,5,137,13,2,0 // vbroadcastss 0x20d89(%rip),%ymm8 # 2b9f0 <_sk_overlay_sse2_8bit+0x50b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,104,11,2,0 // vbroadcastss 0x20b68(%rip),%ymm8 # 2b4c4 <_sk_overlay_sse2_8bit+0x50f>
+ .byte 196,98,125,24,5,127,13,2,0 // vbroadcastss 0x20d7f(%rip),%ymm8 # 2b9f4 <_sk_overlay_sse2_8bit+0x50f>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,5,94,11,2,0 // vbroadcastss 0x20b5e(%rip),%ymm8 # 2b4c8 <_sk_overlay_sse2_8bit+0x513>
+ .byte 196,98,125,24,5,117,13,2,0 // vbroadcastss 0x20d75(%rip),%ymm8 # 2b9f8 <_sk_overlay_sse2_8bit+0x513>
.byte 196,193,116,89,200 // vmulps %ymm8,%ymm1,%ymm1
.byte 197,252,88,201 // vaddps %ymm1,%ymm0,%ymm1
- .byte 196,98,125,24,5,80,11,2,0 // vbroadcastss 0x20b50(%rip),%ymm8 # 2b4cc <_sk_overlay_sse2_8bit+0x517>
+ .byte 196,98,125,24,5,103,13,2,0 // vbroadcastss 0x20d67(%rip),%ymm8 # 2b9fc <_sk_overlay_sse2_8bit+0x517>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 197,252,92,210 // vsubps %ymm2,%ymm0,%ymm2
.byte 197,116,89,193 // vmulps %ymm1,%ymm1,%ymm8
.byte 196,65,116,89,192 // vmulps %ymm8,%ymm1,%ymm8
- .byte 196,98,125,24,13,57,11,2,0 // vbroadcastss 0x20b39(%rip),%ymm9 # 2b4d0 <_sk_overlay_sse2_8bit+0x51b>
+ .byte 196,98,125,24,13,80,13,2,0 // vbroadcastss 0x20d50(%rip),%ymm9 # 2ba00 <_sk_overlay_sse2_8bit+0x51b>
.byte 196,65,52,194,208,1 // vcmpltps %ymm8,%ymm9,%ymm10
- .byte 196,98,125,24,29,46,11,2,0 // vbroadcastss 0x20b2e(%rip),%ymm11 # 2b4d4 <_sk_overlay_sse2_8bit+0x51f>
+ .byte 196,98,125,24,29,69,13,2,0 // vbroadcastss 0x20d45(%rip),%ymm11 # 2ba04 <_sk_overlay_sse2_8bit+0x51f>
.byte 196,193,116,88,203 // vaddps %ymm11,%ymm1,%ymm1
- .byte 196,98,125,24,37,36,11,2,0 // vbroadcastss 0x20b24(%rip),%ymm12 # 2b4d8 <_sk_overlay_sse2_8bit+0x523>
+ .byte 196,98,125,24,37,59,13,2,0 // vbroadcastss 0x20d3b(%rip),%ymm12 # 2ba08 <_sk_overlay_sse2_8bit+0x523>
.byte 196,193,116,89,204 // vmulps %ymm12,%ymm1,%ymm1
.byte 196,67,117,74,192,160 // vblendvps %ymm10,%ymm8,%ymm1,%ymm8
.byte 197,252,89,200 // vmulps %ymm0,%ymm0,%ymm1
@@ -19789,9 +19962,9 @@ _sk_lab_to_xyz_avx:
.byte 196,193,108,88,211 // vaddps %ymm11,%ymm2,%ymm2
.byte 196,193,108,89,212 // vmulps %ymm12,%ymm2,%ymm2
.byte 196,227,109,74,208,144 // vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- .byte 196,226,125,24,5,218,10,2,0 // vbroadcastss 0x20ada(%rip),%ymm0 # 2b4dc <_sk_overlay_sse2_8bit+0x527>
+ .byte 196,226,125,24,5,241,12,2,0 // vbroadcastss 0x20cf1(%rip),%ymm0 # 2ba0c <_sk_overlay_sse2_8bit+0x527>
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,209,10,2,0 // vbroadcastss 0x20ad1(%rip),%ymm8 # 2b4e0 <_sk_overlay_sse2_8bit+0x52b>
+ .byte 196,98,125,24,5,232,12,2,0 // vbroadcastss 0x20ce8(%rip),%ymm8 # 2ba10 <_sk_overlay_sse2_8bit+0x52b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -19808,15 +19981,15 @@ _sk_load_a8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne aa74 <_sk_load_a8_avx+0x5c>
+ .byte 117,67 // jne ad8d <_sk_load_a8_avx+0x5c>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,81,19,2,0 // vpand 0x21351(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,249,219,5,120,21,2,0 // vpand 0x21578(%rip),%xmm0,%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,13,10,2,0 // vbroadcastss 0x20a0d(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,36,12,2,0 // vbroadcastss 0x20c24(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -19829,15 +20002,15 @@ _sk_load_a8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja aa37 <_sk_load_a8_avx+0x1f>
+ .byte 119,175 // ja ad50 <_sk_load_a8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ab0c <_sk_load_a8_avx+0xf4>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # ae24 <_sk_load_a8_avx+0xf3>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,144 // jmp aa37 <_sk_load_a8_avx+0x1f>
+ .byte 235,144 // jmp ad50 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -19845,7 +20018,7 @@ _sk_load_a8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,104,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq ad50 <_sk_load_a8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -19856,22 +20029,22 @@ _sk_load_a8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,45,255,255,255 // jmpq aa37 <_sk_load_a8_avx+0x1f>
- .byte 102,144 // xchg %ax,%ax
+ .byte 233,45,255,255,255 // jmpq ad50 <_sk_load_a8_avx+0x1f>
.byte 144 // nop
+ .byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,170,255,255,255,155 // ljmp *-0x64000001(%rdx)
+ .byte 255,171,255,255,255,156 // ljmp *-0x63000001(%rbx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde00ab1c <_sk_overlay_sse2_8bit+0xffffffffddfdfb67>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00ae34 <_sk_overlay_sse2_8bit+0xffffffffdefdf94f>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,210 // callq *%rdx
+ .byte 255,211 // callq *%rbx
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,195 // inc %ebx
+ .byte 255,196 // inc %esp
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -19888,15 +20061,15 @@ _sk_load_a8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,67 // jne ab84 <_sk_load_a8_dst_avx+0x5c>
+ .byte 117,67 // jne ae9c <_sk_load_a8_dst_avx+0x5c>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,65,18,2,0 // vpand 0x21241(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,217,219,37,105,20,2,0 // vpand 0x21469(%rip),%xmm4,%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,253,8,2,0 // vbroadcastss 0x208fd(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,21,11,2,0 // vbroadcastss 0x20b15(%rip),%ymm5 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,253 // vmulps %ymm5,%ymm4,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,220,87,228 // vxorps %ymm4,%ymm4,%ymm4
@@ -19909,15 +20082,15 @@ _sk_load_a8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,175 // ja ab47 <_sk_load_a8_dst_avx+0x1f>
+ .byte 119,175 // ja ae5f <_sk_load_a8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # ac1c <_sk_load_a8_dst_avx+0xf4>
+ .byte 76,141,29,121,0,0,0 // lea 0x79(%rip),%r11 # af34 <_sk_load_a8_dst_avx+0xf4>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,144 // jmp ab47 <_sk_load_a8_dst_avx+0x1f>
+ .byte 235,144 // jmp ae5f <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -19925,7 +20098,7 @@ _sk_load_a8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,104,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,104,255,255,255 // jmpq ae5f <_sk_load_a8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -19936,7 +20109,7 @@ _sk_load_a8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,45,255,255,255 // jmpq ab47 <_sk_load_a8_dst_avx+0x1f>
+ .byte 233,45,255,255,255 // jmpq ae5f <_sk_load_a8_dst_avx+0x1f>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -19945,7 +20118,7 @@ _sk_load_a8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde00ac2c <_sk_overlay_sse2_8bit+0xffffffffddfdfc77>
+ .byte 232,255,255,255,221 // callq ffffffffde00af44 <_sk_overlay_sse2_8bit+0xffffffffddfdfa5f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -20000,7 +20173,7 @@ _sk_gather_a8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,104,7,2,0 // vbroadcastss 0x20768(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,128,9,2,0 // vbroadcastss 0x20980(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,217 // vmulps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,87,192 // vxorps %ymm0,%ymm0,%ymm0
@@ -20019,14 +20192,14 @@ _sk_store_a8_avx:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,239,6,2,0 // vbroadcastss 0x206ef(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,7,9,2,0 // vbroadcastss 0x20907(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,100,89,192 // vmulps %ymm8,%ymm3,%ymm8
.byte 196,65,125,91,192 // vcvtps2dq %ymm8,%ymm8
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 196,65,57,103,192 // vpackuswb %xmm8,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne ad5f <_sk_store_a8_avx+0x47>
+ .byte 117,11 // jne b077 <_sk_store_a8_avx+0x47>
.byte 196,65,123,17,4,25 // vmovsd %xmm8,(%r9,%rbx,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20035,25 +20208,25 @@ _sk_store_a8_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja ad5a <_sk_store_a8_avx+0x42>
+ .byte 119,235 // ja b072 <_sk_store_a8_avx+0x42>
.byte 196,66,121,48,192 // vpmovzxbw %xmm8,%xmm8
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # add4 <_sk_store_a8_avx+0xbc>
+ .byte 76,141,29,85,0,0,0 // lea 0x55(%rip),%r11 # b0ec <_sk_store_a8_avx+0xbc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,20,4,25,0 // vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,201 // jmp ad5a <_sk_store_a8_avx+0x42>
+ .byte 235,201 // jmp b072 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,2,4 // vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- .byte 196,98,57,0,5,254,15,2,0 // vpshufb 0x20ffe(%rip),%xmm8,%xmm8 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
+ .byte 196,98,57,0,5,38,18,2,0 // vpshufb 0x21226(%rip),%xmm8,%xmm8 # 2c2e0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 196,67,121,21,4,25,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- .byte 235,175 // jmp ad5a <_sk_store_a8_avx+0x42>
+ .byte 235,175 // jmp b072 <_sk_store_a8_avx+0x42>
.byte 196,67,121,20,68,25,6,12 // vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
.byte 196,67,121,20,68,25,5,10 // vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
.byte 196,67,121,20,68,25,4,8 // vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- .byte 196,98,57,0,5,228,15,2,0 // vpshufb 0x20fe4(%rip),%xmm8,%xmm8 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
+ .byte 196,98,57,0,5,12,18,2,0 // vpshufb 0x2120c(%rip),%xmm8,%xmm8 # 2c2f0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 196,65,121,126,4,25 // vmovd %xmm8,(%r9,%rbx,1)
- .byte 235,134 // jmp ad5a <_sk_store_a8_avx+0x42>
+ .byte 235,134 // jmp b072 <_sk_store_a8_avx+0x42>
.byte 180,255 // mov $0xff,%ah
.byte 255 // (bad)
.byte 255,197 // inc %ebp
@@ -20086,18 +20259,18 @@ _sk_load_g8_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne ae51 <_sk_load_g8_avx+0x61>
+ .byte 117,72 // jne b169 <_sk_load_g8_avx+0x61>
.byte 196,194,121,48,4,25 // vpmovzxbw (%r9,%rbx,1),%xmm0
- .byte 197,249,219,5,121,15,2,0 // vpand 0x20f79(%rip),%xmm0,%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,249,219,5,161,17,2,0 // vpand 0x211a1(%rip),%xmm0,%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,53,6,2,0 // vbroadcastss 0x20635(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,77,8,2,0 // vbroadcastss 0x2084d(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,178,5,2,0 // vbroadcastss 0x205b2(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,202,7,2,0 // vbroadcastss 0x207ca(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 91 // pop %rbx
@@ -20107,15 +20280,15 @@ _sk_load_g8_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja ae0f <_sk_load_g8_avx+0x1f>
+ .byte 119,170 // ja b127 <_sk_load_g8_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # aee8 <_sk_load_g8_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # b200 <_sk_load_g8_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,139 // jmp ae0f <_sk_load_g8_avx+0x1f>
+ .byte 235,139 // jmp b127 <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,2 // vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -20123,7 +20296,7 @@ _sk_load_g8_avx:
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,99,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq b127 <_sk_load_g8_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 197,249,196,192,6 // vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -20134,7 +20307,7 @@ _sk_load_g8_avx:
.byte 196,193,121,110,12,25 // vmovd (%r9,%rbx,1),%xmm1
.byte 196,226,121,48,201 // vpmovzxbw %xmm1,%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,40,255,255,255 // jmpq ae0f <_sk_load_g8_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq b127 <_sk_load_g8_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -20143,7 +20316,7 @@ _sk_load_g8_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00aef8 <_sk_overlay_sse2_8bit+0xffffffffdefdff43>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00b210 <_sk_overlay_sse2_8bit+0xffffffffdefdfd2b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -20166,18 +20339,18 @@ _sk_load_g8_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne af65 <_sk_load_g8_dst_avx+0x61>
+ .byte 117,72 // jne b27d <_sk_load_g8_dst_avx+0x61>
.byte 196,194,121,48,36,25 // vpmovzxbw (%r9,%rbx,1),%xmm4
- .byte 197,217,219,37,101,14,2,0 // vpand 0x20e65(%rip),%xmm4,%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 197,217,219,37,141,16,2,0 // vpand 0x2108d(%rip),%xmm4,%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,33,5,2,0 // vbroadcastss 0x20521(%rip),%ymm5 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,45,57,7,2,0 // vbroadcastss 0x20739(%rip),%ymm5 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,158,4,2,0 // vbroadcastss 0x2049e(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,182,6,2,0 // vbroadcastss 0x206b6(%rip),%ymm7 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,236 // vmovaps %ymm4,%ymm5
.byte 197,252,40,244 // vmovaps %ymm4,%ymm6
.byte 91 // pop %rbx
@@ -20187,15 +20360,15 @@ _sk_load_g8_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,170 // ja af23 <_sk_load_g8_dst_avx+0x1f>
+ .byte 119,170 // ja b23b <_sk_load_g8_dst_avx+0x1f>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # affc <_sk_load_g8_dst_avx+0xf8>
+ .byte 76,141,29,120,0,0,0 // lea 0x78(%rip),%r11 # b314 <_sk_load_g8_dst_avx+0xf8>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,182,4,25 // movzbl (%r9,%rbx,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 235,139 // jmp af23 <_sk_load_g8_dst_avx+0x1f>
+ .byte 235,139 // jmp b23b <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,2 // movzbl 0x2(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,2 // vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -20203,7 +20376,7 @@ _sk_load_g8_dst_avx:
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,99,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,99,255,255,255 // jmpq b23b <_sk_load_g8_dst_avx+0x1f>
.byte 65,15,182,68,25,6 // movzbl 0x6(%r9,%rbx,1),%eax
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 197,217,196,224,6 // vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -20214,7 +20387,7 @@ _sk_load_g8_dst_avx:
.byte 196,193,121,110,44,25 // vmovd (%r9,%rbx,1),%xmm5
.byte 196,226,121,48,237 // vpmovzxbw %xmm5,%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,40,255,255,255 // jmpq af23 <_sk_load_g8_dst_avx+0x1f>
+ .byte 233,40,255,255,255 // jmpq b23b <_sk_load_g8_dst_avx+0x1f>
.byte 144 // nop
.byte 145 // xchg %eax,%ecx
.byte 255 // (bad)
@@ -20223,7 +20396,7 @@ _sk_load_g8_dst_avx:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf00b00c <_sk_overlay_sse2_8bit+0xffffffffdefe0057>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf00b324 <_sk_overlay_sse2_8bit+0xffffffffdefdfe3f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -20278,10 +20451,10 @@ _sk_gather_g8_avx:
.byte 196,226,121,49,192 // vpmovzxbd %xmm0,%xmm0
.byte 196,227,117,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,136,3,2,0 // vbroadcastss 0x20388(%rip),%ymm1 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,226,125,24,13,160,5,2,0 // vbroadcastss 0x205a0(%rip),%ymm1 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,29,5,2,0 // vbroadcastss 0x2051d(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 197,252,40,208 // vmovaps %ymm0,%ymm2
.byte 255,224 // jmpq *%rax
@@ -20299,29 +20472,29 @@ _sk_load_565_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne b19e <_sk_load_565_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne b4b6 <_sk_load_565_avx+0xa1>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,49,3,2,0 // vbroadcastss 0x20331(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,5,73,5,2,0 // vbroadcastss 0x20549(%rip),%ymm0 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,36,3,2,0 // vbroadcastss 0x20324(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,60,5,2,0 // vbroadcastss 0x2053c(%rip),%ymm1 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,27,3,2,0 // vbroadcastss 0x2031b(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,13,51,5,2,0 // vbroadcastss 0x20533(%rip),%ymm1 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,14,3,2,0 // vbroadcastss 0x2030e(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,38,5,2,0 // vbroadcastss 0x20526(%rip),%ymm3 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,5,3,2,0 // vbroadcastss 0x20305(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,29,29,5,2,0 // vbroadcastss 0x2051d(%rip),%ymm3 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,248,2,2,0 // vbroadcastss 0x202f8(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,16,5,2,0 // vbroadcastss 0x20510(%rip),%ymm3 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,93,2,2,0 // vbroadcastss 0x2025d(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,117,4,2,0 // vbroadcastss 0x20475(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -20329,27 +20502,27 @@ _sk_load_565_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja b123 <_sk_load_565_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja b43b <_sk_load_565_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # b224 <_sk_load_565_avx+0x127>
+ .byte 76,141,29,99,0,0,0 // lea 0x63(%rip),%r11 # b53c <_sk_load_565_avx+0x127>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,75,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq b43b <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,46,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq b43b <_sk_load_565_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,1,255,255,255 // jmpq b123 <_sk_load_565_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq b43b <_sk_load_565_avx+0x26>
.byte 102,144 // xchg %ax,%ax
.byte 166 // cmpsb %es:(%rdi),%ds:(%rsi)
.byte 255 // (bad)
@@ -20383,29 +20556,29 @@ _sk_load_565_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,129,0,0,0 // jne b2e1 <_sk_load_565_dst_avx+0xa1>
+ .byte 15,133,129,0,0,0 // jne b5f9 <_sk_load_565_dst_avx+0xa1>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,245,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- .byte 196,226,125,24,37,238,1,2,0 // vbroadcastss 0x201ee(%rip),%ymm4 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,37,6,4,2,0 // vbroadcastss 0x20406(%rip),%ymm4 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,204,84,228 // vandps %ymm4,%ymm6,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,225,1,2,0 // vbroadcastss 0x201e1(%rip),%ymm5 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,45,249,3,2,0 // vbroadcastss 0x203f9(%rip),%ymm5 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,216,1,2,0 // vbroadcastss 0x201d8(%rip),%ymm5 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,45,240,3,2,0 // vbroadcastss 0x203f0(%rip),%ymm5 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,204,84,237 // vandps %ymm5,%ymm6,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,61,203,1,2,0 // vbroadcastss 0x201cb(%rip),%ymm7 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,61,227,3,2,0 // vbroadcastss 0x203e3(%rip),%ymm7 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,212,89,239 // vmulps %ymm7,%ymm5,%ymm5
- .byte 196,226,125,24,61,194,1,2,0 // vbroadcastss 0x201c2(%rip),%ymm7 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,61,218,3,2,0 // vbroadcastss 0x203da(%rip),%ymm7 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,204,84,247 // vandps %ymm7,%ymm6,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,226,125,24,61,181,1,2,0 // vbroadcastss 0x201b5(%rip),%ymm7 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,61,205,3,2,0 // vbroadcastss 0x203cd(%rip),%ymm7 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,204,89,247 // vmulps %ymm7,%ymm6,%ymm6
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,61,26,1,2,0 // vbroadcastss 0x2011a(%rip),%ymm7 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,61,50,3,2,0 // vbroadcastss 0x20332(%rip),%ymm7 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
@@ -20413,27 +20586,27 @@ _sk_load_565_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,109,255,255,255 // ja b266 <_sk_load_565_dst_avx+0x26>
+ .byte 15,135,109,255,255,255 // ja b57e <_sk_load_565_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b368 <_sk_load_565_dst_avx+0x128>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b680 <_sk_load_565_dst_avx+0x128>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,75,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
+ .byte 233,75,255,255,255 // jmpq b57e <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,46,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
+ .byte 233,46,255,255,255 // jmpq b57e <_sk_load_565_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,1,255,255,255 // jmpq b266 <_sk_load_565_dst_avx+0x26>
+ .byte 233,1,255,255,255 // jmpq b57e <_sk_load_565_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -20505,23 +20678,23 @@ _sk_gather_565_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,209,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- .byte 196,226,125,24,5,26,0,2,0 // vbroadcastss 0x2001a(%rip),%ymm0 # 2b470 <_sk_overlay_sse2_8bit+0x4bb>
+ .byte 196,226,125,24,5,50,2,2,0 // vbroadcastss 0x20232(%rip),%ymm0 # 2b9a0 <_sk_overlay_sse2_8bit+0x4bb>
.byte 197,236,84,192 // vandps %ymm0,%ymm2,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,13,0,2,0 // vbroadcastss 0x2000d(%rip),%ymm1 # 2b474 <_sk_overlay_sse2_8bit+0x4bf>
+ .byte 196,226,125,24,13,37,2,2,0 // vbroadcastss 0x20225(%rip),%ymm1 # 2b9a4 <_sk_overlay_sse2_8bit+0x4bf>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,4,0,2,0 // vbroadcastss 0x20004(%rip),%ymm1 # 2b478 <_sk_overlay_sse2_8bit+0x4c3>
+ .byte 196,226,125,24,13,28,2,2,0 // vbroadcastss 0x2021c(%rip),%ymm1 # 2b9a8 <_sk_overlay_sse2_8bit+0x4c3>
.byte 197,236,84,201 // vandps %ymm1,%ymm2,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,29,247,255,1,0 // vbroadcastss 0x1fff7(%rip),%ymm3 # 2b47c <_sk_overlay_sse2_8bit+0x4c7>
+ .byte 196,226,125,24,29,15,2,2,0 // vbroadcastss 0x2020f(%rip),%ymm3 # 2b9ac <_sk_overlay_sse2_8bit+0x4c7>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
- .byte 196,226,125,24,29,238,255,1,0 // vbroadcastss 0x1ffee(%rip),%ymm3 # 2b480 <_sk_overlay_sse2_8bit+0x4cb>
+ .byte 196,226,125,24,29,6,2,2,0 // vbroadcastss 0x20206(%rip),%ymm3 # 2b9b0 <_sk_overlay_sse2_8bit+0x4cb>
.byte 197,236,84,211 // vandps %ymm3,%ymm2,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,226,125,24,29,225,255,1,0 // vbroadcastss 0x1ffe1(%rip),%ymm3 # 2b484 <_sk_overlay_sse2_8bit+0x4cf>
+ .byte 196,226,125,24,29,249,1,2,0 // vbroadcastss 0x201f9(%rip),%ymm3 # 2b9b4 <_sk_overlay_sse2_8bit+0x4cf>
.byte 197,236,89,211 // vmulps %ymm3,%ymm2,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,70,255,1,0 // vbroadcastss 0x1ff46(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,94,1,2,0 // vbroadcastss 0x2015e(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
HIDDEN _sk_store_565_avx
@@ -20536,14 +20709,14 @@ _sk_store_565_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,16,0,2,0 // vbroadcastss 0x20010(%rip),%ymm8 # 2b4e4 <_sk_overlay_sse2_8bit+0x52f>
+ .byte 196,98,125,24,5,40,2,2,0 // vbroadcastss 0x20228(%rip),%ymm8 # 2ba14 <_sk_overlay_sse2_8bit+0x52f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,11 // vpslld $0xb,%xmm9,%xmm10
.byte 196,67,125,25,201,1 // vextractf128 $0x1,%ymm9,%xmm9
.byte 196,193,49,114,241,11 // vpslld $0xb,%xmm9,%xmm9
.byte 196,67,45,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- .byte 196,98,125,24,21,233,255,1,0 // vbroadcastss 0x1ffe9(%rip),%ymm10 # 2b4e8 <_sk_overlay_sse2_8bit+0x533>
+ .byte 196,98,125,24,21,1,2,2,0 // vbroadcastss 0x20201(%rip),%ymm10 # 2ba18 <_sk_overlay_sse2_8bit+0x533>
.byte 196,65,116,89,210 // vmulps %ymm10,%ymm1,%ymm10
.byte 196,65,125,91,210 // vcvtps2dq %ymm10,%ymm10
.byte 196,193,33,114,242,5 // vpslld $0x5,%xmm10,%xmm11
@@ -20557,7 +20730,7 @@ _sk_store_565_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne b550 <_sk_store_565_avx+0x9c>
+ .byte 117,11 // jne b868 <_sk_store_565_avx+0x9c>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20566,22 +20739,22 @@ _sk_store_565_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja b54b <_sk_store_565_avx+0x97>
+ .byte 119,235 // ja b863 <_sk_store_565_avx+0x97>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b5b0 <_sk_store_565_avx+0xfc>
+ .byte 76,141,29,69,0,0,0 // lea 0x45(%rip),%r11 # b8c8 <_sk_store_565_avx+0xfc>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp b54b <_sk_store_565_avx+0x97>
+ .byte 235,206 // jmp b863 <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp b54b <_sk_store_565_avx+0x97>
+ .byte 235,190 // jmp b863 <_sk_store_565_avx+0x97>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp b54b <_sk_store_565_avx+0x97>
+ .byte 235,158 // jmp b863 <_sk_store_565_avx+0x97>
.byte 15,31,0 // nopl (%rax)
.byte 196 // (bad)
.byte 255 // (bad)
@@ -20620,31 +20793,31 @@ _sk_load_4444_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne b685 <_sk_load_4444_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne b99d <_sk_load_4444_avx+0xb9>
.byte 196,193,122,111,4,89 // vmovdqu (%r9,%rbx,2),%xmm0
.byte 197,241,239,201 // vpxor %xmm1,%xmm1,%xmm1
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,222,254,1,0 // vbroadcastss 0x1fede(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,5,246,0,2,0 // vbroadcastss 0x200f6(%rip),%ymm0 # 2ba1c <_sk_overlay_sse2_8bit+0x537>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,209,254,1,0 // vbroadcastss 0x1fed1(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,233,0,2,0 // vbroadcastss 0x200e9(%rip),%ymm1 # 2ba20 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,200,254,1,0 // vbroadcastss 0x1fec8(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,13,224,0,2,0 // vbroadcastss 0x200e0(%rip),%ymm1 # 2ba24 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,187,254,1,0 // vbroadcastss 0x1febb(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,211,0,2,0 // vbroadcastss 0x200d3(%rip),%ymm2 # 2ba28 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,178,254,1,0 // vbroadcastss 0x1feb2(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,21,202,0,2,0 // vbroadcastss 0x200ca(%rip),%ymm2 # 2ba2c <_sk_overlay_sse2_8bit+0x547>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,165,254,1,0 // vbroadcastss 0x1fea5(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,189,0,2,0 // vbroadcastss 0x200bd(%rip),%ymm8 # 2ba30 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,155,254,1,0 // vbroadcastss 0x1fe9b(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,179,0,2,0 // vbroadcastss 0x200b3(%rip),%ymm8 # 2ba34 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,141,254,1,0 // vbroadcastss 0x1fe8d(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,165,0,2,0 // vbroadcastss 0x200a5(%rip),%ymm8 # 2ba38 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20654,27 +20827,27 @@ _sk_load_4444_avx:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja b5f2 <_sk_load_4444_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja b90a <_sk_load_4444_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b70c <_sk_load_4444_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # ba24 <_sk_load_4444_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 233,51,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq b90a <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,110,12,89 // vmovd (%r9,%rbx,2),%xmm1
.byte 196,227,121,14,193,3 // vpblendw $0x3,%xmm1,%xmm0,%xmm0
- .byte 233,22,255,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq b90a <_sk_load_4444_avx+0x26>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,193,121,196,68,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,121,196,68,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
.byte 196,193,122,126,12,89 // vmovq (%r9,%rbx,2),%xmm1
.byte 196,227,113,14,192,240 // vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- .byte 233,233,254,255,255 // jmpq b5f2 <_sk_load_4444_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq b90a <_sk_load_4444_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -20711,31 +20884,31 @@ _sk_load_4444_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,153,0,0,0 // jne b7e1 <_sk_load_4444_dst_avx+0xb9>
+ .byte 15,133,153,0,0,0 // jne baf9 <_sk_load_4444_dst_avx+0xb9>
.byte 196,193,122,111,36,89 // vmovdqu (%r9,%rbx,2),%xmm4
.byte 197,209,239,237 // vpxor %xmm5,%xmm5,%xmm5
.byte 197,217,105,237 // vpunpckhwd %xmm5,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,253,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- .byte 196,226,125,24,37,130,253,1,0 // vbroadcastss 0x1fd82(%rip),%ymm4 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,37,154,255,1,0 // vbroadcastss 0x1ff9a(%rip),%ymm4 # 2ba1c <_sk_overlay_sse2_8bit+0x537>
.byte 197,196,84,228 // vandps %ymm4,%ymm7,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,226,125,24,45,117,253,1,0 // vbroadcastss 0x1fd75(%rip),%ymm5 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,45,141,255,1,0 // vbroadcastss 0x1ff8d(%rip),%ymm5 # 2ba20 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,220,89,229 // vmulps %ymm5,%ymm4,%ymm4
- .byte 196,226,125,24,45,108,253,1,0 // vbroadcastss 0x1fd6c(%rip),%ymm5 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,45,132,255,1,0 // vbroadcastss 0x1ff84(%rip),%ymm5 # 2ba24 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,196,84,237 // vandps %ymm5,%ymm7,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,226,125,24,53,95,253,1,0 // vbroadcastss 0x1fd5f(%rip),%ymm6 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,53,119,255,1,0 // vbroadcastss 0x1ff77(%rip),%ymm6 # 2ba28 <_sk_overlay_sse2_8bit+0x543>
.byte 197,212,89,238 // vmulps %ymm6,%ymm5,%ymm5
- .byte 196,226,125,24,53,86,253,1,0 // vbroadcastss 0x1fd56(%rip),%ymm6 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,53,110,255,1,0 // vbroadcastss 0x1ff6e(%rip),%ymm6 # 2ba2c <_sk_overlay_sse2_8bit+0x547>
.byte 197,196,84,246 // vandps %ymm6,%ymm7,%ymm6
.byte 197,252,91,246 // vcvtdq2ps %ymm6,%ymm6
- .byte 196,98,125,24,5,73,253,1,0 // vbroadcastss 0x1fd49(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,97,255,1,0 // vbroadcastss 0x1ff61(%rip),%ymm8 # 2ba30 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,76,89,240 // vmulps %ymm8,%ymm6,%ymm6
- .byte 196,98,125,24,5,63,253,1,0 // vbroadcastss 0x1fd3f(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,87,255,1,0 // vbroadcastss 0x1ff57(%rip),%ymm8 # 2ba34 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,68,84,248 // vandps %ymm8,%ymm7,%ymm7
.byte 197,252,91,255 // vcvtdq2ps %ymm7,%ymm7
- .byte 196,98,125,24,5,49,253,1,0 // vbroadcastss 0x1fd31(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,73,255,1,0 // vbroadcastss 0x1ff49(%rip),%ymm8 # 2ba38 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,68,89,248 // vmulps %ymm8,%ymm7,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20745,27 +20918,27 @@ _sk_load_4444_dst_avx:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,85,255,255,255 // ja b74e <_sk_load_4444_dst_avx+0x26>
+ .byte 15,135,85,255,255,255 // ja ba66 <_sk_load_4444_dst_avx+0x26>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # b868 <_sk_load_4444_dst_avx+0x140>
+ .byte 76,141,29,100,0,0,0 // lea 0x64(%rip),%r11 # bb80 <_sk_load_4444_dst_avx+0x140>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 65,15,183,4,89 // movzwl (%r9,%rbx,2),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,51,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
+ .byte 233,51,255,255,255 // jmpq ba66 <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,4,2 // vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,121,110,44,89 // vmovd (%r9,%rbx,2),%xmm5
.byte 196,227,89,14,229,3 // vpblendw $0x3,%xmm5,%xmm4,%xmm4
- .byte 233,22,255,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
+ .byte 233,22,255,255,255 // jmpq ba66 <_sk_load_4444_dst_avx+0x26>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,193,89,196,100,89,12,6 // vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,10,5 // vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,89,196,100,89,8,4 // vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
.byte 196,193,122,126,44,89 // vmovq (%r9,%rbx,2),%xmm5
.byte 196,227,81,14,228,240 // vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- .byte 233,233,254,255,255 // jmpq b74e <_sk_load_4444_dst_avx+0x26>
+ .byte 233,233,254,255,255 // jmpq ba66 <_sk_load_4444_dst_avx+0x26>
.byte 15,31,0 // nopl (%rax)
.byte 165 // movsl %ds:(%rsi),%es:(%rdi)
.byte 255 // (bad)
@@ -20837,25 +21010,25 @@ _sk_gather_4444_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,217,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- .byte 196,226,125,24,5,150,251,1,0 // vbroadcastss 0x1fb96(%rip),%ymm0 # 2b4ec <_sk_overlay_sse2_8bit+0x537>
+ .byte 196,226,125,24,5,174,253,1,0 // vbroadcastss 0x1fdae(%rip),%ymm0 # 2ba1c <_sk_overlay_sse2_8bit+0x537>
.byte 197,228,84,192 // vandps %ymm0,%ymm3,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,226,125,24,13,137,251,1,0 // vbroadcastss 0x1fb89(%rip),%ymm1 # 2b4f0 <_sk_overlay_sse2_8bit+0x53b>
+ .byte 196,226,125,24,13,161,253,1,0 // vbroadcastss 0x1fda1(%rip),%ymm1 # 2ba20 <_sk_overlay_sse2_8bit+0x53b>
.byte 197,252,89,193 // vmulps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,128,251,1,0 // vbroadcastss 0x1fb80(%rip),%ymm1 # 2b4f4 <_sk_overlay_sse2_8bit+0x53f>
+ .byte 196,226,125,24,13,152,253,1,0 // vbroadcastss 0x1fd98(%rip),%ymm1 # 2ba24 <_sk_overlay_sse2_8bit+0x53f>
.byte 197,228,84,201 // vandps %ymm1,%ymm3,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,226,125,24,21,115,251,1,0 // vbroadcastss 0x1fb73(%rip),%ymm2 # 2b4f8 <_sk_overlay_sse2_8bit+0x543>
+ .byte 196,226,125,24,21,139,253,1,0 // vbroadcastss 0x1fd8b(%rip),%ymm2 # 2ba28 <_sk_overlay_sse2_8bit+0x543>
.byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
- .byte 196,226,125,24,21,106,251,1,0 // vbroadcastss 0x1fb6a(%rip),%ymm2 # 2b4fc <_sk_overlay_sse2_8bit+0x547>
+ .byte 196,226,125,24,21,130,253,1,0 // vbroadcastss 0x1fd82(%rip),%ymm2 # 2ba2c <_sk_overlay_sse2_8bit+0x547>
.byte 197,228,84,210 // vandps %ymm2,%ymm3,%ymm2
.byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,98,125,24,5,93,251,1,0 // vbroadcastss 0x1fb5d(%rip),%ymm8 # 2b500 <_sk_overlay_sse2_8bit+0x54b>
+ .byte 196,98,125,24,5,117,253,1,0 // vbroadcastss 0x1fd75(%rip),%ymm8 # 2ba30 <_sk_overlay_sse2_8bit+0x54b>
.byte 196,193,108,89,208 // vmulps %ymm8,%ymm2,%ymm2
- .byte 196,98,125,24,5,83,251,1,0 // vbroadcastss 0x1fb53(%rip),%ymm8 # 2b504 <_sk_overlay_sse2_8bit+0x54f>
+ .byte 196,98,125,24,5,107,253,1,0 // vbroadcastss 0x1fd6b(%rip),%ymm8 # 2ba34 <_sk_overlay_sse2_8bit+0x54f>
.byte 196,193,100,84,216 // vandps %ymm8,%ymm3,%ymm3
.byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
- .byte 196,98,125,24,5,69,251,1,0 // vbroadcastss 0x1fb45(%rip),%ymm8 # 2b508 <_sk_overlay_sse2_8bit+0x553>
+ .byte 196,98,125,24,5,93,253,1,0 // vbroadcastss 0x1fd5d(%rip),%ymm8 # 2ba38 <_sk_overlay_sse2_8bit+0x553>
.byte 196,193,100,89,216 // vmulps %ymm8,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -20872,7 +21045,7 @@ _sk_store_4444_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,32,251,1,0 // vbroadcastss 0x1fb20(%rip),%ymm8 # 2b50c <_sk_overlay_sse2_8bit+0x557>
+ .byte 196,98,125,24,5,56,253,1,0 // vbroadcastss 0x1fd38(%rip),%ymm8 # 2ba3c <_sk_overlay_sse2_8bit+0x557>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,193,41,114,241,12 // vpslld $0xc,%xmm9,%xmm10
@@ -20899,7 +21072,7 @@ _sk_store_4444_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,66,57,43,193 // vpackusdw %xmm9,%xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne ba86 <_sk_store_4444_avx+0xba>
+ .byte 117,11 // jne bd9e <_sk_store_4444_avx+0xba>
.byte 196,65,122,127,4,89 // vmovdqu %xmm8,(%r9,%rbx,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -20908,22 +21081,22 @@ _sk_store_4444_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja ba81 <_sk_store_4444_avx+0xb5>
+ .byte 119,235 // ja bd99 <_sk_store_4444_avx+0xb5>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # bae4 <_sk_store_4444_avx+0x118>
+ .byte 76,141,29,67,0,0,0 // lea 0x43(%rip),%r11 # bdfc <_sk_store_4444_avx+0x118>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,67,121,21,4,89,0 // vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- .byte 235,206 // jmp ba81 <_sk_store_4444_avx+0xb5>
+ .byte 235,206 // jmp bd99 <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,4,2 // vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
.byte 196,65,121,126,4,89 // vmovd %xmm8,(%r9,%rbx,2)
- .byte 235,190 // jmp ba81 <_sk_store_4444_avx+0xb5>
+ .byte 235,190 // jmp bd99 <_sk_store_4444_avx+0xb5>
.byte 196,67,121,21,68,89,12,6 // vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
.byte 196,67,121,21,68,89,10,5 // vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
.byte 196,67,121,21,68,89,8,4 // vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
.byte 196,65,121,214,4,89 // vmovq %xmm8,(%r9,%rbx,2)
- .byte 235,158 // jmp ba81 <_sk_store_4444_avx+0xb5>
+ .byte 235,158 // jmp bd99 <_sk_store_4444_avx+0xb5>
.byte 144 // nop
.byte 198 // (bad)
.byte 255 // (bad)
@@ -20962,12 +21135,12 @@ _sk_load_8888_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne bba9 <_sk_load_8888_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne bec1 <_sk_load_8888_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,177,253,1,0 // vmovapd 0x1fdb1(%rip),%ymm10 # 2b8e0 <_sk_overlay_sse2_8bit+0x92b>
+ .byte 197,125,40,21,217,255,1,0 // vmovapd 0x1ffd9(%rip),%ymm10 # 2be20 <_sk_overlay_sse2_8bit+0x93b>
.byte 196,193,53,84,194 // vandpd %ymm10,%ymm9,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,5,43,249,1,0 // vbroadcastss 0x1f92b(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,67,251,1,0 // vbroadcastss 0x1fb43(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,192 // vmulps %ymm8,%ymm0,%ymm0
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -20995,21 +21168,21 @@ _sk_load_8888_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja bb27 <_sk_load_8888_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja be3f <_sk_load_8888_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bc60 <_sk_load_8888_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bf78 <_sk_load_8888_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq be3f <_sk_load_8888_avx+0x27>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq be3f <_sk_load_8888_avx+0x27>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -21023,9 +21196,9 @@ _sk_load_8888_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,202,254,255,255 // jmpq bb27 <_sk_load_8888_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq be3f <_sk_load_8888_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe bc61 <_sk_load_8888_avx+0x161>
+ .byte 118,255 // jbe bf79 <_sk_load_8888_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -21058,12 +21231,12 @@ _sk_load_8888_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne bd25 <_sk_load_8888_dst_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c03d <_sk_load_8888_dst_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,85,252,1,0 // vmovapd 0x1fc55(%rip),%ymm10 # 2b900 <_sk_overlay_sse2_8bit+0x94b>
+ .byte 197,125,40,21,125,254,1,0 // vmovapd 0x1fe7d(%rip),%ymm10 # 2be40 <_sk_overlay_sse2_8bit+0x95b>
.byte 196,193,53,84,226 // vandpd %ymm10,%ymm9,%ymm4
.byte 197,252,91,228 // vcvtdq2ps %ymm4,%ymm4
- .byte 196,98,125,24,5,175,247,1,0 // vbroadcastss 0x1f7af(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,199,249,1,0 // vbroadcastss 0x1f9c7(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,92,89,224 // vmulps %ymm8,%ymm4,%ymm4
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -21091,21 +21264,21 @@ _sk_load_8888_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja bca3 <_sk_load_8888_dst_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja bfbb <_sk_load_8888_dst_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # bddc <_sk_load_8888_dst_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c0f4 <_sk_load_8888_dst_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq bfbb <_sk_load_8888_dst_avx+0x27>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq bfbb <_sk_load_8888_dst_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -21119,9 +21292,9 @@ _sk_load_8888_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,202,254,255,255 // jmpq bca3 <_sk_load_8888_dst_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq bfbb <_sk_load_8888_dst_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe bddd <_sk_load_8888_dst_avx+0x161>
+ .byte 118,255 // jbe c0f5 <_sk_load_8888_dst_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -21178,10 +21351,10 @@ _sk_gather_8888_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,21,125,250,1,0 // vmovaps 0x1fa7d(%rip),%ymm10 # 2b920 <_sk_overlay_sse2_8bit+0x96b>
+ .byte 197,124,40,21,165,252,1,0 // vmovaps 0x1fca5(%rip),%ymm10 # 2be60 <_sk_overlay_sse2_8bit+0x97b>
.byte 196,193,124,84,194 // vandps %ymm10,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,13,183,245,1,0 // vbroadcastss 0x1f5b7(%rip),%ymm9 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,13,207,247,1,0 // vbroadcastss 0x1f7cf(%rip),%ymm9 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,193 // vmulps %ymm9,%ymm0,%ymm0
.byte 196,193,113,114,208,8 // vpsrld $0x8,%xmm8,%xmm1
.byte 197,233,114,211,8 // vpsrld $0x8,%xmm3,%xmm2
@@ -21215,7 +21388,7 @@ _sk_store_8888_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,237,244,1,0 // vbroadcastss 0x1f4ed(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,5,247,1,0 // vbroadcastss 0x1f705(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21240,7 +21413,7 @@ _sk_store_8888_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne bfc6 <_sk_store_8888_avx+0xb0>
+ .byte 117,11 // jne c2de <_sk_store_8888_avx+0xb0>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -21249,17 +21422,17 @@ _sk_store_8888_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja bfc1 <_sk_store_8888_avx+0xab>
+ .byte 119,235 // ja c2d9 <_sk_store_8888_avx+0xab>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c034 <_sk_store_8888_avx+0x11e>
+ .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c34c <_sk_store_8888_avx+0x11e>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp bfc1 <_sk_store_8888_avx+0xab>
+ .byte 235,207 // jmp c2d9 <_sk_store_8888_avx+0xab>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp bfc1 <_sk_store_8888_avx+0xab>
+ .byte 235,191 // jmp c2d9 <_sk_store_8888_avx+0xab>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -21267,7 +21440,7 @@ _sk_store_8888_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp bfc1 <_sk_store_8888_avx+0xab>
+ .byte 235,142 // jmp c2d9 <_sk_store_8888_avx+0xab>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -21303,12 +21476,12 @@ _sk_load_bgra_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne c0f9 <_sk_load_bgra_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c411 <_sk_load_bgra_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,193,248,1,0 // vmovapd 0x1f8c1(%rip),%ymm10 # 2b940 <_sk_overlay_sse2_8bit+0x98b>
+ .byte 197,125,40,21,233,250,1,0 // vmovapd 0x1fae9(%rip),%ymm10 # 2be80 <_sk_overlay_sse2_8bit+0x99b>
.byte 196,193,53,84,202 // vandpd %ymm10,%ymm9,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,98,125,24,5,219,243,1,0 // vbroadcastss 0x1f3db(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,243,245,1,0 // vbroadcastss 0x1f5f3(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,116,89,208 // vmulps %ymm8,%ymm1,%ymm2
.byte 196,193,113,114,209,8 // vpsrld $0x8,%xmm9,%xmm1
.byte 196,99,125,25,203,1 // vextractf128 $0x1,%ymm9,%xmm3
@@ -21336,21 +21509,21 @@ _sk_load_bgra_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja c077 <_sk_load_bgra_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja c38f <_sk_load_bgra_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c1b0 <_sk_load_bgra_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c4c8 <_sk_load_bgra_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq c38f <_sk_load_bgra_avx+0x27>
.byte 196,193,121,110,68,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,99,117,12,200,4 // vblendps $0x4,%ymm0,%ymm1,%ymm9
.byte 196,193,123,16,4,153 // vmovsd (%r9,%rbx,4),%xmm0
.byte 196,99,53,13,200,1 // vblendpd $0x1,%ymm0,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq c38f <_sk_load_bgra_avx+0x27>
.byte 196,193,121,110,68,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm0
.byte 197,249,112,192,68 // vpshufd $0x44,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -21364,9 +21537,9 @@ _sk_load_bgra_avx:
.byte 196,99,53,24,200,1 // vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
.byte 196,193,121,16,4,153 // vmovupd (%r9,%rbx,4),%xmm0
.byte 196,67,125,13,201,12 // vblendpd $0xc,%ymm9,%ymm0,%ymm9
- .byte 233,202,254,255,255 // jmpq c077 <_sk_load_bgra_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq c38f <_sk_load_bgra_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe c1b1 <_sk_load_bgra_avx+0x161>
+ .byte 118,255 // jbe c4c9 <_sk_load_bgra_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -21399,12 +21572,12 @@ _sk_load_bgra_dst_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,136,0,0,0 // jne c275 <_sk_load_bgra_dst_avx+0xa9>
+ .byte 15,133,136,0,0,0 // jne c58d <_sk_load_bgra_dst_avx+0xa9>
.byte 196,65,125,16,12,153 // vmovupd (%r9,%rbx,4),%ymm9
- .byte 197,125,40,21,101,247,1,0 // vmovapd 0x1f765(%rip),%ymm10 # 2b960 <_sk_overlay_sse2_8bit+0x9ab>
+ .byte 197,125,40,21,141,249,1,0 // vmovapd 0x1f98d(%rip),%ymm10 # 2bea0 <_sk_overlay_sse2_8bit+0x9bb>
.byte 196,193,53,84,234 // vandpd %ymm10,%ymm9,%ymm5
.byte 197,252,91,237 // vcvtdq2ps %ymm5,%ymm5
- .byte 196,98,125,24,5,95,242,1,0 // vbroadcastss 0x1f25f(%rip),%ymm8 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,5,119,244,1,0 // vbroadcastss 0x1f477(%rip),%ymm8 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,84,89,240 // vmulps %ymm8,%ymm5,%ymm6
.byte 196,193,81,114,209,8 // vpsrld $0x8,%xmm9,%xmm5
.byte 196,99,125,25,207,1 // vextractf128 $0x1,%ymm9,%xmm7
@@ -21432,21 +21605,21 @@ _sk_load_bgra_dst_avx:
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 15,135,101,255,255,255 // ja c1f3 <_sk_load_bgra_dst_avx+0x27>
+ .byte 15,135,101,255,255,255 // ja c50b <_sk_load_bgra_dst_avx+0x27>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c32c <_sk_load_bgra_dst_avx+0x160>
+ .byte 76,141,29,147,0,0,0 // lea 0x93(%rip),%r11 # c644 <_sk_load_bgra_dst_avx+0x160>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,122,16,12,153 // vmovss (%r9,%rbx,4),%xmm9
- .byte 233,70,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,70,255,255,255 // jmpq c50b <_sk_load_bgra_dst_avx+0x27>
.byte 196,193,121,110,100,153,8 // vmovd 0x8(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 197,212,87,237 // vxorps %ymm5,%ymm5,%ymm5
.byte 196,99,85,12,204,4 // vblendps $0x4,%ymm4,%ymm5,%ymm9
.byte 196,193,123,16,36,153 // vmovsd (%r9,%rbx,4),%xmm4
.byte 196,99,53,13,204,1 // vblendpd $0x1,%ymm4,%ymm9,%ymm9
- .byte 233,31,255,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,31,255,255,255 // jmpq c50b <_sk_load_bgra_dst_avx+0x27>
.byte 196,193,121,110,100,153,24 // vmovd 0x18(%r9,%rbx,4),%xmm4
.byte 197,249,112,228,68 // vpshufd $0x44,%xmm4,%xmm4
.byte 196,227,125,24,228,1 // vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -21460,9 +21633,9 @@ _sk_load_bgra_dst_avx:
.byte 196,99,53,24,204,1 // vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
.byte 196,193,121,16,36,153 // vmovupd (%r9,%rbx,4),%xmm4
.byte 196,67,93,13,201,12 // vblendpd $0xc,%ymm9,%ymm4,%ymm9
- .byte 233,202,254,255,255 // jmpq c1f3 <_sk_load_bgra_dst_avx+0x27>
+ .byte 233,202,254,255,255 // jmpq c50b <_sk_load_bgra_dst_avx+0x27>
.byte 15,31,0 // nopl (%rax)
- .byte 118,255 // jbe c32d <_sk_load_bgra_dst_avx+0x161>
+ .byte 118,255 // jbe c645 <_sk_load_bgra_dst_avx+0x161>
.byte 255 // (bad)
.byte 255,151,255,255,255,129 // callq *-0x7e000001(%rdi)
.byte 255 // (bad)
@@ -21519,10 +21692,10 @@ _sk_gather_bgra_avx:
.byte 73,193,234,32 // shr $0x20,%r10
.byte 196,131,121,34,28,145,3 // vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
.byte 196,227,61,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- .byte 197,124,40,13,141,245,1,0 // vmovaps 0x1f58d(%rip),%ymm9 # 2b980 <_sk_overlay_sse2_8bit+0x9cb>
+ .byte 197,124,40,13,181,247,1,0 // vmovaps 0x1f7b5(%rip),%ymm9 # 2bec0 <_sk_overlay_sse2_8bit+0x9db>
.byte 196,193,124,84,193 // vandps %ymm9,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,21,103,240,1,0 // vbroadcastss 0x1f067(%rip),%ymm10 # 2b46c <_sk_overlay_sse2_8bit+0x4b7>
+ .byte 196,98,125,24,21,127,242,1,0 // vbroadcastss 0x1f27f(%rip),%ymm10 # 2b99c <_sk_overlay_sse2_8bit+0x4b7>
.byte 196,193,124,89,210 // vmulps %ymm10,%ymm0,%ymm2
.byte 196,193,121,114,208,8 // vpsrld $0x8,%xmm8,%xmm0
.byte 197,241,114,211,8 // vpsrld $0x8,%xmm3,%xmm1
@@ -21556,7 +21729,7 @@ _sk_store_bgra_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,218 // movslq %edx,%rbx
- .byte 196,98,125,24,5,157,239,1,0 // vbroadcastss 0x1ef9d(%rip),%ymm8 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 196,98,125,24,5,181,241,1,0 // vbroadcastss 0x1f1b5(%rip),%ymm8 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 196,65,108,89,200 // vmulps %ymm8,%ymm2,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,65,116,89,208 // vmulps %ymm8,%ymm1,%ymm10
@@ -21581,7 +21754,7 @@ _sk_store_bgra_avx:
.byte 196,65,45,86,192 // vorpd %ymm8,%ymm10,%ymm8
.byte 196,65,53,86,192 // vorpd %ymm8,%ymm9,%ymm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,11 // jne c516 <_sk_store_bgra_avx+0xb0>
+ .byte 117,11 // jne c82e <_sk_store_bgra_avx+0xb0>
.byte 196,65,124,17,4,153 // vmovups %ymm8,(%r9,%rbx,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
@@ -21590,17 +21763,17 @@ _sk_store_bgra_avx:
.byte 65,128,226,7 // and $0x7,%r10b
.byte 65,254,202 // dec %r10b
.byte 65,128,250,6 // cmp $0x6,%r10b
- .byte 119,235 // ja c511 <_sk_store_bgra_avx+0xab>
+ .byte 119,235 // ja c829 <_sk_store_bgra_avx+0xab>
.byte 69,15,182,210 // movzbl %r10b,%r10d
- .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c584 <_sk_store_bgra_avx+0x11e>
+ .byte 76,141,29,83,0,0,0 // lea 0x53(%rip),%r11 # c89c <_sk_store_bgra_avx+0x11e>
.byte 75,99,4,147 // movslq (%r11,%r10,4),%rax
.byte 76,1,216 // add %r11,%rax
.byte 255,224 // jmpq *%rax
.byte 196,65,121,126,4,153 // vmovd %xmm8,(%r9,%rbx,4)
- .byte 235,207 // jmp c511 <_sk_store_bgra_avx+0xab>
+ .byte 235,207 // jmp c829 <_sk_store_bgra_avx+0xab>
.byte 196,67,121,22,68,153,8,2 // vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
.byte 196,65,121,214,4,153 // vmovq %xmm8,(%r9,%rbx,4)
- .byte 235,191 // jmp c511 <_sk_store_bgra_avx+0xab>
+ .byte 235,191 // jmp c829 <_sk_store_bgra_avx+0xab>
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,67,121,22,76,153,24,2 // vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
@@ -21608,7 +21781,7 @@ _sk_store_bgra_avx:
.byte 196,67,125,25,193,1 // vextractf128 $0x1,%ymm8,%xmm9
.byte 196,65,122,17,76,153,16 // vmovss %xmm9,0x10(%r9,%rbx,4)
.byte 196,65,121,17,4,153 // vmovupd %xmm8,(%r9,%rbx,4)
- .byte 235,142 // jmp c511 <_sk_store_bgra_avx+0xab>
+ .byte 235,142 // jmp c829 <_sk_store_bgra_avx+0xab>
.byte 144 // nop
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -21648,7 +21821,7 @@ _sk_load_f16_avx:
.byte 197,252,17,116,36,192 // vmovups %ymm6,-0x40(%rsp)
.byte 197,252,17,108,36,160 // vmovups %ymm5,-0x60(%rsp)
.byte 197,254,127,100,36,128 // vmovdqu %ymm4,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne c86d <_sk_load_f16_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne cb85 <_sk_load_f16_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,84,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm2
.byte 196,193,121,16,76,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -21666,13 +21839,13 @@ _sk_load_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,59,239,1,0 // vbroadcastss 0x1ef3b(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,83,241,1,0 // vbroadcastss 0x1f153(%rip),%ymm12 # 2baa4 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,255,238,1,0 // vbroadcastss 0x1eeff(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,23,241,1,0 // vbroadcastss 0x1f117(%rip),%xmm11 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,25,239,1,0 // vbroadcastss 0x1ef19(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,49,241,1,0 // vbroadcastss 0x1f131(%rip),%xmm13 # 2baa8 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -21686,7 +21859,7 @@ _sk_load_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,207,238,1,0 // vbroadcastss 0x1eecf(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,29,231,240,1,0 // vbroadcastss 0x1f0e7(%rip),%xmm3 # 2baac <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -21779,29 +21952,29 @@ _sk_load_f16_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je c8d3 <_sk_load_f16_avx+0x333>
+ .byte 116,85 // je cbeb <_sk_load_f16_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb c8d3 <_sk_load_f16_avx+0x333>
+ .byte 114,72 // jb cbeb <_sk_load_f16_avx+0x333>
.byte 196,193,123,16,84,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je c8e0 <_sk_load_f16_avx+0x340>
+ .byte 116,72 // je cbf8 <_sk_load_f16_avx+0x340>
.byte 196,193,105,22,84,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb c8e0 <_sk_load_f16_avx+0x340>
+ .byte 114,59 // jb cbf8 <_sk_load_f16_avx+0x340>
.byte 196,193,123,16,76,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm1
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je c5f7 <_sk_load_f16_avx+0x57>
+ .byte 15,132,65,253,255,255 // je c90f <_sk_load_f16_avx+0x57>
.byte 196,193,113,22,76,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb c5f7 <_sk_load_f16_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb c90f <_sk_load_f16_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq c90f <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,23,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq c90f <_sk_load_f16_avx+0x57>
.byte 197,241,87,201 // vxorpd %xmm1,%xmm1,%xmm1
- .byte 233,14,253,255,255 // jmpq c5f7 <_sk_load_f16_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq c90f <_sk_load_f16_avx+0x57>
HIDDEN _sk_load_f16_dst_avx
.globl _sk_load_f16_dst_avx
@@ -21820,7 +21993,7 @@ _sk_load_f16_dst_avx:
.byte 197,252,17,84,36,192 // vmovups %ymm2,-0x40(%rsp)
.byte 197,252,17,76,36,160 // vmovups %ymm1,-0x60(%rsp)
.byte 197,254,127,68,36,128 // vmovdqu %ymm0,-0x80(%rsp)
- .byte 15,133,145,2,0,0 // jne cbb6 <_sk_load_f16_dst_avx+0x2cd>
+ .byte 15,133,145,2,0,0 // jne cece <_sk_load_f16_dst_avx+0x2cd>
.byte 196,65,121,16,4,193 // vmovupd (%r9,%rax,8),%xmm8
.byte 196,193,121,16,116,193,16 // vmovupd 0x10(%r9,%rax,8),%xmm6
.byte 196,193,121,16,108,193,32 // vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -21838,13 +22011,13 @@ _sk_load_f16_dst_avx:
.byte 197,217,105,232 // vpunpckhwd %xmm0,%xmm4,%xmm5
.byte 196,226,121,51,228 // vpmovzxwd %xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- .byte 196,98,125,24,37,242,235,1,0 // vbroadcastss 0x1ebf2(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,10,238,1,0 // vbroadcastss 0x1ee0a(%rip),%ymm12 # 2baa4 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,92,84,236 // vandps %ymm12,%ymm4,%ymm5
.byte 197,220,87,229 // vxorps %ymm5,%ymm4,%ymm4
.byte 196,195,125,25,230,1 // vextractf128 $0x1,%ymm4,%xmm14
- .byte 196,98,121,24,29,182,235,1,0 // vbroadcastss 0x1ebb6(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,206,237,1,0 // vbroadcastss 0x1edce(%rip),%xmm11 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,251 // vxorps %xmm11,%xmm14,%xmm7
- .byte 196,98,121,24,45,208,235,1,0 // vbroadcastss 0x1ebd0(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,232,237,1,0 // vbroadcastss 0x1ede8(%rip),%xmm13 # 2baa8 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,255 // vpcmpgtd %xmm7,%xmm13,%xmm7
.byte 196,65,88,87,211 // vxorps %xmm11,%xmm4,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -21858,7 +22031,7 @@ _sk_load_f16_dst_avx:
.byte 196,227,93,24,231,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
.byte 197,220,86,229 // vorps %ymm5,%ymm4,%ymm4
.byte 196,227,125,25,229,1 // vextractf128 $0x1,%ymm4,%xmm5
- .byte 196,226,121,24,61,134,235,1,0 // vbroadcastss 0x1eb86(%rip),%xmm7 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,61,158,237,1,0 // vbroadcastss 0x1ed9e(%rip),%xmm7 # 2baac <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,209,254,239 // vpaddd %xmm7,%xmm5,%xmm5
.byte 197,217,254,231 // vpaddd %xmm7,%xmm4,%xmm4
.byte 196,227,93,24,229,1 // vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -21951,29 +22124,29 @@ _sk_load_f16_dst_avx:
.byte 196,65,123,16,4,193 // vmovsd (%r9,%rax,8),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je cc1c <_sk_load_f16_dst_avx+0x333>
+ .byte 116,85 // je cf34 <_sk_load_f16_dst_avx+0x333>
.byte 196,65,57,22,68,193,8 // vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb cc1c <_sk_load_f16_dst_avx+0x333>
+ .byte 114,72 // jb cf34 <_sk_load_f16_dst_avx+0x333>
.byte 196,193,123,16,116,193,16 // vmovsd 0x10(%r9,%rax,8),%xmm6
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je cc29 <_sk_load_f16_dst_avx+0x340>
+ .byte 116,72 // je cf41 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,73,22,116,193,24 // vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb cc29 <_sk_load_f16_dst_avx+0x340>
+ .byte 114,59 // jb cf41 <_sk_load_f16_dst_avx+0x340>
.byte 196,193,123,16,108,193,32 // vmovsd 0x20(%r9,%rax,8),%xmm5
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,65,253,255,255 // je c940 <_sk_load_f16_dst_avx+0x57>
+ .byte 15,132,65,253,255,255 // je cc58 <_sk_load_f16_dst_avx+0x57>
.byte 196,193,81,22,108,193,40 // vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,48,253,255,255 // jb c940 <_sk_load_f16_dst_avx+0x57>
+ .byte 15,130,48,253,255,255 // jb cc58 <_sk_load_f16_dst_avx+0x57>
.byte 196,65,122,126,76,193,48 // vmovq 0x30(%r9,%rax,8),%xmm9
- .byte 233,36,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
+ .byte 233,36,253,255,255 // jmpq cc58 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
.byte 197,201,87,246 // vxorpd %xmm6,%xmm6,%xmm6
- .byte 233,23,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
+ .byte 233,23,253,255,255 // jmpq cc58 <_sk_load_f16_dst_avx+0x57>
.byte 197,209,87,237 // vxorpd %xmm5,%xmm5,%xmm5
- .byte 233,14,253,255,255 // jmpq c940 <_sk_load_f16_dst_avx+0x57>
+ .byte 233,14,253,255,255 // jmpq cc58 <_sk_load_f16_dst_avx+0x57>
HIDDEN _sk_gather_f16_avx
.globl _sk_gather_f16_avx
@@ -22034,13 +22207,13 @@ _sk_gather_f16_avx:
.byte 197,249,105,201 // vpunpckhwd %xmm1,%xmm0,%xmm1
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- .byte 196,98,125,24,37,56,232,1,0 // vbroadcastss 0x1e838(%rip),%ymm12 # 2b574 <_sk_overlay_sse2_8bit+0x5bf>
+ .byte 196,98,125,24,37,80,234,1,0 // vbroadcastss 0x1ea50(%rip),%ymm12 # 2baa4 <_sk_overlay_sse2_8bit+0x5bf>
.byte 196,193,124,84,204 // vandps %ymm12,%ymm0,%ymm1
.byte 197,252,87,193 // vxorps %ymm1,%ymm0,%ymm0
.byte 196,195,125,25,198,1 // vextractf128 $0x1,%ymm0,%xmm14
- .byte 196,98,121,24,29,252,231,1,0 // vbroadcastss 0x1e7fc(%rip),%xmm11 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,121,24,29,20,234,1,0 // vbroadcastss 0x1ea14(%rip),%xmm11 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,8,87,219 // vxorps %xmm11,%xmm14,%xmm3
- .byte 196,98,121,24,45,22,232,1,0 // vbroadcastss 0x1e816(%rip),%xmm13 # 2b578 <_sk_overlay_sse2_8bit+0x5c3>
+ .byte 196,98,121,24,45,46,234,1,0 // vbroadcastss 0x1ea2e(%rip),%xmm13 # 2baa8 <_sk_overlay_sse2_8bit+0x5c3>
.byte 197,145,102,219 // vpcmpgtd %xmm3,%xmm13,%xmm3
.byte 196,65,120,87,211 // vxorps %xmm11,%xmm0,%xmm10
.byte 196,65,17,102,210 // vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -22054,7 +22227,7 @@ _sk_gather_f16_avx:
.byte 196,227,125,24,195,1 // vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
.byte 197,252,86,193 // vorps %ymm1,%ymm0,%ymm0
.byte 196,227,125,25,193,1 // vextractf128 $0x1,%ymm0,%xmm1
- .byte 196,226,121,24,29,204,231,1,0 // vbroadcastss 0x1e7cc(%rip),%xmm3 # 2b57c <_sk_overlay_sse2_8bit+0x5c7>
+ .byte 196,226,121,24,29,228,233,1,0 // vbroadcastss 0x1e9e4(%rip),%xmm3 # 2baac <_sk_overlay_sse2_8bit+0x5c7>
.byte 197,241,254,203 // vpaddd %xmm3,%xmm1,%xmm1
.byte 197,249,254,195 // vpaddd %xmm3,%xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -22154,12 +22327,12 @@ _sk_store_f16_avx:
.byte 197,252,17,52,36 // vmovups %ymm6,(%rsp)
.byte 197,252,17,108,36,224 // vmovups %ymm5,-0x20(%rsp)
.byte 197,252,17,100,36,192 // vmovups %ymm4,-0x40(%rsp)
- .byte 196,98,125,24,13,188,229,1,0 // vbroadcastss 0x1e5bc(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,212,231,1,0 // vbroadcastss 0x1e7d4(%rip),%ymm9 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,124,84,209 // vandps %ymm9,%ymm0,%ymm10
.byte 197,252,17,68,36,128 // vmovups %ymm0,-0x80(%rsp)
.byte 196,65,124,87,218 // vxorps %ymm10,%ymm0,%ymm11
.byte 196,67,125,25,220,1 // vextractf128 $0x1,%ymm11,%xmm12
- .byte 196,98,121,24,5,205,229,1,0 // vbroadcastss 0x1e5cd(%rip),%xmm8 # 2b580 <_sk_overlay_sse2_8bit+0x5cb>
+ .byte 196,98,121,24,5,229,231,1,0 // vbroadcastss 0x1e7e5(%rip),%xmm8 # 2bab0 <_sk_overlay_sse2_8bit+0x5cb>
.byte 196,65,57,102,236 // vpcmpgtd %xmm12,%xmm8,%xmm13
.byte 196,65,57,102,243 // vpcmpgtd %xmm11,%xmm8,%xmm14
.byte 196,67,13,24,237,1 // vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -22169,7 +22342,7 @@ _sk_store_f16_avx:
.byte 196,67,13,24,242,1 // vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
.byte 196,193,33,114,211,13 // vpsrld $0xd,%xmm11,%xmm11
.byte 196,193,25,114,212,13 // vpsrld $0xd,%xmm12,%xmm12
- .byte 196,98,125,24,21,148,229,1,0 // vbroadcastss 0x1e594(%rip),%ymm10 # 2b584 <_sk_overlay_sse2_8bit+0x5cf>
+ .byte 196,98,125,24,21,172,231,1,0 // vbroadcastss 0x1e7ac(%rip),%ymm10 # 2bab4 <_sk_overlay_sse2_8bit+0x5cf>
.byte 196,65,12,86,242 // vorps %ymm10,%ymm14,%ymm14
.byte 196,67,125,25,247,1 // vextractf128 $0x1,%ymm14,%xmm15
.byte 196,65,1,254,228 // vpaddd %xmm12,%xmm15,%xmm12
@@ -22256,7 +22429,7 @@ _sk_store_f16_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,70 // jne d1e4 <_sk_store_f16_avx+0x274>
+ .byte 117,70 // jne d4fc <_sk_store_f16_avx+0x274>
.byte 196,65,120,17,28,193 // vmovups %xmm11,(%r9,%rax,8)
.byte 196,65,120,17,84,193,16 // vmovups %xmm10,0x10(%r9,%rax,8)
.byte 196,65,120,17,76,193,32 // vmovups %xmm9,0x20(%r9,%rax,8)
@@ -22272,22 +22445,22 @@ _sk_store_f16_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,193 // vmovq %xmm11,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,201 // je d1b9 <_sk_store_f16_avx+0x249>
+ .byte 116,201 // je d4d1 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,92,193,8 // vmovhpd %xmm11,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,188 // jb d1b9 <_sk_store_f16_avx+0x249>
+ .byte 114,188 // jb d4d1 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,84,193,16 // vmovq %xmm10,0x10(%r9,%rax,8)
- .byte 116,179 // je d1b9 <_sk_store_f16_avx+0x249>
+ .byte 116,179 // je d4d1 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,84,193,24 // vmovhpd %xmm10,0x18(%r9,%rax,8)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,166 // jb d1b9 <_sk_store_f16_avx+0x249>
+ .byte 114,166 // jb d4d1 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,76,193,32 // vmovq %xmm9,0x20(%r9,%rax,8)
- .byte 116,157 // je d1b9 <_sk_store_f16_avx+0x249>
+ .byte 116,157 // je d4d1 <_sk_store_f16_avx+0x249>
.byte 196,65,121,23,76,193,40 // vmovhpd %xmm9,0x28(%r9,%rax,8)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,144 // jb d1b9 <_sk_store_f16_avx+0x249>
+ .byte 114,144 // jb d4d1 <_sk_store_f16_avx+0x249>
.byte 196,65,121,214,68,193,48 // vmovq %xmm8,0x30(%r9,%rax,8)
- .byte 235,135 // jmp d1b9 <_sk_store_f16_avx+0x249>
+ .byte 235,135 // jmp d4d1 <_sk_store_f16_avx+0x249>
HIDDEN _sk_load_u16_be_avx
.globl _sk_load_u16_be_avx
@@ -22302,7 +22475,7 @@ _sk_load_u16_be_avx:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne d356 <_sk_load_u16_be_avx+0x124>
+ .byte 15,133,253,0,0,0 // jne d66e <_sk_load_u16_be_avx+0x124>
.byte 196,65,121,16,4,65 // vmovupd (%r9,%rax,2),%xmm8
.byte 196,193,121,16,84,65,16 // vmovupd 0x10(%r9,%rax,2),%xmm2
.byte 196,193,121,16,92,65,32 // vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -22324,7 +22497,7 @@ _sk_load_u16_be_avx:
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
.byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,190,225,1,0 // vbroadcastss 0x1e1be(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 196,98,125,24,29,214,227,1,0 // vbroadcastss 0x1e3d6(%rip),%ymm11 # 2b9b8 <_sk_overlay_sse2_8bit+0x4d3>
.byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
.byte 197,177,109,202 // vpunpckhqdq %xmm2,%xmm9,%xmm1
.byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
@@ -22358,29 +22531,29 @@ _sk_load_u16_be_avx:
.byte 196,65,123,16,4,65 // vmovsd (%r9,%rax,2),%xmm8
.byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,85 // je d3bc <_sk_load_u16_be_avx+0x18a>
+ .byte 116,85 // je d6d4 <_sk_load_u16_be_avx+0x18a>
.byte 196,65,57,22,68,65,8 // vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,72 // jb d3bc <_sk_load_u16_be_avx+0x18a>
+ .byte 114,72 // jb d6d4 <_sk_load_u16_be_avx+0x18a>
.byte 196,193,123,16,84,65,16 // vmovsd 0x10(%r9,%rax,2),%xmm2
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 116,72 // je d3c9 <_sk_load_u16_be_avx+0x197>
+ .byte 116,72 // je d6e1 <_sk_load_u16_be_avx+0x197>
.byte 196,193,105,22,84,65,24 // vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,59 // jb d3c9 <_sk_load_u16_be_avx+0x197>
+ .byte 114,59 // jb d6e1 <_sk_load_u16_be_avx+0x197>
.byte 196,193,123,16,92,65,32 // vmovsd 0x20(%r9,%rax,2),%xmm3
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 15,132,213,254,255,255 // je d274 <_sk_load_u16_be_avx+0x42>
+ .byte 15,132,213,254,255,255 // je d58c <_sk_load_u16_be_avx+0x42>
.byte 196,193,97,22,92,65,40 // vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,130,196,254,255,255 // jb d274 <_sk_load_u16_be_avx+0x42>
+ .byte 15,130,196,254,255,255 // jb d58c <_sk_load_u16_be_avx+0x42>
.byte 196,65,122,126,76,65,48 // vmovq 0x30(%r9,%rax,2),%xmm9
- .byte 233,184,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
+ .byte 233,184,254,255,255 // jmpq d58c <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
.byte 197,233,87,210 // vxorpd %xmm2,%xmm2,%xmm2
- .byte 233,171,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
+ .byte 233,171,254,255,255 // jmpq d58c <_sk_load_u16_be_avx+0x42>
.byte 197,225,87,219 // vxorpd %xmm3,%xmm3,%xmm3
- .byte 233,162,254,255,255 // jmpq d274 <_sk_load_u16_be_avx+0x42>
+ .byte 233,162,254,255,255 // jmpq d58c <_sk_load_u16_be_avx+0x42>
HIDDEN _sk_load_rgb_u16_be_avx
.globl _sk_load_rgb_u16_be_avx
@@ -22397,89 +22570,117 @@ _sk_load_rgb_u16_be_avx:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,243,0,0,0 // jne d4f0 <_sk_load_rgb_u16_be_avx+0x11e>
- .byte 196,193,122,111,4,65 // vmovdqu (%r9,%rax,2),%xmm0
- .byte 196,193,122,111,84,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm2
- .byte 196,193,122,111,76,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm1
- .byte 196,193,122,111,92,65,32 // vmovdqu 0x20(%r9,%rax,2),%xmm3
- .byte 197,225,115,219,4 // vpsrldq $0x4,%xmm3,%xmm3
- .byte 197,185,115,216,6 // vpsrldq $0x6,%xmm0,%xmm8
- .byte 197,177,115,218,6 // vpsrldq $0x6,%xmm2,%xmm9
- .byte 197,161,115,217,6 // vpsrldq $0x6,%xmm1,%xmm11
+ .byte 15,133,241,0,0,0 // jne d806 <_sk_load_rgb_u16_be_avx+0x11c>
+ .byte 196,65,122,111,28,65 // vmovdqu (%r9,%rax,2),%xmm11
+ .byte 196,193,122,111,92,65,12 // vmovdqu 0xc(%r9,%rax,2),%xmm3
+ .byte 196,193,122,111,84,65,24 // vmovdqu 0x18(%r9,%rax,2),%xmm2
+ .byte 196,193,122,111,68,65,32 // vmovdqu 0x20(%r9,%rax,2),%xmm0
+ .byte 197,249,115,216,4 // vpsrldq $0x4,%xmm0,%xmm0
+ .byte 196,193,57,115,219,6 // vpsrldq $0x6,%xmm11,%xmm8
.byte 197,169,115,219,6 // vpsrldq $0x6,%xmm3,%xmm10
- .byte 197,249,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm0
- .byte 196,193,57,97,209 // vpunpcklwd %xmm9,%xmm8,%xmm2
- .byte 197,241,97,203 // vpunpcklwd %xmm3,%xmm1,%xmm1
- .byte 196,193,33,97,218 // vpunpcklwd %xmm10,%xmm11,%xmm3
- .byte 197,121,97,194 // vpunpcklwd %xmm2,%xmm0,%xmm8
- .byte 197,121,105,202 // vpunpckhwd %xmm2,%xmm0,%xmm9
- .byte 197,241,97,211 // vpunpcklwd %xmm3,%xmm1,%xmm2
- .byte 197,113,105,211 // vpunpckhwd %xmm3,%xmm1,%xmm10
- .byte 197,185,108,194 // vpunpcklqdq %xmm2,%xmm8,%xmm0
- .byte 197,241,113,240,8 // vpsllw $0x8,%xmm0,%xmm1
+ .byte 197,153,115,218,6 // vpsrldq $0x6,%xmm2,%xmm12
+ .byte 197,177,115,216,6 // vpsrldq $0x6,%xmm0,%xmm9
+ .byte 197,161,97,219 // vpunpcklwd %xmm3,%xmm11,%xmm3
+ .byte 196,193,57,97,202 // vpunpcklwd %xmm10,%xmm8,%xmm1
+ .byte 197,233,97,192 // vpunpcklwd %xmm0,%xmm2,%xmm0
+ .byte 196,193,25,97,209 // vpunpcklwd %xmm9,%xmm12,%xmm2
+ .byte 197,97,97,193 // vpunpcklwd %xmm1,%xmm3,%xmm8
+ .byte 197,97,105,201 // vpunpckhwd %xmm1,%xmm3,%xmm9
+ .byte 197,249,97,202 // vpunpcklwd %xmm2,%xmm0,%xmm1
+ .byte 197,121,105,210 // vpunpckhwd %xmm2,%xmm0,%xmm10
+ .byte 197,185,108,193 // vpunpcklqdq %xmm1,%xmm8,%xmm0
+ .byte 197,225,113,240,8 // vpsllw $0x8,%xmm0,%xmm3
.byte 197,249,113,208,8 // vpsrlw $0x8,%xmm0,%xmm0
- .byte 197,241,235,192 // vpor %xmm0,%xmm1,%xmm0
- .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
- .byte 196,193,121,105,204 // vpunpckhwd %xmm12,%xmm0,%xmm1
+ .byte 197,225,235,192 // vpor %xmm0,%xmm3,%xmm0
+ .byte 196,65,33,239,219 // vpxor %xmm11,%xmm11,%xmm11
+ .byte 196,193,121,105,211 // vpunpckhwd %xmm11,%xmm0,%xmm2
.byte 196,226,121,51,192 // vpmovzxwd %xmm0,%xmm0
- .byte 196,227,125,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
+ .byte 196,227,125,24,194,1 // vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
.byte 197,252,91,192 // vcvtdq2ps %ymm0,%ymm0
- .byte 196,98,125,24,29,1,224,1,0 // vbroadcastss 0x1e001(%rip),%ymm11 # 2b488 <_sk_overlay_sse2_8bit+0x4d3>
- .byte 196,193,124,89,195 // vmulps %ymm11,%ymm0,%ymm0
- .byte 197,185,109,202 // vpunpckhqdq %xmm2,%xmm8,%xmm1
- .byte 197,233,113,241,8 // vpsllw $0x8,%xmm1,%xmm2
+ .byte 196,226,125,24,21,24,226,1,0 // vbroadcastss 0x1e218(%rip),%ymm2 # 2b9b8 <_sk_overlay_sse2_8bit+0x4d3>
+ .byte 197,252,89,194 // vmulps %ymm2,%ymm0,%ymm0
+ .byte 197,185,109,201 // vpunpckhqdq %xmm1,%xmm8,%xmm1
+ .byte 197,225,113,241,8 // vpsllw $0x8,%xmm1,%xmm3
.byte 197,241,113,209,8 // vpsrlw $0x8,%xmm1,%xmm1
- .byte 197,233,235,201 // vpor %xmm1,%xmm2,%xmm1
- .byte 196,193,113,105,212 // vpunpckhwd %xmm12,%xmm1,%xmm2
+ .byte 197,225,235,201 // vpor %xmm1,%xmm3,%xmm1
+ .byte 196,193,113,105,219 // vpunpckhwd %xmm11,%xmm1,%xmm3
.byte 196,226,121,51,201 // vpmovzxwd %xmm1,%xmm1
- .byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
+ .byte 196,227,117,24,203,1 // vinsertf128 $0x1,%xmm3,%ymm1,%ymm1
.byte 197,252,91,201 // vcvtdq2ps %ymm1,%ymm1
- .byte 196,193,116,89,203 // vmulps %ymm11,%ymm1,%ymm1
- .byte 196,193,49,108,210 // vpunpcklqdq %xmm10,%xmm9,%xmm2
- .byte 197,225,113,242,8 // vpsllw $0x8,%xmm2,%xmm3
- .byte 197,233,113,210,8 // vpsrlw $0x8,%xmm2,%xmm2
- .byte 197,225,235,210 // vpor %xmm2,%xmm3,%xmm2
- .byte 196,193,105,105,220 // vpunpckhwd %xmm12,%xmm2,%xmm3
- .byte 196,226,121,51,210 // vpmovzxwd %xmm2,%xmm2
- .byte 196,227,109,24,211,1 // vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
- .byte 197,252,91,210 // vcvtdq2ps %ymm2,%ymm2
- .byte 196,193,108,89,211 // vmulps %ymm11,%ymm2,%ymm2
+ .byte 197,244,89,202 // vmulps %ymm2,%ymm1,%ymm1
+ .byte 196,193,49,108,218 // vpunpcklqdq %xmm10,%xmm9,%xmm3
+ .byte 197,185,113,243,8 // vpsllw $0x8,%xmm3,%xmm8
+ .byte 197,225,113,211,8 // vpsrlw $0x8,%xmm3,%xmm3
+ .byte 197,185,235,219 // vpor %xmm3,%xmm8,%xmm3
+ .byte 196,65,97,105,195 // vpunpckhwd %xmm11,%xmm3,%xmm8
+ .byte 196,226,121,51,219 // vpmovzxwd %xmm3,%xmm3
+ .byte 196,195,101,24,216,1 // vinsertf128 $0x1,%xmm8,%ymm3,%ymm3
+ .byte 197,252,91,219 // vcvtdq2ps %ymm3,%ymm3
+ .byte 197,228,89,210 // vmulps %ymm2,%ymm3,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,10,223,1,0 // vbroadcastss 0x1df0a(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,36,225,1,0 // vbroadcastss 0x1e124(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 255,224 // jmpq *%rax
.byte 196,193,121,110,4,65 // vmovd (%r9,%rax,2),%xmm0
- .byte 196,193,121,196,68,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
+ .byte 196,65,121,196,92,65,4,2 // vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm11
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,5 // jne d509 <_sk_load_rgb_u16_be_avx+0x137>
- .byte 233,40,255,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 196,193,121,110,76,65,6 // vmovd 0x6(%r9,%rax,2),%xmm1
- .byte 196,65,113,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
+ .byte 117,32 // jne d83f <_sk_load_rgb_u16_be_avx+0x155>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 196,65,57,239,192 // vpxor %xmm8,%xmm8,%xmm8
+ .byte 233,11,255,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 196,193,121,110,68,65,6 // vmovd 0x6(%r9,%rax,2),%xmm0
+ .byte 196,65,121,196,68,65,10,2 // vpinsrw $0x2,0xa(%r9,%rax,2),%xmm0,%xmm8
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,26 // jb d538 <_sk_load_rgb_u16_be_avx+0x166>
- .byte 196,193,121,110,76,65,12 // vmovd 0xc(%r9,%rax,2),%xmm1
- .byte 196,193,113,196,84,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
+ .byte 114,49 // jb d88a <_sk_load_rgb_u16_be_avx+0x1a0>
+ .byte 196,193,121,110,68,65,12 // vmovd 0xc(%r9,%rax,2),%xmm0
+ .byte 196,193,121,196,92,65,16,2 // vpinsrw $0x2,0x10(%r9,%rax,2),%xmm0,%xmm3
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 117,10 // jne d53d <_sk_load_rgb_u16_be_avx+0x16b>
- .byte 233,249,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,244,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 196,193,121,110,76,65,18 // vmovd 0x12(%r9,%rax,2),%xmm1
- .byte 196,65,113,196,76,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
+ .byte 117,50 // jne d8a5 <_sk_load_rgb_u16_be_avx+0x1bb>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 233,192,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 196,65,41,239,210 // vpxor %xmm10,%xmm10,%xmm10
+ .byte 197,225,239,219 // vpxor %xmm3,%xmm3,%xmm3
+ .byte 233,165,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 196,193,121,110,68,65,18 // vmovd 0x12(%r9,%rax,2),%xmm0
+ .byte 196,65,121,196,84,65,22,2 // vpinsrw $0x2,0x16(%r9,%rax,2),%xmm0,%xmm10
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,26 // jb d56c <_sk_load_rgb_u16_be_avx+0x19a>
- .byte 196,193,121,110,76,65,24 // vmovd 0x18(%r9,%rax,2),%xmm1
- .byte 196,193,113,196,76,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
+ .byte 114,40 // jb d8e7 <_sk_load_rgb_u16_be_avx+0x1fd>
+ .byte 196,193,121,110,68,65,24 // vmovd 0x18(%r9,%rax,2),%xmm0
+ .byte 196,193,121,196,84,65,28,2 // vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm0,%xmm2
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 117,10 // jne d571 <_sk_load_rgb_u16_be_avx+0x19f>
- .byte 233,197,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,192,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 196,193,121,110,92,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm3
- .byte 196,65,97,196,92,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
+ .byte 117,32 // jne d8f9 <_sk_load_rgb_u16_be_avx+0x20f>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 233,99,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 196,65,25,239,228 // vpxor %xmm12,%xmm12,%xmm12
+ .byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
+ .byte 233,81,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 196,193,121,110,68,65,30 // vmovd 0x1e(%r9,%rax,2),%xmm0
+ .byte 196,65,121,196,100,65,34,2 // vpinsrw $0x2,0x22(%r9,%rax,2),%xmm0,%xmm12
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,20 // jb d59a <_sk_load_rgb_u16_be_avx+0x1c8>
- .byte 196,193,121,110,92,65,36 // vmovd 0x24(%r9,%rax,2),%xmm3
- .byte 196,193,97,196,92,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- .byte 233,151,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
- .byte 233,146,254,255,255 // jmpq d431 <_sk_load_rgb_u16_be_avx+0x5f>
+ .byte 114,25 // jb d92c <_sk_load_rgb_u16_be_avx+0x242>
+ .byte 196,193,121,110,68,65,36 // vmovd 0x24(%r9,%rax,2),%xmm0
+ .byte 196,193,121,196,68,65,40,2 // vpinsrw $0x2,0x28(%r9,%rax,2),%xmm0,%xmm0
+ .byte 196,65,49,239,201 // vpxor %xmm9,%xmm9,%xmm9
+ .byte 233,30,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
+ .byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
+ .byte 233,21,254,255,255 // jmpq d74a <_sk_load_rgb_u16_be_avx+0x60>
HIDDEN _sk_store_u16_be_avx
.globl _sk_store_u16_be_avx
@@ -22493,7 +22694,7 @@ _sk_store_u16_be_avx:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 196,98,125,24,5,74,223,1,0 // vbroadcastss 0x1df4a(%rip),%ymm8 # 2b510 <_sk_overlay_sse2_8bit+0x55b>
+ .byte 196,98,125,24,5,228,224,1,0 // vbroadcastss 0x1e0e4(%rip),%ymm8 # 2ba40 <_sk_overlay_sse2_8bit+0x55b>
.byte 196,65,124,89,200 // vmulps %ymm8,%ymm0,%ymm9
.byte 196,65,125,91,201 // vcvtps2dq %ymm9,%ymm9
.byte 196,67,125,25,202,1 // vextractf128 $0x1,%ymm9,%xmm10
@@ -22531,7 +22732,7 @@ _sk_store_u16_be_avx:
.byte 196,65,17,98,200 // vpunpckldq %xmm8,%xmm13,%xmm9
.byte 196,65,17,106,192 // vpunpckhdq %xmm8,%xmm13,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,31 // jne d6aa <_sk_store_u16_be_avx+0x10b>
+ .byte 117,31 // jne da40 <_sk_store_u16_be_avx+0x10b>
.byte 196,65,120,17,28,65 // vmovups %xmm11,(%r9,%rax,2)
.byte 196,65,120,17,84,65,16 // vmovups %xmm10,0x10(%r9,%rax,2)
.byte 196,65,120,17,76,65,32 // vmovups %xmm9,0x20(%r9,%rax,2)
@@ -22540,30 +22741,36 @@ _sk_store_u16_be_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,214,28,65 // vmovq %xmm11,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 116,240 // je da3c <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,92,65,8 // vmovhpd %xmm11,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 114,227 // jb da3c <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,84,65,16 // vmovq %xmm10,0x10(%r9,%rax,2)
- .byte 116,218 // je d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 116,218 // je da3c <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,84,65,24 // vmovhpd %xmm10,0x18(%r9,%rax,2)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 114,205 // jb da3c <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,76,65,32 // vmovq %xmm9,0x20(%r9,%rax,2)
- .byte 116,196 // je d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 116,196 // je da3c <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,23,76,65,40 // vmovhpd %xmm9,0x28(%r9,%rax,2)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,183 // jb d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 114,183 // jb da3c <_sk_store_u16_be_avx+0x107>
.byte 196,65,121,214,68,65,48 // vmovq %xmm8,0x30(%r9,%rax,2)
- .byte 235,174 // jmp d6a6 <_sk_store_u16_be_avx+0x107>
+ .byte 235,174 // jmp da3c <_sk_store_u16_be_avx+0x107>
HIDDEN _sk_load_f32_avx
.globl _sk_load_f32_avx
FUNCTION(_sk_load_f32_avx)
_sk_load_f32_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja d784 <_sk_load_f32_avx+0x8c>
+ .byte 15,135,97,1,0,0 // ja dbff <_sk_load_f32_avx+0x171>
+ .byte 72,131,236,24 // sub $0x18,%rsp
+ .byte 197,253,17,100,36,128 // vmovupd %ymm4,-0x80(%rsp)
+ .byte 197,253,17,108,36,160 // vmovupd %ymm5,-0x60(%rsp)
+ .byte 197,253,17,116,36,192 // vmovupd %ymm6,-0x40(%rsp)
+ .byte 197,253,17,124,36,224 // vmovupd %ymm7,-0x20(%rsp)
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -22571,45 +22778,82 @@ _sk_load_f32_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d7ac <_sk_load_f32_avx+0xb4>
+ .byte 76,141,29,50,1,0,0 // lea 0x132(%rip),%r11 # dc10 <_sk_load_f32_avx+0x182>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
- .byte 255,224 // jmpq *%rax
- .byte 196,3,125,24,68,145,112,1 // vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- .byte 196,131,125,24,92,145,96,1 // vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm3
- .byte 196,131,125,24,76,145,80,1 // vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm1
- .byte 196,131,125,24,84,145,64,1 // vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm2
- .byte 196,129,121,16,68,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm0
- .byte 196,195,125,13,192,12 // vblendpd $0xc,%ymm8,%ymm0,%ymm0
- .byte 196,1,121,16,68,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm8
- .byte 196,99,61,13,203,12 // vblendpd $0xc,%ymm3,%ymm8,%ymm9
- .byte 196,129,121,16,92,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm3
- .byte 196,99,101,13,209,12 // vblendpd $0xc,%ymm1,%ymm3,%ymm10
+ .byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
+ .byte 196,65,53,87,201 // vxorpd %ymm9,%ymm9,%ymm9
+ .byte 197,237,87,210 // vxorpd %ymm2,%ymm2,%ymm2
+ .byte 196,65,37,87,219 // vxorpd %ymm11,%ymm11,%ymm11
+ .byte 196,65,29,87,228 // vxorpd %ymm12,%ymm12,%ymm12
+ .byte 196,65,61,87,192 // vxorpd %ymm8,%ymm8,%ymm8
+ .byte 196,65,13,87,246 // vxorpd %ymm14,%ymm14,%ymm14
+ .byte 197,205,87,246 // vxorpd %ymm6,%ymm6,%ymm6
+ .byte 196,65,5,87,255 // vxorpd %ymm15,%ymm15,%ymm15
+ .byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
+ .byte 196,65,21,87,237 // vxorpd %ymm13,%ymm13,%ymm13
+ .byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
+ .byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
+ .byte 255,224 // jmpq *%rax
+ .byte 196,129,121,16,68,145,112 // vmovupd 0x70(%r9,%r10,4),%xmm0
+ .byte 196,227,125,6,192,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ .byte 196,129,121,16,76,145,96 // vmovupd 0x60(%r9,%r10,4),%xmm1
+ .byte 196,227,125,6,225,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm4
+ .byte 196,129,121,16,76,145,80 // vmovupd 0x50(%r9,%r10,4),%xmm1
+ .byte 196,227,125,6,209,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm2
+ .byte 197,125,40,204 // vmovapd %ymm4,%ymm9
+ .byte 196,129,121,16,76,145,64 // vmovupd 0x40(%r9,%r10,4),%xmm1
+ .byte 196,99,125,6,193,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm8
+ .byte 196,65,125,40,217 // vmovapd %ymm9,%ymm11
+ .byte 197,125,40,226 // vmovapd %ymm2,%ymm12
+ .byte 196,129,121,16,76,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm1
+ .byte 196,227,117,13,192,12 // vblendpd $0xc,%ymm0,%ymm1,%ymm0
+ .byte 196,65,125,40,243 // vmovapd %ymm11,%ymm14
+ .byte 197,125,41,230 // vmovapd %ymm12,%ymm6
+ .byte 196,65,125,40,248 // vmovapd %ymm8,%ymm15
+ .byte 196,129,121,16,76,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm1
+ .byte 196,195,117,13,206,12 // vblendpd $0xc,%ymm14,%ymm1,%ymm1
+ .byte 197,125,40,238 // vmovapd %ymm6,%ymm13
+ .byte 197,125,41,253 // vmovapd %ymm15,%ymm5
+ .byte 196,129,121,16,84,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm2
+ .byte 196,67,109,13,213,12 // vblendpd $0xc,%ymm13,%ymm2,%ymm10
+ .byte 197,253,40,217 // vmovapd %ymm1,%ymm3
+ .byte 197,253,40,253 // vmovapd %ymm5,%ymm7
.byte 196,129,121,16,12,145 // vmovupd (%r9,%r10,4),%xmm1
- .byte 196,227,117,13,202,12 // vblendpd $0xc,%ymm2,%ymm1,%ymm1
+ .byte 196,227,117,13,207,12 // vblendpd $0xc,%ymm7,%ymm1,%ymm1
+ .byte 197,252,16,124,36,224 // vmovups -0x20(%rsp),%ymm7
+ .byte 197,252,16,116,36,192 // vmovups -0x40(%rsp),%ymm6
+ .byte 197,252,16,108,36,160 // vmovups -0x60(%rsp),%ymm5
+ .byte 197,252,16,100,36,128 // vmovups -0x80(%rsp),%ymm4
+ .byte 72,131,196,24 // add $0x18,%rsp
.byte 196,193,116,20,210 // vunpcklps %ymm10,%ymm1,%ymm2
- .byte 196,193,116,21,218 // vunpckhps %ymm10,%ymm1,%ymm3
- .byte 197,180,20,200 // vunpcklps %ymm0,%ymm9,%ymm1
- .byte 197,52,21,192 // vunpckhps %ymm0,%ymm9,%ymm8
+ .byte 196,65,116,21,194 // vunpckhps %ymm10,%ymm1,%ymm8
+ .byte 197,228,20,200 // vunpcklps %ymm0,%ymm3,%ymm1
+ .byte 197,228,21,216 // vunpckhps %ymm0,%ymm3,%ymm3
.byte 197,237,20,193 // vunpcklpd %ymm1,%ymm2,%ymm0
.byte 197,237,21,201 // vunpckhpd %ymm1,%ymm2,%ymm1
- .byte 196,193,101,20,208 // vunpcklpd %ymm8,%ymm3,%ymm2
- .byte 196,193,101,21,216 // vunpckhpd %ymm8,%ymm3,%ymm3
+ .byte 197,189,20,211 // vunpcklpd %ymm3,%ymm8,%ymm2
+ .byte 197,189,21,219 // vunpckhpd %ymm3,%ymm8,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
- .byte 133,255 // test %edi,%edi
- .byte 255 // (bad)
- .byte 255,204 // dec %esp
- .byte 255 // (bad)
- .byte 255 // (bad)
+ .byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
+ .byte 235,203 // jmp dbd9 <_sk_load_f32_avx+0x14b>
+ .byte 102,144 // xchg %ax,%ax
+ .byte 27,255 // sbb %edi,%edi
.byte 255 // (bad)
- .byte 191,255,255,255,178 // mov $0xb2ffffff,%edi
+ .byte 255,161,255,255,255,140 // jmpq *-0x73000001(%rcx)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
+ .byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
+ .byte 255,92,255,255 // lcall *-0x1(%rdi,%rdi,8)
+ .byte 255,70,255 // incl -0x1(%rsi)
.byte 255 // (bad)
- .byte 255,149,255,255,255,141 // callq *-0x72000001(%rbp)
+ .byte 255,53,255,255,255,40 // pushq 0x28ffffff(%rip) # 2900dc2c <_sk_overlay_sse2_8bit+0x28fe2747>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -22619,8 +22863,14 @@ HIDDEN _sk_load_f32_dst_avx
FUNCTION(_sk_load_f32_dst_avx)
_sk_load_f32_dst_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
+ .byte 197,221,87,228 // vxorpd %ymm4,%ymm4,%ymm4
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 15,135,128,0,0,0 // ja d858 <_sk_load_f32_dst_avx+0x8c>
+ .byte 15,135,97,1,0,0 // ja dda1 <_sk_load_f32_dst_avx+0x171>
+ .byte 72,131,236,24 // sub $0x18,%rsp
+ .byte 197,253,17,68,36,128 // vmovupd %ymm0,-0x80(%rsp)
+ .byte 197,253,17,76,36,160 // vmovupd %ymm1,-0x60(%rsp)
+ .byte 197,253,17,84,36,192 // vmovupd %ymm2,-0x40(%rsp)
+ .byte 197,253,17,92,36,224 // vmovupd %ymm3,-0x20(%rsp)
.byte 68,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10d
.byte 76,99,88,8 // movslq 0x8(%rax),%r11
.byte 76,99,201 // movslq %ecx,%r9
@@ -22628,45 +22878,84 @@ _sk_load_f32_dst_avx:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 77,99,210 // movslq %r10d,%r10
- .byte 76,141,29,132,0,0,0 // lea 0x84(%rip),%r11 # d880 <_sk_load_f32_dst_avx+0xb4>
+ .byte 76,141,29,48,1,0,0 // lea 0x130(%rip),%r11 # ddb0 <_sk_load_f32_dst_avx+0x180>
.byte 75,99,4,131 // movslq (%r11,%r8,4),%rax
.byte 76,1,216 // add %r11,%rax
- .byte 255,224 // jmpq *%rax
- .byte 196,3,125,24,68,145,112,1 // vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- .byte 196,131,125,24,124,145,96,1 // vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm7
- .byte 196,131,125,24,108,145,80,1 // vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm5
- .byte 196,131,125,24,116,145,64,1 // vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm6
- .byte 196,129,121,16,100,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm4
- .byte 196,195,93,13,224,12 // vblendpd $0xc,%ymm8,%ymm4,%ymm4
- .byte 196,1,121,16,68,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm8
- .byte 196,99,61,13,207,12 // vblendpd $0xc,%ymm7,%ymm8,%ymm9
- .byte 196,129,121,16,124,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm7
- .byte 196,99,69,13,213,12 // vblendpd $0xc,%ymm5,%ymm7,%ymm10
- .byte 196,129,121,16,44,145 // vmovupd (%r9,%r10,4),%xmm5
- .byte 196,227,85,13,238,12 // vblendpd $0xc,%ymm6,%ymm5,%ymm5
+ .byte 197,253,87,192 // vxorpd %ymm0,%ymm0,%ymm0
+ .byte 196,65,53,87,201 // vxorpd %ymm9,%ymm9,%ymm9
+ .byte 197,205,87,246 // vxorpd %ymm6,%ymm6,%ymm6
+ .byte 196,65,37,87,219 // vxorpd %ymm11,%ymm11,%ymm11
+ .byte 196,65,29,87,228 // vxorpd %ymm12,%ymm12,%ymm12
+ .byte 196,65,61,87,192 // vxorpd %ymm8,%ymm8,%ymm8
+ .byte 196,65,13,87,246 // vxorpd %ymm14,%ymm14,%ymm14
+ .byte 197,237,87,210 // vxorpd %ymm2,%ymm2,%ymm2
+ .byte 196,65,5,87,255 // vxorpd %ymm15,%ymm15,%ymm15
+ .byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
+ .byte 196,65,21,87,237 // vxorpd %ymm13,%ymm13,%ymm13
+ .byte 197,245,87,201 // vxorpd %ymm1,%ymm1,%ymm1
+ .byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,229,87,219 // vxorpd %ymm3,%ymm3,%ymm3
+ .byte 255,224 // jmpq *%rax
+ .byte 196,129,121,16,68,145,112 // vmovupd 0x70(%r9,%r10,4),%xmm0
+ .byte 196,227,125,6,224,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm4
+ .byte 196,129,121,16,68,145,96 // vmovupd 0x60(%r9,%r10,4),%xmm0
+ .byte 196,227,125,6,192,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ .byte 196,129,121,16,76,145,80 // vmovupd 0x50(%r9,%r10,4),%xmm1
+ .byte 196,227,125,6,241,40 // vperm2f128 $0x28,%ymm1,%ymm0,%ymm6
+ .byte 197,125,40,200 // vmovapd %ymm0,%ymm9
+ .byte 196,129,121,16,68,145,64 // vmovupd 0x40(%r9,%r10,4),%xmm0
+ .byte 196,99,125,6,192,40 // vperm2f128 $0x28,%ymm0,%ymm0,%ymm8
+ .byte 196,65,125,40,217 // vmovapd %ymm9,%ymm11
+ .byte 197,125,40,230 // vmovapd %ymm6,%ymm12
+ .byte 196,129,121,16,68,145,48 // vmovupd 0x30(%r9,%r10,4),%xmm0
+ .byte 196,227,125,13,228,12 // vblendpd $0xc,%ymm4,%ymm0,%ymm4
+ .byte 196,65,125,40,243 // vmovapd %ymm11,%ymm14
+ .byte 197,125,41,226 // vmovapd %ymm12,%ymm2
+ .byte 196,65,125,40,248 // vmovapd %ymm8,%ymm15
+ .byte 196,129,121,16,68,145,32 // vmovupd 0x20(%r9,%r10,4),%xmm0
+ .byte 196,195,125,13,238,12 // vblendpd $0xc,%ymm14,%ymm0,%ymm5
+ .byte 197,125,40,234 // vmovapd %ymm2,%ymm13
+ .byte 197,125,41,249 // vmovapd %ymm15,%ymm1
+ .byte 196,129,121,16,68,145,16 // vmovupd 0x10(%r9,%r10,4),%xmm0
+ .byte 196,67,125,13,213,12 // vblendpd $0xc,%ymm13,%ymm0,%ymm10
+ .byte 197,253,40,253 // vmovapd %ymm5,%ymm7
+ .byte 197,253,40,217 // vmovapd %ymm1,%ymm3
+ .byte 196,129,121,16,4,145 // vmovupd (%r9,%r10,4),%xmm0
+ .byte 196,227,125,13,235,12 // vblendpd $0xc,%ymm3,%ymm0,%ymm5
+ .byte 197,252,16,92,36,224 // vmovups -0x20(%rsp),%ymm3
+ .byte 197,252,16,84,36,192 // vmovups -0x40(%rsp),%ymm2
+ .byte 197,252,16,76,36,160 // vmovups -0x60(%rsp),%ymm1
+ .byte 197,252,16,68,36,128 // vmovups -0x80(%rsp),%ymm0
+ .byte 72,131,196,24 // add $0x18,%rsp
.byte 196,193,84,20,242 // vunpcklps %ymm10,%ymm5,%ymm6
- .byte 196,193,84,21,250 // vunpckhps %ymm10,%ymm5,%ymm7
- .byte 197,180,20,236 // vunpcklps %ymm4,%ymm9,%ymm5
- .byte 197,52,21,196 // vunpckhps %ymm4,%ymm9,%ymm8
+ .byte 196,65,84,21,194 // vunpckhps %ymm10,%ymm5,%ymm8
+ .byte 197,196,20,236 // vunpcklps %ymm4,%ymm7,%ymm5
+ .byte 197,196,21,252 // vunpckhps %ymm4,%ymm7,%ymm7
.byte 197,205,20,229 // vunpcklpd %ymm5,%ymm6,%ymm4
.byte 197,205,21,237 // vunpckhpd %ymm5,%ymm6,%ymm5
- .byte 196,193,69,20,240 // vunpcklpd %ymm8,%ymm7,%ymm6
- .byte 196,193,69,21,248 // vunpckhpd %ymm8,%ymm7,%ymm7
+ .byte 197,189,20,247 // vunpcklpd %ymm7,%ymm8,%ymm6
+ .byte 197,189,21,255 // vunpckhpd %ymm7,%ymm8,%ymm7
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
- .byte 133,255 // test %edi,%edi
+ .byte 197,197,87,255 // vxorpd %ymm7,%ymm7,%ymm7
+ .byte 196,65,45,87,210 // vxorpd %ymm10,%ymm10,%ymm10
+ .byte 197,213,87,237 // vxorpd %ymm5,%ymm5,%ymm5
+ .byte 235,203 // jmp dd7b <_sk_load_f32_dst_avx+0x14b>
+ .byte 29,255,255,255,163 // sbb $0xa3ffffff,%eax
.byte 255 // (bad)
- .byte 255,204 // dec %esp
.byte 255 // (bad)
+ .byte 255,142,255,255,255,121 // decl 0x79ffffff(%rsi)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 191,255,255,255,178 // mov $0xb2ffffff,%edi
+ .byte 255,94,255 // lcall *-0x1(%rsi)
.byte 255 // (bad)
+ .byte 255,72,255 // decl -0x1(%rax)
.byte 255 // (bad)
- .byte 255,165,255,255,255,157 // jmpq *-0x62000001(%rbp)
+ .byte 255,55 // pushq (%rdi)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,149,255,255,255,141 // callq *-0x72000001(%rbp)
+ .byte 255,42 // ljmp *(%rdx)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -22692,7 +22981,7 @@ _sk_store_f32_avx:
.byte 196,65,37,20,196 // vunpcklpd %ymm12,%ymm11,%ymm8
.byte 196,65,37,21,220 // vunpckhpd %ymm12,%ymm11,%ymm11
.byte 77,133,192 // test %r8,%r8
- .byte 117,55 // jne d91f <_sk_store_f32_avx+0x7f>
+ .byte 117,55 // jne de4f <_sk_store_f32_avx+0x7f>
.byte 196,67,45,24,225,1 // vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
.byte 196,67,61,24,235,1 // vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
.byte 196,67,45,6,201,49 // vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -22705,22 +22994,22 @@ _sk_store_f32_avx:
.byte 255,224 // jmpq *%rax
.byte 196,65,121,17,20,129 // vmovupd %xmm10,(%r9,%rax,4)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je d91b <_sk_store_f32_avx+0x7b>
+ .byte 116,240 // je de4b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,76,129,16 // vmovupd %xmm9,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb d91b <_sk_store_f32_avx+0x7b>
+ .byte 114,227 // jb de4b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,68,129,32 // vmovupd %xmm8,0x20(%r9,%rax,4)
- .byte 116,218 // je d91b <_sk_store_f32_avx+0x7b>
+ .byte 116,218 // je de4b <_sk_store_f32_avx+0x7b>
.byte 196,65,121,17,92,129,48 // vmovupd %xmm11,0x30(%r9,%rax,4)
.byte 73,131,248,5 // cmp $0x5,%r8
- .byte 114,205 // jb d91b <_sk_store_f32_avx+0x7b>
+ .byte 114,205 // jb de4b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,84,129,64,1 // vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- .byte 116,195 // je d91b <_sk_store_f32_avx+0x7b>
+ .byte 116,195 // je de4b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,76,129,80,1 // vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
.byte 73,131,248,7 // cmp $0x7,%r8
- .byte 114,181 // jb d91b <_sk_store_f32_avx+0x7b>
+ .byte 114,181 // jb de4b <_sk_store_f32_avx+0x7b>
.byte 196,67,125,25,68,129,96,1 // vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- .byte 235,171 // jmp d91b <_sk_store_f32_avx+0x7b>
+ .byte 235,171 // jmp de4b <_sk_store_f32_avx+0x7b>
HIDDEN _sk_clamp_x_avx
.globl _sk_clamp_x_avx
@@ -22813,7 +23102,7 @@ _sk_mirror_x_avx:
.byte 196,193,58,88,192 // vaddss %xmm8,%xmm8,%xmm0
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,99,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- .byte 197,178,89,5,79,217,1,0 // vmulss 0x1d94f(%rip),%xmm9,%xmm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,5,79,217,1,0 // vmulss 0x1d94f(%rip),%xmm9,%xmm0 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,89,192 // vmulps %ymm0,%ymm11,%ymm0
@@ -22847,7 +23136,7 @@ _sk_mirror_y_avx:
.byte 196,193,58,88,200 // vaddss %xmm8,%xmm8,%xmm1
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,99,117,24,193,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- .byte 197,178,89,13,194,216,1,0 // vmulss 0x1d8c2(%rip),%xmm9,%xmm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 197,178,89,13,194,216,1,0 // vmulss 0x1d8c2(%rip),%xmm9,%xmm1 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,227,121,4,201,0 // vpermilps $0x0,%xmm1,%xmm1
.byte 196,227,117,24,201,1 // vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
.byte 197,164,89,201 // vmulps %ymm1,%ymm11,%ymm1
@@ -22874,7 +23163,7 @@ FUNCTION(_sk_clamp_x_1_avx)
_sk_clamp_x_1_avx:
.byte 196,65,60,87,192 // vxorps %ymm8,%ymm8,%ymm8
.byte 197,188,95,192 // vmaxps %ymm0,%ymm8,%ymm0
- .byte 196,98,125,24,5,92,216,1,0 // vbroadcastss 0x1d85c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,92,216,1,0 // vbroadcastss 0x1d85c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 196,193,124,93,192 // vminps %ymm8,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -22892,9 +23181,9 @@ HIDDEN _sk_mirror_x_1_avx
.globl _sk_mirror_x_1_avx
FUNCTION(_sk_mirror_x_1_avx)
_sk_mirror_x_1_avx:
- .byte 196,98,125,24,5,83,216,1,0 // vbroadcastss 0x1d853(%rip),%ymm8 # 2b410 <_sk_overlay_sse2_8bit+0x45b>
+ .byte 196,98,125,24,5,83,216,1,0 // vbroadcastss 0x1d853(%rip),%ymm8 # 2b940 <_sk_overlay_sse2_8bit+0x45b>
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,13,41,216,1,0 // vbroadcastss 0x1d829(%rip),%ymm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,13,41,216,1,0 // vbroadcastss 0x1d829(%rip),%ymm9 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,89,201 // vmulps %ymm9,%ymm0,%ymm9
.byte 196,67,125,8,201,1 // vroundps $0x1,%ymm9,%ymm9
.byte 196,65,52,88,201 // vaddps %ymm9,%ymm9,%ymm9
@@ -22910,12 +23199,12 @@ HIDDEN _sk_luminance_to_alpha_avx
.globl _sk_luminance_to_alpha_avx
FUNCTION(_sk_luminance_to_alpha_avx)
_sk_luminance_to_alpha_avx:
- .byte 196,226,125,24,29,21,217,1,0 // vbroadcastss 0x1d915(%rip),%ymm3 # 2b514 <_sk_overlay_sse2_8bit+0x55f>
+ .byte 196,226,125,24,29,21,217,1,0 // vbroadcastss 0x1d915(%rip),%ymm3 # 2ba44 <_sk_overlay_sse2_8bit+0x55f>
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,29,12,217,1,0 // vbroadcastss 0x1d90c(%rip),%ymm3 # 2b518 <_sk_overlay_sse2_8bit+0x563>
+ .byte 196,226,125,24,29,12,217,1,0 // vbroadcastss 0x1d90c(%rip),%ymm3 # 2ba48 <_sk_overlay_sse2_8bit+0x563>
.byte 197,244,89,203 // vmulps %ymm3,%ymm1,%ymm1
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
- .byte 196,226,125,24,13,255,216,1,0 // vbroadcastss 0x1d8ff(%rip),%ymm1 # 2b51c <_sk_overlay_sse2_8bit+0x567>
+ .byte 196,226,125,24,13,255,216,1,0 // vbroadcastss 0x1d8ff(%rip),%ymm1 # 2ba4c <_sk_overlay_sse2_8bit+0x567>
.byte 197,236,89,201 // vmulps %ymm1,%ymm2,%ymm1
.byte 197,252,88,217 // vaddps %ymm1,%ymm0,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23163,9 +23452,9 @@ _sk_evenly_spaced_gradient_avx:
.byte 72,139,24 // mov (%rax),%rbx
.byte 72,139,104,8 // mov 0x8(%rax),%rbp
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js dfc1 <_sk_evenly_spaced_gradient_avx+0x25>
+ .byte 120,7 // js e4f1 <_sk_evenly_spaced_gradient_avx+0x25>
.byte 196,225,242,42,203 // vcvtsi2ss %rbx,%xmm1,%xmm1
- .byte 235,21 // jmp dfd6 <_sk_evenly_spaced_gradient_avx+0x3a>
+ .byte 235,21 // jmp e506 <_sk_evenly_spaced_gradient_avx+0x3a>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -23323,18 +23612,18 @@ HIDDEN _sk_gauss_a_to_rgba_avx
.globl _sk_gauss_a_to_rgba_avx
FUNCTION(_sk_gauss_a_to_rgba_avx)
_sk_gauss_a_to_rgba_avx:
- .byte 196,226,125,24,5,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm0 # 2b524 <_sk_overlay_sse2_8bit+0x56f>
+ .byte 196,226,125,24,5,234,209,1,0 // vbroadcastss 0x1d1ea(%rip),%ymm0 # 2ba54 <_sk_overlay_sse2_8bit+0x56f>
.byte 197,228,89,192 // vmulps %ymm0,%ymm3,%ymm0
- .byte 196,226,125,24,13,217,209,1,0 // vbroadcastss 0x1d1d9(%rip),%ymm1 # 2b520 <_sk_overlay_sse2_8bit+0x56b>
+ .byte 196,226,125,24,13,217,209,1,0 // vbroadcastss 0x1d1d9(%rip),%ymm1 # 2ba50 <_sk_overlay_sse2_8bit+0x56b>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,208,209,1,0 // vbroadcastss 0x1d1d0(%rip),%ymm1 # 2b528 <_sk_overlay_sse2_8bit+0x573>
+ .byte 196,226,125,24,13,208,209,1,0 // vbroadcastss 0x1d1d0(%rip),%ymm1 # 2ba58 <_sk_overlay_sse2_8bit+0x573>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,195,209,1,0 // vbroadcastss 0x1d1c3(%rip),%ymm1 # 2b52c <_sk_overlay_sse2_8bit+0x577>
+ .byte 196,226,125,24,13,195,209,1,0 // vbroadcastss 0x1d1c3(%rip),%ymm1 # 2ba5c <_sk_overlay_sse2_8bit+0x577>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 197,252,89,195 // vmulps %ymm3,%ymm0,%ymm0
- .byte 196,226,125,24,13,182,209,1,0 // vbroadcastss 0x1d1b6(%rip),%ymm1 # 2b530 <_sk_overlay_sse2_8bit+0x57b>
+ .byte 196,226,125,24,13,182,209,1,0 // vbroadcastss 0x1d1b6(%rip),%ymm1 # 2ba60 <_sk_overlay_sse2_8bit+0x57b>
.byte 197,252,88,193 // vaddps %ymm1,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
@@ -23357,12 +23646,12 @@ _sk_gradient_avx:
.byte 76,139,8 // mov (%rax),%r9
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,80 // jb e3fd <_sk_gradient_avx+0x6f>
+ .byte 114,80 // jb e92d <_sk_gradient_avx+0x6f>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 196,65,52,87,201 // vxorps %ymm9,%ymm9,%ymm9
- .byte 196,98,125,24,21,54,208,1,0 // vbroadcastss 0x1d036(%rip),%ymm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,125,24,21,54,208,1,0 // vbroadcastss 0x1d036(%rip),%ymm10 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 197,244,87,201 // vxorps %ymm1,%ymm1,%ymm1
.byte 196,98,125,24,3 // vbroadcastss (%rbx),%ymm8
.byte 197,60,194,192,2 // vcmpleps %ymm0,%ymm8,%ymm8
@@ -23374,7 +23663,7 @@ _sk_gradient_avx:
.byte 196,227,117,24,202,1 // vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,205 // jne e3ca <_sk_gradient_avx+0x3c>
+ .byte 117,205 // jne e8fa <_sk_gradient_avx+0x3c>
.byte 196,195,249,22,201,1 // vpextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -23557,27 +23846,27 @@ _sk_xy_to_unit_angle_avx:
.byte 196,65,52,95,226 // vmaxps %ymm10,%ymm9,%ymm12
.byte 196,65,36,94,220 // vdivps %ymm12,%ymm11,%ymm11
.byte 196,65,36,89,227 // vmulps %ymm11,%ymm11,%ymm12
- .byte 196,98,125,24,45,96,205,1,0 // vbroadcastss 0x1cd60(%rip),%ymm13 # 2b534 <_sk_overlay_sse2_8bit+0x57f>
+ .byte 196,98,125,24,45,96,205,1,0 // vbroadcastss 0x1cd60(%rip),%ymm13 # 2ba64 <_sk_overlay_sse2_8bit+0x57f>
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,86,205,1,0 // vbroadcastss 0x1cd56(%rip),%ymm14 # 2b538 <_sk_overlay_sse2_8bit+0x583>
+ .byte 196,98,125,24,53,86,205,1,0 // vbroadcastss 0x1cd56(%rip),%ymm14 # 2ba68 <_sk_overlay_sse2_8bit+0x583>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,237 // vmulps %ymm13,%ymm12,%ymm13
- .byte 196,98,125,24,53,71,205,1,0 // vbroadcastss 0x1cd47(%rip),%ymm14 # 2b53c <_sk_overlay_sse2_8bit+0x587>
+ .byte 196,98,125,24,53,71,205,1,0 // vbroadcastss 0x1cd47(%rip),%ymm14 # 2ba6c <_sk_overlay_sse2_8bit+0x587>
.byte 196,65,20,88,238 // vaddps %ymm14,%ymm13,%ymm13
.byte 196,65,28,89,229 // vmulps %ymm13,%ymm12,%ymm12
- .byte 196,98,125,24,45,56,205,1,0 // vbroadcastss 0x1cd38(%rip),%ymm13 # 2b540 <_sk_overlay_sse2_8bit+0x58b>
+ .byte 196,98,125,24,45,56,205,1,0 // vbroadcastss 0x1cd38(%rip),%ymm13 # 2ba70 <_sk_overlay_sse2_8bit+0x58b>
.byte 196,65,28,88,229 // vaddps %ymm13,%ymm12,%ymm12
.byte 196,65,36,89,220 // vmulps %ymm12,%ymm11,%ymm11
.byte 196,65,52,194,202,1 // vcmpltps %ymm10,%ymm9,%ymm9
- .byte 196,98,125,24,21,35,205,1,0 // vbroadcastss 0x1cd23(%rip),%ymm10 # 2b544 <_sk_overlay_sse2_8bit+0x58f>
+ .byte 196,98,125,24,21,35,205,1,0 // vbroadcastss 0x1cd23(%rip),%ymm10 # 2ba74 <_sk_overlay_sse2_8bit+0x58f>
.byte 196,65,44,92,211 // vsubps %ymm11,%ymm10,%ymm10
.byte 196,67,37,74,202,144 // vblendvps %ymm9,%ymm10,%ymm11,%ymm9
.byte 196,193,124,194,192,1 // vcmpltps %ymm8,%ymm0,%ymm0
- .byte 196,98,125,24,21,185,203,1,0 // vbroadcastss 0x1cbb9(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,185,203,1,0 // vbroadcastss 0x1cbb9(%rip),%ymm10 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,44,92,209 // vsubps %ymm9,%ymm10,%ymm10
.byte 196,195,53,74,194,0 // vblendvps %ymm0,%ymm10,%ymm9,%ymm0
.byte 196,65,116,194,200,1 // vcmpltps %ymm8,%ymm1,%ymm9
- .byte 196,98,125,24,21,163,203,1,0 // vbroadcastss 0x1cba3(%rip),%ymm10 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,21,163,203,1,0 // vbroadcastss 0x1cba3(%rip),%ymm10 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,44,92,208 // vsubps %ymm0,%ymm10,%ymm10
.byte 196,195,125,74,194,144 // vblendvps %ymm9,%ymm10,%ymm0,%ymm0
.byte 196,65,124,194,200,3 // vcmpunordps %ymm8,%ymm0,%ymm9
@@ -23607,7 +23896,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,153,204,1,0 // vbroadcastss 0x1cc99(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,153,204,1,0 // vbroadcastss 0x1cc99(%rip),%ymm11 # 2ba78 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -23616,17 +23905,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,109,204,1,0 // vbroadcastss 0x1cc6d(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,109,204,1,0 // vbroadcastss 0x1cc6d(%rip),%ymm9 # 2ba7c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,75,204,1,0 // vbroadcastss 0x1cc4b(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,75,204,1,0 // vbroadcastss 0x1cc4b(%rip),%ymm9 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,220,202,1,0 // vbroadcastss 0x1cadc(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,220,202,1,0 // vbroadcastss 0x1cadc(%rip),%ymm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -23646,7 +23935,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,67,121,4,210,0 // vpermilps $0x0,%xmm10,%xmm10
.byte 196,67,45,24,210,1 // vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
.byte 197,44,88,208 // vaddps %ymm0,%ymm10,%ymm10
- .byte 196,98,125,24,29,235,203,1,0 // vbroadcastss 0x1cbeb(%rip),%ymm11 # 2b548 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,29,235,203,1,0 // vbroadcastss 0x1cbeb(%rip),%ymm11 # 2ba78 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,44,89,211 // vmulps %ymm11,%ymm10,%ymm10
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,217 // vmulps %ymm1,%ymm1,%ymm11
@@ -23655,17 +23944,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,164,92,192 // vsubps %ymm0,%ymm11,%ymm0
- .byte 196,98,125,24,13,191,203,1,0 // vbroadcastss 0x1cbbf(%rip),%ymm9 # 2b54c <_sk_overlay_sse2_8bit+0x597>
+ .byte 196,98,125,24,13,191,203,1,0 // vbroadcastss 0x1cbbf(%rip),%ymm9 # 2ba7c <_sk_overlay_sse2_8bit+0x597>
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
.byte 197,188,89,192 // vmulps %ymm0,%ymm8,%ymm0
.byte 196,65,44,89,194 // vmulps %ymm10,%ymm10,%ymm8
.byte 196,193,124,88,192 // vaddps %ymm8,%ymm0,%ymm0
.byte 197,252,81,192 // vsqrtps %ymm0,%ymm0
.byte 196,98,125,24,64,36 // vbroadcastss 0x24(%rax),%ymm8
- .byte 196,98,125,24,13,157,203,1,0 // vbroadcastss 0x1cb9d(%rip),%ymm9 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,13,157,203,1,0 // vbroadcastss 0x1cb9d(%rip),%ymm9 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,65,44,87,201 // vxorps %ymm9,%ymm10,%ymm9
.byte 196,65,124,92,210 // vsubps %ymm10,%ymm0,%ymm10
- .byte 196,98,125,24,29,46,202,1,0 // vbroadcastss 0x1ca2e(%rip),%ymm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,29,46,202,1,0 // vbroadcastss 0x1ca2e(%rip),%ymm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,60,89,195 // vmulps %ymm11,%ymm8,%ymm8
.byte 196,65,60,89,210 // vmulps %ymm10,%ymm8,%ymm10
.byte 197,180,92,192 // vsubps %ymm0,%ymm9,%ymm0
@@ -23684,7 +23973,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,67,121,4,201,0 // vpermilps $0x0,%xmm9,%xmm9
.byte 196,67,53,24,201,1 // vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
.byte 197,52,88,200 // vaddps %ymm0,%ymm9,%ymm9
- .byte 196,98,125,24,21,67,203,1,0 // vbroadcastss 0x1cb43(%rip),%ymm10 # 2b548 <_sk_overlay_sse2_8bit+0x593>
+ .byte 196,98,125,24,21,67,203,1,0 // vbroadcastss 0x1cb43(%rip),%ymm10 # 2ba78 <_sk_overlay_sse2_8bit+0x593>
.byte 196,65,52,89,202 // vmulps %ymm10,%ymm9,%ymm9
.byte 197,252,89,192 // vmulps %ymm0,%ymm0,%ymm0
.byte 197,116,89,209 // vmulps %ymm1,%ymm1,%ymm10
@@ -23693,7 +23982,7 @@ _sk_xy_to_2pt_conical_linear_avx:
.byte 196,227,121,4,192,0 // vpermilps $0x0,%xmm0,%xmm0
.byte 196,227,125,24,192,1 // vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
.byte 197,172,92,192 // vsubps %ymm0,%ymm10,%ymm0
- .byte 196,98,125,24,5,27,203,1,0 // vbroadcastss 0x1cb1b(%rip),%ymm8 # 2b550 <_sk_overlay_sse2_8bit+0x59b>
+ .byte 196,98,125,24,5,27,203,1,0 // vbroadcastss 0x1cb1b(%rip),%ymm8 # 2ba80 <_sk_overlay_sse2_8bit+0x59b>
.byte 196,193,124,87,192 // vxorps %ymm8,%ymm0,%ymm0
.byte 196,193,124,94,193 // vdivps %ymm9,%ymm0,%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23734,7 +24023,7 @@ HIDDEN _sk_save_xy_avx
FUNCTION(_sk_save_xy_avx)
_sk_save_xy_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,87,201,1,0 // vbroadcastss 0x1c957(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,87,201,1,0 // vbroadcastss 0x1c957(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,124,88,200 // vaddps %ymm8,%ymm0,%ymm9
.byte 196,67,125,8,209,1 // vroundps $0x1,%ymm9,%ymm10
.byte 196,65,52,92,202 // vsubps %ymm10,%ymm9,%ymm9
@@ -23771,9 +24060,9 @@ HIDDEN _sk_bilinear_nx_avx
FUNCTION(_sk_bilinear_nx_avx)
_sk_bilinear_nx_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,63,202,1,0 // vbroadcastss 0x1ca3f(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,63,202,1,0 // vbroadcastss 0x1ca3f(%rip),%ymm0 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,214,200,1,0 // vbroadcastss 0x1c8d6(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,214,200,1,0 // vbroadcastss 0x1c8d6(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23784,7 +24073,7 @@ HIDDEN _sk_bilinear_px_avx
FUNCTION(_sk_bilinear_px_avx)
_sk_bilinear_px_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,182,200,1,0 // vbroadcastss 0x1c8b6(%rip),%ymm0 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,5,182,200,1,0 // vbroadcastss 0x1c8b6(%rip),%ymm0 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -23796,9 +24085,9 @@ HIDDEN _sk_bilinear_ny_avx
FUNCTION(_sk_bilinear_ny_avx)
_sk_bilinear_ny_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,246,201,1,0 // vbroadcastss 0x1c9f6(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,246,201,1,0 // vbroadcastss 0x1c9f6(%rip),%ymm1 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,140,200,1,0 // vbroadcastss 0x1c88c(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,140,200,1,0 // vbroadcastss 0x1c88c(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23809,7 +24098,7 @@ HIDDEN _sk_bilinear_py_avx
FUNCTION(_sk_bilinear_py_avx)
_sk_bilinear_py_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,108,200,1,0 // vbroadcastss 0x1c86c(%rip),%ymm1 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,226,125,24,13,108,200,1,0 // vbroadcastss 0x1c86c(%rip),%ymm1 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -23821,14 +24110,14 @@ HIDDEN _sk_bicubic_n3x_avx
FUNCTION(_sk_bicubic_n3x_avx)
_sk_bicubic_n3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,175,201,1,0 // vbroadcastss 0x1c9af(%rip),%ymm0 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,5,175,201,1,0 // vbroadcastss 0x1c9af(%rip),%ymm0 # 2ba88 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,66,200,1,0 // vbroadcastss 0x1c842(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,66,200,1,0 // vbroadcastss 0x1c842(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,147,201,1,0 // vbroadcastss 0x1c993(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,147,201,1,0 // vbroadcastss 0x1c993(%rip),%ymm10 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,145,200,1,0 // vbroadcastss 0x1c891(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,145,200,1,0 // vbroadcastss 0x1c891(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -23840,19 +24129,19 @@ HIDDEN _sk_bicubic_n1x_avx
FUNCTION(_sk_bicubic_n1x_avx)
_sk_bicubic_n1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,92,201,1,0 // vbroadcastss 0x1c95c(%rip),%ymm0 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,5,92,201,1,0 // vbroadcastss 0x1c95c(%rip),%ymm0 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
- .byte 196,98,125,24,5,243,199,1,0 // vbroadcastss 0x1c7f3(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,243,199,1,0 // vbroadcastss 0x1c7f3(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,64 // vsubps 0x40(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,81,201,1,0 // vbroadcastss 0x1c951(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,81,201,1,0 // vbroadcastss 0x1c951(%rip),%ymm9 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,63,201,1,0 // vbroadcastss 0x1c93f(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,63,201,1,0 // vbroadcastss 0x1c93f(%rip),%ymm10 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,192,199,1,0 // vbroadcastss 0x1c7c0(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,192,199,1,0 // vbroadcastss 0x1c7c0(%rip),%ymm10 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,33,201,1,0 // vbroadcastss 0x1c921(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,33,201,1,0 // vbroadcastss 0x1c921(%rip),%ymm9 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23863,17 +24152,17 @@ HIDDEN _sk_bicubic_p1x_avx
FUNCTION(_sk_bicubic_p1x_avx)
_sk_bicubic_p1x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,145,199,1,0 // vbroadcastss 0x1c791(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,145,199,1,0 // vbroadcastss 0x1c791(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,0 // vaddps (%rax),%ymm8,%ymm0
.byte 197,124,16,72,64 // vmovups 0x40(%rax),%ymm9
- .byte 196,98,125,24,21,239,200,1,0 // vbroadcastss 0x1c8ef(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,239,200,1,0 // vbroadcastss 0x1c8ef(%rip),%ymm10 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,221,200,1,0 // vbroadcastss 0x1c8dd(%rip),%ymm11 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,200,200,1,0 // vbroadcastss 0x1c8c8(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,200,200,1,0 // vbroadcastss 0x1c8c8(%rip),%ymm9 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23884,13 +24173,13 @@ HIDDEN _sk_bicubic_p3x_avx
FUNCTION(_sk_bicubic_p3x_avx)
_sk_bicubic_p3x_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,164,200,1,0 // vbroadcastss 0x1c8a4(%rip),%ymm0 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,5,164,200,1,0 // vbroadcastss 0x1c8a4(%rip),%ymm0 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,252,88,0 // vaddps (%rax),%ymm0,%ymm0
.byte 197,124,16,64,64 // vmovups 0x40(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,137,200,1,0 // vbroadcastss 0x1c889(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,137,200,1,0 // vbroadcastss 0x1c889(%rip),%ymm10 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,135,199,1,0 // vbroadcastss 0x1c787(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,135,199,1,0 // vbroadcastss 0x1c787(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,128,0,0,0 // vmovups %ymm8,0x80(%rax)
@@ -23902,14 +24191,14 @@ HIDDEN _sk_bicubic_n3y_avx
FUNCTION(_sk_bicubic_n3y_avx)
_sk_bicubic_n3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,86,200,1,0 // vbroadcastss 0x1c856(%rip),%ymm1 # 2b558 <_sk_overlay_sse2_8bit+0x5a3>
+ .byte 196,226,125,24,13,86,200,1,0 // vbroadcastss 0x1c856(%rip),%ymm1 # 2ba88 <_sk_overlay_sse2_8bit+0x5a3>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,232,198,1,0 // vbroadcastss 0x1c6e8(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,232,198,1,0 // vbroadcastss 0x1c6e8(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,57,200,1,0 // vbroadcastss 0x1c839(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,57,200,1,0 // vbroadcastss 0x1c839(%rip),%ymm10 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,55,199,1,0 // vbroadcastss 0x1c737(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,55,199,1,0 // vbroadcastss 0x1c737(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -23921,19 +24210,19 @@ HIDDEN _sk_bicubic_n1y_avx
FUNCTION(_sk_bicubic_n1y_avx)
_sk_bicubic_n1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,2,200,1,0 // vbroadcastss 0x1c802(%rip),%ymm1 # 2b554 <_sk_overlay_sse2_8bit+0x59f>
+ .byte 196,226,125,24,13,2,200,1,0 // vbroadcastss 0x1c802(%rip),%ymm1 # 2ba84 <_sk_overlay_sse2_8bit+0x59f>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
- .byte 196,98,125,24,5,152,198,1,0 // vbroadcastss 0x1c698(%rip),%ymm8 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,98,125,24,5,152,198,1,0 // vbroadcastss 0x1c698(%rip),%ymm8 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,60,92,64,96 // vsubps 0x60(%rax),%ymm8,%ymm8
- .byte 196,98,125,24,13,246,199,1,0 // vbroadcastss 0x1c7f6(%rip),%ymm9 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,13,246,199,1,0 // vbroadcastss 0x1c7f6(%rip),%ymm9 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,228,199,1,0 // vbroadcastss 0x1c7e4(%rip),%ymm10 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,21,228,199,1,0 // vbroadcastss 0x1c7e4(%rip),%ymm10 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,201 // vmulps %ymm9,%ymm8,%ymm9
- .byte 196,98,125,24,21,101,198,1,0 // vbroadcastss 0x1c665(%rip),%ymm10 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,21,101,198,1,0 // vbroadcastss 0x1c665(%rip),%ymm10 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 196,65,52,88,202 // vaddps %ymm10,%ymm9,%ymm9
.byte 196,65,60,89,193 // vmulps %ymm9,%ymm8,%ymm8
- .byte 196,98,125,24,13,198,199,1,0 // vbroadcastss 0x1c7c6(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,198,199,1,0 // vbroadcastss 0x1c7c6(%rip),%ymm9 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23944,17 +24233,17 @@ HIDDEN _sk_bicubic_p1y_avx
FUNCTION(_sk_bicubic_p1y_avx)
_sk_bicubic_p1y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,98,125,24,5,54,198,1,0 // vbroadcastss 0x1c636(%rip),%ymm8 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 196,98,125,24,5,54,198,1,0 // vbroadcastss 0x1c636(%rip),%ymm8 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 197,188,88,72,32 // vaddps 0x20(%rax),%ymm8,%ymm1
.byte 197,124,16,72,96 // vmovups 0x60(%rax),%ymm9
- .byte 196,98,125,24,21,147,199,1,0 // vbroadcastss 0x1c793(%rip),%ymm10 # 2b564 <_sk_overlay_sse2_8bit+0x5af>
+ .byte 196,98,125,24,21,147,199,1,0 // vbroadcastss 0x1c793(%rip),%ymm10 # 2ba94 <_sk_overlay_sse2_8bit+0x5af>
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
- .byte 196,98,125,24,29,129,199,1,0 // vbroadcastss 0x1c781(%rip),%ymm11 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,98,125,24,29,129,199,1,0 // vbroadcastss 0x1c781(%rip),%ymm11 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 196,65,44,88,211 // vaddps %ymm11,%ymm10,%ymm10
.byte 196,65,52,89,210 // vmulps %ymm10,%ymm9,%ymm10
.byte 196,65,44,88,192 // vaddps %ymm8,%ymm10,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
- .byte 196,98,125,24,13,108,199,1,0 // vbroadcastss 0x1c76c(%rip),%ymm9 # 2b568 <_sk_overlay_sse2_8bit+0x5b3>
+ .byte 196,98,125,24,13,108,199,1,0 // vbroadcastss 0x1c76c(%rip),%ymm9 # 2ba98 <_sk_overlay_sse2_8bit+0x5b3>
.byte 196,65,60,88,193 // vaddps %ymm9,%ymm8,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -23965,13 +24254,13 @@ HIDDEN _sk_bicubic_p3y_avx
FUNCTION(_sk_bicubic_p3y_avx)
_sk_bicubic_p3y_avx:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,13,72,199,1,0 // vbroadcastss 0x1c748(%rip),%ymm1 # 2b560 <_sk_overlay_sse2_8bit+0x5ab>
+ .byte 196,226,125,24,13,72,199,1,0 // vbroadcastss 0x1c748(%rip),%ymm1 # 2ba90 <_sk_overlay_sse2_8bit+0x5ab>
.byte 197,244,88,72,32 // vaddps 0x20(%rax),%ymm1,%ymm1
.byte 197,124,16,64,96 // vmovups 0x60(%rax),%ymm8
.byte 196,65,60,89,200 // vmulps %ymm8,%ymm8,%ymm9
- .byte 196,98,125,24,21,44,199,1,0 // vbroadcastss 0x1c72c(%rip),%ymm10 # 2b55c <_sk_overlay_sse2_8bit+0x5a7>
+ .byte 196,98,125,24,21,44,199,1,0 // vbroadcastss 0x1c72c(%rip),%ymm10 # 2ba8c <_sk_overlay_sse2_8bit+0x5a7>
.byte 196,65,60,89,194 // vmulps %ymm10,%ymm8,%ymm8
- .byte 196,98,125,24,21,42,198,1,0 // vbroadcastss 0x1c62a(%rip),%ymm10 # 2b468 <_sk_overlay_sse2_8bit+0x4b3>
+ .byte 196,98,125,24,21,42,198,1,0 // vbroadcastss 0x1c62a(%rip),%ymm10 # 2b998 <_sk_overlay_sse2_8bit+0x4b3>
.byte 196,65,60,88,194 // vaddps %ymm10,%ymm8,%ymm8
.byte 196,65,52,89,192 // vmulps %ymm8,%ymm9,%ymm8
.byte 197,124,17,128,160,0,0,0 // vmovups %ymm8,0xa0(%rax)
@@ -24117,7 +24406,7 @@ _sk_clut_3D_avx:
.byte 197,249,127,68,36,224 // vmovdqa %xmm0,-0x20(%rsp)
.byte 72,139,0 // mov (%rax),%rax
.byte 196,193,121,254,194 // vpaddd %xmm10,%xmm0,%xmm0
- .byte 196,98,121,24,29,194,196,1,0 // vbroadcastss 0x1c4c2(%rip),%xmm11 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,121,24,29,194,196,1,0 // vbroadcastss 0x1c4c2(%rip),%xmm11 # 2baa0 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,121,64,203 // vpmulld %xmm11,%xmm0,%xmm1
.byte 196,193,249,126,201 // vmovq %xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
@@ -24151,7 +24440,7 @@ _sk_clut_3D_avx:
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,227,93,24,223,1 // vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
.byte 197,252,17,92,36,64 // vmovups %ymm3,0x40(%rsp)
- .byte 196,98,121,24,13,141,194,1,0 // vbroadcastss 0x1c28d(%rip),%xmm9 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,121,24,13,141,194,1,0 // vbroadcastss 0x1c28d(%rip),%xmm9 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,193,105,254,249 // vpaddd %xmm9,%xmm2,%xmm7
.byte 196,195,249,22,249,1 // vpextrq $0x1,%xmm7,%r9
.byte 196,193,249,126,250 // vmovq %xmm7,%r10
@@ -24179,7 +24468,7 @@ _sk_clut_3D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,254,1 // vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- .byte 196,98,121,24,37,0,194,1,0 // vbroadcastss 0x1c200(%rip),%xmm12 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,121,24,37,0,194,1,0 // vbroadcastss 0x1c200(%rip),%xmm12 # 2b934 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,105,254,212 // vpaddd %xmm12,%xmm2,%xmm2
.byte 196,195,249,22,209,1 // vpextrq $0x1,%xmm2,%r9
.byte 196,193,249,126,210 // vmovq %xmm2,%r10
@@ -24207,7 +24496,7 @@ _sk_clut_3D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,105,33,213,48 // vinsertps $0x30,%xmm5,%xmm2,%xmm2
.byte 196,227,109,24,225,1 // vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- .byte 196,226,125,24,13,212,194,1,0 // vbroadcastss 0x1c2d4(%rip),%ymm1 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,226,125,24,13,212,194,1,0 // vbroadcastss 0x1c2d4(%rip),%ymm1 # 2ba9c <_sk_overlay_sse2_8bit+0x5b7>
.byte 197,188,88,209 // vaddps %ymm1,%ymm8,%ymm2
.byte 197,252,17,76,36,32 // vmovups %ymm1,0x20(%rsp)
.byte 197,254,91,210 // vcvttps2dq %ymm2,%ymm2
@@ -24962,7 +25251,7 @@ _sk_clut_4D_avx:
.byte 196,226,25,64,200 // vpmulld %xmm0,%xmm12,%xmm1
.byte 197,249,127,76,36,128 // vmovdqa %xmm1,-0x80(%rsp)
.byte 197,241,254,202 // vpaddd %xmm2,%xmm1,%xmm1
- .byte 196,98,121,24,61,130,179,1,0 // vbroadcastss 0x1b382(%rip),%xmm15 # 2b570 <_sk_overlay_sse2_8bit+0x5bb>
+ .byte 196,98,121,24,61,130,179,1,0 // vbroadcastss 0x1b382(%rip),%xmm15 # 2baa0 <_sk_overlay_sse2_8bit+0x5bb>
.byte 196,194,113,64,247 // vpmulld %xmm15,%xmm1,%xmm6
.byte 196,193,249,126,241 // vmovq %xmm6,%r9
.byte 69,137,202 // mov %r9d,%r10d
@@ -25000,7 +25289,7 @@ _sk_clut_4D_avx:
.byte 196,163,65,33,60,144,32 // vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
.byte 196,163,65,33,60,152,48 // vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
.byte 196,99,53,24,247,1 // vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- .byte 196,98,121,24,21,53,177,1,0 // vbroadcastss 0x1b135(%rip),%xmm10 # 2b3fc <_sk_overlay_sse2_8bit+0x447>
+ .byte 196,98,121,24,21,53,177,1,0 // vbroadcastss 0x1b135(%rip),%xmm10 # 2b92c <_sk_overlay_sse2_8bit+0x447>
.byte 196,65,97,254,202 // vpaddd %xmm10,%xmm3,%xmm9
.byte 196,67,249,22,201,1 // vpextrq $0x1,%xmm9,%r9
.byte 196,65,249,126,202 // vmovq %xmm9,%r10
@@ -25028,7 +25317,7 @@ _sk_clut_4D_avx:
.byte 196,161,122,16,60,152 // vmovss (%rax,%r11,4),%xmm7
.byte 196,227,81,33,239,48 // vinsertps $0x30,%xmm7,%xmm5,%xmm5
.byte 196,99,85,24,220,1 // vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- .byte 196,98,121,24,13,168,176,1,0 // vbroadcastss 0x1b0a8(%rip),%xmm9 # 2b404 <_sk_overlay_sse2_8bit+0x44f>
+ .byte 196,98,121,24,13,168,176,1,0 // vbroadcastss 0x1b0a8(%rip),%xmm9 # 2b934 <_sk_overlay_sse2_8bit+0x44f>
.byte 196,193,97,254,217 // vpaddd %xmm9,%xmm3,%xmm3
.byte 196,195,249,22,217,1 // vpextrq $0x1,%xmm3,%r9
.byte 196,193,249,126,218 // vmovq %xmm3,%r10
@@ -25056,7 +25345,7 @@ _sk_clut_4D_avx:
.byte 197,250,16,44,152 // vmovss (%rax,%rbx,4),%xmm5
.byte 196,227,89,33,229,48 // vinsertps $0x30,%xmm5,%xmm4,%xmm4
.byte 196,227,93,24,243,1 // vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- .byte 196,226,125,24,37,124,177,1,0 // vbroadcastss 0x1b17c(%rip),%ymm4 # 2b56c <_sk_overlay_sse2_8bit+0x5b7>
+ .byte 196,226,125,24,37,124,177,1,0 // vbroadcastss 0x1b17c(%rip),%ymm4 # 2ba9c <_sk_overlay_sse2_8bit+0x5b7>
.byte 197,148,88,220 // vaddps %ymm4,%ymm13,%ymm3
.byte 197,252,40,252 // vmovaps %ymm4,%ymm7
.byte 197,252,17,124,36,32 // vmovups %ymm7,0x20(%rsp)
@@ -26486,7 +26775,7 @@ _sk_clut_4D_avx:
.byte 197,220,89,210 // vmulps %ymm2,%ymm4,%ymm2
.byte 197,212,88,210 // vaddps %ymm2,%ymm5,%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,29,140,146,1,0 // vbroadcastss 0x1928c(%rip),%ymm3 # 2b3f8 <_sk_overlay_sse2_8bit+0x443>
+ .byte 196,226,125,24,29,140,146,1,0 // vbroadcastss 0x1928c(%rip),%ymm3 # 2b928 <_sk_overlay_sse2_8bit+0x443>
.byte 197,252,16,164,36,32,2,0,0 // vmovups 0x220(%rsp),%ymm4
.byte 197,252,16,172,36,64,2,0,0 // vmovups 0x240(%rsp),%ymm5
.byte 197,252,16,180,36,96,2,0,0 // vmovups 0x260(%rsp),%ymm6
@@ -26517,7 +26806,7 @@ _sk_start_pipeline_sse41:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 1223f <_sk_start_pipeline_sse41+0xa1>
+ .byte 115,117 // jae 1276f <_sk_start_pipeline_sse41+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -26527,7 +26816,7 @@ _sk_start_pipeline_sse41:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,45 // ja 1221b <_sk_start_pipeline_sse41+0x7d>
+ .byte 119,45 // ja 1274b <_sk_start_pipeline_sse41+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -26541,10 +26830,10 @@ _sk_start_pipeline_sse41:
.byte 73,131,199,8 // add $0x8,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 121f2 <_sk_start_pipeline_sse41+0x54>
+ .byte 118,215 // jbe 12722 <_sk_start_pipeline_sse41+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 12236 <_sk_start_pipeline_sse41+0x98>
+ .byte 116,19 // je 12766 <_sk_start_pipeline_sse41+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -26553,7 +26842,7 @@ _sk_start_pipeline_sse41:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 121e4 <_sk_start_pipeline_sse41+0x46>
+ .byte 117,165 // jne 12714 <_sk_start_pipeline_sse41+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -26576,7 +26865,7 @@ _sk_seed_shader_sse41:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,94,155,1,0 // movaps 0x19b5e(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,40,21,110,155,1,0 // movaps 0x19b6e(%rip),%xmm2 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -26585,7 +26874,7 @@ _sk_seed_shader_sse41:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,77,155,1,0 // movaps 0x19b4d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,93,155,1,0 // movaps 0x19b5d(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -26605,14 +26894,14 @@ _sk_dither_sse41:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,27,155,1,0 // movdqa 0x19b1b(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,21,43,155,1,0 // movdqa 0x19b2b(%rip),%xmm10 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,7,155,1,0 // movdqa 0x19b07(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b>
- .byte 102,68,15,111,45,14,155,1,0 // movdqa 0x19b0e(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,37,23,155,1,0 // movdqa 0x19b17(%rip),%xmm12 # 2c330 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,45,30,155,1,0 // movdqa 0x19b1e(%rip),%xmm13 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -26628,8 +26917,8 @@ _sk_dither_sse41:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,201,154,1,0 // mulps 0x19ac9(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b>
- .byte 68,15,88,5,209,154,1,0 // addps 0x19ad1(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b>
+ .byte 68,15,89,5,217,154,1,0 // mulps 0x19ad9(%rip),%xmm8 # 2c350 <_sk_overlay_sse2_8bit+0xe6b>
+ .byte 68,15,88,5,225,154,1,0 // addps 0x19ae1(%rip),%xmm8 # 2c360 <_sk_overlay_sse2_8bit+0xe7b>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -26671,7 +26960,7 @@ HIDDEN _sk_black_color_sse41
FUNCTION(_sk_black_color_sse41)
_sk_black_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,7,154,1,0 // movaps 0x19a07(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,23,154,1,0 // movaps 0x19a17(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -26682,7 +26971,7 @@ HIDDEN _sk_white_color_sse41
FUNCTION(_sk_white_color_sse41)
_sk_white_color_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,243,153,1,0 // movaps 0x199f3(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,5,3,154,1,0 // movaps 0x19a03(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -26728,7 +27017,7 @@ HIDDEN _sk_srcatop_sse41
FUNCTION(_sk_srcatop_sse41)
_sk_srcatop_sse41:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,163,153,1,0 // movaps 0x199a3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,179,153,1,0 // movaps 0x199b3(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -26753,7 +27042,7 @@ FUNCTION(_sk_dstatop_sse41)
_sk_dstatop_sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,86,153,1,0 // movaps 0x19956(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,102,153,1,0 // movaps 0x19966(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -26800,7 +27089,7 @@ HIDDEN _sk_srcout_sse41
.globl _sk_srcout_sse41
FUNCTION(_sk_srcout_sse41)
_sk_srcout_sse41:
- .byte 68,15,40,5,234,152,1,0 // movaps 0x198ea(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,250,152,1,0 // movaps 0x198fa(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -26813,7 +27102,7 @@ HIDDEN _sk_dstout_sse41
.globl _sk_dstout_sse41
FUNCTION(_sk_dstout_sse41)
_sk_dstout_sse41:
- .byte 68,15,40,5,202,152,1,0 // movaps 0x198ca(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,218,152,1,0 // movaps 0x198da(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -26830,7 +27119,7 @@ HIDDEN _sk_srcover_sse41
.globl _sk_srcover_sse41
FUNCTION(_sk_srcover_sse41)
_sk_srcover_sse41:
- .byte 68,15,40,5,157,152,1,0 // movaps 0x1989d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,173,152,1,0 // movaps 0x198ad(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -26850,7 +27139,7 @@ HIDDEN _sk_dstover_sse41
.globl _sk_dstover_sse41
FUNCTION(_sk_dstover_sse41)
_sk_dstover_sse41:
- .byte 68,15,40,5,97,152,1,0 // movaps 0x19861(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,113,152,1,0 // movaps 0x19871(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -26878,7 +27167,7 @@ HIDDEN _sk_multiply_sse41
.globl _sk_multiply_sse41
FUNCTION(_sk_multiply_sse41)
_sk_multiply_sse41:
- .byte 68,15,40,5,37,152,1,0 // movaps 0x19825(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,53,152,1,0 // movaps 0x19835(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -26916,7 +27205,7 @@ HIDDEN _sk_plus__sse41
FUNCTION(_sk_plus__sse41)
_sk_plus__sse41:
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 68,15,40,5,166,151,1,0 // movaps 0x197a6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,182,151,1,0 // movaps 0x197b6(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 65,15,93,200 // minps %xmm8,%xmm1
@@ -26958,7 +27247,7 @@ HIDDEN _sk_xor__sse41
FUNCTION(_sk_xor__sse41)
_sk_xor__sse41:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,50,151,1,0 // movaps 0x19732(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,66,151,1,0 // movaps 0x19742(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -27006,7 +27295,7 @@ _sk_darken_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,141,150,1,0 // movaps 0x1968d(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,157,150,1,0 // movaps 0x1969d(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27040,7 +27329,7 @@ _sk_lighten_sse41:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,34,150,1,0 // movaps 0x19622(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,50,150,1,0 // movaps 0x19632(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27077,7 +27366,7 @@ _sk_difference_sse41:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,172,149,1,0 // movaps 0x195ac(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,188,149,1,0 // movaps 0x195bc(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27105,7 +27394,7 @@ _sk_exclusion_sse41:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,92,149,1,0 // movaps 0x1955c(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,108,149,1,0 // movaps 0x1956c(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -27117,7 +27406,7 @@ HIDDEN _sk_colorburn_sse41
.globl _sk_colorburn_sse41
FUNCTION(_sk_colorburn_sse41)
_sk_colorburn_sse41:
- .byte 68,15,40,29,67,149,1,0 // movaps 0x19543(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,29,83,149,1,0 // movaps 0x19553(%rip),%xmm11 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 68,15,92,231 // subps %xmm7,%xmm12
.byte 69,15,40,204 // movaps %xmm12,%xmm9
@@ -27201,7 +27490,7 @@ HIDDEN _sk_colordodge_sse41
FUNCTION(_sk_colordodge_sse41)
_sk_colordodge_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,21,13,148,1,0 // movaps 0x1940d(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,29,148,1,0 // movaps 0x1941d(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -27283,7 +27572,7 @@ _sk_hardlight_sse41:
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 15,40,227 // movaps %xmm3,%xmm4
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,216,146,1,0 // movaps 0x192d8(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,232,146,1,0 // movaps 0x192e8(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,40,234 // movaps %xmm10,%xmm5
.byte 15,92,239 // subps %xmm7,%xmm5
.byte 15,40,197 // movaps %xmm5,%xmm0
@@ -27366,7 +27655,7 @@ FUNCTION(_sk_overlay_sse41)
_sk_overlay_sse41:
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,40,240 // movaps %xmm0,%xmm14
- .byte 68,15,40,21,173,145,1,0 // movaps 0x191ad(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,189,145,1,0 // movaps 0x191bd(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -27451,7 +27740,7 @@ _sk_softlight_sse41:
.byte 15,40,198 // movaps %xmm6,%xmm0
.byte 15,94,199 // divps %xmm7,%xmm0
.byte 65,15,84,193 // andps %xmm9,%xmm0
- .byte 15,40,13,116,144,1,0 // movaps 0x19074(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,13,132,144,1,0 // movaps 0x19084(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 68,15,40,240 // movaps %xmm0,%xmm14
@@ -27464,10 +27753,10 @@ _sk_softlight_sse41:
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,89,210 // mulps %xmm2,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,40,45,162,144,1,0 // movaps 0x190a2(%rip),%xmm13 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
+ .byte 68,15,40,45,178,144,1,0 // movaps 0x190b2(%rip),%xmm13 # 2c370 <_sk_overlay_sse2_8bit+0xe8b>
.byte 69,15,88,245 // addps %xmm13,%xmm14
.byte 68,15,89,242 // mulps %xmm2,%xmm14
- .byte 68,15,40,37,162,144,1,0 // movaps 0x190a2(%rip),%xmm12 # 2be40 <_sk_overlay_sse2_8bit+0xe8b>
+ .byte 68,15,40,37,178,144,1,0 // movaps 0x190b2(%rip),%xmm12 # 2c380 <_sk_overlay_sse2_8bit+0xe9b>
.byte 69,15,89,252 // mulps %xmm12,%xmm15
.byte 69,15,88,254 // addps %xmm14,%xmm15
.byte 15,40,198 // movaps %xmm6,%xmm0
@@ -27653,12 +27942,12 @@ _sk_hue_sse41:
.byte 68,15,84,208 // andps %xmm0,%xmm10
.byte 15,84,200 // andps %xmm0,%xmm1
.byte 68,15,84,232 // andps %xmm0,%xmm13
- .byte 15,40,5,13,142,1,0 // movaps 0x18e0d(%rip),%xmm0 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 15,40,5,29,142,1,0 // movaps 0x18e1d(%rip),%xmm0 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,89,224 // mulps %xmm0,%xmm12
- .byte 15,40,21,18,142,1,0 // movaps 0x18e12(%rip),%xmm2 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 15,40,21,34,142,1,0 // movaps 0x18e22(%rip),%xmm2 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 15,89,250 // mulps %xmm2,%xmm7
.byte 65,15,88,252 // addps %xmm12,%xmm7
- .byte 68,15,40,53,19,142,1,0 // movaps 0x18e13(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,53,35,142,1,0 // movaps 0x18e23(%rip),%xmm14 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 68,15,40,252 // movaps %xmm4,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,255 // addps %xmm7,%xmm15
@@ -27741,7 +28030,7 @@ _sk_hue_sse41:
.byte 65,15,88,214 // addps %xmm14,%xmm2
.byte 15,40,196 // movaps %xmm4,%xmm0
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,40,13,39,140,1,0 // movaps 0x18c27(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,55,140,1,0 // movaps 0x18c37(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,40,225 // movaps %xmm9,%xmm4
.byte 15,92,229 // subps %xmm5,%xmm4
.byte 15,40,68,36,200 // movaps -0x38(%rsp),%xmm0
@@ -27835,14 +28124,14 @@ _sk_saturation_sse41:
.byte 68,15,84,215 // andps %xmm7,%xmm10
.byte 68,15,84,223 // andps %xmm7,%xmm11
.byte 68,15,84,199 // andps %xmm7,%xmm8
- .byte 15,40,21,81,139,1,0 // movaps 0x18b51(%rip),%xmm2 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 15,40,21,97,139,1,0 // movaps 0x18b61(%rip),%xmm2 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,218 // mulps %xmm2,%xmm3
- .byte 15,40,13,84,139,1,0 // movaps 0x18b54(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 15,40,13,100,139,1,0 // movaps 0x18b64(%rip),%xmm1 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 15,40,254 // movaps %xmm6,%xmm7
.byte 15,89,249 // mulps %xmm1,%xmm7
.byte 15,88,251 // addps %xmm3,%xmm7
- .byte 68,15,40,45,83,139,1,0 // movaps 0x18b53(%rip),%xmm13 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,45,99,139,1,0 // movaps 0x18b63(%rip),%xmm13 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 68,15,88,247 // addps %xmm7,%xmm14
.byte 65,15,40,218 // movaps %xmm10,%xmm3
@@ -27923,7 +28212,7 @@ _sk_saturation_sse41:
.byte 65,15,88,253 // addps %xmm13,%xmm7
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 102,68,15,56,20,223 // blendvps %xmm0,%xmm7,%xmm11
- .byte 68,15,40,13,105,137,1,0 // movaps 0x18969(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,121,137,1,0 // movaps 0x18979(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 68,15,92,204 // subps %xmm4,%xmm9
.byte 15,40,124,36,168 // movaps -0x58(%rsp),%xmm7
@@ -27978,14 +28267,14 @@ _sk_color_sse41:
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 68,15,89,244 // mulps %xmm4,%xmm14
.byte 15,89,204 // mulps %xmm4,%xmm1
- .byte 68,15,40,13,36,137,1,0 // movaps 0x18924(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,13,52,137,1,0 // movaps 0x18934(%rip),%xmm9 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,40,250 // movaps %xmm10,%xmm7
.byte 65,15,89,249 // mulps %xmm9,%xmm7
- .byte 68,15,40,21,36,137,1,0 // movaps 0x18924(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 68,15,40,21,52,137,1,0 // movaps 0x18934(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 65,15,40,219 // movaps %xmm11,%xmm3
.byte 65,15,89,218 // mulps %xmm10,%xmm3
.byte 15,88,223 // addps %xmm7,%xmm3
- .byte 68,15,40,29,33,137,1,0 // movaps 0x18921(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,29,49,137,1,0 // movaps 0x18931(%rip),%xmm11 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
@@ -28070,7 +28359,7 @@ _sk_color_sse41:
.byte 65,15,88,251 // addps %xmm11,%xmm7
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,15,56,20,207 // blendvps %xmm0,%xmm7,%xmm1
- .byte 68,15,40,13,45,135,1,0 // movaps 0x1872d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,61,135,1,0 // movaps 0x1873d(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 68,15,89,192 // mulps %xmm0,%xmm8
@@ -28122,13 +28411,13 @@ _sk_luminosity_sse41:
.byte 69,15,89,216 // mulps %xmm8,%xmm11
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,89,205 // mulps %xmm5,%xmm9
- .byte 68,15,40,5,245,134,1,0 // movaps 0x186f5(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,5,5,135,1,0 // movaps 0x18705(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
- .byte 68,15,40,21,249,134,1,0 // movaps 0x186f9(%rip),%xmm10 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 68,15,40,21,9,135,1,0 // movaps 0x18709(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 15,40,233 // movaps %xmm1,%xmm5
.byte 65,15,89,234 // mulps %xmm10,%xmm5
.byte 15,88,232 // addps %xmm0,%xmm5
- .byte 68,15,40,37,247,134,1,0 // movaps 0x186f7(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,37,7,135,1,0 // movaps 0x18707(%rip),%xmm12 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 68,15,40,242 // movaps %xmm2,%xmm14
.byte 69,15,89,244 // mulps %xmm12,%xmm14
.byte 68,15,88,245 // addps %xmm5,%xmm14
@@ -28213,7 +28502,7 @@ _sk_luminosity_sse41:
.byte 65,15,88,244 // addps %xmm12,%xmm6
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 102,68,15,56,20,206 // blendvps %xmm0,%xmm6,%xmm9
- .byte 15,40,5,253,132,1,0 // movaps 0x184fd(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,5,13,133,1,0 // movaps 0x1850d(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,92,215 // subps %xmm7,%xmm2
.byte 15,89,226 // mulps %xmm2,%xmm4
@@ -28258,23 +28547,23 @@ _sk_srcover_rgba_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,219,0,0,0 // jne 13a3b <_sk_srcover_rgba_8888_sse41+0xfb>
+ .byte 15,133,219,0,0,0 // jne 13f6b <_sk_srcover_rgba_8888_sse41+0xfb>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,15,133,1,0 // movdqa 0x1850f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,37,31,133,1,0 // movdqa 0x1851f(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,11,133,1,0 // pshufb 0x1850b(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,45,27,133,1,0 // pshufb 0x1851b(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,11,133,1,0 // pshufb 0x1850b(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,53,27,133,1,0 // pshufb 0x1851b(%rip),%xmm6 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 68,15,40,5,40,132,1,0 // movaps 0x18428(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,56,132,1,0 // movaps 0x18438(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,252,132,1,0 // movaps 0x184fc(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,37,12,133,1,0 // movaps 0x1850c(%rip),%xmm12 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -28300,7 +28589,7 @@ _sk_srcover_rgba_8888_sse41:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,88 // jne 13a79 <_sk_srcover_rgba_8888_sse41+0x139>
+ .byte 117,88 // jne 13fa9 <_sk_srcover_rgba_8888_sse41+0x139>
.byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -28311,32 +28600,32 @@ _sk_srcover_rgba_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,91 // je 13aa3 <_sk_srcover_rgba_8888_sse41+0x163>
+ .byte 116,91 // je 13fd3 <_sk_srcover_rgba_8888_sse41+0x163>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 13a68 <_sk_srcover_rgba_8888_sse41+0x128>
+ .byte 116,22 // je 13f98 <_sk_srcover_rgba_8888_sse41+0x128>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,10,255,255,255 // jne 13966 <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 15,133,10,255,255,255 // jne 13e96 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,237,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,237,254,255,255 // jmpq 13e96 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,40 // je 13aae <_sk_srcover_rgba_8888_sse41+0x16e>
+ .byte 116,40 // je 13fde <_sk_srcover_rgba_8888_sse41+0x16e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 13a9b <_sk_srcover_rgba_8888_sse41+0x15b>
+ .byte 116,15 // je 13fcb <_sk_srcover_rgba_8888_sse41+0x15b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,149 // jne 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 117,149 // jne 13f57 <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,58,22,68,129,8,2 // pextrd $0x2,%xmm0,0x8(%r9,%rax,4)
.byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4)
- .byte 235,132 // jmp 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 235,132 // jmp 13f57 <_sk_srcover_rgba_8888_sse41+0xe7>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,184,254,255,255 // jmpq 13966 <_sk_srcover_rgba_8888_sse41+0x26>
+ .byte 233,184,254,255,255 // jmpq 13e96 <_sk_srcover_rgba_8888_sse41+0x26>
.byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4)
- .byte 233,110,255,255,255 // jmpq 13a27 <_sk_srcover_rgba_8888_sse41+0xe7>
+ .byte 233,110,255,255,255 // jmpq 13f57 <_sk_srcover_rgba_8888_sse41+0xe7>
HIDDEN _sk_clamp_0_sse41
.globl _sk_clamp_0_sse41
@@ -28354,7 +28643,7 @@ HIDDEN _sk_clamp_1_sse41
.globl _sk_clamp_1_sse41
FUNCTION(_sk_clamp_1_sse41)
_sk_clamp_1_sse41:
- .byte 68,15,40,5,247,130,1,0 // movaps 0x182f7(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,7,131,1,0 // movaps 0x18307(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -28366,7 +28655,7 @@ HIDDEN _sk_clamp_a_sse41
.globl _sk_clamp_a_sse41
FUNCTION(_sk_clamp_a_sse41)
_sk_clamp_a_sse41:
- .byte 15,93,29,220,130,1,0 // minps 0x182dc(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,29,236,130,1,0 // minps 0x182ec(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -28377,7 +28666,7 @@ HIDDEN _sk_clamp_a_dst_sse41
.globl _sk_clamp_a_dst_sse41
FUNCTION(_sk_clamp_a_dst_sse41)
_sk_clamp_a_dst_sse41:
- .byte 15,93,61,200,130,1,0 // minps 0x182c8(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,61,216,130,1,0 // minps 0x182d8(%rip),%xmm7 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -28412,7 +28701,7 @@ HIDDEN _sk_invert_sse41
.globl _sk_invert_sse41
FUNCTION(_sk_invert_sse41)
_sk_invert_sse41:
- .byte 68,15,40,5,132,130,1,0 // movaps 0x18284(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,148,130,1,0 // movaps 0x18294(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -28474,7 +28763,7 @@ HIDDEN _sk_unpremul_sse41
FUNCTION(_sk_unpremul_sse41)
_sk_unpremul_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,14,130,1,0 // movaps 0x1820e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,30,130,1,0 // movaps 0x1821e(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -28488,20 +28777,20 @@ HIDDEN _sk_from_srgb_sse41
.globl _sk_from_srgb_sse41
FUNCTION(_sk_from_srgb_sse41)
_sk_from_srgb_sse41:
- .byte 68,15,40,29,217,130,1,0 // movaps 0x182d9(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
+ .byte 68,15,40,29,233,130,1,0 // movaps 0x182e9(%rip),%xmm11 # 2c400 <_sk_overlay_sse2_8bit+0xf1b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
.byte 68,15,40,208 // movaps %xmm0,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
- .byte 68,15,40,37,81,130,1,0 // movaps 0x18251(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,37,97,130,1,0 // movaps 0x18261(%rip),%xmm12 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,193,130,1,0 // movaps 0x182c1(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
+ .byte 68,15,40,45,209,130,1,0 // movaps 0x182d1(%rip),%xmm13 # 2c410 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,197 // addps %xmm13,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
- .byte 68,15,40,53,193,130,1,0 // movaps 0x182c1(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
+ .byte 68,15,40,53,209,130,1,0 // movaps 0x182d1(%rip),%xmm14 # 2c420 <_sk_overlay_sse2_8bit+0xf3b>
.byte 69,15,88,198 // addps %xmm14,%xmm8
- .byte 68,15,40,61,197,130,1,0 // movaps 0x182c5(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
+ .byte 68,15,40,61,213,130,1,0 // movaps 0x182d5(%rip),%xmm15 # 2c430 <_sk_overlay_sse2_8bit+0xf4b>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,40,209 // movaps %xmm1,%xmm10
@@ -28538,19 +28827,19 @@ FUNCTION(_sk_from_srgb_dst_sse41)
_sk_from_srgb_dst_sse41:
.byte 68,15,40,204 // movaps %xmm4,%xmm9
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,29,16,130,1,0 // movaps 0x18210(%rip),%xmm11 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
+ .byte 68,15,40,29,32,130,1,0 // movaps 0x18220(%rip),%xmm11 # 2c400 <_sk_overlay_sse2_8bit+0xf1b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
- .byte 68,15,40,37,137,129,1,0 // movaps 0x18189(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,37,153,129,1,0 // movaps 0x18199(%rip),%xmm12 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,89,228 // mulps %xmm12,%xmm4
- .byte 68,15,40,45,253,129,1,0 // movaps 0x181fd(%rip),%xmm13 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
+ .byte 68,15,40,45,13,130,1,0 // movaps 0x1820d(%rip),%xmm13 # 2c410 <_sk_overlay_sse2_8bit+0xf2b>
.byte 65,15,88,229 // addps %xmm13,%xmm4
.byte 15,89,224 // mulps %xmm0,%xmm4
- .byte 68,15,40,53,254,129,1,0 // movaps 0x181fe(%rip),%xmm14 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
+ .byte 68,15,40,53,14,130,1,0 // movaps 0x1820e(%rip),%xmm14 # 2c420 <_sk_overlay_sse2_8bit+0xf3b>
.byte 65,15,88,230 // addps %xmm14,%xmm4
- .byte 68,15,40,61,2,130,1,0 // movaps 0x18202(%rip),%xmm15 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
+ .byte 68,15,40,61,18,130,1,0 // movaps 0x18212(%rip),%xmm15 # 2c430 <_sk_overlay_sse2_8bit+0xf4b>
.byte 69,15,194,207,1 // cmpltps %xmm15,%xmm9
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,226 // blendvps %xmm0,%xmm10,%xmm4
@@ -28594,22 +28883,22 @@ _sk_to_srgb_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,209 // movaps %xmm1,%xmm2
.byte 68,15,82,192 // rsqrtps %xmm0,%xmm8
- .byte 68,15,40,29,118,129,1,0 // movaps 0x18176(%rip),%xmm11 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b>
+ .byte 68,15,40,29,134,129,1,0 // movaps 0x18186(%rip),%xmm11 # 2c440 <_sk_overlay_sse2_8bit+0xf5b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
- .byte 68,15,40,37,118,129,1,0 // movaps 0x18176(%rip),%xmm12 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b>
+ .byte 68,15,40,37,134,129,1,0 // movaps 0x18186(%rip),%xmm12 # 2c450 <_sk_overlay_sse2_8bit+0xf6b>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 69,15,89,252 // mulps %xmm12,%xmm15
- .byte 68,15,40,21,118,129,1,0 // movaps 0x18176(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b>
+ .byte 68,15,40,21,134,129,1,0 // movaps 0x18186(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0xf7b>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,248 // mulps %xmm8,%xmm15
- .byte 68,15,40,45,118,129,1,0 // movaps 0x18176(%rip),%xmm13 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b>
+ .byte 68,15,40,45,134,129,1,0 // movaps 0x18186(%rip),%xmm13 # 2c470 <_sk_overlay_sse2_8bit+0xf8b>
.byte 69,15,88,253 // addps %xmm13,%xmm15
- .byte 68,15,40,53,122,129,1,0 // movaps 0x1817a(%rip),%xmm14 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b>
+ .byte 68,15,40,53,138,129,1,0 // movaps 0x1818a(%rip),%xmm14 # 2c480 <_sk_overlay_sse2_8bit+0xf9b>
.byte 69,15,88,198 // addps %xmm14,%xmm8
.byte 69,15,83,192 // rcpps %xmm8,%xmm8
.byte 69,15,89,199 // mulps %xmm15,%xmm8
- .byte 68,15,40,61,118,129,1,0 // movaps 0x18176(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b>
+ .byte 68,15,40,61,134,129,1,0 // movaps 0x18186(%rip),%xmm15 # 2c490 <_sk_overlay_sse2_8bit+0xfab>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 68,15,82,202 // rsqrtps %xmm2,%xmm9
@@ -28664,7 +28953,7 @@ _sk_rgb_to_hsl_sse41:
.byte 68,15,93,224 // minps %xmm0,%xmm12
.byte 65,15,40,203 // movaps %xmm11,%xmm1
.byte 65,15,92,204 // subps %xmm12,%xmm1
- .byte 68,15,40,53,45,127,1,0 // movaps 0x17f2d(%rip),%xmm14 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,53,61,127,1,0 // movaps 0x17f3d(%rip),%xmm14 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,94,241 // divps %xmm1,%xmm14
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 69,15,194,208,0 // cmpeqps %xmm8,%xmm10
@@ -28673,27 +28962,27 @@ _sk_rgb_to_hsl_sse41:
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 68,15,194,250,1 // cmpltps %xmm2,%xmm15
- .byte 68,15,84,61,148,128,1,0 // andps 0x18094(%rip),%xmm15 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
+ .byte 68,15,84,61,164,128,1,0 // andps 0x180a4(%rip),%xmm15 # 2c4a0 <_sk_overlay_sse2_8bit+0xfbb>
.byte 68,15,88,248 // addps %xmm0,%xmm15
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,193,0 // cmpeqps %xmm9,%xmm0
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,214 // mulps %xmm14,%xmm2
- .byte 68,15,40,45,135,128,1,0 // movaps 0x18087(%rip),%xmm13 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb>
+ .byte 68,15,40,45,151,128,1,0 // movaps 0x18097(%rip),%xmm13 # 2c4b0 <_sk_overlay_sse2_8bit+0xfcb>
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,198 // mulps %xmm14,%xmm8
- .byte 68,15,88,5,131,128,1,0 // addps 0x18083(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
+ .byte 68,15,88,5,147,128,1,0 // addps 0x18093(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0xfdb>
.byte 102,68,15,56,20,194 // blendvps %xmm0,%xmm2,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 102,69,15,56,20,199 // blendvps %xmm0,%xmm15,%xmm8
- .byte 68,15,89,5,123,128,1,0 // mulps 0x1807b(%rip),%xmm8 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
+ .byte 68,15,89,5,139,128,1,0 // mulps 0x1808b(%rip),%xmm8 # 2c4d0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 69,15,40,203 // movaps %xmm11,%xmm9
.byte 69,15,194,204,4 // cmpneqps %xmm12,%xmm9
.byte 69,15,84,193 // andps %xmm9,%xmm8
.byte 69,15,92,235 // subps %xmm11,%xmm13
.byte 69,15,88,220 // addps %xmm12,%xmm11
- .byte 15,40,5,143,126,1,0 // movaps 0x17e8f(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,40,5,159,126,1,0 // movaps 0x17e9f(%rip),%xmm0 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,211 // movaps %xmm11,%xmm2
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,194,194,1 // cmpltps %xmm2,%xmm0
@@ -28715,7 +29004,7 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,100,36,184 // movaps %xmm4,-0x48(%rsp)
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,208 // movaps %xmm0,%xmm10
- .byte 68,15,40,13,69,126,1,0 // movaps 0x17e45(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,13,85,126,1,0 // movaps 0x17e55(%rip),%xmm9 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,194,194,2 // cmpleps %xmm2,%xmm0
.byte 15,40,217 // movaps %xmm1,%xmm3
@@ -28728,19 +29017,19 @@ _sk_hsl_to_rgb_sse41:
.byte 15,41,84,36,152 // movaps %xmm2,-0x68(%rsp)
.byte 69,15,88,192 // addps %xmm8,%xmm8
.byte 68,15,92,197 // subps %xmm5,%xmm8
- .byte 68,15,40,53,240,127,1,0 // movaps 0x17ff0(%rip),%xmm14 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb>
+ .byte 68,15,40,53,0,128,1,0 // movaps 0x18000(%rip),%xmm14 # 2c4e0 <_sk_overlay_sse2_8bit+0xffb>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 102,65,15,58,8,198,1 // roundps $0x1,%xmm14,%xmm0
.byte 68,15,92,240 // subps %xmm0,%xmm14
- .byte 68,15,40,29,233,127,1,0 // movaps 0x17fe9(%rip),%xmm11 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb>
+ .byte 68,15,40,29,249,127,1,0 // movaps 0x17ff9(%rip),%xmm11 # 2c4f0 <_sk_overlay_sse2_8bit+0x100b>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 65,15,92,240 // subps %xmm8,%xmm6
- .byte 15,40,61,130,127,1,0 // movaps 0x17f82(%rip),%xmm7 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
+ .byte 15,40,61,146,127,1,0 // movaps 0x17f92(%rip),%xmm7 # 2c4a0 <_sk_overlay_sse2_8bit+0xfbb>
.byte 69,15,40,238 // movaps %xmm14,%xmm13
.byte 68,15,89,239 // mulps %xmm7,%xmm13
- .byte 15,40,29,147,127,1,0 // movaps 0x17f93(%rip),%xmm3 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
+ .byte 15,40,29,163,127,1,0 // movaps 0x17fa3(%rip),%xmm3 # 2c4c0 <_sk_overlay_sse2_8bit+0xfdb>
.byte 68,15,40,227 // movaps %xmm3,%xmm12
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 68,15,89,230 // mulps %xmm6,%xmm12
@@ -28750,7 +29039,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,40,253 // movaps %xmm5,%xmm15
.byte 102,69,15,56,20,252 // blendvps %xmm0,%xmm12,%xmm15
- .byte 68,15,40,37,114,127,1,0 // movaps 0x17f72(%rip),%xmm12 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
+ .byte 68,15,40,37,130,127,1,0 // movaps 0x17f82(%rip),%xmm12 # 2c4d0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 65,15,40,196 // movaps %xmm12,%xmm0
.byte 65,15,194,198,2 // cmpleps %xmm14,%xmm0
.byte 68,15,89,238 // mulps %xmm6,%xmm13
@@ -28784,7 +29073,7 @@ _sk_hsl_to_rgb_sse41:
.byte 65,15,40,198 // movaps %xmm14,%xmm0
.byte 15,40,84,36,152 // movaps -0x68(%rsp),%xmm2
.byte 102,15,56,20,202 // blendvps %xmm0,%xmm2,%xmm1
- .byte 68,15,88,21,10,127,1,0 // addps 0x17f0a(%rip),%xmm10 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,88,21,26,127,1,0 // addps 0x17f1a(%rip),%xmm10 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 102,65,15,58,8,194,1 // roundps $0x1,%xmm10,%xmm0
.byte 68,15,92,208 // subps %xmm0,%xmm10
.byte 69,15,194,218,2 // cmpleps %xmm10,%xmm11
@@ -28839,11 +29128,11 @@ _sk_scale_u8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,52 // jne 1419d <_sk_scale_u8_sse41+0x4c>
+ .byte 117,52 // jne 146cd <_sk_scale_u8_sse41+0x4c>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,7,125,1,0 // pand 0x17d07(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,68,15,219,5,23,125,1,0 // pand 0x17d17(%rip),%xmm8 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,75,126,1,0 // mulps 0x17e4b(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,89,5,91,126,1,0 // mulps 0x17e5b(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -28854,12 +29143,12 @@ _sk_scale_u8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 141e5 <_sk_scale_u8_sse41+0x94>
+ .byte 116,59 // je 14715 <_sk_scale_u8_sse41+0x94>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 141cc <_sk_scale_u8_sse41+0x7b>
+ .byte 116,23 // je 146fc <_sk_scale_u8_sse41+0x7b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,181 // jne 14170 <_sk_scale_u8_sse41+0x1f>
+ .byte 117,181 // jne 146a0 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -28867,10 +29156,10 @@ _sk_scale_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 235,139 // jmp 14170 <_sk_scale_u8_sse41+0x1f>
+ .byte 235,139 // jmp 146a0 <_sk_scale_u8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,124,255,255,255 // jmpq 14170 <_sk_scale_u8_sse41+0x1f>
+ .byte 233,124,255,255,255 // jmpq 146a0 <_sk_scale_u8_sse41+0x1f>
HIDDEN _sk_scale_565_sse41
.globl _sk_scale_565_sse41
@@ -28885,19 +29174,19 @@ _sk_scale_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,159,0,0,0 // jne 142b7 <_sk_scale_565_sse41+0xc3>
+ .byte 15,133,159,0,0,0 // jne 147e7 <_sk_scale_565_sse41+0xc3>
.byte 102,71,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm11
- .byte 102,15,111,5,185,125,1,0 // movdqa 0x17db9(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,5,201,125,1,0 // movdqa 0x17dc9(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,65,15,219,195 // pand %xmm11,%xmm0
.byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
- .byte 68,15,89,13,184,125,1,0 // mulps 0x17db8(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,5,192,125,1,0 // movdqa 0x17dc0(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 68,15,89,13,200,125,1,0 // mulps 0x17dc8(%rip),%xmm9 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,5,208,125,1,0 // movdqa 0x17dd0(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,65,15,219,195 // pand %xmm11,%xmm0
.byte 68,15,91,208 // cvtdq2ps %xmm0,%xmm10
- .byte 68,15,89,21,191,125,1,0 // mulps 0x17dbf(%rip),%xmm10 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,68,15,219,29,198,125,1,0 // pand 0x17dc6(%rip),%xmm11 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 68,15,89,21,207,125,1,0 // mulps 0x17dcf(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,68,15,219,29,214,125,1,0 // pand 0x17dd6(%rip),%xmm11 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 69,15,91,219 // cvtdq2ps %xmm11,%xmm11
- .byte 68,15,89,29,202,125,1,0 // mulps 0x17dca(%rip),%xmm11 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,89,29,218,125,1,0 // mulps 0x17dda(%rip),%xmm11 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
.byte 69,15,40,226 // movaps %xmm10,%xmm12
@@ -28922,22 +29211,22 @@ _sk_scale_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,60 // je 14300 <_sk_scale_565_sse41+0x10c>
+ .byte 116,60 // je 14830 <_sk_scale_565_sse41+0x10c>
.byte 102,69,15,239,219 // pxor %xmm11,%xmm11
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,26 // je 142e9 <_sk_scale_565_sse41+0xf5>
+ .byte 116,26 // je 14819 <_sk_scale_565_sse41+0xf5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,70,255,255,255 // jne 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 15,133,70,255,255,255 // jne 1474f <_sk_scale_565_sse41+0x2b>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,68,15,112,216,69 // pshufd $0x45,%xmm0,%xmm11
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,68,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm11
- .byte 233,31,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 233,31,255,255,255 // jmpq 1474f <_sk_scale_565_sse41+0x2b>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,68,15,110,216 // movd %eax,%xmm11
- .byte 233,16,255,255,255 // jmpq 1421f <_sk_scale_565_sse41+0x2b>
+ .byte 233,16,255,255,255 // jmpq 1474f <_sk_scale_565_sse41+0x2b>
HIDDEN _sk_lerp_1_float_sse41
.globl _sk_lerp_1_float_sse41
@@ -28972,11 +29261,11 @@ _sk_lerp_u8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 143a7 <_sk_lerp_u8_sse41+0x60>
+ .byte 117,72 // jne 148d7 <_sk_lerp_u8_sse41+0x60>
.byte 102,71,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm8
- .byte 102,68,15,219,5,17,123,1,0 // pand 0x17b11(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,68,15,219,5,33,123,1,0 // pand 0x17b21(%rip),%xmm8 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,85,124,1,0 // mulps 0x17c55(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,89,5,101,124,1,0 // mulps 0x17c65(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -28994,12 +29283,12 @@ _sk_lerp_u8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,62 // je 143f2 <_sk_lerp_u8_sse41+0xab>
+ .byte 116,62 // je 14922 <_sk_lerp_u8_sse41+0xab>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 143d6 <_sk_lerp_u8_sse41+0x8f>
+ .byte 116,23 // je 14906 <_sk_lerp_u8_sse41+0x8f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,161 // jne 14366 <_sk_lerp_u8_sse41+0x1f>
+ .byte 117,161 // jne 14896 <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -29007,10 +29296,10 @@ _sk_lerp_u8_sse41:
.byte 102,68,15,110,200 // movd %eax,%xmm9
.byte 102,69,15,56,49,201 // pmovzxbd %xmm9,%xmm9
.byte 102,69,15,58,14,193,15 // pblendw $0xf,%xmm9,%xmm8
- .byte 233,116,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,116,255,255,255 // jmpq 14896 <_sk_lerp_u8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,101,255,255,255 // jmpq 14366 <_sk_lerp_u8_sse41+0x1f>
+ .byte 233,101,255,255,255 // jmpq 14896 <_sk_lerp_u8_sse41+0x1f>
HIDDEN _sk_lerp_565_sse41
.globl _sk_lerp_565_sse41
@@ -29025,19 +29314,19 @@ _sk_lerp_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,165,0,0,0 // jne 144ca <_sk_lerp_565_sse41+0xc9>
+ .byte 15,133,165,0,0,0 // jne 149fa <_sk_lerp_565_sse41+0xc9>
.byte 102,71,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm10
- .byte 102,15,111,5,172,123,1,0 // movdqa 0x17bac(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,5,188,123,1,0 // movdqa 0x17bbc(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 68,15,91,200 // cvtdq2ps %xmm0,%xmm9
- .byte 68,15,89,13,171,123,1,0 // mulps 0x17bab(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,5,179,123,1,0 // movdqa 0x17bb3(%rip),%xmm0 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 68,15,89,13,187,123,1,0 // mulps 0x17bbb(%rip),%xmm9 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,5,195,123,1,0 // movdqa 0x17bc3(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 68,15,91,216 // cvtdq2ps %xmm0,%xmm11
- .byte 68,15,89,29,178,123,1,0 // mulps 0x17bb2(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,68,15,219,21,185,123,1,0 // pand 0x17bb9(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 68,15,89,29,194,123,1,0 // mulps 0x17bc2(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,68,15,219,21,201,123,1,0 // pand 0x17bc9(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,189,123,1,0 // mulps 0x17bbd(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,89,21,205,123,1,0 // mulps 0x17bcd(%rip),%xmm10 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 15,40,195 // movaps %xmm3,%xmm0
.byte 15,194,199,1 // cmpltps %xmm7,%xmm0
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -29065,22 +29354,22 @@ _sk_lerp_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,60 // je 14513 <_sk_lerp_565_sse41+0x112>
+ .byte 116,60 // je 14a43 <_sk_lerp_565_sse41+0x112>
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,26 // je 144fc <_sk_lerp_565_sse41+0xfb>
+ .byte 116,26 // je 14a2c <_sk_lerp_565_sse41+0xfb>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,64,255,255,255 // jne 1442c <_sk_lerp_565_sse41+0x2b>
+ .byte 15,133,64,255,255,255 // jne 1495c <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,68,15,112,208,69 // pshufd $0x45,%xmm0,%xmm10
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,68,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm10
- .byte 233,25,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b>
+ .byte 233,25,255,255,255 // jmpq 1495c <_sk_lerp_565_sse41+0x2b>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,68,15,110,208 // movd %eax,%xmm10
- .byte 233,10,255,255,255 // jmpq 1442c <_sk_lerp_565_sse41+0x2b>
+ .byte 233,10,255,255,255 // jmpq 1495c <_sk_lerp_565_sse41+0x2b>
HIDDEN _sk_load_tables_sse41
.globl _sk_load_tables_sse41
@@ -29089,12 +29378,12 @@ _sk_load_tables_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,24,1,0,0 // jne 14648 <_sk_load_tables_sse41+0x126>
+ .byte 15,133,24,1,0,0 // jne 14b78 <_sk_load_tables_sse41+0x126>
.byte 243,69,15,111,4,145 // movdqu (%r9,%rdx,4),%xmm8
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,15,111,5,61,121,1,0 // movdqa 0x1793d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,77,121,1,0 // movdqa 0x1794d(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -29109,7 +29398,7 @@ _sk_load_tables_sse41:
.byte 102,66,15,58,33,4,179,32 // insertps $0x20,(%rbx,%r14,4),%xmm0
.byte 102,66,15,58,33,4,11,48 // insertps $0x30,(%rbx,%r9,1),%xmm0
.byte 102,65,15,111,200 // movdqa %xmm8,%xmm1
- .byte 102,15,56,0,13,248,120,1,0 // pshufb 0x178f8(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,13,8,121,1,0 // pshufb 0x17908(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
.byte 68,15,182,211 // movzbl %bl,%r10d
@@ -29124,7 +29413,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,202,48 // insertps $0x30,%xmm2,%xmm1
.byte 76,139,72,24 // mov 0x18(%rax),%r9
.byte 102,65,15,111,208 // movdqa %xmm8,%xmm2
- .byte 102,15,56,0,21,180,120,1,0 // pshufb 0x178b4(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,21,196,120,1,0 // pshufb 0x178c4(%rip),%xmm2 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 102,72,15,58,22,211,1 // pextrq $0x1,%xmm2,%rbx
.byte 102,72,15,126,208 // movq %xmm2,%rax
.byte 68,15,182,208 // movzbl %al,%r10d
@@ -29139,7 +29428,7 @@ _sk_load_tables_sse41:
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,216 // cvtdq2ps %xmm8,%xmm3
- .byte 15,89,29,145,121,1,0 // mulps 0x17991(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,29,161,121,1,0 // mulps 0x179a1(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -29148,19 +29437,19 @@ _sk_load_tables_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,52 // je 14689 <_sk_load_tables_sse41+0x167>
+ .byte 116,52 // je 14bb9 <_sk_load_tables_sse41+0x167>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 14677 <_sk_load_tables_sse41+0x155>
+ .byte 116,23 // je 14ba7 <_sk_load_tables_sse41+0x155>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,204,254,255,255 // jne 14536 <_sk_load_tables_sse41+0x14>
+ .byte 15,133,204,254,255,255 // jne 14a66 <_sk_load_tables_sse41+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,192,69 // pshufd $0x45,%xmm0,%xmm8
.byte 243,65,15,126,4,145 // movq (%r9,%rdx,4),%xmm0
.byte 102,68,15,58,14,192,15 // pblendw $0xf,%xmm0,%xmm8
- .byte 233,173,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14>
+ .byte 233,173,254,255,255 // jmpq 14a66 <_sk_load_tables_sse41+0x14>
.byte 102,69,15,110,4,145 // movd (%r9,%rdx,4),%xmm8
- .byte 233,162,254,255,255 // jmpq 14536 <_sk_load_tables_sse41+0x14>
+ .byte 233,162,254,255,255 // jmpq 14a66 <_sk_load_tables_sse41+0x14>
HIDDEN _sk_load_tables_u16_be_sse41
.globl _sk_load_tables_u16_be_sse41
@@ -29170,7 +29459,7 @@ _sk_load_tables_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,99,1,0,0 // jne 1480d <_sk_load_tables_u16_be_sse41+0x179>
+ .byte 15,133,99,1,0,0 // jne 14d3d <_sk_load_tables_u16_be_sse41+0x179>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 243,67,15,111,76,81,16 // movdqu 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -29182,7 +29471,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,5,95,121,1,0 // movdqa 0x1795f(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
+ .byte 102,68,15,111,5,111,121,1,0 // movdqa 0x1796f(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0x109b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -29200,7 +29489,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,15,58,33,194,32 // insertps $0x20,%xmm2,%xmm0
.byte 243,66,15,16,20,11 // movss (%rbx,%r9,1),%xmm2
.byte 102,15,58,33,194,48 // insertps $0x30,%xmm2,%xmm0
- .byte 102,15,56,0,13,14,121,1,0 // pshufb 0x1790e(%rip),%xmm1 # 2c050 <_sk_overlay_sse2_8bit+0x109b>
+ .byte 102,15,56,0,13,30,121,1,0 // pshufb 0x1791e(%rip),%xmm1 # 2c590 <_sk_overlay_sse2_8bit+0x10ab>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -29236,7 +29525,7 @@ _sk_load_tables_u16_be_sse41:
.byte 102,65,15,235,216 // por %xmm8,%xmm3
.byte 102,15,56,51,219 // pmovzxwd %xmm3,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,92,120,1,0 // mulps 0x1785c(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
+ .byte 15,89,29,108,120,1,0 // mulps 0x1786c(%rip),%xmm3 # 2c5a0 <_sk_overlay_sse2_8bit+0x10bb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -29244,16 +29533,16 @@ _sk_load_tables_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 14826 <_sk_load_tables_u16_be_sse41+0x192>
+ .byte 117,13 // jne 14d56 <_sk_load_tables_u16_be_sse41+0x192>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,145,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,145,254,255,255 // jmpq 14be7 <_sk_load_tables_u16_be_sse41+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,124,254,255,255 // jb 146b7 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 15,130,124,254,255,255 // jb 14be7 <_sk_load_tables_u16_be_sse41+0x23>
.byte 243,67,15,126,76,81,16 // movq 0x10(%r9,%r10,2),%xmm1
- .byte 233,112,254,255,255 // jmpq 146b7 <_sk_load_tables_u16_be_sse41+0x23>
+ .byte 233,112,254,255,255 // jmpq 14be7 <_sk_load_tables_u16_be_sse41+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse41
.globl _sk_load_tables_rgb_u16_be_sse41
@@ -29263,7 +29552,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,83,1,0,0 // jne 149ac <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ .byte 15,133,83,1,0,0 // jne 14edc <_sk_load_tables_rgb_u16_be_sse41+0x165>
.byte 243,67,15,111,20,81 // movdqu (%r9,%r10,2),%xmm2
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -29278,7 +29567,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
- .byte 102,68,15,111,5,161,119,1,0 // movdqa 0x177a1(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
+ .byte 102,68,15,111,5,177,119,1,0 // movdqa 0x177b1(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0x109b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
@@ -29296,7 +29585,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,15,58,33,195,32 // insertps $0x20,%xmm3,%xmm0
.byte 243,66,15,16,28,11 // movss (%rbx,%r9,1),%xmm3
.byte 102,15,58,33,195,48 // insertps $0x30,%xmm3,%xmm0
- .byte 102,15,56,0,13,112,119,1,0 // pshufb 0x17770(%rip),%xmm1 # 2c070 <_sk_overlay_sse2_8bit+0x10bb>
+ .byte 102,15,56,0,13,128,119,1,0 // pshufb 0x17780(%rip),%xmm1 # 2c5b0 <_sk_overlay_sse2_8bit+0x10cb>
.byte 102,15,56,51,201 // pmovzxwd %xmm1,%xmm1
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 102,72,15,126,203 // movq %xmm1,%rbx
@@ -29327,7 +29616,7 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 243,65,15,16,28,25 // movss (%r9,%rbx,1),%xmm3
.byte 102,15,58,33,211,48 // insertps $0x30,%xmm3,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,43,116,1,0 // movaps 0x1742b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,59,116,1,0 // movaps 0x1743b(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -29336,21 +29625,21 @@ _sk_load_tables_rgb_u16_be_sse41:
.byte 102,67,15,196,84,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 149d2 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ .byte 117,14 // jne 14f02 <_sk_load_tables_rgb_u16_be_sse41+0x18b>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
- .byte 233,173,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,173,254,255,255 // jmpq 14daf <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,71,15,110,76,81,6 // movd 0x6(%r9,%r10,2),%xmm9
.byte 102,71,15,196,76,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 14a03 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ .byte 114,24 // jb 14f33 <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,124,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,124,254,255,255 // jmpq 14daf <_sk_load_tables_rgb_u16_be_sse41+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,115,254,255,255 // jmpq 1487f <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ .byte 233,115,254,255,255 // jmpq 14daf <_sk_load_tables_rgb_u16_be_sse41+0x38>
HIDDEN _sk_byte_tables_sse41
.globl _sk_byte_tables_sse41
@@ -29361,7 +29650,7 @@ _sk_byte_tables_sse41:
.byte 65,84 // push %r12
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,147,116,1,0 // movaps 0x17493(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,163,116,1,0 // movaps 0x174a3(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,58,22,193,1 // pextrq $0x1,%xmm0,%r9
@@ -29380,7 +29669,7 @@ _sk_byte_tables_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,84,117,1,0 // movaps 0x17554(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,13,100,117,1,0 // movaps 0x17564(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -29476,7 +29765,7 @@ _sk_byte_tables_rgb_sse41:
.byte 102,15,58,32,195,3 // pinsrb $0x3,%ebx,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,13,188,115,1,0 // movaps 0x173bc(%rip),%xmm9 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,13,204,115,1,0 // movaps 0x173cc(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -29663,31 +29952,31 @@ _sk_parametric_r_sse41:
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,194 // cvtdq2ps %xmm10,%xmm8
- .byte 68,15,89,5,164,113,1,0 // mulps 0x171a4(%rip),%xmm8 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,21,172,113,1,0 // andps 0x171ac(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,21,212,110,1,0 // orps 0x16ed4(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,5,172,113,1,0 // addps 0x171ac(%rip),%xmm8 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 68,15,40,37,180,113,1,0 // movaps 0x171b4(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,5,180,113,1,0 // mulps 0x171b4(%rip),%xmm8 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,21,188,113,1,0 // andps 0x171bc(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,21,228,110,1,0 // orps 0x16ee4(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,5,188,113,1,0 // addps 0x171bc(%rip),%xmm8 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,37,196,113,1,0 // movaps 0x171c4(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
- .byte 68,15,88,21,180,113,1,0 // addps 0x171b4(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 68,15,40,37,188,113,1,0 // movaps 0x171bc(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,21,196,113,1,0 // addps 0x171c4(%rip),%xmm10 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,37,204,113,1,0 // movaps 0x171cc(%rip),%xmm12 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,196 // subps %xmm12,%xmm8
.byte 69,15,89,195 // mulps %xmm11,%xmm8
.byte 102,69,15,58,8,208,1 // roundps $0x1,%xmm8,%xmm10
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,5,169,113,1,0 // addps 0x171a9(%rip),%xmm8 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,5,185,113,1,0 // addps 0x171b9(%rip),%xmm8 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,40,21,193,113,1,0 // movaps 0x171c1(%rip),%xmm10 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,89,211 // mulps %xmm11,%xmm10
.byte 69,15,92,194 // subps %xmm10,%xmm8
- .byte 68,15,40,21,177,113,1,0 // movaps 0x171b1(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,21,193,113,1,0 // movaps 0x171c1(%rip),%xmm10 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 68,15,40,29,181,113,1,0 // movaps 0x171b5(%rip),%xmm11 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,29,197,113,1,0 // movaps 0x171c5(%rip),%xmm11 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 69,15,94,218 // divps %xmm10,%xmm11
.byte 69,15,88,216 // addps %xmm8,%xmm11
- .byte 68,15,89,29,181,113,1,0 // mulps 0x171b5(%rip),%xmm11 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 68,15,89,29,197,113,1,0 // mulps 0x171c5(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,69,15,91,211 // cvtps2dq %xmm11,%xmm10
.byte 243,68,15,16,64,20 // movss 0x14(%rax),%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
@@ -29695,7 +29984,7 @@ _sk_parametric_r_sse41:
.byte 102,69,15,56,20,193 // blendvps %xmm0,%xmm9,%xmm8
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,60,110,1,0 // minps 0x16e3c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,93,5,76,110,1,0 // minps 0x16e4c(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -29725,31 +30014,31 @@ _sk_parametric_g_sse41:
.byte 68,15,88,217 // addps %xmm1,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,125,112,1,0 // mulps 0x1707d(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,29,133,112,1,0 // andps 0x17085(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,29,173,109,1,0 // orps 0x16dad(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,37,133,112,1,0 // addps 0x17085(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 15,40,13,142,112,1,0 // movaps 0x1708e(%rip),%xmm1 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,37,141,112,1,0 // mulps 0x1708d(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,29,149,112,1,0 // andps 0x17095(%rip),%xmm11 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,29,189,109,1,0 // orps 0x16dbd(%rip),%xmm11 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,37,149,112,1,0 // addps 0x17095(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 15,40,13,158,112,1,0 // movaps 0x1709e(%rip),%xmm1 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,88,29,142,112,1,0 // addps 0x1708e(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 15,40,13,151,112,1,0 // movaps 0x17097(%rip),%xmm1 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,29,158,112,1,0 // addps 0x1709e(%rip),%xmm11 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 15,40,13,167,112,1,0 // movaps 0x170a7(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 65,15,94,203 // divps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,132,112,1,0 // addps 0x17084(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 15,40,13,141,112,1,0 // movaps 0x1708d(%rip),%xmm1 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,37,148,112,1,0 // addps 0x17094(%rip),%xmm12 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 15,40,13,157,112,1,0 // movaps 0x1709d(%rip),%xmm1 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 68,15,92,225 // subps %xmm1,%xmm12
- .byte 68,15,40,21,141,112,1,0 // movaps 0x1708d(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,21,157,112,1,0 // movaps 0x1709d(%rip),%xmm10 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,13,146,112,1,0 // movaps 0x17092(%rip),%xmm1 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 15,40,13,162,112,1,0 // movaps 0x170a2(%rip),%xmm1 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 65,15,94,202 // divps %xmm10,%xmm1
.byte 65,15,88,204 // addps %xmm12,%xmm1
- .byte 15,89,13,147,112,1,0 // mulps 0x17093(%rip),%xmm1 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 15,89,13,163,112,1,0 // mulps 0x170a3(%rip),%xmm1 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,68,15,91,209 // cvtps2dq %xmm1,%xmm10
.byte 243,15,16,72,20 // movss 0x14(%rax),%xmm1
.byte 15,198,201,0 // shufps $0x0,%xmm1,%xmm1
@@ -29757,7 +30046,7 @@ _sk_parametric_g_sse41:
.byte 102,65,15,56,20,201 // blendvps %xmm0,%xmm9,%xmm1
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,200 // maxps %xmm0,%xmm1
- .byte 15,93,13,30,109,1,0 // minps 0x16d1e(%rip),%xmm1 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,13,46,109,1,0 // minps 0x16d2e(%rip),%xmm1 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -29787,31 +30076,31 @@ _sk_parametric_b_sse41:
.byte 68,15,88,218 // addps %xmm2,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,95,111,1,0 // mulps 0x16f5f(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,29,103,111,1,0 // andps 0x16f67(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,29,143,108,1,0 // orps 0x16c8f(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,37,103,111,1,0 // addps 0x16f67(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 15,40,21,112,111,1,0 // movaps 0x16f70(%rip),%xmm2 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,37,111,111,1,0 // mulps 0x16f6f(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,29,119,111,1,0 // andps 0x16f77(%rip),%xmm11 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,29,159,108,1,0 // orps 0x16c9f(%rip),%xmm11 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,37,119,111,1,0 // addps 0x16f77(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 15,40,21,128,111,1,0 // movaps 0x16f80(%rip),%xmm2 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,88,29,112,111,1,0 // addps 0x16f70(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 15,40,21,121,111,1,0 // movaps 0x16f79(%rip),%xmm2 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,29,128,111,1,0 // addps 0x16f80(%rip),%xmm11 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 15,40,21,137,111,1,0 // movaps 0x16f89(%rip),%xmm2 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 65,15,94,211 // divps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,102,111,1,0 // addps 0x16f66(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm2 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,37,118,111,1,0 // addps 0x16f76(%rip),%xmm12 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 15,40,21,127,111,1,0 // movaps 0x16f7f(%rip),%xmm2 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 65,15,89,211 // mulps %xmm11,%xmm2
.byte 68,15,92,226 // subps %xmm2,%xmm12
- .byte 68,15,40,21,111,111,1,0 // movaps 0x16f6f(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,21,127,111,1,0 // movaps 0x16f7f(%rip),%xmm10 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,21,116,111,1,0 // movaps 0x16f74(%rip),%xmm2 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 15,40,21,132,111,1,0 // movaps 0x16f84(%rip),%xmm2 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 65,15,94,210 // divps %xmm10,%xmm2
.byte 65,15,88,212 // addps %xmm12,%xmm2
- .byte 15,89,21,117,111,1,0 // mulps 0x16f75(%rip),%xmm2 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 15,89,21,133,111,1,0 // mulps 0x16f85(%rip),%xmm2 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,68,15,91,210 // cvtps2dq %xmm2,%xmm10
.byte 243,15,16,80,20 // movss 0x14(%rax),%xmm2
.byte 15,198,210,0 // shufps $0x0,%xmm2,%xmm2
@@ -29819,7 +30108,7 @@ _sk_parametric_b_sse41:
.byte 102,65,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm2
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,208 // maxps %xmm0,%xmm2
- .byte 15,93,21,0,108,1,0 // minps 0x16c00(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,21,16,108,1,0 // minps 0x16c10(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -29849,31 +30138,31 @@ _sk_parametric_a_sse41:
.byte 68,15,88,219 // addps %xmm3,%xmm11
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,91,227 // cvtdq2ps %xmm11,%xmm12
- .byte 68,15,89,37,65,110,1,0 // mulps 0x16e41(%rip),%xmm12 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,29,73,110,1,0 // andps 0x16e49(%rip),%xmm11 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,29,113,107,1,0 // orps 0x16b71(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,37,73,110,1,0 // addps 0x16e49(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 15,40,29,82,110,1,0 // movaps 0x16e52(%rip),%xmm3 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,37,81,110,1,0 // mulps 0x16e51(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,29,89,110,1,0 // andps 0x16e59(%rip),%xmm11 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,29,129,107,1,0 // orps 0x16b81(%rip),%xmm11 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,37,89,110,1,0 // addps 0x16e59(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 15,40,29,98,110,1,0 // movaps 0x16e62(%rip),%xmm3 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,88,29,82,110,1,0 // addps 0x16e52(%rip),%xmm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 15,40,29,91,110,1,0 // movaps 0x16e5b(%rip),%xmm3 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,29,98,110,1,0 // addps 0x16e62(%rip),%xmm11 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 15,40,29,107,110,1,0 // movaps 0x16e6b(%rip),%xmm3 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 65,15,94,219 // divps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 102,69,15,58,8,212,1 // roundps $0x1,%xmm12,%xmm10
.byte 69,15,40,220 // movaps %xmm12,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 68,15,88,37,72,110,1,0 // addps 0x16e48(%rip),%xmm12 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 15,40,29,81,110,1,0 // movaps 0x16e51(%rip),%xmm3 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,37,88,110,1,0 // addps 0x16e58(%rip),%xmm12 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 15,40,29,97,110,1,0 // movaps 0x16e61(%rip),%xmm3 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 65,15,89,219 // mulps %xmm11,%xmm3
.byte 68,15,92,227 // subps %xmm3,%xmm12
- .byte 68,15,40,21,81,110,1,0 // movaps 0x16e51(%rip),%xmm10 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,21,97,110,1,0 // movaps 0x16e61(%rip),%xmm10 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,211 // subps %xmm11,%xmm10
- .byte 15,40,29,86,110,1,0 // movaps 0x16e56(%rip),%xmm3 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 15,40,29,102,110,1,0 // movaps 0x16e66(%rip),%xmm3 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 65,15,94,218 // divps %xmm10,%xmm3
.byte 65,15,88,220 // addps %xmm12,%xmm3
- .byte 15,89,29,87,110,1,0 // mulps 0x16e57(%rip),%xmm3 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 15,89,29,103,110,1,0 // mulps 0x16e67(%rip),%xmm3 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,68,15,91,211 // cvtps2dq %xmm3,%xmm10
.byte 243,15,16,88,20 // movss 0x14(%rax),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
@@ -29881,7 +30170,7 @@ _sk_parametric_a_sse41:
.byte 102,65,15,56,20,217 // blendvps %xmm0,%xmm9,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,95,216 // maxps %xmm0,%xmm3
- .byte 15,93,29,226,106,1,0 // minps 0x16ae2(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,29,242,106,1,0 // minps 0x16af2(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -29898,20 +30187,20 @@ _sk_gamma_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,97,109,1,0 // mulps 0x16d61(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,40,53,105,109,1,0 // movaps 0x16d69(%rip),%xmm14 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,89,5,113,109,1,0 // mulps 0x16d71(%rip),%xmm0 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,40,53,121,109,1,0 // movaps 0x16d79(%rip),%xmm14 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,37,141,106,1,0 // movaps 0x16a8d(%rip),%xmm12 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,37,157,106,1,0 // movaps 0x16a9d(%rip),%xmm12 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,86,212 // orps %xmm12,%xmm2
- .byte 68,15,40,21,97,109,1,0 // movaps 0x16d61(%rip),%xmm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,21,113,109,1,0 // movaps 0x16d71(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,29,101,109,1,0 // movaps 0x16d65(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,29,117,109,1,0 // movaps 0x16d75(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,13,99,109,1,0 // movaps 0x16d63(%rip),%xmm9 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,13,115,109,1,0 // movaps 0x16d73(%rip),%xmm9 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 68,15,40,45,103,109,1,0 // movaps 0x16d67(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,45,119,109,1,0 // movaps 0x16d77(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -29922,21 +30211,21 @@ _sk_gamma_sse41:
.byte 102,15,58,8,208,1 // roundps $0x1,%xmm0,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,74,109,1,0 // movaps 0x16d4a(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,53,90,109,1,0 // movaps 0x16d5a(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,96,109,1,0 // movaps 0x16d60(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 15,40,61,112,109,1,0 // movaps 0x16d70(%rip),%xmm7 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,64,109,1,0 // movaps 0x16d40(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 15,40,37,80,109,1,0 // movaps 0x16d50(%rip),%xmm4 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,82,109,1,0 // movaps 0x16d52(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,61,98,109,1,0 // movaps 0x16d62(%rip),%xmm15 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,174,108,1,0 // mulps 0x16cae(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
+ .byte 15,89,5,190,108,1,0 // mulps 0x16cbe(%rip),%xmm0 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
.byte 65,15,84,206 // andps %xmm14,%xmm1
.byte 65,15,86,204 // orps %xmm12,%xmm1
.byte 65,15,88,194 // addps %xmm10,%xmm0
@@ -29962,8 +30251,8 @@ _sk_gamma_sse41:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,79,108,1,0 // mulps 0x16c4f(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 15,84,29,88,108,1,0 // andps 0x16c58(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,89,5,95,108,1,0 // mulps 0x16c5f(%rip),%xmm0 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,84,29,104,108,1,0 // andps 0x16c68(%rip),%xmm3 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,86,220 // orps %xmm12,%xmm3
.byte 65,15,88,194 // addps %xmm10,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
@@ -29981,7 +30270,7 @@ _sk_gamma_sse41:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,160,108,1,0 // movaps 0x16ca0(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 15,40,5,176,108,1,0 // movaps 0x16cb0(%rip),%xmm0 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -30001,29 +30290,29 @@ HIDDEN _sk_lab_to_xyz_sse41
FUNCTION(_sk_lab_to_xyz_sse41)
_sk_lab_to_xyz_sse41:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,89,5,112,108,1,0 // mulps 0x16c70(%rip),%xmm8 # 2c130 <_sk_overlay_sse2_8bit+0x117b>
- .byte 68,15,40,13,232,105,1,0 // movaps 0x169e8(%rip),%xmm9 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,89,5,128,108,1,0 // mulps 0x16c80(%rip),%xmm8 # 2c670 <_sk_overlay_sse2_8bit+0x118b>
+ .byte 68,15,40,13,248,105,1,0 // movaps 0x169f8(%rip),%xmm9 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 65,15,89,201 // mulps %xmm9,%xmm1
- .byte 15,40,5,109,108,1,0 // movaps 0x16c6d(%rip),%xmm0 # 2c140 <_sk_overlay_sse2_8bit+0x118b>
+ .byte 15,40,5,125,108,1,0 // movaps 0x16c7d(%rip),%xmm0 # 2c680 <_sk_overlay_sse2_8bit+0x119b>
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
- .byte 68,15,88,5,107,108,1,0 // addps 0x16c6b(%rip),%xmm8 # 2c150 <_sk_overlay_sse2_8bit+0x119b>
- .byte 68,15,89,5,115,108,1,0 // mulps 0x16c73(%rip),%xmm8 # 2c160 <_sk_overlay_sse2_8bit+0x11ab>
- .byte 15,89,13,124,108,1,0 // mulps 0x16c7c(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb>
+ .byte 68,15,88,5,123,108,1,0 // addps 0x16c7b(%rip),%xmm8 # 2c690 <_sk_overlay_sse2_8bit+0x11ab>
+ .byte 68,15,89,5,131,108,1,0 // mulps 0x16c83(%rip),%xmm8 # 2c6a0 <_sk_overlay_sse2_8bit+0x11bb>
+ .byte 15,89,13,140,108,1,0 // mulps 0x16c8c(%rip),%xmm1 # 2c6b0 <_sk_overlay_sse2_8bit+0x11cb>
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 15,89,21,129,108,1,0 // mulps 0x16c81(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb>
+ .byte 15,89,21,145,108,1,0 // mulps 0x16c91(%rip),%xmm2 # 2c6c0 <_sk_overlay_sse2_8bit+0x11db>
.byte 69,15,40,208 // movaps %xmm8,%xmm10
.byte 68,15,92,210 // subps %xmm2,%xmm10
.byte 68,15,40,217 // movaps %xmm1,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
- .byte 68,15,40,13,117,108,1,0 // movaps 0x16c75(%rip),%xmm9 # 2c190 <_sk_overlay_sse2_8bit+0x11db>
+ .byte 68,15,40,13,133,108,1,0 // movaps 0x16c85(%rip),%xmm9 # 2c6d0 <_sk_overlay_sse2_8bit+0x11eb>
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 15,40,21,117,108,1,0 // movaps 0x16c75(%rip),%xmm2 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb>
+ .byte 15,40,21,133,108,1,0 // movaps 0x16c85(%rip),%xmm2 # 2c6e0 <_sk_overlay_sse2_8bit+0x11fb>
.byte 15,88,202 // addps %xmm2,%xmm1
- .byte 68,15,40,37,122,108,1,0 // movaps 0x16c7a(%rip),%xmm12 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb>
+ .byte 68,15,40,37,138,108,1,0 // movaps 0x16c8a(%rip),%xmm12 # 2c6f0 <_sk_overlay_sse2_8bit+0x120b>
.byte 65,15,89,204 // mulps %xmm12,%xmm1
.byte 102,65,15,56,20,203 // blendvps %xmm0,%xmm11,%xmm1
.byte 69,15,40,216 // movaps %xmm8,%xmm11
@@ -30042,8 +30331,8 @@ _sk_lab_to_xyz_sse41:
.byte 65,15,89,212 // mulps %xmm12,%xmm2
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,65,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm2
- .byte 15,89,13,51,108,1,0 // mulps 0x16c33(%rip),%xmm1 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b>
- .byte 15,89,21,60,108,1,0 // mulps 0x16c3c(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b>
+ .byte 15,89,13,67,108,1,0 // mulps 0x16c43(%rip),%xmm1 # 2c700 <_sk_overlay_sse2_8bit+0x121b>
+ .byte 15,89,21,76,108,1,0 // mulps 0x16c4c(%rip),%xmm2 # 2c710 <_sk_overlay_sse2_8bit+0x122b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,40,200 // movaps %xmm8,%xmm1
@@ -30060,11 +30349,11 @@ _sk_load_a8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 155de <_sk_load_a8_sse41+0x3f>
+ .byte 117,39 // jne 15b0e <_sk_load_a8_sse41+0x3f>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,186,104,1,0 // pand 0x168ba(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,5,202,104,1,0 // pand 0x168ca(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,0,106,1,0 // mulps 0x16a00(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,29,16,106,1,0 // mulps 0x16a10(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -30073,12 +30362,12 @@ _sk_load_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15620 <_sk_load_a8_sse41+0x81>
+ .byte 116,53 // je 15b50 <_sk_load_a8_sse41+0x81>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1560a <_sk_load_a8_sse41+0x6b>
+ .byte 116,21 // je 15b3a <_sk_load_a8_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 155be <_sk_load_a8_sse41+0x1f>
+ .byte 117,195 // jne 15aee <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -30086,10 +30375,10 @@ _sk_load_a8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,158 // jmp 155be <_sk_load_a8_sse41+0x1f>
+ .byte 235,158 // jmp 15aee <_sk_load_a8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,147 // jmp 155be <_sk_load_a8_sse41+0x1f>
+ .byte 235,147 // jmp 15aee <_sk_load_a8_sse41+0x1f>
HIDDEN _sk_load_a8_dst_sse41
.globl _sk_load_a8_dst_sse41
@@ -30102,11 +30391,11 @@ _sk_load_a8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,39 // jne 1566a <_sk_load_a8_dst_sse41+0x3f>
+ .byte 117,39 // jne 15b9a <_sk_load_a8_dst_sse41+0x3f>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,46,104,1,0 // pand 0x1682e(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,37,62,104,1,0 // pand 0x1683e(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,116,105,1,0 // mulps 0x16974(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,61,132,105,1,0 // mulps 0x16984(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
@@ -30115,12 +30404,12 @@ _sk_load_a8_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 156ac <_sk_load_a8_dst_sse41+0x81>
+ .byte 116,53 // je 15bdc <_sk_load_a8_dst_sse41+0x81>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15696 <_sk_load_a8_dst_sse41+0x6b>
+ .byte 116,21 // je 15bc6 <_sk_load_a8_dst_sse41+0x6b>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1564a <_sk_load_a8_dst_sse41+0x1f>
+ .byte 117,195 // jne 15b7a <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -30128,10 +30417,10 @@ _sk_load_a8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,158 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,158 // jmp 15b7a <_sk_load_a8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,147 // jmp 1564a <_sk_load_a8_dst_sse41+0x1f>
+ .byte 235,147 // jmp 15b7a <_sk_load_a8_dst_sse41+0x1f>
HIDDEN _sk_gather_a8_sse41
.globl _sk_gather_a8_sse41
@@ -30160,7 +30449,7 @@ _sk_gather_a8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,169,104,1,0 // mulps 0x168a9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,29,185,104,1,0 // mulps 0x168b9(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -30178,13 +30467,13 @@ _sk_store_a8_sse41:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,94,103,1,0 // movaps 0x1675e(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,110,103,1,0 // movaps 0x1676e(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 15778 <_sk_store_a8_sse41+0x41>
+ .byte 117,13 // jne 15ca8 <_sk_store_a8_sse41+0x41>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -30193,17 +30482,17 @@ _sk_store_a8_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 157b4 <_sk_store_a8_sse41+0x7d>
+ .byte 116,41 // je 15ce4 <_sk_store_a8_sse41+0x7d>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 157a0 <_sk_store_a8_sse41+0x69>
+ .byte 116,15 // je 15cd0 <_sk_store_a8_sse41+0x69>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 15774 <_sk_store_a8_sse41+0x3d>
+ .byte 117,221 // jne 15ca4 <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,68,25,2,8 // pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- .byte 102,68,15,56,0,5,54,106,1,0 // pshufb 0x16a36(%rip),%xmm8 # 2c1e0 <_sk_overlay_sse2_8bit+0x122b>
+ .byte 102,68,15,56,0,5,70,106,1,0 // pshufb 0x16a46(%rip),%xmm8 # 2c720 <_sk_overlay_sse2_8bit+0x123b>
.byte 102,71,15,58,21,4,25,0 // pextrw $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,192 // jmp 15774 <_sk_store_a8_sse41+0x3d>
+ .byte 235,192 // jmp 15ca4 <_sk_store_a8_sse41+0x3d>
.byte 102,71,15,58,20,4,25,0 // pextrb $0x0,%xmm8,(%r9,%r11,1)
- .byte 235,182 // jmp 15774 <_sk_store_a8_sse41+0x3d>
+ .byte 235,182 // jmp 15ca4 <_sk_store_a8_sse41+0x3d>
HIDDEN _sk_load_g8_sse41
.globl _sk_load_g8_sse41
@@ -30216,25 +30505,25 @@ _sk_load_g8_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 15800 <_sk_load_g8_sse41+0x42>
+ .byte 117,42 // jne 15d30 <_sk_load_g8_sse41+0x42>
.byte 102,67,15,56,49,4,25 // pmovzxbd (%r9,%r11,1),%xmm0
- .byte 102,15,219,5,155,102,1,0 // pand 0x1669b(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,5,171,102,1,0 // pand 0x166ab(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,225,103,1,0 // mulps 0x167e1(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,5,241,103,1,0 // mulps 0x167f1(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,216,101,1,0 // movaps 0x165d8(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,232,101,1,0 // movaps 0x165e8(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15842 <_sk_load_g8_sse41+0x84>
+ .byte 116,53 // je 15d72 <_sk_load_g8_sse41+0x84>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1582c <_sk_load_g8_sse41+0x6e>
+ .byte 116,21 // je 15d5c <_sk_load_g8_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 157dd <_sk_load_g8_sse41+0x1f>
+ .byte 117,192 // jne 15d0d <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -30242,10 +30531,10 @@ _sk_load_g8_sse41:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,56,49,201 // pmovzxbd %xmm1,%xmm1
.byte 102,15,58,14,193,15 // pblendw $0xf,%xmm1,%xmm0
- .byte 235,155 // jmp 157dd <_sk_load_g8_sse41+0x1f>
+ .byte 235,155 // jmp 15d0d <_sk_load_g8_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,144 // jmp 157dd <_sk_load_g8_sse41+0x1f>
+ .byte 235,144 // jmp 15d0d <_sk_load_g8_sse41+0x1f>
HIDDEN _sk_load_g8_dst_sse41
.globl _sk_load_g8_dst_sse41
@@ -30258,25 +30547,25 @@ _sk_load_g8_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,42 // jne 1588f <_sk_load_g8_dst_sse41+0x42>
+ .byte 117,42 // jne 15dbf <_sk_load_g8_dst_sse41+0x42>
.byte 102,67,15,56,49,36,25 // pmovzxbd (%r9,%r11,1),%xmm4
- .byte 102,15,219,37,12,102,1,0 // pand 0x1660c(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,37,28,102,1,0 // pand 0x1661c(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,82,103,1,0 // mulps 0x16752(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,37,98,103,1,0 // mulps 0x16762(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,73,101,1,0 // movaps 0x16549(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,61,89,101,1,0 // movaps 0x16559(%rip),%xmm7 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 158d1 <_sk_load_g8_dst_sse41+0x84>
+ .byte 116,53 // je 15e01 <_sk_load_g8_dst_sse41+0x84>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 158bb <_sk_load_g8_dst_sse41+0x6e>
+ .byte 116,21 // je 15deb <_sk_load_g8_dst_sse41+0x6e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1586c <_sk_load_g8_dst_sse41+0x1f>
+ .byte 117,192 // jne 15d9c <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -30284,10 +30573,10 @@ _sk_load_g8_dst_sse41:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,49,237 // pmovzxbd %xmm5,%xmm5
.byte 102,15,58,14,229,15 // pblendw $0xf,%xmm5,%xmm4
- .byte 235,155 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,155 // jmp 15d9c <_sk_load_g8_dst_sse41+0x1f>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,144 // jmp 1586c <_sk_load_g8_dst_sse41+0x1f>
+ .byte 235,144 // jmp 15d9c <_sk_load_g8_dst_sse41+0x1f>
HIDDEN _sk_gather_g8_sse41
.globl _sk_gather_g8_sse41
@@ -30316,9 +30605,9 @@ _sk_gather_g8_sse41:
.byte 102,15,58,32,192,3 // pinsrb $0x3,%eax,%xmm0
.byte 102,15,56,49,192 // pmovzxbd %xmm0,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,132,102,1,0 // mulps 0x16684(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,5,148,102,1,0 // mulps 0x16694(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,123,100,1,0 // movaps 0x1647b(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,139,100,1,0 // movaps 0x1648b(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -30336,41 +30625,41 @@ _sk_load_565_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 159c9 <_sk_load_565_sse41+0x6b>
+ .byte 117,80 // jne 15ef9 <_sk_load_565_sse41+0x6b>
.byte 102,67,15,56,51,20,89 // pmovzxwd (%r9,%r11,2),%xmm2
- .byte 102,15,111,5,88,102,1,0 // movdqa 0x16658(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,5,104,102,1,0 // movdqa 0x16668(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,90,102,1,0 // mulps 0x1665a(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,13,98,102,1,0 // movdqa 0x16662(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 15,89,5,106,102,1,0 // mulps 0x1666a(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,13,114,102,1,0 // movdqa 0x16672(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,100,102,1,0 // mulps 0x16664(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,15,219,21,108,102,1,0 // pand 0x1666c(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 15,89,13,116,102,1,0 // mulps 0x16674(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,15,219,21,124,102,1,0 // pand 0x1667c(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,114,102,1,0 // mulps 0x16672(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,89,21,130,102,1,0 // mulps 0x16682(%rip),%xmm2 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,9,100,1,0 // movaps 0x16409(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,25,100,1,0 // movaps 0x16419(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15a0b <_sk_load_565_sse41+0xad>
+ .byte 116,53 // je 15f3b <_sk_load_565_sse41+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 159f5 <_sk_load_565_sse41+0x97>
+ .byte 116,21 // je 15f25 <_sk_load_565_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 15980 <_sk_load_565_sse41+0x22>
+ .byte 117,154 // jne 15eb0 <_sk_load_565_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,208,15 // pblendw $0xf,%xmm0,%xmm2
- .byte 233,117,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15eb0 <_sk_load_565_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,103,255,255,255 // jmpq 15980 <_sk_load_565_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15eb0 <_sk_load_565_sse41+0x22>
HIDDEN _sk_load_565_dst_sse41
.globl _sk_load_565_dst_sse41
@@ -30384,41 +30673,41 @@ _sk_load_565_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,80 // jne 15a84 <_sk_load_565_dst_sse41+0x6b>
+ .byte 117,80 // jne 15fb4 <_sk_load_565_dst_sse41+0x6b>
.byte 102,67,15,56,51,52,89 // pmovzxwd (%r9,%r11,2),%xmm6
- .byte 102,15,111,37,157,101,1,0 // movdqa 0x1659d(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,37,173,101,1,0 // movdqa 0x165ad(%rip),%xmm4 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,159,101,1,0 // mulps 0x1659f(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,45,167,101,1,0 // movdqa 0x165a7(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 15,89,37,175,101,1,0 // mulps 0x165af(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,45,183,101,1,0 // movdqa 0x165b7(%rip),%xmm5 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,169,101,1,0 // mulps 0x165a9(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,15,219,53,177,101,1,0 // pand 0x165b1(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 15,89,45,185,101,1,0 // mulps 0x165b9(%rip),%xmm5 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,15,219,53,193,101,1,0 // pand 0x165c1(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,183,101,1,0 // mulps 0x165b7(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,89,53,199,101,1,0 // mulps 0x165c7(%rip),%xmm6 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,78,99,1,0 // movaps 0x1634e(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,61,94,99,1,0 // movaps 0x1635e(%rip),%xmm7 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15ac6 <_sk_load_565_dst_sse41+0xad>
+ .byte 116,53 // je 15ff6 <_sk_load_565_dst_sse41+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15ab0 <_sk_load_565_dst_sse41+0x97>
+ .byte 116,21 // je 15fe0 <_sk_load_565_dst_sse41+0x97>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 15a3b <_sk_load_565_dst_sse41+0x22>
+ .byte 117,154 // jne 15f6b <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,117,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22>
+ .byte 233,117,255,255,255 // jmpq 15f6b <_sk_load_565_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,103,255,255,255 // jmpq 15a3b <_sk_load_565_dst_sse41+0x22>
+ .byte 233,103,255,255,255 // jmpq 15f6b <_sk_load_565_dst_sse41+0x22>
HIDDEN _sk_gather_565_sse41
.globl _sk_gather_565_sse41
@@ -30446,19 +30735,19 @@ _sk_gather_565_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,208 // pmovzxwd %xmm0,%xmm2
- .byte 102,15,111,5,162,100,1,0 // movdqa 0x164a2(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,5,178,100,1,0 // movdqa 0x164b2(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,164,100,1,0 // mulps 0x164a4(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,13,172,100,1,0 // movdqa 0x164ac(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 15,89,5,180,100,1,0 // mulps 0x164b4(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,13,188,100,1,0 // movdqa 0x164bc(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,174,100,1,0 // mulps 0x164ae(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,15,219,21,182,100,1,0 // pand 0x164b6(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 15,89,13,190,100,1,0 // mulps 0x164be(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,15,219,21,198,100,1,0 // pand 0x164c6(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,188,100,1,0 // mulps 0x164bc(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,89,21,204,100,1,0 // mulps 0x164cc(%rip),%xmm2 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,83,98,1,0 // movaps 0x16253(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,99,98,1,0 // movaps 0x16263(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -30473,12 +30762,12 @@ _sk_store_565_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,82,102,1,0 // movaps 0x16652(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b>
+ .byte 68,15,40,5,98,102,1,0 // movaps 0x16662(%rip),%xmm8 # 2c730 <_sk_overlay_sse2_8bit+0x124b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,71,102,1,0 // movaps 0x16647(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b>
+ .byte 68,15,40,21,87,102,1,0 // movaps 0x16657(%rip),%xmm10 # 2c740 <_sk_overlay_sse2_8bit+0x125b>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -30488,7 +30777,7 @@ _sk_store_565_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15bf0 <_sk_store_565_sse41+0x70>
+ .byte 117,10 // jne 16120 <_sk_store_565_sse41+0x70>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30496,17 +30785,17 @@ _sk_store_565_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 15c26 <_sk_store_565_sse41+0xa6>
+ .byte 116,35 // je 16156 <_sk_store_565_sse41+0xa6>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15c18 <_sk_store_565_sse41+0x98>
+ .byte 116,15 // je 16148 <_sk_store_565_sse41+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 15bec <_sk_store_565_sse41+0x6c>
+ .byte 117,221 // jne 1611c <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 15bec <_sk_store_565_sse41+0x6c>
+ .byte 235,198 // jmp 1611c <_sk_store_565_sse41+0x6c>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 15bec <_sk_store_565_sse41+0x6c>
+ .byte 235,188 // jmp 1611c <_sk_store_565_sse41+0x6c>
HIDDEN _sk_load_4444_sse41
.globl _sk_load_4444_sse41
@@ -30520,44 +30809,44 @@ _sk_load_4444_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 15caa <_sk_load_4444_sse41+0x7a>
+ .byte 117,95 // jne 161da <_sk_load_4444_sse41+0x7a>
.byte 102,67,15,56,51,28,89 // pmovzxwd (%r9,%r11,2),%xmm3
- .byte 102,15,111,5,182,101,1,0 // movdqa 0x165b6(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
+ .byte 102,15,111,5,198,101,1,0 // movdqa 0x165c6(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x126b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,184,101,1,0 // mulps 0x165b8(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
- .byte 102,15,111,13,192,101,1,0 // movdqa 0x165c0(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 15,89,5,200,101,1,0 // mulps 0x165c8(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 102,15,111,13,208,101,1,0 // movdqa 0x165d0(%rip),%xmm1 # 2c770 <_sk_overlay_sse2_8bit+0x128b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,194,101,1,0 // mulps 0x165c2(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
- .byte 102,15,111,21,202,101,1,0 // movdqa 0x165ca(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 15,89,13,210,101,1,0 // mulps 0x165d2(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 102,15,111,21,218,101,1,0 // movdqa 0x165da(%rip),%xmm2 # 2c790 <_sk_overlay_sse2_8bit+0x12ab>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,204,101,1,0 // mulps 0x165cc(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
- .byte 102,15,219,29,212,101,1,0 // pand 0x165d4(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 15,89,21,220,101,1,0 // mulps 0x165dc(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 102,15,219,29,228,101,1,0 // pand 0x165e4(%rip),%xmm3 # 2c7b0 <_sk_overlay_sse2_8bit+0x12cb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,218,101,1,0 // mulps 0x165da(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
+ .byte 15,89,29,234,101,1,0 // mulps 0x165ea(%rip),%xmm3 # 2c7c0 <_sk_overlay_sse2_8bit+0x12db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15cec <_sk_load_4444_sse41+0xbc>
+ .byte 116,53 // je 1621c <_sk_load_4444_sse41+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15cd6 <_sk_load_4444_sse41+0xa6>
+ .byte 116,21 // je 16206 <_sk_load_4444_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 15c52 <_sk_load_4444_sse41+0x22>
+ .byte 117,139 // jne 16182 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,56,51,192 // pmovzxwd %xmm0,%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,102,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 16182 <_sk_load_4444_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,88,255,255,255 // jmpq 15c52 <_sk_load_4444_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 16182 <_sk_load_4444_sse41+0x22>
HIDDEN _sk_load_4444_dst_sse41
.globl _sk_load_4444_dst_sse41
@@ -30571,44 +30860,44 @@ _sk_load_4444_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,95 // jne 15d74 <_sk_load_4444_dst_sse41+0x7a>
+ .byte 117,95 // jne 162a4 <_sk_load_4444_dst_sse41+0x7a>
.byte 102,67,15,56,51,60,89 // pmovzxwd (%r9,%r11,2),%xmm7
- .byte 102,15,111,37,236,100,1,0 // movdqa 0x164ec(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
+ .byte 102,15,111,37,252,100,1,0 // movdqa 0x164fc(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x126b>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,238,100,1,0 // mulps 0x164ee(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
- .byte 102,15,111,45,246,100,1,0 // movdqa 0x164f6(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 15,89,37,254,100,1,0 // mulps 0x164fe(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 102,15,111,45,6,101,1,0 // movdqa 0x16506(%rip),%xmm5 # 2c770 <_sk_overlay_sse2_8bit+0x128b>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,248,100,1,0 // mulps 0x164f8(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
- .byte 102,15,111,53,0,101,1,0 // movdqa 0x16500(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 15,89,45,8,101,1,0 // mulps 0x16508(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 102,15,111,53,16,101,1,0 // movdqa 0x16510(%rip),%xmm6 # 2c790 <_sk_overlay_sse2_8bit+0x12ab>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,2,101,1,0 // mulps 0x16502(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
- .byte 102,15,219,61,10,101,1,0 // pand 0x1650a(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 15,89,53,18,101,1,0 // mulps 0x16512(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 102,15,219,61,26,101,1,0 // pand 0x1651a(%rip),%xmm7 # 2c7b0 <_sk_overlay_sse2_8bit+0x12cb>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,16,101,1,0 // mulps 0x16510(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
+ .byte 15,89,61,32,101,1,0 // mulps 0x16520(%rip),%xmm7 # 2c7c0 <_sk_overlay_sse2_8bit+0x12db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,53 // je 15db6 <_sk_load_4444_dst_sse41+0xbc>
+ .byte 116,53 // je 162e6 <_sk_load_4444_dst_sse41+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 15da0 <_sk_load_4444_dst_sse41+0xa6>
+ .byte 116,21 // je 162d0 <_sk_load_4444_dst_sse41+0xa6>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 15d1c <_sk_load_4444_dst_sse41+0x22>
+ .byte 117,139 // jne 1624c <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,56,51,228 // pmovzxwd %xmm4,%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,102,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,102,255,255,255 // jmpq 1624c <_sk_load_4444_dst_sse41+0x22>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,88,255,255,255 // jmpq 15d1c <_sk_load_4444_dst_sse41+0x22>
+ .byte 233,88,255,255,255 // jmpq 1624c <_sk_load_4444_dst_sse41+0x22>
HIDDEN _sk_gather_4444_sse41
.globl _sk_gather_4444_sse41
@@ -30636,21 +30925,21 @@ _sk_gather_4444_sse41:
.byte 65,15,183,4,65 // movzwl (%r9,%rax,2),%eax
.byte 102,15,196,192,3 // pinsrw $0x3,%eax,%xmm0
.byte 102,15,56,51,216 // pmovzxwd %xmm0,%xmm3
- .byte 102,15,111,5,226,99,1,0 // movdqa 0x163e2(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
+ .byte 102,15,111,5,242,99,1,0 // movdqa 0x163f2(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x126b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,228,99,1,0 // mulps 0x163e4(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
- .byte 102,15,111,13,236,99,1,0 // movdqa 0x163ec(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 15,89,5,244,99,1,0 // mulps 0x163f4(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 102,15,111,13,252,99,1,0 // movdqa 0x163fc(%rip),%xmm1 # 2c770 <_sk_overlay_sse2_8bit+0x128b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,238,99,1,0 // mulps 0x163ee(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
- .byte 102,15,111,21,246,99,1,0 // movdqa 0x163f6(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 15,89,13,254,99,1,0 // mulps 0x163fe(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 102,15,111,21,6,100,1,0 // movdqa 0x16406(%rip),%xmm2 # 2c790 <_sk_overlay_sse2_8bit+0x12ab>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,248,99,1,0 // mulps 0x163f8(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
- .byte 102,15,219,29,0,100,1,0 // pand 0x16400(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 15,89,21,8,100,1,0 // mulps 0x16408(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 102,15,219,29,16,100,1,0 // pand 0x16410(%rip),%xmm3 # 2c7b0 <_sk_overlay_sse2_8bit+0x12cb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,6,100,1,0 // mulps 0x16406(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
+ .byte 15,89,29,22,100,1,0 // mulps 0x16416(%rip),%xmm3 # 2c7c0 <_sk_overlay_sse2_8bit+0x12db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -30666,7 +30955,7 @@ _sk_store_4444_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,243,99,1,0 // movaps 0x163f3(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db>
+ .byte 68,15,40,5,3,100,1,0 // movaps 0x16403(%rip),%xmm8 # 2c7d0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -30686,7 +30975,7 @@ _sk_store_4444_sse41:
.byte 102,69,15,86,194 // orpd %xmm10,%xmm8
.byte 102,69,15,56,43,192 // packusdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 15f03 <_sk_store_4444_sse41+0x84>
+ .byte 117,10 // jne 16433 <_sk_store_4444_sse41+0x84>
.byte 242,69,15,17,4,65 // movsd %xmm8,(%r9,%rax,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -30694,17 +30983,17 @@ _sk_store_4444_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,35 // je 15f39 <_sk_store_4444_sse41+0xba>
+ .byte 116,35 // je 16469 <_sk_store_4444_sse41+0xba>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 15f2b <_sk_store_4444_sse41+0xac>
+ .byte 116,15 // je 1645b <_sk_store_4444_sse41+0xac>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,221 // jne 15eff <_sk_store_4444_sse41+0x80>
+ .byte 117,221 // jne 1642f <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,68,65,4,4 // pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,69,15,126,4,65 // movd %xmm8,(%r9,%rax,2)
- .byte 235,198 // jmp 15eff <_sk_store_4444_sse41+0x80>
+ .byte 235,198 // jmp 1642f <_sk_store_4444_sse41+0x80>
.byte 102,69,15,58,21,4,65,0 // pextrw $0x0,%xmm8,(%r9,%rax,2)
- .byte 235,188 // jmp 15eff <_sk_store_4444_sse41+0x80>
+ .byte 235,188 // jmp 1642f <_sk_store_4444_sse41+0x80>
HIDDEN _sk_load_8888_sse41
.globl _sk_load_8888_sse41
@@ -30718,19 +31007,19 @@ _sk_load_8888_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 15fb8 <_sk_load_8888_sse41+0x75>
+ .byte 117,89 // jne 164e8 <_sk_load_8888_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,19,95,1,0 // movdqa 0x15f13(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,35,95,1,0 // movdqa 0x15f23(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,84,96,1,0 // movaps 0x16054(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,100,96,1,0 // movaps 0x16064(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,3,95,1,0 // pshufb 0x15f03(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,13,19,95,1,0 // pshufb 0x15f13(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,255,94,1,0 // pshufb 0x15eff(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,21,15,95,1,0 // pshufb 0x15f0f(%rip),%xmm2 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -30741,19 +31030,19 @@ _sk_load_8888_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 15ff2 <_sk_load_8888_sse41+0xaf>
+ .byte 116,45 // je 16522 <_sk_load_8888_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 15fe1 <_sk_load_8888_sse41+0x9e>
+ .byte 116,18 // je 16511 <_sk_load_8888_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 15f65 <_sk_load_8888_sse41+0x22>
+ .byte 117,144 // jne 16495 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 16495 <_sk_load_8888_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 15f65 <_sk_load_8888_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 16495 <_sk_load_8888_sse41+0x22>
HIDDEN _sk_load_8888_dst_sse41
.globl _sk_load_8888_dst_sse41
@@ -30767,19 +31056,19 @@ _sk_load_8888_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 16072 <_sk_load_8888_dst_sse41+0x75>
+ .byte 117,89 // jne 165a2 <_sk_load_8888_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,89,94,1,0 // movdqa 0x15e59(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,37,105,94,1,0 // movdqa 0x15e69(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,154,95,1,0 // movaps 0x15f9a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,170,95,1,0 // movaps 0x15faa(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,111,239 // movdqa %xmm7,%xmm5
- .byte 102,15,56,0,45,73,94,1,0 // pshufb 0x15e49(%rip),%xmm5 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,45,89,94,1,0 // pshufb 0x15e59(%rip),%xmm5 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,69,94,1,0 // pshufb 0x15e45(%rip),%xmm6 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,53,85,94,1,0 // pshufb 0x15e55(%rip),%xmm6 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -30790,19 +31079,19 @@ _sk_load_8888_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 160ac <_sk_load_8888_dst_sse41+0xaf>
+ .byte 116,45 // je 165dc <_sk_load_8888_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1609b <_sk_load_8888_dst_sse41+0x9e>
+ .byte 116,18 // je 165cb <_sk_load_8888_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 1601f <_sk_load_8888_dst_sse41+0x22>
+ .byte 117,144 // jne 1654f <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 1654f <_sk_load_8888_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 1601f <_sk_load_8888_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 1654f <_sk_load_8888_dst_sse41+0x22>
HIDDEN _sk_gather_8888_sse41
.globl _sk_gather_8888_sse41
@@ -30827,17 +31116,17 @@ _sk_gather_8888_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,104,93,1,0 // movdqa 0x15d68(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,120,93,1,0 // movdqa 0x15d78(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,169,94,1,0 // movaps 0x15ea9(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,185,94,1,0 // movaps 0x15eb9(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
- .byte 102,15,56,0,13,88,93,1,0 // pshufb 0x15d58(%rip),%xmm1 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,13,104,93,1,0 // pshufb 0x15d68(%rip),%xmm1 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,56,0,21,84,93,1,0 // pshufb 0x15d54(%rip),%xmm2 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,21,100,93,1,0 // pshufb 0x15d64(%rip),%xmm2 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -30858,7 +31147,7 @@ _sk_store_8888_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,45,93,1,0 // movaps 0x15d2d(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,61,93,1,0 // movaps 0x15d3d(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -30877,23 +31166,23 @@ _sk_store_8888_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 161e3 <_sk_store_8888_sse41+0x7f>
+ .byte 117,10 // jne 16713 <_sk_store_8888_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 1620d <_sk_store_8888_sse41+0xa9>
+ .byte 116,29 // je 1673d <_sk_store_8888_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 16205 <_sk_store_8888_sse41+0xa1>
+ .byte 116,15 // je 16735 <_sk_store_8888_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 161df <_sk_store_8888_sse41+0x7b>
+ .byte 117,227 // jne 1670f <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 161df <_sk_store_8888_sse41+0x7b>
+ .byte 235,210 // jmp 1670f <_sk_store_8888_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 161df <_sk_store_8888_sse41+0x7b>
+ .byte 235,202 // jmp 1670f <_sk_store_8888_sse41+0x7b>
HIDDEN _sk_load_bgra_sse41
.globl _sk_load_bgra_sse41
@@ -30907,19 +31196,19 @@ _sk_load_bgra_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 1628a <_sk_load_bgra_sse41+0x75>
+ .byte 117,89 // jne 167ba <_sk_load_bgra_sse41+0x75>
.byte 243,65,15,111,28,129 // movdqu (%r9,%rax,4),%xmm3
- .byte 102,15,111,5,65,92,1,0 // movdqa 0x15c41(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,81,92,1,0 // movdqa 0x15c51(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,130,93,1,0 // movaps 0x15d82(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,146,93,1,0 // movaps 0x15d92(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,49,92,1,0 // pshufb 0x15c31(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,5,65,92,1,0 // pshufb 0x15c41(%rip),%xmm0 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,45,92,1,0 // pshufb 0x15c2d(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,5,61,92,1,0 // pshufb 0x15c3d(%rip),%xmm0 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -30930,19 +31219,19 @@ _sk_load_bgra_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 162c4 <_sk_load_bgra_sse41+0xaf>
+ .byte 116,45 // je 167f4 <_sk_load_bgra_sse41+0xaf>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 162b3 <_sk_load_bgra_sse41+0x9e>
+ .byte 116,18 // je 167e3 <_sk_load_bgra_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 16237 <_sk_load_bgra_sse41+0x22>
+ .byte 117,144 // jne 16767 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 243,65,15,126,4,129 // movq (%r9,%rax,4),%xmm0
.byte 102,15,58,14,216,15 // pblendw $0xf,%xmm0,%xmm3
- .byte 233,115,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 16767 <_sk_load_bgra_sse41+0x22>
.byte 102,65,15,110,28,129 // movd (%r9,%rax,4),%xmm3
- .byte 233,104,255,255,255 // jmpq 16237 <_sk_load_bgra_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 16767 <_sk_load_bgra_sse41+0x22>
HIDDEN _sk_load_bgra_dst_sse41
.globl _sk_load_bgra_dst_sse41
@@ -30956,19 +31245,19 @@ _sk_load_bgra_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,89 // jne 16344 <_sk_load_bgra_dst_sse41+0x75>
+ .byte 117,89 // jne 16874 <_sk_load_bgra_dst_sse41+0x75>
.byte 243,65,15,111,60,129 // movdqu (%r9,%rax,4),%xmm7
- .byte 102,15,111,37,135,91,1,0 // movdqa 0x15b87(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,37,151,91,1,0 // movdqa 0x15b97(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,244 // cvtdq2ps %xmm4,%xmm6
- .byte 68,15,40,5,200,92,1,0 // movaps 0x15cc8(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,216,92,1,0 // movaps 0x15cd8(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,119,91,1,0 // pshufb 0x15b77(%rip),%xmm4 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,37,135,91,1,0 // pshufb 0x15b87(%rip),%xmm4 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,236 // cvtdq2ps %xmm4,%xmm5
.byte 65,15,89,232 // mulps %xmm8,%xmm5
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
- .byte 102,15,56,0,37,115,91,1,0 // pshufb 0x15b73(%rip),%xmm4 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,37,131,91,1,0 // pshufb 0x15b83(%rip),%xmm4 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,15,114,215,24 // psrld $0x18,%xmm7
@@ -30979,19 +31268,19 @@ _sk_load_bgra_dst_sse41:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 1637e <_sk_load_bgra_dst_sse41+0xaf>
+ .byte 116,45 // je 168ae <_sk_load_bgra_dst_sse41+0xaf>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1636d <_sk_load_bgra_dst_sse41+0x9e>
+ .byte 116,18 // je 1689d <_sk_load_bgra_dst_sse41+0x9e>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,144 // jne 162f1 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 117,144 // jne 16821 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 243,65,15,126,36,129 // movq (%r9,%rax,4),%xmm4
.byte 102,15,58,14,252,15 // pblendw $0xf,%xmm4,%xmm7
- .byte 233,115,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,115,255,255,255 // jmpq 16821 <_sk_load_bgra_dst_sse41+0x22>
.byte 102,65,15,110,60,129 // movd (%r9,%rax,4),%xmm7
- .byte 233,104,255,255,255 // jmpq 162f1 <_sk_load_bgra_dst_sse41+0x22>
+ .byte 233,104,255,255,255 // jmpq 16821 <_sk_load_bgra_dst_sse41+0x22>
HIDDEN _sk_gather_bgra_sse41
.globl _sk_gather_bgra_sse41
@@ -31016,17 +31305,17 @@ _sk_gather_bgra_sse41:
.byte 102,65,15,58,34,28,129,1 // pinsrd $0x1,(%r9,%rax,4),%xmm3
.byte 102,65,15,58,34,28,153,2 // pinsrd $0x2,(%r9,%rbx,4),%xmm3
.byte 102,67,15,58,34,28,153,3 // pinsrd $0x3,(%r9,%r11,4),%xmm3
- .byte 102,15,111,5,150,90,1,0 // movdqa 0x15a96(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,166,90,1,0 // movdqa 0x15aa6(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,208 // cvtdq2ps %xmm0,%xmm2
- .byte 68,15,40,5,215,91,1,0 // movaps 0x15bd7(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,231,91,1,0 // movaps 0x15be7(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,134,90,1,0 // pshufb 0x15a86(%rip),%xmm0 # 2be90 <_sk_overlay_sse2_8bit+0xedb>
+ .byte 102,15,56,0,5,150,90,1,0 // pshufb 0x15a96(%rip),%xmm0 # 2c3d0 <_sk_overlay_sse2_8bit+0xeeb>
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
- .byte 102,15,56,0,5,130,90,1,0 // pshufb 0x15a82(%rip),%xmm0 # 2bea0 <_sk_overlay_sse2_8bit+0xeeb>
+ .byte 102,15,56,0,5,146,90,1,0 // pshufb 0x15a92(%rip),%xmm0 # 2c3e0 <_sk_overlay_sse2_8bit+0xefb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,114,211,24 // psrld $0x18,%xmm3
@@ -31047,7 +31336,7 @@ _sk_store_bgra_sse41:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,91,90,1,0 // movaps 0x15a5b(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,107,90,1,0 // movaps 0x15a6b(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -31066,23 +31355,23 @@ _sk_store_bgra_sse41:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 164b5 <_sk_store_bgra_sse41+0x7f>
+ .byte 117,10 // jne 169e5 <_sk_store_bgra_sse41+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,29 // je 164df <_sk_store_bgra_sse41+0xa9>
+ .byte 116,29 // je 16a0f <_sk_store_bgra_sse41+0xa9>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,15 // je 164d7 <_sk_store_bgra_sse41+0xa1>
+ .byte 116,15 // je 16a07 <_sk_store_bgra_sse41+0xa1>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 164b1 <_sk_store_bgra_sse41+0x7b>
+ .byte 117,227 // jne 169e1 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,58,22,68,129,8,2 // pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,210 // jmp 164b1 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,210 // jmp 169e1 <_sk_store_bgra_sse41+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,202 // jmp 164b1 <_sk_store_bgra_sse41+0x7b>
+ .byte 235,202 // jmp 169e1 <_sk_store_bgra_sse41+0x7b>
HIDDEN _sk_load_f16_sse41
.globl _sk_load_f16_sse41
@@ -31096,7 +31385,7 @@ _sk_load_f16_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 16645 <_sk_load_f16_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 16b75 <_sk_load_f16_sse41+0x15e>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 243,65,15,111,76,193,16 // movdqu 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,200 // movapd %xmm0,%xmm9
@@ -31106,18 +31395,18 @@ _sk_load_f16_sse41:
.byte 102,68,15,97,216 // punpcklwd %xmm0,%xmm11
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,96,93,1,0 // movdqa 0x15d60(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
+ .byte 102,68,15,111,5,112,93,1,0 // movdqa 0x15d70(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,91,93,1,0 // movdqa 0x15d5b(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
+ .byte 102,15,111,29,107,93,1,0 // movdqa 0x15d6b(%rip),%xmm3 # 2c7f0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,71,93,1,0 // movdqa 0x15d47(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
+ .byte 102,68,15,111,21,87,93,1,0 // movdqa 0x15d57(%rip),%xmm10 # 2c800 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31160,16 +31449,16 @@ _sk_load_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 1665e <_sk_load_f16_sse41+0x177>
+ .byte 117,13 // jne 16b8e <_sk_load_f16_sse41+0x177>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,182,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 16a44 <_sk_load_f16_sse41+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 16514 <_sk_load_f16_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 16a44 <_sk_load_f16_sse41+0x2d>
.byte 243,65,15,126,76,193,16 // movq 0x10(%r9,%rax,8),%xmm1
- .byte 233,149,254,255,255 // jmpq 16514 <_sk_load_f16_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 16a44 <_sk_load_f16_sse41+0x2d>
HIDDEN _sk_load_f16_dst_sse41
.globl _sk_load_f16_dst_sse41
@@ -31183,7 +31472,7 @@ _sk_load_f16_dst_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,62,1,0,0 // jne 167dd <_sk_load_f16_dst_sse41+0x15e>
+ .byte 15,133,62,1,0,0 // jne 16d0d <_sk_load_f16_dst_sse41+0x15e>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 243,65,15,111,108,193,16 // movdqu 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,204 // movapd %xmm4,%xmm9
@@ -31193,18 +31482,18 @@ _sk_load_f16_dst_sse41:
.byte 102,68,15,97,220 // punpcklwd %xmm4,%xmm11
.byte 102,68,15,105,204 // punpckhwd %xmm4,%xmm9
.byte 102,65,15,56,51,235 // pmovzxwd %xmm11,%xmm5
- .byte 102,68,15,111,5,200,91,1,0 // movdqa 0x15bc8(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
+ .byte 102,68,15,111,5,216,91,1,0 // movdqa 0x15bd8(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,111,245 // movdqa %xmm5,%xmm6
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,239,238 // pxor %xmm6,%xmm5
- .byte 102,15,111,61,195,91,1,0 // movdqa 0x15bc3(%rip),%xmm7 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
+ .byte 102,15,111,61,211,91,1,0 // movdqa 0x15bd3(%rip),%xmm7 # 2c7f0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,15,114,246,16 // pslld $0x10,%xmm6
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,15,56,63,231 // pmaxud %xmm7,%xmm4
.byte 102,15,118,229 // pcmpeqd %xmm5,%xmm4
.byte 102,15,114,245,13 // pslld $0xd,%xmm5
.byte 102,15,235,238 // por %xmm6,%xmm5
- .byte 102,68,15,111,21,175,91,1,0 // movdqa 0x15baf(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
+ .byte 102,68,15,111,21,191,91,1,0 // movdqa 0x15bbf(%rip),%xmm10 # 2c800 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,254,234 // paddd %xmm10,%xmm5
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31247,16 +31536,16 @@ _sk_load_f16_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 167f6 <_sk_load_f16_dst_sse41+0x177>
+ .byte 117,13 // jne 16d26 <_sk_load_f16_dst_sse41+0x177>
.byte 243,15,126,228 // movq %xmm4,%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
- .byte 233,182,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,182,254,255,255 // jmpq 16bdc <_sk_load_f16_dst_sse41+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,161,254,255,255 // jb 166ac <_sk_load_f16_dst_sse41+0x2d>
+ .byte 15,130,161,254,255,255 // jb 16bdc <_sk_load_f16_dst_sse41+0x2d>
.byte 243,65,15,126,108,193,16 // movq 0x10(%r9,%rax,8),%xmm5
- .byte 233,149,254,255,255 // jmpq 166ac <_sk_load_f16_dst_sse41+0x2d>
+ .byte 233,149,254,255,255 // jmpq 16bdc <_sk_load_f16_dst_sse41+0x2d>
HIDDEN _sk_gather_f16_sse41
.globl _sk_gather_f16_sse41
@@ -31290,18 +31579,18 @@ _sk_gather_f16_sse41:
.byte 102,68,15,97,218 // punpcklwd %xmm2,%xmm11
.byte 102,68,15,105,202 // punpckhwd %xmm2,%xmm9
.byte 102,65,15,56,51,203 // pmovzxwd %xmm11,%xmm1
- .byte 102,68,15,111,5,2,90,1,0 // movdqa 0x15a02(%rip),%xmm8 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
+ .byte 102,68,15,111,5,18,90,1,0 // movdqa 0x15a12(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,65,15,219,208 // pand %xmm8,%xmm2
.byte 102,15,239,202 // pxor %xmm2,%xmm1
- .byte 102,15,111,29,253,89,1,0 // movdqa 0x159fd(%rip),%xmm3 # 2c2b0 <_sk_overlay_sse2_8bit+0x12fb>
+ .byte 102,15,111,29,13,90,1,0 // movdqa 0x15a0d(%rip),%xmm3 # 2c7f0 <_sk_overlay_sse2_8bit+0x130b>
.byte 102,15,114,242,16 // pslld $0x10,%xmm2
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,15,56,63,195 // pmaxud %xmm3,%xmm0
.byte 102,15,118,193 // pcmpeqd %xmm1,%xmm0
.byte 102,15,114,241,13 // pslld $0xd,%xmm1
.byte 102,15,235,202 // por %xmm2,%xmm1
- .byte 102,68,15,111,21,233,89,1,0 // movdqa 0x159e9(%rip),%xmm10 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
+ .byte 102,68,15,111,21,249,89,1,0 // movdqa 0x159f9(%rip),%xmm10 # 2c800 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,219,193 // pand %xmm1,%xmm0
.byte 102,65,15,115,219,8 // psrldq $0x8,%xmm11
@@ -31355,17 +31644,17 @@ _sk_store_f16_sse41:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,12,89,1,0 // movdqa 0x1590c(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 102,68,15,111,21,28,89,1,0 // movdqa 0x1591c(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,68,15,111,216 // movdqa %xmm0,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,235 // pxor %xmm11,%xmm13
- .byte 102,68,15,111,13,255,88,1,0 // movdqa 0x158ff(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b>
+ .byte 102,68,15,111,13,15,89,1,0 // movdqa 0x1590f(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x133b>
.byte 102,65,15,114,211,16 // psrld $0x10,%xmm11
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,37,240,88,1,0 // movdqa 0x158f0(%rip),%xmm12 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b>
+ .byte 102,68,15,111,37,0,89,1,0 // movdqa 0x15900(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x134b>
.byte 102,69,15,235,220 // por %xmm12,%xmm11
.byte 102,69,15,254,221 // paddd %xmm13,%xmm11
.byte 102,69,15,223,195 // pandn %xmm11,%xmm8
@@ -31409,7 +31698,7 @@ _sk_store_f16_sse41:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,203 // punpckldq %xmm11,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 16af6 <_sk_store_f16_sse41+0x152>
+ .byte 117,21 // jne 17026 <_sk_store_f16_sse41+0x152>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -31417,13 +31706,13 @@ _sk_store_f16_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 16af2 <_sk_store_f16_sse41+0x14e>
+ .byte 116,240 // je 17022 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 16af2 <_sk_store_f16_sse41+0x14e>
+ .byte 114,227 // jb 17022 <_sk_store_f16_sse41+0x14e>
.byte 102,69,15,106,195 // punpckhdq %xmm11,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 16af2 <_sk_store_f16_sse41+0x14e>
+ .byte 235,213 // jmp 17022 <_sk_store_f16_sse41+0x14e>
HIDDEN _sk_load_u16_be_sse41
.globl _sk_load_u16_be_sse41
@@ -31438,7 +31727,7 @@ _sk_load_u16_be_sse41:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,185,0,0,0 // jne 16bfd <_sk_load_u16_be_sse41+0xe0>
+ .byte 15,133,185,0,0,0 // jne 1712d <_sk_load_u16_be_sse41+0xe0>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 243,65,15,111,76,65,16 // movdqu 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -31454,7 +31743,7 @@ _sk_load_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,208,84,1,0 // movaps 0x154d0(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
+ .byte 68,15,40,5,224,84,1,0 // movaps 0x154e0(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0x10bb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -31482,16 +31771,16 @@ _sk_load_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 16c16 <_sk_load_u16_be_sse41+0xf9>
+ .byte 117,13 // jne 17146 <_sk_load_u16_be_sse41+0xf9>
.byte 243,15,126,192 // movq %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,59,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34>
+ .byte 233,59,255,255,255 // jmpq 17081 <_sk_load_u16_be_sse41+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,38,255,255,255 // jb 16b51 <_sk_load_u16_be_sse41+0x34>
+ .byte 15,130,38,255,255,255 // jb 17081 <_sk_load_u16_be_sse41+0x34>
.byte 243,65,15,126,76,65,16 // movq 0x10(%r9,%rax,2),%xmm1
- .byte 233,26,255,255,255 // jmpq 16b51 <_sk_load_u16_be_sse41+0x34>
+ .byte 233,26,255,255,255 // jmpq 17081 <_sk_load_u16_be_sse41+0x34>
HIDDEN _sk_load_rgb_u16_be_sse41
.globl _sk_load_rgb_u16_be_sse41
@@ -31508,7 +31797,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,170,0,0,0 // jne 16d0c <_sk_load_rgb_u16_be_sse41+0xd5>
+ .byte 15,133,170,0,0,0 // jne 1723c <_sk_load_rgb_u16_be_sse41+0xd5>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -31528,7 +31817,7 @@ _sk_load_rgb_u16_be_sse41:
.byte 102,15,235,200 // por %xmm0,%xmm1
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,159,83,1,0 // movaps 0x1539f(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
+ .byte 68,15,40,5,175,83,1,0 // movaps 0x153af(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0x10bb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -31545,27 +31834,27 @@ _sk_load_rgb_u16_be_sse41:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,198,80,1,0 // movaps 0x150c6(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,214,80,1,0 // movaps 0x150d6(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 16d31 <_sk_load_rgb_u16_be_sse41+0xfa>
+ .byte 117,13 // jne 17261 <_sk_load_rgb_u16_be_sse41+0xfa>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,85,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,85,255,255,255 // jmpq 171b6 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 16d62 <_sk_load_rgb_u16_be_sse41+0x12b>
+ .byte 114,24 // jb 17292 <_sk_load_rgb_u16_be_sse41+0x12b>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,36,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,36,255,255,255 // jmpq 171b6 <_sk_load_rgb_u16_be_sse41+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,27,255,255,255 // jmpq 16c86 <_sk_load_rgb_u16_be_sse41+0x4f>
+ .byte 233,27,255,255,255 // jmpq 171b6 <_sk_load_rgb_u16_be_sse41+0x4f>
HIDDEN _sk_store_u16_be_sse41
.globl _sk_store_u16_be_sse41
@@ -31579,7 +31868,7 @@ _sk_store_u16_be_sse41:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,111,85,1,0 // movaps 0x1556f(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b>
+ .byte 68,15,40,21,127,85,1,0 // movaps 0x1557f(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x135b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -31616,7 +31905,7 @@ _sk_store_u16_be_sse41:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 16e5f <_sk_store_u16_be_sse41+0xf4>
+ .byte 117,21 // jne 1738f <_sk_store_u16_be_sse41+0xf4>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -31624,13 +31913,13 @@ _sk_store_u16_be_sse41:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 16e5b <_sk_store_u16_be_sse41+0xf0>
+ .byte 116,240 // je 1738b <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 16e5b <_sk_store_u16_be_sse41+0xf0>
+ .byte 114,227 // jb 1738b <_sk_store_u16_be_sse41+0xf0>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 16e5b <_sk_store_u16_be_sse41+0xf0>
+ .byte 235,213 // jmp 1738b <_sk_store_u16_be_sse41+0xf0>
HIDDEN _sk_load_f32_sse41
.globl _sk_load_f32_sse41
@@ -31646,7 +31935,7 @@ _sk_load_f32_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 16ef1 <_sk_load_f32_sse41+0x6b>
+ .byte 117,66 // jne 17421 <_sk_load_f32_sse41+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -31666,17 +31955,17 @@ _sk_load_f32_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 16f03 <_sk_load_f32_sse41+0x7d>
+ .byte 117,8 // jne 17433 <_sk_load_f32_sse41+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
+ .byte 235,190 // jmp 173f1 <_sk_load_f32_sse41+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 16f17 <_sk_load_f32_sse41+0x91>
+ .byte 114,8 // jb 17447 <_sk_load_f32_sse41+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
+ .byte 235,170 // jmp 173f1 <_sk_load_f32_sse41+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 16ec1 <_sk_load_f32_sse41+0x3b>
+ .byte 235,165 // jmp 173f1 <_sk_load_f32_sse41+0x3b>
HIDDEN _sk_load_f32_dst_sse41
.globl _sk_load_f32_dst_sse41
@@ -31692,7 +31981,7 @@ _sk_load_f32_dst_sse41:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 16f87 <_sk_load_f32_dst_sse41+0x6b>
+ .byte 117,66 // jne 174b7 <_sk_load_f32_dst_sse41+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -31712,17 +32001,17 @@ _sk_load_f32_dst_sse41:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 16f99 <_sk_load_f32_dst_sse41+0x7d>
+ .byte 117,8 // jne 174c9 <_sk_load_f32_dst_sse41+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,190 // jmp 17487 <_sk_load_f32_dst_sse41+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 16fad <_sk_load_f32_dst_sse41+0x91>
+ .byte 114,8 // jb 174dd <_sk_load_f32_dst_sse41+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,170 // jmp 17487 <_sk_load_f32_dst_sse41+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 16f57 <_sk_load_f32_dst_sse41+0x3b>
+ .byte 235,165 // jmp 17487 <_sk_load_f32_dst_sse41+0x3b>
HIDDEN _sk_store_f32_sse41
.globl _sk_store_f32_sse41
@@ -31751,7 +32040,7 @@ _sk_store_f32_sse41:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 1702f <_sk_store_f32_sse41+0x7d>
+ .byte 117,29 // jne 1755f <_sk_store_f32_sse41+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -31759,12 +32048,12 @@ _sk_store_f32_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 1702b <_sk_store_f32_sse41+0x79>
+ .byte 116,246 // je 1755b <_sk_store_f32_sse41+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 1702b <_sk_store_f32_sse41+0x79>
+ .byte 114,234 // jb 1755b <_sk_store_f32_sse41+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 1702b <_sk_store_f32_sse41+0x79>
+ .byte 235,225 // jmp 1755b <_sk_store_f32_sse41+0x79>
HIDDEN _sk_clamp_x_sse41
.globl _sk_clamp_x_sse41
@@ -31854,7 +32143,7 @@ _sk_mirror_x_sse41:
.byte 65,15,92,194 // subps %xmm10,%xmm0
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,157,66,1,0 // mulss 0x1429d(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,13,157,66,1,0 // mulss 0x1429d(%rip),%xmm9 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -31885,7 +32174,7 @@ _sk_mirror_y_sse41:
.byte 65,15,92,202 // subps %xmm10,%xmm1
.byte 243,69,15,88,192 // addss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
- .byte 243,68,15,89,13,43,66,1,0 // mulss 0x1422b(%rip),%xmm9 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,13,43,66,1,0 // mulss 0x1422b(%rip),%xmm9 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,89,201 // mulps %xmm1,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
@@ -31910,7 +32199,7 @@ FUNCTION(_sk_clamp_x_1_sse41)
_sk_clamp_x_1_sse41:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,178,75,1,0 // minps 0x14bb2(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,93,5,194,75,1,0 // minps 0x14bc2(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -31928,9 +32217,9 @@ HIDDEN _sk_mirror_x_1_sse41
.globl _sk_mirror_x_1_sse41
FUNCTION(_sk_mirror_x_1_sse41)
_sk_mirror_x_1_sse41:
- .byte 68,15,40,5,243,75,1,0 // movaps 0x14bf3(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
+ .byte 68,15,40,5,3,76,1,0 // movaps 0x14c03(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xe8b>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,119,75,1,0 // movaps 0x14b77(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,13,135,75,1,0 // movaps 0x14b87(%rip),%xmm9 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 102,69,15,58,8,201,1 // roundps $0x1,%xmm9,%xmm9
.byte 69,15,88,201 // addps %xmm9,%xmm9
@@ -31947,10 +32236,10 @@ HIDDEN _sk_luminance_to_alpha_sse41
FUNCTION(_sk_luminance_to_alpha_sse41)
_sk_luminance_to_alpha_sse41:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,150,80,1,0 // mulps 0x15096(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b>
- .byte 15,89,13,159,80,1,0 // mulps 0x1509f(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b>
+ .byte 15,89,5,166,80,1,0 // mulps 0x150a6(%rip),%xmm0 # 2c850 <_sk_overlay_sse2_8bit+0x136b>
+ .byte 15,89,13,175,80,1,0 // mulps 0x150af(%rip),%xmm1 # 2c860 <_sk_overlay_sse2_8bit+0x137b>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,165,80,1,0 // mulps 0x150a5(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b>
+ .byte 15,89,29,181,80,1,0 // mulps 0x150b5(%rip),%xmm3 # 2c870 <_sk_overlay_sse2_8bit+0x138b>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -32263,9 +32552,9 @@ _sk_evenly_spaced_gradient_sse41:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 1772d <_sk_evenly_spaced_gradient_sse41+0x1a>
+ .byte 120,7 // js 17c5d <_sk_evenly_spaced_gradient_sse41+0x1a>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 17742 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ .byte 235,21 // jmp 17c72 <_sk_evenly_spaced_gradient_sse41+0x2f>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -32355,15 +32644,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse41
.globl _sk_gauss_a_to_rgba_sse41
FUNCTION(_sk_gauss_a_to_rgba_sse41)
_sk_gauss_a_to_rgba_sse41:
- .byte 15,40,5,80,74,1,0 // movaps 0x14a50(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b>
+ .byte 15,40,5,96,74,1,0 // movaps 0x14a60(%rip),%xmm0 # 2c880 <_sk_overlay_sse2_8bit+0x139b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,86,74,1,0 // addps 0x14a56(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b>
+ .byte 15,88,5,102,74,1,0 // addps 0x14a66(%rip),%xmm0 # 2c890 <_sk_overlay_sse2_8bit+0x13ab>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,92,74,1,0 // addps 0x14a5c(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab>
+ .byte 15,88,5,108,74,1,0 // addps 0x14a6c(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x13bb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,98,74,1,0 // addps 0x14a62(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb>
+ .byte 15,88,5,114,74,1,0 // addps 0x14a72(%rip),%xmm0 # 2c8b0 <_sk_overlay_sse2_8bit+0x13cb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,104,74,1,0 // addps 0x14a68(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb>
+ .byte 15,88,5,120,74,1,0 // addps 0x14a78(%rip),%xmm0 # 2c8c0 <_sk_overlay_sse2_8bit+0x13db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -32381,12 +32670,12 @@ _sk_gradient_sse41:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 1796b <_sk_gradient_sse41+0x46>
+ .byte 114,50 // jb 17e9b <_sk_gradient_sse41+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,145,68,1,0 // movaps 0x14491(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 15,40,21,161,68,1,0 // movaps 0x144a1(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -32394,7 +32683,7 @@ _sk_gradient_sse41:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 1794f <_sk_gradient_sse41+0x2a>
+ .byte 117,228 // jne 17e7f <_sk_gradient_sse41+0x2a>
.byte 102,73,15,58,22,201,1 // pextrq $0x1,%xmm1,%r9
.byte 69,137,202 // mov %r9d,%r10d
.byte 73,193,233,32 // shr $0x20,%r9
@@ -32524,26 +32813,26 @@ _sk_xy_to_unit_angle_sse41:
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,40,236 // movaps %xmm12,%xmm13
.byte 69,15,89,237 // mulps %xmm13,%xmm13
- .byte 68,15,40,21,210,71,1,0 // movaps 0x147d2(%rip),%xmm10 # 2c390 <_sk_overlay_sse2_8bit+0x13db>
+ .byte 68,15,40,21,226,71,1,0 // movaps 0x147e2(%rip),%xmm10 # 2c8d0 <_sk_overlay_sse2_8bit+0x13eb>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,214,71,1,0 // addps 0x147d6(%rip),%xmm10 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb>
+ .byte 68,15,88,21,230,71,1,0 // addps 0x147e6(%rip),%xmm10 # 2c8e0 <_sk_overlay_sse2_8bit+0x13fb>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,218,71,1,0 // addps 0x147da(%rip),%xmm10 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb>
+ .byte 68,15,88,21,234,71,1,0 // addps 0x147ea(%rip),%xmm10 # 2c8f0 <_sk_overlay_sse2_8bit+0x140b>
.byte 69,15,89,213 // mulps %xmm13,%xmm10
- .byte 68,15,88,21,222,71,1,0 // addps 0x147de(%rip),%xmm10 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b>
+ .byte 68,15,88,21,238,71,1,0 // addps 0x147ee(%rip),%xmm10 # 2c900 <_sk_overlay_sse2_8bit+0x141b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,194,195,1 // cmpltps %xmm11,%xmm0
- .byte 68,15,40,29,221,71,1,0 // movaps 0x147dd(%rip),%xmm11 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b>
+ .byte 68,15,40,29,237,71,1,0 // movaps 0x147ed(%rip),%xmm11 # 2c910 <_sk_overlay_sse2_8bit+0x142b>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,40,29,182,65,1,0 // movaps 0x141b6(%rip),%xmm11 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,29,198,65,1,0 // movaps 0x141c6(%rip),%xmm11 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 102,69,15,56,20,211 // blendvps %xmm0,%xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
.byte 65,15,194,192,1 // cmpltps %xmm8,%xmm0
- .byte 68,15,40,13,168,65,1,0 // movaps 0x141a8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,184,65,1,0 // movaps 0x141b8(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 102,69,15,56,20,209 // blendvps %xmm0,%xmm9,%xmm10
.byte 69,15,194,194,7 // cmpordps %xmm10,%xmm8
@@ -32577,7 +32866,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,81,71,1,0 // mulps 0x14751(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
+ .byte 68,15,89,13,97,71,1,0 // mulps 0x14761(%rip),%xmm9 # 2c920 <_sk_overlay_sse2_8bit+0x143b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -32585,7 +32874,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,60,71,1,0 // mulps 0x1473c(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
+ .byte 68,15,89,21,76,71,1,0 // mulps 0x1474c(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x144b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -32594,8 +32883,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,244,69,1,0 // xorps 0x145f4(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
- .byte 68,15,89,5,220,64,1,0 // mulps 0x140dc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,87,13,4,70,1,0 // xorps 0x14604(%rip),%xmm9 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
+ .byte 68,15,89,5,236,64,1,0 // mulps 0x140ec(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -32616,7 +32905,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,179,70,1,0 // mulps 0x146b3(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
+ .byte 68,15,89,13,195,70,1,0 // mulps 0x146c3(%rip),%xmm9 # 2c920 <_sk_overlay_sse2_8bit+0x143b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -32624,7 +32913,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,158,70,1,0 // mulps 0x1469e(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
+ .byte 68,15,89,21,174,70,1,0 // mulps 0x146ae(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x144b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -32633,8 +32922,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,86,69,1,0 // xorps 0x14556(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
- .byte 68,15,89,5,62,64,1,0 // mulps 0x1403e(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,87,13,102,69,1,0 // xorps 0x14566(%rip),%xmm9 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
+ .byte 68,15,89,5,78,64,1,0 // mulps 0x1404e(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -32652,7 +32941,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,38,70,1,0 // mulps 0x14626(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
+ .byte 68,15,89,13,54,70,1,0 // mulps 0x14636(%rip),%xmm9 # 2c920 <_sk_overlay_sse2_8bit+0x143b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -32660,7 +32949,7 @@ _sk_xy_to_2pt_conical_linear_sse41:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,242,68,1,0 // xorps 0x144f2(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 15,87,5,2,69,1,0 // xorps 0x14502(%rip),%xmm0 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32703,7 +32992,7 @@ HIDDEN _sk_save_xy_sse41
FUNCTION(_sk_save_xy_sse41)
_sk_save_xy_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,120,63,1,0 // movaps 0x13f78(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,5,136,63,1,0 // movaps 0x13f88(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -32747,8 +33036,8 @@ _sk_bilinear_nx_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,42,69,1,0 // addps 0x1452a(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,242,62,1,0 // movaps 0x13ef2(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,5,58,69,1,0 // addps 0x1453a(%rip),%xmm0 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,2,63,1,0 // movaps 0x13f02(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -32761,7 +33050,7 @@ _sk_bilinear_px_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,193,62,1,0 // addps 0x13ec1(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,88,5,209,62,1,0 // addps 0x13ed1(%rip),%xmm0 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32773,8 +33062,8 @@ _sk_bilinear_ny_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,227,68,1,0 // addps 0x144e3(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,171,62,1,0 // movaps 0x13eab(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,13,243,68,1,0 // addps 0x144f3(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,187,62,1,0 // movaps 0x13ebb(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -32787,7 +33076,7 @@ _sk_bilinear_py_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,121,62,1,0 // addps 0x13e79(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,88,13,137,62,1,0 // addps 0x13e89(%rip),%xmm1 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32799,13 +33088,13 @@ _sk_bicubic_n3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,172,68,1,0 // addps 0x144ac(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
- .byte 68,15,40,13,100,62,1,0 // movaps 0x13e64(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,5,188,68,1,0 // addps 0x144bc(%rip),%xmm0 # 2c950 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,40,13,116,62,1,0 // movaps 0x13e74(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,160,68,1,0 // mulps 0x144a0(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,13,56,64,1,0 // addps 0x14038(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,13,176,68,1,0 // mulps 0x144b0(%rip),%xmm9 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,13,72,64,1,0 // addps 0x14048(%rip),%xmm9 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -32818,16 +33107,16 @@ _sk_bicubic_n1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,87,68,1,0 // addps 0x14457(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,31,62,1,0 // movaps 0x13e1f(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,5,103,68,1,0 // addps 0x14467(%rip),%xmm0 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,47,62,1,0 // movaps 0x13e2f(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,115,68,1,0 // movaps 0x14473(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,5,131,68,1,0 // movaps 0x14483(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,119,68,1,0 // addps 0x14477(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,5,135,68,1,0 // addps 0x14487(%rip),%xmm8 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,235,61,1,0 // addps 0x13deb(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,5,251,61,1,0 // addps 0x13dfb(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,111,68,1,0 // addps 0x1446f(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,5,127,68,1,0 // addps 0x1447f(%rip),%xmm8 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32837,17 +33126,17 @@ HIDDEN _sk_bicubic_p1x_sse41
FUNCTION(_sk_bicubic_p1x_sse41)
_sk_bicubic_p1x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,201,61,1,0 // movaps 0x13dc9(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,5,217,61,1,0 // movaps 0x13dd9(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,37,68,1,0 // movaps 0x14425(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,21,53,68,1,0 // movaps 0x14435(%rip),%xmm10 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,41,68,1,0 // addps 0x14429(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,21,57,68,1,0 // addps 0x14439(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,37,68,1,0 // addps 0x14425(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,21,53,68,1,0 // addps 0x14435(%rip),%xmm10 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32859,11 +33148,11 @@ _sk_bicubic_p3x_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,248,67,1,0 // addps 0x143f8(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 15,88,5,8,68,1,0 // addps 0x14408(%rip),%xmm0 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,200,67,1,0 // mulps 0x143c8(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,5,96,63,1,0 // addps 0x13f60(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,5,216,67,1,0 // mulps 0x143d8(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,5,112,63,1,0 // addps 0x13f70(%rip),%xmm8 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -32876,13 +33165,13 @@ _sk_bicubic_n3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,142,67,1,0 // addps 0x1438e(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
- .byte 68,15,40,13,70,61,1,0 // movaps 0x13d46(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,13,158,67,1,0 // addps 0x1439e(%rip),%xmm1 # 2c950 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,40,13,86,61,1,0 // movaps 0x13d56(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,130,67,1,0 // mulps 0x14382(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,13,26,63,1,0 // addps 0x13f1a(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,13,146,67,1,0 // mulps 0x14392(%rip),%xmm9 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,13,42,63,1,0 // addps 0x13f2a(%rip),%xmm9 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -32895,16 +33184,16 @@ _sk_bicubic_n1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,56,67,1,0 // addps 0x14338(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,0,61,1,0 // movaps 0x13d00(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,13,72,67,1,0 // addps 0x14348(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,16,61,1,0 // movaps 0x13d10(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,84,67,1,0 // movaps 0x14354(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,5,100,67,1,0 // movaps 0x14364(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,88,67,1,0 // addps 0x14358(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,5,104,67,1,0 // addps 0x14368(%rip),%xmm8 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,204,60,1,0 // addps 0x13ccc(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,5,220,60,1,0 // addps 0x13cdc(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,80,67,1,0 // addps 0x14350(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,5,96,67,1,0 // addps 0x14360(%rip),%xmm8 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32914,17 +33203,17 @@ HIDDEN _sk_bicubic_p1y_sse41
FUNCTION(_sk_bicubic_p1y_sse41)
_sk_bicubic_p1y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,170,60,1,0 // movaps 0x13caa(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,5,186,60,1,0 // movaps 0x13cba(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,5,67,1,0 // movaps 0x14305(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,21,21,67,1,0 // movaps 0x14315(%rip),%xmm10 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,9,67,1,0 // addps 0x14309(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,21,25,67,1,0 // addps 0x14319(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,5,67,1,0 // addps 0x14305(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,21,21,67,1,0 // addps 0x14315(%rip),%xmm10 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -32936,11 +33225,11 @@ _sk_bicubic_p3y_sse41:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,215,66,1,0 // addps 0x142d7(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 15,88,13,231,66,1,0 // addps 0x142e7(%rip),%xmm1 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,167,66,1,0 // mulps 0x142a7(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,5,63,62,1,0 // addps 0x13e3f(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,5,183,66,1,0 // mulps 0x142b7(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,5,79,62,1,0 // addps 0x13e4f(%rip),%xmm8 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -33087,10 +33376,10 @@ _sk_clut_3D_sse41:
.byte 102,68,15,56,64,227 // pmulld %xmm3,%xmm12
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,15,254,209 // paddd %xmm1,%xmm2
- .byte 102,15,111,37,248,64,1,0 // movdqa 0x140f8(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,37,8,65,1,0 // movdqa 0x14108(%rip),%xmm4 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
- .byte 102,68,15,111,61,85,58,1,0 // movdqa 0x13a55(%rip),%xmm15 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,61,101,58,1,0 // movdqa 0x13a65(%rip),%xmm15 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,111,226 // movdqa %xmm2,%xmm4
.byte 102,65,15,254,231 // paddd %xmm15,%xmm4
.byte 102,73,15,58,22,225,1 // pextrq $0x1,%xmm4,%r9
@@ -33110,7 +33399,7 @@ _sk_clut_3D_sse41:
.byte 102,65,15,58,22,210,1 // pextrd $0x1,%xmm2,%r10d
.byte 102,65,15,58,22,211,2 // pextrd $0x2,%xmm2,%r11d
.byte 102,65,15,58,22,214,3 // pextrd $0x3,%xmm2,%r14d
- .byte 102,68,15,111,13,7,58,1,0 // movdqa 0x13a07(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,13,23,58,1,0 // movdqa 0x13a17(%rip),%xmm9 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,65,15,254,209 // paddd %xmm9,%xmm2
.byte 102,73,15,58,22,215,1 // pextrq $0x1,%xmm2,%r15
.byte 102,72,15,126,211 // movq %xmm2,%rbx
@@ -33124,7 +33413,7 @@ _sk_clut_3D_sse41:
.byte 73,193,239,32 // shr $0x20,%r15
.byte 243,66,15,16,20,184 // movss (%rax,%r15,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
- .byte 15,40,45,28,64,1,0 // movaps 0x1401c(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
+ .byte 15,40,45,44,64,1,0 // movaps 0x1402c(%rip),%xmm5 # 2c9a0 <_sk_overlay_sse2_8bit+0x14bb>
.byte 68,15,88,197 // addps %xmm5,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 15,40,215 // movaps %xmm7,%xmm2
@@ -33293,7 +33582,7 @@ _sk_clut_3D_sse41:
.byte 102,68,15,254,232 // paddd %xmm0,%xmm13
.byte 102,65,15,111,212 // movdqa %xmm12,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
- .byte 102,15,111,45,219,60,1,0 // movdqa 0x13cdb(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,45,235,60,1,0 // movdqa 0x13ceb(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,56,64,213 // pmulld %xmm5,%xmm2
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
.byte 102,65,15,254,207 // paddd %xmm15,%xmm1
@@ -33399,7 +33688,7 @@ _sk_clut_3D_sse41:
.byte 102,69,15,58,22,225,1 // pextrd $0x1,%xmm12,%r9d
.byte 102,69,15,58,22,226,2 // pextrd $0x2,%xmm12,%r10d
.byte 102,69,15,58,22,227,3 // pextrd $0x3,%xmm12,%r11d
- .byte 102,15,111,21,63,52,1,0 // movdqa 0x1343f(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,111,21,79,52,1,0 // movdqa 0x1344f(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,68,15,254,226 // paddd %xmm2,%xmm12
.byte 102,76,15,58,22,225,1 // pextrq $0x1,%xmm12,%rcx
.byte 102,76,15,126,226 // movq %xmm12,%rdx
@@ -33578,8 +33867,8 @@ _sk_clut_4D_sse41:
.byte 102,65,15,111,197 // movdqa %xmm13,%xmm0
.byte 102,68,15,127,108,36,176 // movdqa %xmm13,-0x50(%rsp)
.byte 102,15,254,193 // paddd %xmm1,%xmm0
- .byte 102,15,56,64,5,168,55,1,0 // pmulld 0x137a8(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
- .byte 102,68,15,111,29,15,49,1,0 // movdqa 0x1310f(%rip),%xmm11 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,56,64,5,184,55,1,0 // pmulld 0x137b8(%rip),%xmm0 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
+ .byte 102,68,15,111,29,31,49,1,0 // movdqa 0x1311f(%rip),%xmm11 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
.byte 102,65,15,254,211 // paddd %xmm11,%xmm2
.byte 102,73,15,58,22,209,1 // pextrq $0x1,%xmm2,%r9
@@ -33599,7 +33888,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
.byte 102,65,15,58,22,195,2 // pextrd $0x2,%xmm0,%r11d
.byte 102,65,15,58,22,198,3 // pextrd $0x3,%xmm0,%r14d
- .byte 102,68,15,111,5,193,48,1,0 // movdqa 0x130c1(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,5,209,48,1,0 // movdqa 0x130d1(%rip),%xmm8 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,73,15,58,22,199,1 // pextrq $0x1,%xmm0,%r15
.byte 102,72,15,126,195 // movq %xmm0,%rbx
@@ -33613,7 +33902,7 @@ _sk_clut_4D_sse41:
.byte 73,193,239,32 // shr $0x20,%r15
.byte 243,66,15,16,4,184 // movss (%rax,%r15,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
- .byte 15,40,53,214,54,1,0 // movaps 0x136d6(%rip),%xmm6 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
+ .byte 15,40,53,230,54,1,0 // movaps 0x136e6(%rip),%xmm6 # 2c9a0 <_sk_overlay_sse2_8bit+0x14bb>
.byte 68,15,88,214 // addps %xmm6,%xmm10
.byte 68,15,41,84,36,48 // movaps %xmm10,0x30(%rsp)
.byte 15,88,254 // addps %xmm6,%xmm7
@@ -33626,7 +33915,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,68,15,111,214 // movdqa %xmm6,%xmm10
.byte 102,68,15,127,84,36,160 // movdqa %xmm10,-0x60(%rsp)
- .byte 102,15,56,64,13,167,54,1,0 // pmulld 0x136a7(%rip),%xmm1 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,56,64,13,183,54,1,0 // pmulld 0x136b7(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,73,15,58,22,231,1 // pextrq $0x1,%xmm4,%r15
@@ -33684,11 +33973,11 @@ _sk_clut_4D_sse41:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,5,123,53,1,0 // movdqa 0x1357b(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,5,139,53,1,0 // movdqa 0x1358b(%rip),%xmm0 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,56,64,200 // pmulld %xmm0,%xmm1
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,5,212,46,1,0 // movdqa 0x12ed4(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,5,228,46,1,0 // movdqa 0x12ee4(%rip),%xmm8 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,192 // paddd %xmm8,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -33790,7 +34079,7 @@ _sk_clut_4D_sse41:
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,68,15,111,108,36,176 // movdqa -0x50(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
- .byte 102,15,111,45,80,51,1,0 // movdqa 0x13350(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,45,96,51,1,0 // movdqa 0x13360(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,56,64,205 // pmulld %xmm5,%xmm1
.byte 102,15,126,201 // movd %xmm1,%ecx
.byte 102,15,58,22,202,1 // pextrd $0x1,%xmm1,%edx
@@ -33802,7 +34091,7 @@ _sk_clut_4D_sse41:
.byte 243,15,16,20,152 // movss (%rax,%rbx,4),%xmm2
.byte 102,15,58,33,242,48 // insertps $0x30,%xmm2,%xmm6
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,123,44,1,0 // movdqa 0x12c7b(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,29,139,44,1,0 // movdqa 0x12c8b(%rip),%xmm3 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,72,15,58,22,209,1 // pextrq $0x1,%xmm2,%rcx
.byte 102,72,15,126,210 // movq %xmm2,%rdx
@@ -33850,7 +34139,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,194,1 // pextrd $0x1,%xmm0,%r10d
.byte 102,65,15,58,22,198,2 // pextrd $0x2,%xmm0,%r14d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,254,5,169,43,1,0 // paddd 0x12ba9(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,5,185,43,1,0 // paddd 0x12bb9(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
.byte 137,211 // mov %edx,%ebx
@@ -33879,10 +34168,10 @@ _sk_clut_4D_sse41:
.byte 102,15,254,100,36,144 // paddd -0x70(%rsp),%xmm4
.byte 102,15,111,196 // movdqa %xmm4,%xmm0
.byte 102,65,15,254,197 // paddd %xmm13,%xmm0
- .byte 102,68,15,111,45,139,49,1,0 // movdqa 0x1318b(%rip),%xmm13 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,68,15,111,45,155,49,1,0 // movdqa 0x1319b(%rip),%xmm13 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,65,15,56,64,197 // pmulld %xmm13,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,111,53,233,42,1,0 // movdqa 0x12ae9(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,53,249,42,1,0 // movdqa 0x12af9(%rip),%xmm6 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,206 // paddd %xmm6,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,202 // movq %xmm1,%rdx
@@ -33900,7 +34189,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,61,169,42,1,0 // movdqa 0x12aa9(%rip),%xmm7 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,111,61,185,42,1,0 // movdqa 0x12ab9(%rip),%xmm7 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,254,199 // paddd %xmm7,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -33917,7 +34206,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,254,227 // paddd %xmm11,%xmm4
.byte 102,65,15,56,64,229 // pmulld %xmm13,%xmm4
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
- .byte 102,68,15,111,45,51,42,1,0 // movdqa 0x12a33(%rip),%xmm13 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,45,67,42,1,0 // movdqa 0x12a43(%rip),%xmm13 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,245 // paddd %xmm13,%xmm6
.byte 102,72,15,58,22,241,1 // pextrq $0x1,%xmm6,%rcx
.byte 102,72,15,126,242 // movq %xmm6,%rdx
@@ -33996,7 +34285,7 @@ _sk_clut_4D_sse41:
.byte 102,68,15,111,76,36,176 // movdqa -0x50(%rsp),%xmm9
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,254,194 // paddd %xmm2,%xmm0
- .byte 102,15,111,29,67,47,1,0 // movdqa 0x12f43(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,29,83,47,1,0 // movdqa 0x12f53(%rip),%xmm3 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,56,64,195 // pmulld %xmm3,%xmm0
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
.byte 102,69,15,111,213 // movdqa %xmm13,%xmm10
@@ -34017,7 +34306,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,193,1 // pextrd $0x1,%xmm0,%r9d
.byte 102,65,15,58,22,194,2 // pextrd $0x2,%xmm0,%r10d
.byte 102,65,15,58,22,195,3 // pextrd $0x3,%xmm0,%r11d
- .byte 102,15,111,45,100,40,1,0 // movdqa 0x12864(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,111,45,116,40,1,0 // movdqa 0x12874(%rip),%xmm5 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -34105,7 +34394,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,225,1 // pextrd $0x1,%xmm4,%r9d
.byte 102,65,15,58,22,226,2 // pextrd $0x2,%xmm4,%r10d
.byte 102,65,15,58,22,227,3 // pextrd $0x3,%xmm4,%r11d
- .byte 102,68,15,111,13,160,38,1,0 // movdqa 0x126a0(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,13,176,38,1,0 // movdqa 0x126b0(%rip),%xmm9 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,65,15,254,225 // paddd %xmm9,%xmm4
.byte 102,72,15,58,22,225,1 // pextrq $0x1,%xmm4,%rcx
.byte 102,72,15,126,226 // movq %xmm4,%rdx
@@ -34187,7 +34476,7 @@ _sk_clut_4D_sse41:
.byte 102,15,254,76,36,176 // paddd -0x50(%rsp),%xmm1
.byte 102,65,15,56,64,205 // pmulld %xmm13,%xmm1
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
- .byte 102,68,15,111,37,217,36,1,0 // movdqa 0x124d9(%rip),%xmm12 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,37,233,36,1,0 // movdqa 0x124e9(%rip),%xmm12 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,196 // paddd %xmm12,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -34205,7 +34494,7 @@ _sk_clut_4D_sse41:
.byte 102,65,15,58,22,201,1 // pextrd $0x1,%xmm1,%r9d
.byte 102,65,15,58,22,202,2 // pextrd $0x2,%xmm1,%r10d
.byte 102,65,15,58,22,203,3 // pextrd $0x3,%xmm1,%r11d
- .byte 102,15,111,29,152,36,1,0 // movdqa 0x12498(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,111,29,168,36,1,0 // movdqa 0x124a8(%rip),%xmm3 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 102,72,15,58,22,201,1 // pextrq $0x1,%xmm1,%rcx
.byte 102,72,15,126,202 // movq %xmm1,%rdx
@@ -34274,9 +34563,9 @@ _sk_clut_4D_sse41:
.byte 102,68,15,254,116,36,144 // paddd -0x70(%rsp),%xmm14
.byte 102,15,111,68,36,176 // movdqa -0x50(%rsp),%xmm0
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
- .byte 102,15,56,64,5,153,41,1,0 // pmulld 0x12999(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,56,64,5,169,41,1,0 // pmulld 0x129a9(%rip),%xmm0 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,5,253,34,1,0 // paddd 0x122fd(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,5,13,35,1,0 // paddd 0x1230d(%rip),%xmm0 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
.byte 137,213 // mov %edx,%ebp
@@ -34309,8 +34598,8 @@ _sk_clut_4D_sse41:
.byte 243,15,16,4,136 // movss (%rax,%rcx,4),%xmm0
.byte 102,15,58,33,232,48 // insertps $0x30,%xmm0,%xmm5
.byte 102,68,15,254,116,36,160 // paddd -0x60(%rsp),%xmm14
- .byte 102,68,15,56,64,53,226,40,1,0 // pmulld 0x128e2(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
- .byte 102,15,111,5,74,34,1,0 // movdqa 0x1224a(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,56,64,53,242,40,1,0 // pmulld 0x128f2(%rip),%xmm14 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
+ .byte 102,15,111,5,90,34,1,0 // movdqa 0x1225a(%rip),%xmm0 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,198 // paddd %xmm14,%xmm0
.byte 102,72,15,58,22,193,1 // pextrq $0x1,%xmm0,%rcx
.byte 102,72,15,126,194 // movq %xmm0,%rdx
@@ -34391,7 +34680,7 @@ _sk_clut_4D_sse41:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,88,215 // addps %xmm7,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,203,32,1,0 // movaps 0x120cb(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,219,32,1,0 // movaps 0x120db(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 76,137,194 // mov %r8,%rdx
.byte 72,139,76,36,240 // mov -0x10(%rsp),%rcx
.byte 76,139,68,36,248 // mov -0x8(%rsp),%r8
@@ -34428,7 +34717,7 @@ _sk_start_pipeline_sse2:
.byte 72,137,194 // mov %rax,%rdx
.byte 72,137,77,176 // mov %rcx,-0x50(%rbp)
.byte 73,57,206 // cmp %rcx,%r14
- .byte 115,117 // jae 19ddd <_sk_start_pipeline_sse2+0xa1>
+ .byte 115,117 // jae 1a30d <_sk_start_pipeline_sse2+0xa1>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,4 // lea 0x4(%rax),%rax
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
@@ -34438,7 +34727,7 @@ _sk_start_pipeline_sse2:
.byte 73,137,244 // mov %rsi,%r12
.byte 72,57,93,184 // cmp %rbx,-0x48(%rbp)
.byte 72,139,85,208 // mov -0x30(%rbp),%rdx
- .byte 119,45 // ja 19db9 <_sk_start_pipeline_sse2+0x7d>
+ .byte 119,45 // ja 1a2e9 <_sk_start_pipeline_sse2+0x7d>
.byte 76,139,125,208 // mov -0x30(%rbp),%r15
.byte 69,49,192 // xor %r8d,%r8d
.byte 76,137,207 // mov %r9,%rdi
@@ -34452,10 +34741,10 @@ _sk_start_pipeline_sse2:
.byte 73,131,199,8 // add $0x8,%r15
.byte 73,57,223 // cmp %rbx,%r15
.byte 73,137,215 // mov %rdx,%r15
- .byte 118,215 // jbe 19d90 <_sk_start_pipeline_sse2+0x54>
+ .byte 118,215 // jbe 1a2c0 <_sk_start_pipeline_sse2+0x54>
.byte 73,137,216 // mov %rbx,%r8
.byte 73,41,208 // sub %rdx,%r8
- .byte 116,19 // je 19dd4 <_sk_start_pipeline_sse2+0x98>
+ .byte 116,19 // je 1a304 <_sk_start_pipeline_sse2+0x98>
.byte 76,137,207 // mov %r9,%rdi
.byte 76,137,230 // mov %r12,%rsi
.byte 76,137,241 // mov %r14,%rcx
@@ -34464,7 +34753,7 @@ _sk_start_pipeline_sse2:
.byte 76,139,77,192 // mov -0x40(%rbp),%r9
.byte 73,255,198 // inc %r14
.byte 76,59,117,176 // cmp -0x50(%rbp),%r14
- .byte 117,165 // jne 19d82 <_sk_start_pipeline_sse2+0x46>
+ .byte 117,165 // jne 1a2b2 <_sk_start_pipeline_sse2+0x46>
.byte 72,131,196,40 // add $0x28,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -34487,7 +34776,7 @@ _sk_seed_shader_sse2:
.byte 102,15,110,194 // movd %edx,%xmm0
.byte 102,15,112,192,0 // pshufd $0x0,%xmm0,%xmm0
.byte 15,91,200 // cvtdq2ps %xmm0,%xmm1
- .byte 15,40,21,192,31,1,0 // movaps 0x11fc0(%rip),%xmm2 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,40,21,208,31,1,0 // movaps 0x11fd0(%rip),%xmm2 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 15,16,7 // movups (%rdi),%xmm0
.byte 15,88,193 // addps %xmm1,%xmm0
@@ -34496,7 +34785,7 @@ _sk_seed_shader_sse2:
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,88,202 // addps %xmm2,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,21,175,31,1,0 // movaps 0x11faf(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,191,31,1,0 // movaps 0x11fbf(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 15,87,237 // xorps %xmm5,%xmm5
@@ -34516,14 +34805,14 @@ _sk_dither_sse2:
.byte 102,68,15,110,193 // movd %ecx,%xmm8
.byte 102,69,15,112,192,0 // pshufd $0x0,%xmm8,%xmm8
.byte 102,69,15,239,193 // pxor %xmm9,%xmm8
- .byte 102,68,15,111,21,125,31,1,0 // movdqa 0x11f7d(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,21,141,31,1,0 // movdqa 0x11f8d(%rip),%xmm10 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,69,15,111,216 // movdqa %xmm8,%xmm11
.byte 102,69,15,219,218 // pand %xmm10,%xmm11
.byte 102,65,15,114,243,5 // pslld $0x5,%xmm11
.byte 102,69,15,219,209 // pand %xmm9,%xmm10
.byte 102,65,15,114,242,4 // pslld $0x4,%xmm10
- .byte 102,68,15,111,37,105,31,1,0 // movdqa 0x11f69(%rip),%xmm12 # 2bdf0 <_sk_overlay_sse2_8bit+0xe3b>
- .byte 102,68,15,111,45,112,31,1,0 // movdqa 0x11f70(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,37,121,31,1,0 // movdqa 0x11f79(%rip),%xmm12 # 2c330 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,45,128,31,1,0 // movdqa 0x11f80(%rip),%xmm13 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,69,15,111,240 // movdqa %xmm8,%xmm14
.byte 102,69,15,219,245 // pand %xmm13,%xmm14
.byte 102,65,15,114,246,2 // pslld $0x2,%xmm14
@@ -34539,8 +34828,8 @@ _sk_dither_sse2:
.byte 102,69,15,235,245 // por %xmm13,%xmm14
.byte 102,69,15,235,240 // por %xmm8,%xmm14
.byte 69,15,91,198 // cvtdq2ps %xmm14,%xmm8
- .byte 68,15,89,5,43,31,1,0 // mulps 0x11f2b(%rip),%xmm8 # 2be10 <_sk_overlay_sse2_8bit+0xe5b>
- .byte 68,15,88,5,51,31,1,0 // addps 0x11f33(%rip),%xmm8 # 2be20 <_sk_overlay_sse2_8bit+0xe6b>
+ .byte 68,15,89,5,59,31,1,0 // mulps 0x11f3b(%rip),%xmm8 # 2c350 <_sk_overlay_sse2_8bit+0xe6b>
+ .byte 68,15,88,5,67,31,1,0 // addps 0x11f43(%rip),%xmm8 # 2c360 <_sk_overlay_sse2_8bit+0xe7b>
.byte 243,68,15,16,16 // movss (%rax),%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
@@ -34582,7 +34871,7 @@ HIDDEN _sk_black_color_sse2
FUNCTION(_sk_black_color_sse2)
_sk_black_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,105,30,1,0 // movaps 0x11e69(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,121,30,1,0 // movaps 0x11e79(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 15,87,201 // xorps %xmm1,%xmm1
.byte 15,87,210 // xorps %xmm2,%xmm2
@@ -34593,7 +34882,7 @@ HIDDEN _sk_white_color_sse2
FUNCTION(_sk_white_color_sse2)
_sk_white_color_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,85,30,1,0 // movaps 0x11e55(%rip),%xmm0 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,5,101,30,1,0 // movaps 0x11e65(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,40,216 // movaps %xmm0,%xmm3
@@ -34639,7 +34928,7 @@ HIDDEN _sk_srcatop_sse2
FUNCTION(_sk_srcatop_sse2)
_sk_srcatop_sse2:
.byte 15,89,199 // mulps %xmm7,%xmm0
- .byte 68,15,40,5,5,30,1,0 // movaps 0x11e05(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,21,30,1,0 // movaps 0x11e15(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -34664,7 +34953,7 @@ FUNCTION(_sk_dstatop_sse2)
_sk_dstatop_sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
.byte 68,15,89,196 // mulps %xmm4,%xmm8
- .byte 68,15,40,13,184,29,1,0 // movaps 0x11db8(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,200,29,1,0 // movaps 0x11dc8(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
@@ -34711,7 +35000,7 @@ HIDDEN _sk_srcout_sse2
.globl _sk_srcout_sse2
FUNCTION(_sk_srcout_sse2)
_sk_srcout_sse2:
- .byte 68,15,40,5,76,29,1,0 // movaps 0x11d4c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,92,29,1,0 // movaps 0x11d5c(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
@@ -34724,7 +35013,7 @@ HIDDEN _sk_dstout_sse2
.globl _sk_dstout_sse2
FUNCTION(_sk_dstout_sse2)
_sk_dstout_sse2:
- .byte 68,15,40,5,44,29,1,0 // movaps 0x11d2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,60,29,1,0 // movaps 0x11d3c(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 15,89,196 // mulps %xmm4,%xmm0
@@ -34741,7 +35030,7 @@ HIDDEN _sk_srcover_sse2
.globl _sk_srcover_sse2
FUNCTION(_sk_srcover_sse2)
_sk_srcover_sse2:
- .byte 68,15,40,5,255,28,1,0 // movaps 0x11cff(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,15,29,1,0 // movaps 0x11d0f(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -34761,7 +35050,7 @@ HIDDEN _sk_dstover_sse2
.globl _sk_dstover_sse2
FUNCTION(_sk_dstover_sse2)
_sk_dstover_sse2:
- .byte 68,15,40,5,195,28,1,0 // movaps 0x11cc3(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,211,28,1,0 // movaps 0x11cd3(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -34789,7 +35078,7 @@ HIDDEN _sk_multiply_sse2
.globl _sk_multiply_sse2
FUNCTION(_sk_multiply_sse2)
_sk_multiply_sse2:
- .byte 68,15,40,5,135,28,1,0 // movaps 0x11c87(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,151,28,1,0 // movaps 0x11c97(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 69,15,40,209 // movaps %xmm9,%xmm10
@@ -34827,7 +35116,7 @@ HIDDEN _sk_plus__sse2
FUNCTION(_sk_plus__sse2)
_sk_plus__sse2:
.byte 15,88,196 // addps %xmm4,%xmm0
- .byte 68,15,40,5,8,28,1,0 // movaps 0x11c08(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,24,28,1,0 // movaps 0x11c18(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 15,88,205 // addps %xmm5,%xmm1
.byte 65,15,93,200 // minps %xmm8,%xmm1
@@ -34869,7 +35158,7 @@ HIDDEN _sk_xor__sse2
FUNCTION(_sk_xor__sse2)
_sk_xor__sse2:
.byte 68,15,40,195 // movaps %xmm3,%xmm8
- .byte 15,40,29,148,27,1,0 // movaps 0x11b94(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,164,27,1,0 // movaps 0x11ba4(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,40,203 // movaps %xmm3,%xmm9
.byte 68,15,92,207 // subps %xmm7,%xmm9
.byte 65,15,89,193 // mulps %xmm9,%xmm0
@@ -34917,7 +35206,7 @@ _sk_darken_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,95,209 // maxps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,239,26,1,0 // movaps 0x11aef(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,255,26,1,0 // movaps 0x11aff(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34951,7 +35240,7 @@ _sk_lighten_sse2:
.byte 68,15,89,206 // mulps %xmm6,%xmm9
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,132,26,1,0 // movaps 0x11a84(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,148,26,1,0 // movaps 0x11a94(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -34988,7 +35277,7 @@ _sk_difference_sse2:
.byte 65,15,93,209 // minps %xmm9,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,14,26,1,0 // movaps 0x11a0e(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,30,26,1,0 // movaps 0x11a1e(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35016,7 +35305,7 @@ _sk_exclusion_sse2:
.byte 15,89,214 // mulps %xmm6,%xmm2
.byte 15,88,210 // addps %xmm2,%xmm2
.byte 68,15,92,194 // subps %xmm2,%xmm8
- .byte 15,40,21,190,25,1,0 // movaps 0x119be(%rip),%xmm2 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,21,206,25,1,0 // movaps 0x119ce(%rip),%xmm2 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,211 // subps %xmm3,%xmm2
.byte 15,89,215 // mulps %xmm7,%xmm2
.byte 15,88,218 // addps %xmm2,%xmm3
@@ -35029,7 +35318,7 @@ HIDDEN _sk_colorburn_sse2
FUNCTION(_sk_colorburn_sse2)
_sk_colorburn_sse2:
.byte 68,15,40,192 // movaps %xmm0,%xmm8
- .byte 68,15,40,13,161,25,1,0 // movaps 0x119a1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,177,25,1,0 // movaps 0x119b1(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35124,7 +35413,7 @@ HIDDEN _sk_colordodge_sse2
FUNCTION(_sk_colordodge_sse2)
_sk_colordodge_sse2:
.byte 68,15,40,200 // movaps %xmm0,%xmm9
- .byte 68,15,40,21,73,24,1,0 // movaps 0x11849(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,89,24,1,0 // movaps 0x11859(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,218 // movaps %xmm10,%xmm11
.byte 68,15,92,223 // subps %xmm7,%xmm11
.byte 65,15,40,195 // movaps %xmm11,%xmm0
@@ -35216,7 +35505,7 @@ _sk_hardlight_sse2:
.byte 15,41,116,36,232 // movaps %xmm6,-0x18(%rsp)
.byte 15,40,245 // movaps %xmm5,%xmm6
.byte 15,40,236 // movaps %xmm4,%xmm5
- .byte 68,15,40,29,242,22,1,0 // movaps 0x116f2(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,29,2,23,1,0 // movaps 0x11702(%rip),%xmm11 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,211 // movaps %xmm11,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,194 // movaps %xmm10,%xmm8
@@ -35304,7 +35593,7 @@ FUNCTION(_sk_overlay_sse2)
_sk_overlay_sse2:
.byte 68,15,40,193 // movaps %xmm1,%xmm8
.byte 68,15,40,232 // movaps %xmm0,%xmm13
- .byte 68,15,40,13,176,21,1,0 // movaps 0x115b0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,192,21,1,0 // movaps 0x115c0(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 68,15,92,215 // subps %xmm7,%xmm10
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35395,7 +35684,7 @@ _sk_softlight_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 68,15,94,215 // divps %xmm7,%xmm10
.byte 69,15,84,212 // andps %xmm12,%xmm10
- .byte 68,15,40,13,93,20,1,0 // movaps 0x1145d(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,109,20,1,0 // movaps 0x1146d(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,249 // movaps %xmm9,%xmm15
.byte 69,15,92,250 // subps %xmm10,%xmm15
.byte 69,15,40,218 // movaps %xmm10,%xmm11
@@ -35408,10 +35697,10 @@ _sk_softlight_sse2:
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 65,15,88,194 // addps %xmm10,%xmm0
- .byte 68,15,40,53,135,20,1,0 // movaps 0x11487(%rip),%xmm14 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
+ .byte 68,15,40,53,151,20,1,0 // movaps 0x11497(%rip),%xmm14 # 2c370 <_sk_overlay_sse2_8bit+0xe8b>
.byte 69,15,88,222 // addps %xmm14,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
- .byte 68,15,40,21,135,20,1,0 // movaps 0x11487(%rip),%xmm10 # 2be40 <_sk_overlay_sse2_8bit+0xe8b>
+ .byte 68,15,40,21,151,20,1,0 // movaps 0x11497(%rip),%xmm10 # 2c380 <_sk_overlay_sse2_8bit+0xe9b>
.byte 69,15,89,234 // mulps %xmm10,%xmm13
.byte 69,15,88,235 // addps %xmm11,%xmm13
.byte 15,88,228 // addps %xmm4,%xmm4
@@ -35556,7 +35845,7 @@ _sk_hue_sse2:
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 68,15,89,211 // mulps %xmm3,%xmm10
- .byte 68,15,40,5,26,18,1,0 // movaps 0x1121a(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,42,18,1,0 // movaps 0x1122a(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,216 // movaps %xmm8,%xmm11
.byte 15,40,207 // movaps %xmm7,%xmm1
.byte 68,15,92,217 // subps %xmm1,%xmm11
@@ -35604,12 +35893,12 @@ _sk_hue_sse2:
.byte 69,15,84,206 // andps %xmm14,%xmm9
.byte 69,15,84,214 // andps %xmm14,%xmm10
.byte 65,15,84,214 // andps %xmm14,%xmm2
- .byte 68,15,40,61,215,17,1,0 // movaps 0x111d7(%rip),%xmm15 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,61,231,17,1,0 // movaps 0x111e7(%rip),%xmm15 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 65,15,89,231 // mulps %xmm15,%xmm4
- .byte 15,40,5,220,17,1,0 // movaps 0x111dc(%rip),%xmm0 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 15,40,5,236,17,1,0 // movaps 0x111ec(%rip),%xmm0 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 15,89,240 // mulps %xmm0,%xmm6
.byte 15,88,244 // addps %xmm4,%xmm6
- .byte 68,15,40,53,222,17,1,0 // movaps 0x111de(%rip),%xmm14 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,53,238,17,1,0 // movaps 0x111ee(%rip),%xmm14 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 68,15,40,239 // movaps %xmm7,%xmm13
.byte 69,15,89,238 // mulps %xmm14,%xmm13
.byte 68,15,88,238 // addps %xmm6,%xmm13
@@ -35787,14 +36076,14 @@ _sk_saturation_sse2:
.byte 68,15,84,211 // andps %xmm3,%xmm10
.byte 68,15,84,203 // andps %xmm3,%xmm9
.byte 15,84,195 // andps %xmm3,%xmm0
- .byte 68,15,40,5,48,15,1,0 // movaps 0x10f30(%rip),%xmm8 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,5,64,15,1,0 // movaps 0x10f40(%rip),%xmm8 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 15,40,214 // movaps %xmm6,%xmm2
.byte 65,15,89,208 // mulps %xmm8,%xmm2
- .byte 15,40,13,50,15,1,0 // movaps 0x10f32(%rip),%xmm1 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 15,40,13,66,15,1,0 // movaps 0x10f42(%rip),%xmm1 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 15,40,221 // movaps %xmm5,%xmm3
.byte 15,89,217 // mulps %xmm1,%xmm3
.byte 15,88,218 // addps %xmm2,%xmm3
- .byte 68,15,40,37,49,15,1,0 // movaps 0x10f31(%rip),%xmm12 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,37,65,15,1,0 // movaps 0x10f41(%rip),%xmm12 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
.byte 68,15,88,235 // addps %xmm3,%xmm13
.byte 65,15,40,210 // movaps %xmm10,%xmm2
@@ -35839,7 +36128,7 @@ _sk_saturation_sse2:
.byte 15,40,223 // movaps %xmm7,%xmm3
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,89,221 // mulps %xmm5,%xmm3
- .byte 68,15,40,5,230,13,1,0 // movaps 0x10de6(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,246,13,1,0 // movaps 0x10df6(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 68,15,92,199 // subps %xmm7,%xmm8
.byte 15,88,253 // addps %xmm5,%xmm7
@@ -35940,14 +36229,14 @@ _sk_color_sse2:
.byte 68,15,40,213 // movaps %xmm5,%xmm10
.byte 69,15,89,208 // mulps %xmm8,%xmm10
.byte 65,15,40,208 // movaps %xmm8,%xmm2
- .byte 68,15,40,45,244,12,1,0 // movaps 0x10cf4(%rip),%xmm13 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,45,4,13,1,0 // movaps 0x10d04(%rip),%xmm13 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,198 // movaps %xmm6,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,40,53,244,12,1,0 // movaps 0x10cf4(%rip),%xmm14 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 68,15,40,53,4,13,1,0 // movaps 0x10d04(%rip),%xmm14 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 65,15,40,195 // movaps %xmm11,%xmm0
.byte 65,15,89,198 // mulps %xmm14,%xmm0
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,29,240,12,1,0 // movaps 0x10cf0(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
+ .byte 68,15,40,29,0,13,1,0 // movaps 0x10d00(%rip),%xmm11 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
.byte 69,15,89,227 // mulps %xmm11,%xmm12
.byte 68,15,88,224 // addps %xmm0,%xmm12
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -35955,7 +36244,7 @@ _sk_color_sse2:
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,89,254 // mulps %xmm14,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 68,15,40,5,44,12,1,0 // movaps 0x10c2c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,60,12,1,0 // movaps 0x10c3c(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,40,224 // movaps %xmm8,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
.byte 15,89,252 // mulps %xmm4,%xmm7
@@ -36091,15 +36380,15 @@ _sk_luminosity_sse2:
.byte 68,15,40,205 // movaps %xmm5,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
.byte 15,89,222 // mulps %xmm6,%xmm3
- .byte 68,15,40,37,179,10,1,0 // movaps 0x10ab3(%rip),%xmm12 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,37,195,10,1,0 // movaps 0x10ac3(%rip),%xmm12 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,199 // movaps %xmm7,%xmm8
.byte 69,15,89,196 // mulps %xmm12,%xmm8
- .byte 68,15,40,45,179,10,1,0 // movaps 0x10ab3(%rip),%xmm13 # 2be60 <_sk_overlay_sse2_8bit+0xeab>
+ .byte 68,15,40,45,195,10,1,0 // movaps 0x10ac3(%rip),%xmm13 # 2c3a0 <_sk_overlay_sse2_8bit+0xebb>
.byte 68,15,40,241 // movaps %xmm1,%xmm14
.byte 69,15,89,245 // mulps %xmm13,%xmm14
.byte 69,15,88,240 // addps %xmm8,%xmm14
- .byte 68,15,40,29,175,10,1,0 // movaps 0x10aaf(%rip),%xmm11 # 2be70 <_sk_overlay_sse2_8bit+0xebb>
- .byte 68,15,40,5,7,10,1,0 // movaps 0x10a07(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,29,191,10,1,0 // movaps 0x10abf(%rip),%xmm11 # 2c3b0 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 68,15,40,5,23,10,1,0 // movaps 0x10a17(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,248 // movaps %xmm8,%xmm15
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 68,15,92,248 // subps %xmm0,%xmm15
@@ -36240,10 +36529,10 @@ _sk_srcover_rgba_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,228,0,0,0 // jne 1b6b4 <_sk_srcover_rgba_8888_sse2+0x104>
+ .byte 15,133,228,0,0,0 // jne 1bbe4 <_sk_srcover_rgba_8888_sse2+0x104>
.byte 243,69,15,111,4,129 // movdqu (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,53,159,8,1,0 // movdqa 0x1089f(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,53,175,8,1,0 // movdqa 0x108af(%rip),%xmm6 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,224 // movdqa %xmm8,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
@@ -36257,9 +36546,9 @@ _sk_srcover_rgba_8888_sse2:
.byte 15,91,247 // cvtdq2ps %xmm7,%xmm6
.byte 102,65,15,114,208,24 // psrld $0x18,%xmm8
.byte 65,15,91,248 // cvtdq2ps %xmm8,%xmm7
- .byte 68,15,40,5,175,7,1,0 // movaps 0x107af(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,191,7,1,0 // movaps 0x107bf(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,92,195 // subps %xmm3,%xmm8
- .byte 68,15,40,37,131,8,1,0 // movaps 0x10883(%rip),%xmm12 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,37,147,8,1,0 // movaps 0x10893(%rip),%xmm12 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 65,15,89,196 // mulps %xmm12,%xmm0
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,89,204 // mulps %xmm4,%xmm9
@@ -36285,7 +36574,7 @@ _sk_srcover_rgba_8888_sse2:
.byte 102,15,114,240,24 // pslld $0x18,%xmm0
.byte 102,15,235,194 // por %xmm2,%xmm0
.byte 102,15,235,193 // por %xmm1,%xmm0
- .byte 117,84 // jne 1b6ee <_sk_srcover_rgba_8888_sse2+0x13e>
+ .byte 117,84 // jne 1bc1e <_sk_srcover_rgba_8888_sse2+0x13e>
.byte 243,65,15,127,4,129 // movdqu %xmm0,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,193 // movaps %xmm9,%xmm0
@@ -36296,32 +36585,32 @@ _sk_srcover_rgba_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,90 // je 1b71b <_sk_srcover_rgba_8888_sse2+0x16b>
+ .byte 116,90 // je 1bc4b <_sk_srcover_rgba_8888_sse2+0x16b>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1b6e3 <_sk_srcover_rgba_8888_sse2+0x133>
+ .byte 116,23 // je 1bc13 <_sk_srcover_rgba_8888_sse2+0x133>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,0,255,255,255 // jne 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 15,133,0,255,255,255 // jne 1bb06 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,69,15,18,4,129 // movlpd (%r9,%rax,4),%xmm8
- .byte 233,232,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,232,254,255,255 // jmpq 1bb06 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,43 // je 1b726 <_sk_srcover_rgba_8888_sse2+0x176>
+ .byte 116,43 // je 1bc56 <_sk_srcover_rgba_8888_sse2+0x176>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1b713 <_sk_srcover_rgba_8888_sse2+0x163>
+ .byte 116,18 // je 1bc43 <_sk_srcover_rgba_8888_sse2+0x163>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,153 // jne 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 117,153 // jne 1bbd0 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,126,76,129,8 // movd %xmm1,0x8(%r9,%rax,4)
.byte 102,65,15,214,4,129 // movq %xmm0,(%r9,%rax,4)
- .byte 235,133 // jmp 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 235,133 // jmp 1bbd0 <_sk_srcover_rgba_8888_sse2+0xf0>
.byte 102,69,15,110,4,129 // movd (%r9,%rax,4),%xmm8
- .byte 233,176,254,255,255 // jmpq 1b5d6 <_sk_srcover_rgba_8888_sse2+0x26>
+ .byte 233,176,254,255,255 // jmpq 1bb06 <_sk_srcover_rgba_8888_sse2+0x26>
.byte 102,65,15,126,4,129 // movd %xmm0,(%r9,%rax,4)
- .byte 233,111,255,255,255 // jmpq 1b6a0 <_sk_srcover_rgba_8888_sse2+0xf0>
+ .byte 233,111,255,255,255 // jmpq 1bbd0 <_sk_srcover_rgba_8888_sse2+0xf0>
HIDDEN _sk_clamp_0_sse2
.globl _sk_clamp_0_sse2
@@ -36339,7 +36628,7 @@ HIDDEN _sk_clamp_1_sse2
.globl _sk_clamp_1_sse2
FUNCTION(_sk_clamp_1_sse2)
_sk_clamp_1_sse2:
- .byte 68,15,40,5,127,6,1,0 // movaps 0x1067f(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,143,6,1,0 // movaps 0x1068f(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,93,192 // minps %xmm8,%xmm0
.byte 65,15,93,200 // minps %xmm8,%xmm1
.byte 65,15,93,208 // minps %xmm8,%xmm2
@@ -36351,7 +36640,7 @@ HIDDEN _sk_clamp_a_sse2
.globl _sk_clamp_a_sse2
FUNCTION(_sk_clamp_a_sse2)
_sk_clamp_a_sse2:
- .byte 15,93,29,100,6,1,0 // minps 0x10664(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,29,116,6,1,0 // minps 0x10674(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,93,195 // minps %xmm3,%xmm0
.byte 15,93,203 // minps %xmm3,%xmm1
.byte 15,93,211 // minps %xmm3,%xmm2
@@ -36362,7 +36651,7 @@ HIDDEN _sk_clamp_a_dst_sse2
.globl _sk_clamp_a_dst_sse2
FUNCTION(_sk_clamp_a_dst_sse2)
_sk_clamp_a_dst_sse2:
- .byte 15,93,61,80,6,1,0 // minps 0x10650(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,93,61,96,6,1,0 // minps 0x10660(%rip),%xmm7 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,93,231 // minps %xmm7,%xmm4
.byte 15,93,239 // minps %xmm7,%xmm5
.byte 15,93,247 // minps %xmm7,%xmm6
@@ -36397,7 +36686,7 @@ HIDDEN _sk_invert_sse2
.globl _sk_invert_sse2
FUNCTION(_sk_invert_sse2)
_sk_invert_sse2:
- .byte 68,15,40,5,12,6,1,0 // movaps 0x1060c(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,5,28,6,1,0 // movaps 0x1061c(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 68,15,92,200 // subps %xmm0,%xmm9
.byte 69,15,40,208 // movaps %xmm8,%xmm10
@@ -36459,7 +36748,7 @@ HIDDEN _sk_unpremul_sse2
FUNCTION(_sk_unpremul_sse2)
_sk_unpremul_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
- .byte 68,15,40,13,150,5,1,0 // movaps 0x10596(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,166,5,1,0 // movaps 0x105a6(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,94,203 // divps %xmm3,%xmm9
.byte 68,15,194,195,4 // cmpneqps %xmm3,%xmm8
.byte 69,15,84,193 // andps %xmm9,%xmm8
@@ -36473,20 +36762,20 @@ HIDDEN _sk_from_srgb_sse2
.globl _sk_from_srgb_sse2
FUNCTION(_sk_from_srgb_sse2)
_sk_from_srgb_sse2:
- .byte 68,15,40,5,97,6,1,0 // movaps 0x10661(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
+ .byte 68,15,40,5,113,6,1,0 // movaps 0x10671(%rip),%xmm8 # 2c400 <_sk_overlay_sse2_8bit+0xf1b>
.byte 68,15,40,232 // movaps %xmm0,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,216 // movaps %xmm0,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,217,5,1,0 // movaps 0x105d9(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,13,233,5,1,0 // movaps 0x105e9(%rip),%xmm9 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,73,6,1,0 // movaps 0x10649(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
+ .byte 68,15,40,21,89,6,1,0 // movaps 0x10659(%rip),%xmm10 # 2c410 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,73,6,1,0 // movaps 0x10649(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
+ .byte 68,15,40,29,89,6,1,0 // movaps 0x10659(%rip),%xmm11 # 2c420 <_sk_overlay_sse2_8bit+0xf3b>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,77,6,1,0 // movaps 0x1064d(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
+ .byte 68,15,40,37,93,6,1,0 // movaps 0x1065d(%rip),%xmm12 # 2c430 <_sk_overlay_sse2_8bit+0xf4b>
.byte 65,15,194,196,1 // cmpltps %xmm12,%xmm0
.byte 68,15,84,232 // andps %xmm0,%xmm13
.byte 65,15,85,198 // andnps %xmm14,%xmm0
@@ -36522,20 +36811,20 @@ HIDDEN _sk_from_srgb_dst_sse2
.globl _sk_from_srgb_dst_sse2
FUNCTION(_sk_from_srgb_dst_sse2)
_sk_from_srgb_dst_sse2:
- .byte 68,15,40,5,158,5,1,0 // movaps 0x1059e(%rip),%xmm8 # 2bec0 <_sk_overlay_sse2_8bit+0xf0b>
+ .byte 68,15,40,5,174,5,1,0 // movaps 0x105ae(%rip),%xmm8 # 2c400 <_sk_overlay_sse2_8bit+0xf1b>
.byte 68,15,40,236 // movaps %xmm4,%xmm13
.byte 69,15,89,232 // mulps %xmm8,%xmm13
.byte 68,15,40,220 // movaps %xmm4,%xmm11
.byte 69,15,89,219 // mulps %xmm11,%xmm11
- .byte 68,15,40,13,22,5,1,0 // movaps 0x10516(%rip),%xmm9 # 2be50 <_sk_overlay_sse2_8bit+0xe9b>
+ .byte 68,15,40,13,38,5,1,0 // movaps 0x10526(%rip),%xmm9 # 2c390 <_sk_overlay_sse2_8bit+0xeab>
.byte 68,15,40,244 // movaps %xmm4,%xmm14
.byte 69,15,89,241 // mulps %xmm9,%xmm14
- .byte 68,15,40,21,134,5,1,0 // movaps 0x10586(%rip),%xmm10 # 2bed0 <_sk_overlay_sse2_8bit+0xf1b>
+ .byte 68,15,40,21,150,5,1,0 // movaps 0x10596(%rip),%xmm10 # 2c410 <_sk_overlay_sse2_8bit+0xf2b>
.byte 69,15,88,242 // addps %xmm10,%xmm14
.byte 69,15,89,243 // mulps %xmm11,%xmm14
- .byte 68,15,40,29,134,5,1,0 // movaps 0x10586(%rip),%xmm11 # 2bee0 <_sk_overlay_sse2_8bit+0xf2b>
+ .byte 68,15,40,29,150,5,1,0 // movaps 0x10596(%rip),%xmm11 # 2c420 <_sk_overlay_sse2_8bit+0xf3b>
.byte 69,15,88,243 // addps %xmm11,%xmm14
- .byte 68,15,40,37,138,5,1,0 // movaps 0x1058a(%rip),%xmm12 # 2bef0 <_sk_overlay_sse2_8bit+0xf3b>
+ .byte 68,15,40,37,154,5,1,0 // movaps 0x1059a(%rip),%xmm12 # 2c430 <_sk_overlay_sse2_8bit+0xf4b>
.byte 65,15,194,228,1 // cmpltps %xmm12,%xmm4
.byte 68,15,84,236 // andps %xmm4,%xmm13
.byte 65,15,85,230 // andnps %xmm14,%xmm4
@@ -36572,22 +36861,22 @@ HIDDEN _sk_to_srgb_sse2
FUNCTION(_sk_to_srgb_sse2)
_sk_to_srgb_sse2:
.byte 68,15,82,232 // rsqrtps %xmm0,%xmm13
- .byte 68,15,40,5,23,5,1,0 // movaps 0x10517(%rip),%xmm8 # 2bf00 <_sk_overlay_sse2_8bit+0xf4b>
+ .byte 68,15,40,5,39,5,1,0 // movaps 0x10527(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0xf5b>
.byte 68,15,40,240 // movaps %xmm0,%xmm14
.byte 69,15,89,240 // mulps %xmm8,%xmm14
- .byte 68,15,40,13,23,5,1,0 // movaps 0x10517(%rip),%xmm9 # 2bf10 <_sk_overlay_sse2_8bit+0xf5b>
+ .byte 68,15,40,13,39,5,1,0 // movaps 0x10527(%rip),%xmm9 # 2c450 <_sk_overlay_sse2_8bit+0xf6b>
.byte 69,15,40,253 // movaps %xmm13,%xmm15
.byte 69,15,89,249 // mulps %xmm9,%xmm15
- .byte 68,15,40,21,23,5,1,0 // movaps 0x10517(%rip),%xmm10 # 2bf20 <_sk_overlay_sse2_8bit+0xf6b>
+ .byte 68,15,40,21,39,5,1,0 // movaps 0x10527(%rip),%xmm10 # 2c460 <_sk_overlay_sse2_8bit+0xf7b>
.byte 69,15,88,250 // addps %xmm10,%xmm15
.byte 69,15,89,253 // mulps %xmm13,%xmm15
- .byte 68,15,40,29,23,5,1,0 // movaps 0x10517(%rip),%xmm11 # 2bf30 <_sk_overlay_sse2_8bit+0xf7b>
+ .byte 68,15,40,29,39,5,1,0 // movaps 0x10527(%rip),%xmm11 # 2c470 <_sk_overlay_sse2_8bit+0xf8b>
.byte 69,15,88,251 // addps %xmm11,%xmm15
- .byte 68,15,40,37,27,5,1,0 // movaps 0x1051b(%rip),%xmm12 # 2bf40 <_sk_overlay_sse2_8bit+0xf8b>
+ .byte 68,15,40,37,43,5,1,0 // movaps 0x1052b(%rip),%xmm12 # 2c480 <_sk_overlay_sse2_8bit+0xf9b>
.byte 69,15,88,236 // addps %xmm12,%xmm13
.byte 69,15,83,237 // rcpps %xmm13,%xmm13
.byte 69,15,89,239 // mulps %xmm15,%xmm13
- .byte 68,15,40,61,23,5,1,0 // movaps 0x10517(%rip),%xmm15 # 2bf50 <_sk_overlay_sse2_8bit+0xf9b>
+ .byte 68,15,40,61,39,5,1,0 // movaps 0x10527(%rip),%xmm15 # 2c490 <_sk_overlay_sse2_8bit+0xfab>
.byte 65,15,194,199,1 // cmpltps %xmm15,%xmm0
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,197 // andnps %xmm13,%xmm0
@@ -36639,7 +36928,7 @@ _sk_rgb_to_hsl_sse2:
.byte 68,15,93,216 // minps %xmm0,%xmm11
.byte 65,15,40,202 // movaps %xmm10,%xmm1
.byte 65,15,92,203 // subps %xmm11,%xmm1
- .byte 68,15,40,45,218,2,1,0 // movaps 0x102da(%rip),%xmm13 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,45,234,2,1,0 // movaps 0x102ea(%rip),%xmm13 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 68,15,94,233 // divps %xmm1,%xmm13
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,194,192,0 // cmpeqps %xmm8,%xmm0
@@ -36648,30 +36937,30 @@ _sk_rgb_to_hsl_sse2:
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,40,241 // movaps %xmm9,%xmm14
.byte 68,15,194,242,1 // cmpltps %xmm2,%xmm14
- .byte 68,15,84,53,64,4,1,0 // andps 0x10440(%rip),%xmm14 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
+ .byte 68,15,84,53,80,4,1,0 // andps 0x10450(%rip),%xmm14 # 2c4a0 <_sk_overlay_sse2_8bit+0xfbb>
.byte 69,15,88,244 // addps %xmm12,%xmm14
.byte 69,15,40,250 // movaps %xmm10,%xmm15
.byte 69,15,194,249,0 // cmpeqps %xmm9,%xmm15
.byte 65,15,92,208 // subps %xmm8,%xmm2
.byte 65,15,89,213 // mulps %xmm13,%xmm2
- .byte 68,15,40,37,51,4,1,0 // movaps 0x10433(%rip),%xmm12 # 2bf70 <_sk_overlay_sse2_8bit+0xfbb>
+ .byte 68,15,40,37,67,4,1,0 // movaps 0x10443(%rip),%xmm12 # 2c4b0 <_sk_overlay_sse2_8bit+0xfcb>
.byte 65,15,88,212 // addps %xmm12,%xmm2
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 69,15,89,197 // mulps %xmm13,%xmm8
- .byte 68,15,88,5,47,4,1,0 // addps 0x1042f(%rip),%xmm8 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
+ .byte 68,15,88,5,63,4,1,0 // addps 0x1043f(%rip),%xmm8 # 2c4c0 <_sk_overlay_sse2_8bit+0xfdb>
.byte 65,15,84,215 // andps %xmm15,%xmm2
.byte 69,15,85,248 // andnps %xmm8,%xmm15
.byte 68,15,86,250 // orps %xmm2,%xmm15
.byte 68,15,84,240 // andps %xmm0,%xmm14
.byte 65,15,85,199 // andnps %xmm15,%xmm0
.byte 65,15,86,198 // orps %xmm14,%xmm0
- .byte 15,89,5,32,4,1,0 // mulps 0x10420(%rip),%xmm0 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
+ .byte 15,89,5,48,4,1,0 // mulps 0x10430(%rip),%xmm0 # 2c4d0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 69,15,40,194 // movaps %xmm10,%xmm8
.byte 69,15,194,195,4 // cmpneqps %xmm11,%xmm8
.byte 65,15,84,192 // andps %xmm8,%xmm0
.byte 69,15,92,226 // subps %xmm10,%xmm12
.byte 69,15,88,211 // addps %xmm11,%xmm10
- .byte 68,15,40,13,51,2,1,0 // movaps 0x10233(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,13,67,2,1,0 // movaps 0x10243(%rip),%xmm9 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,40,210 // movaps %xmm10,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 68,15,194,202,1 // cmpltps %xmm2,%xmm9
@@ -36695,7 +36984,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,41,92,36,168 // movaps %xmm3,-0x58(%rsp)
.byte 68,15,40,218 // movaps %xmm2,%xmm11
.byte 15,40,240 // movaps %xmm0,%xmm6
- .byte 68,15,40,13,226,1,1,0 // movaps 0x101e2(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,13,242,1,1,0 // movaps 0x101f2(%rip),%xmm9 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,40,209 // movaps %xmm9,%xmm10
.byte 69,15,194,211,2 // cmpleps %xmm11,%xmm10
.byte 15,40,193 // movaps %xmm1,%xmm0
@@ -36712,28 +37001,28 @@ _sk_hsl_to_rgb_sse2:
.byte 69,15,88,211 // addps %xmm11,%xmm10
.byte 69,15,88,219 // addps %xmm11,%xmm11
.byte 69,15,92,218 // subps %xmm10,%xmm11
- .byte 15,40,5,123,3,1,0 // movaps 0x1037b(%rip),%xmm0 # 2bfa0 <_sk_overlay_sse2_8bit+0xfeb>
+ .byte 15,40,5,139,3,1,0 // movaps 0x1038b(%rip),%xmm0 # 2c4e0 <_sk_overlay_sse2_8bit+0xffb>
.byte 15,88,198 // addps %xmm6,%xmm0
.byte 243,15,91,200 // cvttps2dq %xmm0,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
.byte 15,40,216 // movaps %xmm0,%xmm3
.byte 15,194,217,1 // cmpltps %xmm1,%xmm3
- .byte 15,84,29,147,1,1,0 // andps 0x10193(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,84,29,163,1,1,0 // andps 0x101a3(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,203 // subps %xmm3,%xmm1
.byte 15,92,193 // subps %xmm1,%xmm0
- .byte 68,15,40,45,101,3,1,0 // movaps 0x10365(%rip),%xmm13 # 2bfb0 <_sk_overlay_sse2_8bit+0xffb>
+ .byte 68,15,40,45,117,3,1,0 // movaps 0x10375(%rip),%xmm13 # 2c4f0 <_sk_overlay_sse2_8bit+0x100b>
.byte 69,15,40,197 // movaps %xmm13,%xmm8
.byte 68,15,194,192,2 // cmpleps %xmm0,%xmm8
.byte 69,15,40,242 // movaps %xmm10,%xmm14
.byte 69,15,92,243 // subps %xmm11,%xmm14
.byte 65,15,40,217 // movaps %xmm9,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
- .byte 15,40,21,37,3,1,0 // movaps 0x10325(%rip),%xmm2 # 2bf90 <_sk_overlay_sse2_8bit+0xfdb>
+ .byte 15,40,21,53,3,1,0 // movaps 0x10335(%rip),%xmm2 # 2c4d0 <_sk_overlay_sse2_8bit+0xfeb>
.byte 68,15,40,250 // movaps %xmm2,%xmm15
.byte 68,15,194,248,2 // cmpleps %xmm0,%xmm15
- .byte 15,40,13,229,2,1,0 // movaps 0x102e5(%rip),%xmm1 # 2bf60 <_sk_overlay_sse2_8bit+0xfab>
+ .byte 15,40,13,245,2,1,0 // movaps 0x102f5(%rip),%xmm1 # 2c4a0 <_sk_overlay_sse2_8bit+0xfbb>
.byte 15,89,193 // mulps %xmm1,%xmm0
- .byte 15,40,45,251,2,1,0 // movaps 0x102fb(%rip),%xmm5 # 2bf80 <_sk_overlay_sse2_8bit+0xfcb>
+ .byte 15,40,45,11,3,1,0 // movaps 0x1030b(%rip),%xmm5 # 2c4c0 <_sk_overlay_sse2_8bit+0xfdb>
.byte 15,40,229 // movaps %xmm5,%xmm4
.byte 15,92,224 // subps %xmm0,%xmm4
.byte 65,15,89,230 // mulps %xmm14,%xmm4
@@ -36756,7 +37045,7 @@ _sk_hsl_to_rgb_sse2:
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,240,0,1,0 // andps 0x100f0(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,84,29,0,1,1,0 // andps 0x10100(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 68,15,40,230 // movaps %xmm6,%xmm12
.byte 68,15,92,224 // subps %xmm0,%xmm12
@@ -36786,12 +37075,12 @@ _sk_hsl_to_rgb_sse2:
.byte 15,40,124,36,136 // movaps -0x78(%rsp),%xmm7
.byte 15,40,231 // movaps %xmm7,%xmm4
.byte 15,85,227 // andnps %xmm3,%xmm4
- .byte 15,88,53,104,2,1,0 // addps 0x10268(%rip),%xmm6 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 15,88,53,120,2,1,0 // addps 0x10278(%rip),%xmm6 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 243,15,91,198 // cvttps2dq %xmm6,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
.byte 15,40,222 // movaps %xmm6,%xmm3
.byte 15,194,216,1 // cmpltps %xmm0,%xmm3
- .byte 15,84,29,99,0,1,0 // andps 0x10063(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,84,29,115,0,1,0 // andps 0x10073(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,92,195 // subps %xmm3,%xmm0
.byte 15,92,240 // subps %xmm0,%xmm6
.byte 15,89,206 // mulps %xmm6,%xmm1
@@ -36855,13 +37144,13 @@ _sk_scale_u8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,61 // jne 1be6e <_sk_scale_u8_sse2+0x55>
+ .byte 117,61 // jne 1c39e <_sk_scale_u8_sse2+0x55>
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,54,0,1,0 // pand 0x10036(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,68,15,219,5,70,0,1,0 // pand 0x10046(%rip),%xmm8 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,122,1,1,0 // mulps 0x1017a(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,89,5,138,1,1,0 // mulps 0x1018a(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
@@ -36872,12 +37161,12 @@ _sk_scale_u8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,61 // je 1beb8 <_sk_scale_u8_sse2+0x9f>
+ .byte 116,61 // je 1c3e8 <_sk_scale_u8_sse2+0x9f>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1be9d <_sk_scale_u8_sse2+0x84>
+ .byte 116,23 // je 1c3cd <_sk_scale_u8_sse2+0x84>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,181 // jne 1be41 <_sk_scale_u8_sse2+0x28>
+ .byte 117,181 // jne 1c371 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -36886,10 +37175,10 @@ _sk_scale_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 235,137 // jmp 1be41 <_sk_scale_u8_sse2+0x28>
+ .byte 235,137 // jmp 1c371 <_sk_scale_u8_sse2+0x28>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,122,255,255,255 // jmpq 1be41 <_sk_scale_u8_sse2+0x28>
+ .byte 233,122,255,255,255 // jmpq 1c371 <_sk_scale_u8_sse2+0x28>
HIDDEN _sk_scale_565_sse2
.globl _sk_scale_565_sse2
@@ -36903,20 +37192,20 @@ _sk_scale_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,173,0,0,0 // jne 1bf93 <_sk_scale_565_sse2+0xcc>
+ .byte 15,133,173,0,0,0 // jne 1c4c3 <_sk_scale_565_sse2+0xcc>
.byte 243,71,15,126,20,89 // movq (%r9,%r11,2),%xmm10
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
- .byte 102,68,15,111,5,230,0,1,0 // movdqa 0x100e6(%rip),%xmm8 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,68,15,111,5,246,0,1,0 // movdqa 0x100f6(%rip),%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,69,15,219,194 // pand %xmm10,%xmm8
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,229,0,1,0 // mulps 0x100e5(%rip),%xmm8 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,68,15,111,13,236,0,1,0 // movdqa 0x100ec(%rip),%xmm9 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 68,15,89,5,245,0,1,0 // mulps 0x100f5(%rip),%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,68,15,111,13,252,0,1,0 // movdqa 0x100fc(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,69,15,219,202 // pand %xmm10,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,235,0,1,0 // mulps 0x100eb(%rip),%xmm9 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,68,15,219,21,242,0,1,0 // pand 0x100f2(%rip),%xmm10 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 68,15,89,13,251,0,1,0 // mulps 0x100fb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,68,15,219,21,2,1,1,0 // pand 0x10102(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
- .byte 68,15,89,21,246,0,1,0 // mulps 0x100f6(%rip),%xmm10 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,89,21,6,1,1,0 // mulps 0x10106(%rip),%xmm10 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 68,15,40,219 // movaps %xmm3,%xmm11
.byte 68,15,194,223,1 // cmpltps %xmm7,%xmm11
.byte 69,15,40,225 // movaps %xmm9,%xmm12
@@ -36943,22 +37232,22 @@ _sk_scale_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1bfdb <_sk_scale_565_sse2+0x114>
+ .byte 116,59 // je 1c50b <_sk_scale_565_sse2+0x114>
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,27 // je 1bfc6 <_sk_scale_565_sse2+0xff>
+ .byte 116,27 // je 1c4f6 <_sk_scale_565_sse2+0xff>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,60,255,255,255 // jne 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 15,133,60,255,255,255 // jne 1c421 <_sk_scale_565_sse2+0x2a>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,208,69 // pshufd $0x45,%xmm8,%xmm10
.byte 102,71,15,110,4,89 // movd (%r9,%r11,2),%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
.byte 242,69,15,16,208 // movsd %xmm8,%xmm10
- .byte 233,22,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 233,22,255,255,255 // jmpq 1c421 <_sk_scale_565_sse2+0x2a>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,68,15,110,208 // movd %eax,%xmm10
- .byte 233,7,255,255,255 // jmpq 1bef1 <_sk_scale_565_sse2+0x2a>
+ .byte 233,7,255,255,255 // jmpq 1c421 <_sk_scale_565_sse2+0x2a>
HIDDEN _sk_lerp_1_float_sse2
.globl _sk_lerp_1_float_sse2
@@ -36993,13 +37282,13 @@ _sk_lerp_u8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,81 // jne 1c08b <_sk_lerp_u8_sse2+0x69>
+ .byte 117,81 // jne 1c5bb <_sk_lerp_u8_sse2+0x69>
.byte 102,71,15,110,4,25 // movd (%r9,%r11,1),%xmm8
.byte 102,68,15,96,192 // punpcklbw %xmm0,%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,219,5,45,254,0,0 // pand 0xfe2d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,68,15,219,5,61,254,0,0 // pand 0xfe3d(%rip),%xmm8 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,113,255,0,0 // mulps 0xff71(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,89,5,129,255,0,0 // mulps 0xff81(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 15,92,196 // subps %xmm4,%xmm0
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 15,88,196 // addps %xmm4,%xmm0
@@ -37017,12 +37306,12 @@ _sk_lerp_u8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,64 // je 1c0d8 <_sk_lerp_u8_sse2+0xb6>
+ .byte 116,64 // je 1c608 <_sk_lerp_u8_sse2+0xb6>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1c0ba <_sk_lerp_u8_sse2+0x98>
+ .byte 116,23 // je 1c5ea <_sk_lerp_u8_sse2+0x98>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,161 // jne 1c04a <_sk_lerp_u8_sse2+0x28>
+ .byte 117,161 // jne 1c57a <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
@@ -37031,10 +37320,10 @@ _sk_lerp_u8_sse2:
.byte 102,68,15,96,200 // punpcklbw %xmm0,%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 233,114,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28>
+ .byte 233,114,255,255,255 // jmpq 1c57a <_sk_lerp_u8_sse2+0x28>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,99,255,255,255 // jmpq 1c04a <_sk_lerp_u8_sse2+0x28>
+ .byte 233,99,255,255,255 // jmpq 1c57a <_sk_lerp_u8_sse2+0x28>
HIDDEN _sk_lerp_565_sse2
.globl _sk_lerp_565_sse2
@@ -37048,20 +37337,20 @@ _sk_lerp_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,173,0,0,0 // jne 1c1b3 <_sk_lerp_565_sse2+0xcc>
+ .byte 15,133,173,0,0,0 // jne 1c6e3 <_sk_lerp_565_sse2+0xcc>
.byte 243,71,15,126,4,89 // movq (%r9,%r11,2),%xmm8
.byte 102,68,15,97,192 // punpcklwd %xmm0,%xmm8
- .byte 102,68,15,111,13,198,254,0,0 // movdqa 0xfec6(%rip),%xmm9 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,68,15,111,13,214,254,0,0 // movdqa 0xfed6(%rip),%xmm9 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,69,15,219,200 // pand %xmm8,%xmm9
.byte 69,15,91,201 // cvtdq2ps %xmm9,%xmm9
- .byte 68,15,89,13,197,254,0,0 // mulps 0xfec5(%rip),%xmm9 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,68,15,111,21,204,254,0,0 // movdqa 0xfecc(%rip),%xmm10 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 68,15,89,13,213,254,0,0 // mulps 0xfed5(%rip),%xmm9 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,68,15,111,21,220,254,0,0 // movdqa 0xfedc(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,69,15,219,208 // pand %xmm8,%xmm10
.byte 69,15,91,218 // cvtdq2ps %xmm10,%xmm11
- .byte 68,15,89,29,203,254,0,0 // mulps 0xfecb(%rip),%xmm11 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,68,15,219,5,210,254,0,0 // pand 0xfed2(%rip),%xmm8 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 68,15,89,29,219,254,0,0 // mulps 0xfedb(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,68,15,219,5,226,254,0,0 // pand 0xfee2(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
- .byte 68,15,89,5,214,254,0,0 // mulps 0xfed6(%rip),%xmm8 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 68,15,89,5,230,254,0,0 // mulps 0xfee6(%rip),%xmm8 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 68,15,40,211 // movaps %xmm3,%xmm10
.byte 68,15,194,215,1 // cmpltps %xmm7,%xmm10
.byte 69,15,40,227 // movaps %xmm11,%xmm12
@@ -37090,22 +37379,22 @@ _sk_lerp_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1c1fb <_sk_lerp_565_sse2+0x114>
+ .byte 116,59 // je 1c72b <_sk_lerp_565_sse2+0x114>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,27 // je 1c1e6 <_sk_lerp_565_sse2+0xff>
+ .byte 116,27 // je 1c716 <_sk_lerp_565_sse2+0xff>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,60,255,255,255 // jne 1c111 <_sk_lerp_565_sse2+0x2a>
+ .byte 15,133,60,255,255,255 // jne 1c641 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
.byte 102,69,15,112,192,69 // pshufd $0x45,%xmm8,%xmm8
.byte 102,71,15,110,12,89 // movd (%r9,%r11,2),%xmm9
.byte 102,68,15,97,200 // punpcklwd %xmm0,%xmm9
.byte 242,69,15,16,193 // movsd %xmm9,%xmm8
- .byte 233,22,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a>
+ .byte 233,22,255,255,255 // jmpq 1c641 <_sk_lerp_565_sse2+0x2a>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,68,15,110,192 // movd %eax,%xmm8
- .byte 233,7,255,255,255 // jmpq 1c111 <_sk_lerp_565_sse2+0x2a>
+ .byte 233,7,255,255,255 // jmpq 1c641 <_sk_lerp_565_sse2+0x2a>
HIDDEN _sk_load_tables_sse2
.globl _sk_load_tables_sse2
@@ -37114,12 +37403,12 @@ _sk_load_tables_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 76,139,8 // mov (%rax),%r9
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,36,1,0,0 // jne 1c33c <_sk_load_tables_sse2+0x132>
+ .byte 15,133,36,1,0,0 // jne 1c86c <_sk_load_tables_sse2+0x132>
.byte 243,69,15,111,12,145 // movdqu (%r9,%rdx,4),%xmm9
.byte 65,87 // push %r15
.byte 65,86 // push %r14
.byte 83 // push %rbx
- .byte 102,68,15,111,5,84,252,0,0 // movdqa 0xfc54(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,68,15,111,5,100,252,0,0 // movdqa 0xfc64(%rip),%xmm8 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
@@ -37175,7 +37464,7 @@ _sk_load_tables_sse2:
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 102,65,15,114,209,24 // psrld $0x18,%xmm9
.byte 65,15,91,217 // cvtdq2ps %xmm9,%xmm3
- .byte 15,89,29,157,252,0,0 // mulps 0xfc9d(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,29,173,252,0,0 // mulps 0xfcad(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -37184,18 +37473,18 @@ _sk_load_tables_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,45 // je 1c376 <_sk_load_tables_sse2+0x16c>
+ .byte 116,45 // je 1c8a6 <_sk_load_tables_sse2+0x16c>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,23 // je 1c36b <_sk_load_tables_sse2+0x161>
+ .byte 116,23 // je 1c89b <_sk_load_tables_sse2+0x161>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 15,133,192,254,255,255 // jne 1c21e <_sk_load_tables_sse2+0x14>
+ .byte 15,133,192,254,255,255 // jne 1c74e <_sk_load_tables_sse2+0x14>
.byte 102,65,15,110,68,145,8 // movd 0x8(%r9,%rdx,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,145 // movlpd (%r9,%rdx,4),%xmm9
- .byte 233,168,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14>
+ .byte 233,168,254,255,255 // jmpq 1c74e <_sk_load_tables_sse2+0x14>
.byte 102,69,15,110,12,145 // movd (%r9,%rdx,4),%xmm9
- .byte 233,157,254,255,255 // jmpq 1c21e <_sk_load_tables_sse2+0x14>
+ .byte 233,157,254,255,255 // jmpq 1c74e <_sk_load_tables_sse2+0x14>
HIDDEN _sk_load_tables_u16_be_sse2
.globl _sk_load_tables_u16_be_sse2
@@ -37205,7 +37494,7 @@ _sk_load_tables_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,149,0,0,0,0 // lea 0x0(,%rdx,4),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,101,1,0,0 // jne 1c4fc <_sk_load_tables_u16_be_sse2+0x17b>
+ .byte 15,133,101,1,0,0 // jne 1ca2c <_sk_load_tables_u16_be_sse2+0x17b>
.byte 102,67,15,16,4,81 // movupd (%r9,%r10,2),%xmm0
.byte 102,67,15,16,76,81,16 // movupd 0x10(%r9,%r10,2),%xmm1
.byte 65,87 // push %r15
@@ -37217,7 +37506,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 102,68,15,105,200 // punpckhwd %xmm0,%xmm9
- .byte 102,68,15,111,21,114,252,0,0 // movdqa 0xfc72(%rip),%xmm10 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
+ .byte 102,68,15,111,21,130,252,0,0 // movdqa 0xfc82(%rip),%xmm10 # 2c580 <_sk_overlay_sse2_8bit+0x109b>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,194 // pand %xmm10,%xmm0
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -37279,7 +37568,7 @@ _sk_load_tables_u16_be_sse2:
.byte 102,65,15,235,217 // por %xmm9,%xmm3
.byte 102,65,15,97,216 // punpcklwd %xmm8,%xmm3
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,109,251,0,0 // mulps 0xfb6d(%rip),%xmm3 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
+ .byte 15,89,29,125,251,0,0 // mulps 0xfb7d(%rip),%xmm3 # 2c5a0 <_sk_overlay_sse2_8bit+0x10bb>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
@@ -37287,17 +37576,17 @@ _sk_load_tables_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,67,15,16,4,81 // movsd (%r9,%r10,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1c519 <_sk_load_tables_u16_be_sse2+0x198>
+ .byte 117,17 // jne 1ca49 <_sk_load_tables_u16_be_sse2+0x198>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,139,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,139,254,255,255 // jmpq 1c8d4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 102,67,15,22,68,81,8 // movhpd 0x8(%r9,%r10,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,118,254,255,255 // jb 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 15,130,118,254,255,255 // jb 1c8d4 <_sk_load_tables_u16_be_sse2+0x23>
.byte 242,67,15,16,76,81,16 // movsd 0x10(%r9,%r10,2),%xmm1
- .byte 233,106,254,255,255 // jmpq 1c3a4 <_sk_load_tables_u16_be_sse2+0x23>
+ .byte 233,106,254,255,255 // jmpq 1c8d4 <_sk_load_tables_u16_be_sse2+0x23>
HIDDEN _sk_load_tables_rgb_u16_be_sse2
.globl _sk_load_tables_rgb_u16_be_sse2
@@ -37307,7 +37596,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 76,141,20,82 // lea (%rdx,%rdx,2),%r10
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,84,1,0,0 // jne 1c6a0 <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ .byte 15,133,84,1,0,0 // jne 1cbd0 <_sk_load_tables_rgb_u16_be_sse2+0x166>
.byte 243,71,15,111,28,81 // movdqu (%r9,%r10,2),%xmm11
.byte 243,67,15,111,76,81,8 // movdqu 0x8(%r9,%r10,2),%xmm1
.byte 102,15,115,217,4 // psrldq $0x4,%xmm1
@@ -37322,7 +37611,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,68,15,97,208 // punpcklwd %xmm0,%xmm10
.byte 102,65,15,111,195 // movdqa %xmm11,%xmm0
.byte 102,65,15,97,194 // punpcklwd %xmm10,%xmm0
- .byte 102,68,15,111,5,172,250,0,0 // movdqa 0xfaac(%rip),%xmm8 # 2c040 <_sk_overlay_sse2_8bit+0x108b>
+ .byte 102,68,15,111,5,188,250,0,0 // movdqa 0xfabc(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0x109b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,65,15,219,192 // pand %xmm8,%xmm0
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -37378,7 +37667,7 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 65,15,20,208 // unpcklps %xmm8,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,55,247,0,0 // movaps 0xf737(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,71,247,0,0 // movaps 0xf747(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 91 // pop %rbx
.byte 65,94 // pop %r14
.byte 65,95 // pop %r15
@@ -37387,21 +37676,21 @@ _sk_load_tables_rgb_u16_be_sse2:
.byte 102,71,15,196,92,81,4,2 // pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,14 // jne 1c6c6 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ .byte 117,14 // jne 1cbf6 <_sk_load_tables_rgb_u16_be_sse2+0x18c>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
- .byte 233,172,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,172,254,255,255 // jmpq 1caa2 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,71,15,110,84,81,6 // movd 0x6(%r9,%r10,2),%xmm10
.byte 102,71,15,196,84,81,10,2 // pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 1c6f7 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ .byte 114,24 // jb 1cc27 <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
.byte 102,67,15,110,76,81,12 // movd 0xc(%r9,%r10,2),%xmm1
.byte 102,67,15,196,76,81,16,2 // pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,123,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,123,254,255,255 // jmpq 1caa2 <_sk_load_tables_rgb_u16_be_sse2+0x38>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,114,254,255,255 // jmpq 1c572 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ .byte 233,114,254,255,255 // jmpq 1caa2 <_sk_load_tables_rgb_u16_be_sse2+0x38>
HIDDEN _sk_byte_tables_sse2
.globl _sk_byte_tables_sse2
@@ -37412,7 +37701,7 @@ _sk_byte_tables_sse2:
.byte 65,86 // push %r14
.byte 83 // push %rbx
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,160,247,0,0 // movaps 0xf7a0(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,176,247,0,0 // movaps 0xf7b0(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,91,192 // cvtps2dq %xmm0,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
@@ -37440,7 +37729,7 @@ _sk_byte_tables_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,74,248,0,0 // movaps 0xf84a(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,21,90,248,0,0 // movaps 0xf85a(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -37561,7 +37850,7 @@ _sk_byte_tables_rgb_sse2:
.byte 102,65,15,96,193 // punpcklbw %xmm9,%xmm0
.byte 102,65,15,97,193 // punpcklwd %xmm9,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,21,130,246,0,0 // movaps 0xf682(%rip),%xmm10 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,21,146,246,0,0 // movaps 0xf692(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,194 // mulps %xmm10,%xmm0
.byte 65,15,89,200 // mulps %xmm8,%xmm1
.byte 102,15,91,201 // cvtps2dq %xmm1,%xmm1
@@ -37768,15 +38057,15 @@ _sk_parametric_r_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,86,244,0,0 // mulps 0xf456(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,21,94,244,0,0 // andps 0xf45e(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,21,134,241,0,0 // orps 0xf186(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,13,94,244,0,0 // addps 0xf45e(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 68,15,40,37,102,244,0,0 // movaps 0xf466(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,13,102,244,0,0 // mulps 0xf466(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,21,110,244,0,0 // andps 0xf46e(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,21,150,241,0,0 // orps 0xf196(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,13,110,244,0,0 // addps 0xf46e(%rip),%xmm9 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,37,118,244,0,0 // movaps 0xf476(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,102,244,0,0 // addps 0xf466(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 68,15,40,37,110,244,0,0 // movaps 0xf46e(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,21,118,244,0,0 // addps 0xf476(%rip),%xmm10 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,37,126,244,0,0 // movaps 0xf47e(%rip),%xmm12 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -37784,22 +38073,22 @@ _sk_parametric_r_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,72,241,0,0 // movaps 0xf148(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,88,241,0,0 // movaps 0xf158(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,60,244,0,0 // addps 0xf43c(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,13,76,244,0,0 // addps 0xf44c(%rip),%xmm9 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,40,37,84,244,0,0 // movaps 0xf454(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,68,244,0,0 // movaps 0xf444(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,37,84,244,0,0 // movaps 0xf454(%rip),%xmm12 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,72,244,0,0 // movaps 0xf448(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,45,88,244,0,0 // movaps 0xf458(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,72,244,0,0 // mulps 0xf448(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 68,15,89,45,88,244,0,0 // mulps 0xf458(%rip),%xmm13 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -37835,15 +38124,15 @@ _sk_parametric_g_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,24,243,0,0 // mulps 0xf318(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,21,32,243,0,0 // andps 0xf320(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,21,72,240,0,0 // orps 0xf048(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,13,32,243,0,0 // addps 0xf320(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 68,15,40,37,40,243,0,0 // movaps 0xf328(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,13,40,243,0,0 // mulps 0xf328(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,21,48,243,0,0 // andps 0xf330(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,21,88,240,0,0 // orps 0xf058(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,13,48,243,0,0 // addps 0xf330(%rip),%xmm9 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,37,56,243,0,0 // movaps 0xf338(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,40,243,0,0 // addps 0xf328(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 68,15,40,37,48,243,0,0 // movaps 0xf330(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,21,56,243,0,0 // addps 0xf338(%rip),%xmm10 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,37,64,243,0,0 // movaps 0xf340(%rip),%xmm12 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -37851,22 +38140,22 @@ _sk_parametric_g_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,10,240,0,0 // movaps 0xf00a(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,26,240,0,0 // movaps 0xf01a(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,254,242,0,0 // addps 0xf2fe(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,13,14,243,0,0 // addps 0xf30e(%rip),%xmm9 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,40,37,22,243,0,0 // movaps 0xf316(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,6,243,0,0 // movaps 0xf306(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,37,22,243,0,0 // movaps 0xf316(%rip),%xmm12 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,10,243,0,0 // movaps 0xf30a(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,45,26,243,0,0 // movaps 0xf31a(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,10,243,0,0 // mulps 0xf30a(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 68,15,89,45,26,243,0,0 // mulps 0xf31a(%rip),%xmm13 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -37902,15 +38191,15 @@ _sk_parametric_b_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,218,241,0,0 // mulps 0xf1da(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,21,226,241,0,0 // andps 0xf1e2(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,21,10,239,0,0 // orps 0xef0a(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,13,226,241,0,0 // addps 0xf1e2(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 68,15,40,37,234,241,0,0 // movaps 0xf1ea(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,13,234,241,0,0 // mulps 0xf1ea(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,21,242,241,0,0 // andps 0xf1f2(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,21,26,239,0,0 // orps 0xef1a(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,13,242,241,0,0 // addps 0xf1f2(%rip),%xmm9 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,37,250,241,0,0 // movaps 0xf1fa(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,234,241,0,0 // addps 0xf1ea(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 68,15,40,37,242,241,0,0 // movaps 0xf1f2(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,21,250,241,0,0 // addps 0xf1fa(%rip),%xmm10 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,37,2,242,0,0 // movaps 0xf202(%rip),%xmm12 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -37918,22 +38207,22 @@ _sk_parametric_b_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,204,238,0,0 // movaps 0xeecc(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,220,238,0,0 // movaps 0xeedc(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,192,241,0,0 // addps 0xf1c0(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,13,208,241,0,0 // addps 0xf1d0(%rip),%xmm9 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,40,37,216,241,0,0 // movaps 0xf1d8(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,200,241,0,0 // movaps 0xf1c8(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,37,216,241,0,0 // movaps 0xf1d8(%rip),%xmm12 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,204,241,0,0 // movaps 0xf1cc(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,45,220,241,0,0 // movaps 0xf1dc(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,204,241,0,0 // mulps 0xf1cc(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 68,15,89,45,220,241,0,0 // mulps 0xf1dc(%rip),%xmm13 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -37969,15 +38258,15 @@ _sk_parametric_a_sse2:
.byte 69,15,88,209 // addps %xmm9,%xmm10
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,91,202 // cvtdq2ps %xmm10,%xmm9
- .byte 68,15,89,13,156,240,0,0 // mulps 0xf09c(%rip),%xmm9 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 68,15,84,21,164,240,0,0 // andps 0xf0a4(%rip),%xmm10 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,86,21,204,237,0,0 // orps 0xedcc(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
- .byte 68,15,88,13,164,240,0,0 // addps 0xf0a4(%rip),%xmm9 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
- .byte 68,15,40,37,172,240,0,0 // movaps 0xf0ac(%rip),%xmm12 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,89,13,172,240,0,0 // mulps 0xf0ac(%rip),%xmm9 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 68,15,84,21,180,240,0,0 // andps 0xf0b4(%rip),%xmm10 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,86,21,220,237,0,0 // orps 0xeddc(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,88,13,180,240,0,0 // addps 0xf0b4(%rip),%xmm9 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,37,188,240,0,0 // movaps 0xf0bc(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 69,15,89,226 // mulps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,88,21,172,240,0,0 // addps 0xf0ac(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
- .byte 68,15,40,37,180,240,0,0 // movaps 0xf0b4(%rip),%xmm12 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,88,21,188,240,0,0 // addps 0xf0bc(%rip),%xmm10 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,37,196,240,0,0 // movaps 0xf0c4(%rip),%xmm12 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 69,15,94,226 // divps %xmm10,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
.byte 69,15,89,203 // mulps %xmm11,%xmm9
@@ -37985,22 +38274,22 @@ _sk_parametric_a_sse2:
.byte 69,15,91,226 // cvtdq2ps %xmm10,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,194,236,1 // cmpltps %xmm12,%xmm13
- .byte 68,15,40,21,142,237,0,0 // movaps 0xed8e(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,158,237,0,0 // movaps 0xed9e(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,84,234 // andps %xmm10,%xmm13
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,229 // subps %xmm13,%xmm12
.byte 69,15,40,233 // movaps %xmm9,%xmm13
.byte 69,15,92,236 // subps %xmm12,%xmm13
- .byte 68,15,88,13,130,240,0,0 // addps 0xf082(%rip),%xmm9 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
- .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,88,13,146,240,0,0 // addps 0xf092(%rip),%xmm9 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 68,15,40,37,154,240,0,0 // movaps 0xf09a(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 69,15,89,229 // mulps %xmm13,%xmm12
.byte 69,15,92,204 // subps %xmm12,%xmm9
- .byte 68,15,40,37,138,240,0,0 // movaps 0xf08a(%rip),%xmm12 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 68,15,40,37,154,240,0,0 // movaps 0xf09a(%rip),%xmm12 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 69,15,92,229 // subps %xmm13,%xmm12
- .byte 68,15,40,45,142,240,0,0 // movaps 0xf08e(%rip),%xmm13 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,45,158,240,0,0 // movaps 0xf09e(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 69,15,94,236 // divps %xmm12,%xmm13
.byte 69,15,88,233 // addps %xmm9,%xmm13
- .byte 68,15,89,45,142,240,0,0 // mulps 0xf08e(%rip),%xmm13 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 68,15,89,45,158,240,0,0 // mulps 0xf09e(%rip),%xmm13 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 102,69,15,91,205 // cvtps2dq %xmm13,%xmm9
.byte 243,68,15,16,96,20 // movss 0x14(%rax),%xmm12
.byte 69,15,198,228,0 // shufps $0x0,%xmm12,%xmm12
@@ -38025,19 +38314,19 @@ _sk_gamma_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 15,91,194 // cvtdq2ps %xmm2,%xmm0
- .byte 15,89,5,153,239,0,0 // mulps 0xef99(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 15,84,21,162,239,0,0 // andps 0xefa2(%rip),%xmm2 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 68,15,40,53,202,236,0,0 // movaps 0xecca(%rip),%xmm14 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,89,5,169,239,0,0 // mulps 0xefa9(%rip),%xmm0 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,84,21,178,239,0,0 // andps 0xefb2(%rip),%xmm2 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,53,218,236,0,0 // movaps 0xecda(%rip),%xmm14 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,86,214 // orps %xmm14,%xmm2
- .byte 68,15,40,37,158,239,0,0 // movaps 0xef9e(%rip),%xmm12 # 2c0a0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 68,15,40,37,174,239,0,0 // movaps 0xefae(%rip),%xmm12 # 2c5e0 <_sk_overlay_sse2_8bit+0x10fb>
.byte 65,15,88,196 // addps %xmm12,%xmm0
- .byte 68,15,40,29,162,239,0,0 // movaps 0xefa2(%rip),%xmm11 # 2c0b0 <_sk_overlay_sse2_8bit+0x10fb>
+ .byte 68,15,40,29,178,239,0,0 // movaps 0xefb2(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0x110b>
.byte 15,40,226 // movaps %xmm2,%xmm4
.byte 65,15,89,227 // mulps %xmm11,%xmm4
.byte 15,92,196 // subps %xmm4,%xmm0
- .byte 68,15,40,21,160,239,0,0 // movaps 0xefa0(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x110b>
+ .byte 68,15,40,21,176,239,0,0 // movaps 0xefb0(%rip),%xmm10 # 2c600 <_sk_overlay_sse2_8bit+0x111b>
.byte 65,15,88,210 // addps %xmm10,%xmm2
- .byte 68,15,40,45,164,239,0,0 // movaps 0xefa4(%rip),%xmm13 # 2c0d0 <_sk_overlay_sse2_8bit+0x111b>
+ .byte 68,15,40,45,180,239,0,0 // movaps 0xefb4(%rip),%xmm13 # 2c610 <_sk_overlay_sse2_8bit+0x112b>
.byte 65,15,40,229 // movaps %xmm13,%xmm4
.byte 15,94,226 // divps %xmm2,%xmm4
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -38049,27 +38338,27 @@ _sk_gamma_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,194,226,1 // cmpltps %xmm2,%xmm4
- .byte 68,15,40,13,116,236,0,0 // movaps 0xec74(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,13,132,236,0,0 // movaps 0xec84(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 65,15,84,225 // andps %xmm9,%xmm4
.byte 15,92,212 // subps %xmm4,%xmm2
.byte 15,40,224 // movaps %xmm0,%xmm4
.byte 15,92,226 // subps %xmm2,%xmm4
- .byte 15,40,53,112,239,0,0 // movaps 0xef70(%rip),%xmm6 # 2c0e0 <_sk_overlay_sse2_8bit+0x112b>
+ .byte 15,40,53,128,239,0,0 // movaps 0xef80(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0x113b>
.byte 15,88,198 // addps %xmm6,%xmm0
- .byte 15,40,61,134,239,0,0 // movaps 0xef86(%rip),%xmm7 # 2c100 <_sk_overlay_sse2_8bit+0x114b>
+ .byte 15,40,61,150,239,0,0 // movaps 0xef96(%rip),%xmm7 # 2c640 <_sk_overlay_sse2_8bit+0x115b>
.byte 15,40,239 // movaps %xmm7,%xmm5
.byte 15,92,236 // subps %xmm4,%xmm5
.byte 15,40,212 // movaps %xmm4,%xmm2
- .byte 15,40,37,102,239,0,0 // movaps 0xef66(%rip),%xmm4 # 2c0f0 <_sk_overlay_sse2_8bit+0x113b>
+ .byte 15,40,37,118,239,0,0 // movaps 0xef76(%rip),%xmm4 # 2c630 <_sk_overlay_sse2_8bit+0x114b>
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 15,92,194 // subps %xmm2,%xmm0
- .byte 68,15,40,61,120,239,0,0 // movaps 0xef78(%rip),%xmm15 # 2c110 <_sk_overlay_sse2_8bit+0x115b>
+ .byte 68,15,40,61,136,239,0,0 // movaps 0xef88(%rip),%xmm15 # 2c650 <_sk_overlay_sse2_8bit+0x116b>
.byte 65,15,40,215 // movaps %xmm15,%xmm2
.byte 15,94,213 // divps %xmm5,%xmm2
.byte 15,88,208 // addps %xmm0,%xmm2
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 15,89,5,212,238,0,0 // mulps 0xeed4(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 15,84,13,221,238,0,0 // andps 0xeedd(%rip),%xmm1 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,89,5,228,238,0,0 // mulps 0xeee4(%rip),%xmm0 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,84,13,237,238,0,0 // andps 0xeeed(%rip),%xmm1 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
.byte 65,15,86,206 // orps %xmm14,%xmm1
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 15,40,233 // movaps %xmm1,%xmm5
@@ -38099,9 +38388,9 @@ _sk_gamma_sse2:
.byte 15,94,206 // divps %xmm6,%xmm1
.byte 15,88,200 // addps %xmm0,%xmm1
.byte 15,91,195 // cvtdq2ps %xmm3,%xmm0
- .byte 15,89,5,99,238,0,0 // mulps 0xee63(%rip),%xmm0 # 2c080 <_sk_overlay_sse2_8bit+0x10cb>
- .byte 15,84,29,108,238,0,0 // andps 0xee6c(%rip),%xmm3 # 2c090 <_sk_overlay_sse2_8bit+0x10db>
- .byte 15,86,29,149,235,0,0 // orps 0xeb95(%rip),%xmm3 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,89,5,115,238,0,0 // mulps 0xee73(%rip),%xmm0 # 2c5c0 <_sk_overlay_sse2_8bit+0x10db>
+ .byte 15,84,29,124,238,0,0 // andps 0xee7c(%rip),%xmm3 # 2c5d0 <_sk_overlay_sse2_8bit+0x10eb>
+ .byte 15,86,29,165,235,0,0 // orps 0xeba5(%rip),%xmm3 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,88,196 // addps %xmm12,%xmm0
.byte 68,15,89,219 // mulps %xmm3,%xmm11
.byte 65,15,92,195 // subps %xmm11,%xmm0
@@ -38123,7 +38412,7 @@ _sk_gamma_sse2:
.byte 15,92,253 // subps %xmm5,%xmm7
.byte 68,15,94,255 // divps %xmm7,%xmm15
.byte 68,15,88,248 // addps %xmm0,%xmm15
- .byte 15,40,5,162,238,0,0 // movaps 0xeea2(%rip),%xmm0 # 2c120 <_sk_overlay_sse2_8bit+0x116b>
+ .byte 15,40,5,178,238,0,0 // movaps 0xeeb2(%rip),%xmm0 # 2c660 <_sk_overlay_sse2_8bit+0x117b>
.byte 15,89,208 // mulps %xmm0,%xmm2
.byte 15,89,200 // mulps %xmm0,%xmm1
.byte 68,15,89,248 // mulps %xmm0,%xmm15
@@ -38142,29 +38431,29 @@ HIDDEN _sk_lab_to_xyz_sse2
.globl _sk_lab_to_xyz_sse2
FUNCTION(_sk_lab_to_xyz_sse2)
_sk_lab_to_xyz_sse2:
- .byte 15,89,5,119,238,0,0 // mulps 0xee77(%rip),%xmm0 # 2c130 <_sk_overlay_sse2_8bit+0x117b>
- .byte 68,15,40,5,239,235,0,0 // movaps 0xebef(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 15,89,5,135,238,0,0 // mulps 0xee87(%rip),%xmm0 # 2c670 <_sk_overlay_sse2_8bit+0x118b>
+ .byte 68,15,40,5,255,235,0,0 // movaps 0xebff(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 65,15,89,200 // mulps %xmm8,%xmm1
- .byte 68,15,40,13,115,238,0,0 // movaps 0xee73(%rip),%xmm9 # 2c140 <_sk_overlay_sse2_8bit+0x118b>
+ .byte 68,15,40,13,131,238,0,0 // movaps 0xee83(%rip),%xmm9 # 2c680 <_sk_overlay_sse2_8bit+0x119b>
.byte 65,15,88,201 // addps %xmm9,%xmm1
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 65,15,88,209 // addps %xmm9,%xmm2
- .byte 15,88,5,112,238,0,0 // addps 0xee70(%rip),%xmm0 # 2c150 <_sk_overlay_sse2_8bit+0x119b>
- .byte 15,89,5,121,238,0,0 // mulps 0xee79(%rip),%xmm0 # 2c160 <_sk_overlay_sse2_8bit+0x11ab>
- .byte 15,89,13,130,238,0,0 // mulps 0xee82(%rip),%xmm1 # 2c170 <_sk_overlay_sse2_8bit+0x11bb>
+ .byte 15,88,5,128,238,0,0 // addps 0xee80(%rip),%xmm0 # 2c690 <_sk_overlay_sse2_8bit+0x11ab>
+ .byte 15,89,5,137,238,0,0 // mulps 0xee89(%rip),%xmm0 # 2c6a0 <_sk_overlay_sse2_8bit+0x11bb>
+ .byte 15,89,13,146,238,0,0 // mulps 0xee92(%rip),%xmm1 # 2c6b0 <_sk_overlay_sse2_8bit+0x11cb>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,21,136,238,0,0 // mulps 0xee88(%rip),%xmm2 # 2c180 <_sk_overlay_sse2_8bit+0x11cb>
+ .byte 15,89,21,152,238,0,0 // mulps 0xee98(%rip),%xmm2 # 2c6c0 <_sk_overlay_sse2_8bit+0x11db>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 68,15,92,202 // subps %xmm2,%xmm9
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
.byte 68,15,89,225 // mulps %xmm1,%xmm12
- .byte 15,40,21,125,238,0,0 // movaps 0xee7d(%rip),%xmm2 # 2c190 <_sk_overlay_sse2_8bit+0x11db>
+ .byte 15,40,21,141,238,0,0 // movaps 0xee8d(%rip),%xmm2 # 2c6d0 <_sk_overlay_sse2_8bit+0x11eb>
.byte 68,15,40,194 // movaps %xmm2,%xmm8
.byte 69,15,194,196,1 // cmpltps %xmm12,%xmm8
- .byte 68,15,40,21,124,238,0,0 // movaps 0xee7c(%rip),%xmm10 # 2c1a0 <_sk_overlay_sse2_8bit+0x11eb>
+ .byte 68,15,40,21,140,238,0,0 // movaps 0xee8c(%rip),%xmm10 # 2c6e0 <_sk_overlay_sse2_8bit+0x11fb>
.byte 65,15,88,202 // addps %xmm10,%xmm1
- .byte 68,15,40,29,128,238,0,0 // movaps 0xee80(%rip),%xmm11 # 2c1b0 <_sk_overlay_sse2_8bit+0x11fb>
+ .byte 68,15,40,29,144,238,0,0 // movaps 0xee90(%rip),%xmm11 # 2c6f0 <_sk_overlay_sse2_8bit+0x120b>
.byte 65,15,89,203 // mulps %xmm11,%xmm1
.byte 69,15,84,224 // andps %xmm8,%xmm12
.byte 68,15,85,193 // andnps %xmm1,%xmm8
@@ -38188,8 +38477,8 @@ _sk_lab_to_xyz_sse2:
.byte 15,84,194 // andps %xmm2,%xmm0
.byte 65,15,85,209 // andnps %xmm9,%xmm2
.byte 15,86,208 // orps %xmm0,%xmm2
- .byte 68,15,89,5,48,238,0,0 // mulps 0xee30(%rip),%xmm8 # 2c1c0 <_sk_overlay_sse2_8bit+0x120b>
- .byte 15,89,21,57,238,0,0 // mulps 0xee39(%rip),%xmm2 # 2c1d0 <_sk_overlay_sse2_8bit+0x121b>
+ .byte 68,15,89,5,64,238,0,0 // mulps 0xee40(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0x121b>
+ .byte 15,89,21,73,238,0,0 // mulps 0xee49(%rip),%xmm2 # 2c710 <_sk_overlay_sse2_8bit+0x122b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -38205,13 +38494,13 @@ _sk_load_a8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 1d3e5 <_sk_load_a8_sse2+0x46>
+ .byte 117,46 // jne 1d915 <_sk_load_a8_sse2+0x46>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,179,234,0,0 // pand 0xeab3(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,5,195,234,0,0 // pand 0xeac3(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,249,235,0,0 // mulps 0xebf9(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,29,9,236,0,0 // mulps 0xec09(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
@@ -38220,12 +38509,12 @@ _sk_load_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d428 <_sk_load_a8_sse2+0x89>
+ .byte 116,54 // je 1d958 <_sk_load_a8_sse2+0x89>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d411 <_sk_load_a8_sse2+0x72>
+ .byte 116,21 // je 1d941 <_sk_load_a8_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1d3c5 <_sk_load_a8_sse2+0x26>
+ .byte 117,195 // jne 1d8f5 <_sk_load_a8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -38234,10 +38523,10 @@ _sk_load_a8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,157 // jmp 1d3c5 <_sk_load_a8_sse2+0x26>
+ .byte 235,157 // jmp 1d8f5 <_sk_load_a8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,146 // jmp 1d3c5 <_sk_load_a8_sse2+0x26>
+ .byte 235,146 // jmp 1d8f5 <_sk_load_a8_sse2+0x26>
HIDDEN _sk_load_a8_dst_sse2
.globl _sk_load_a8_dst_sse2
@@ -38250,13 +38539,13 @@ _sk_load_a8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,46 // jne 1d479 <_sk_load_a8_dst_sse2+0x46>
+ .byte 117,46 // jne 1d9a9 <_sk_load_a8_dst_sse2+0x46>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,31,234,0,0 // pand 0xea1f(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,37,47,234,0,0 // pand 0xea2f(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,252 // cvtdq2ps %xmm4,%xmm7
- .byte 15,89,61,101,235,0,0 // mulps 0xeb65(%rip),%xmm7 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,61,117,235,0,0 // mulps 0xeb75(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,228 // xorps %xmm4,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
@@ -38265,12 +38554,12 @@ _sk_load_a8_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d4bc <_sk_load_a8_dst_sse2+0x89>
+ .byte 116,54 // je 1d9ec <_sk_load_a8_dst_sse2+0x89>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d4a5 <_sk_load_a8_dst_sse2+0x72>
+ .byte 116,21 // je 1d9d5 <_sk_load_a8_dst_sse2+0x72>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,195 // jne 1d459 <_sk_load_a8_dst_sse2+0x26>
+ .byte 117,195 // jne 1d989 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -38279,10 +38568,10 @@ _sk_load_a8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,157 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,157 // jmp 1d989 <_sk_load_a8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,146 // jmp 1d459 <_sk_load_a8_dst_sse2+0x26>
+ .byte 235,146 // jmp 1d989 <_sk_load_a8_dst_sse2+0x26>
HIDDEN _sk_gather_a8_sse2
.globl _sk_gather_a8_sse2
@@ -38324,7 +38613,7 @@ _sk_gather_a8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,216 // cvtdq2ps %xmm0,%xmm3
- .byte 15,89,29,118,234,0,0 // mulps 0xea76(%rip),%xmm3 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,29,134,234,0,0 // mulps 0xea86(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
@@ -38343,7 +38632,7 @@ _sk_store_a8_sse2:
.byte 77,15,175,202 // imul %r10,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,42,233,0,0 // movaps 0xe92a(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,58,233,0,0 // movaps 0xe93a(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,89,195 // mulps %xmm3,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
.byte 102,65,15,114,240,16 // pslld $0x10,%xmm8
@@ -38351,7 +38640,7 @@ _sk_store_a8_sse2:
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,13 // jne 1d5b7 <_sk_store_a8_sse2+0x4c>
+ .byte 117,13 // jne 1dae7 <_sk_store_a8_sse2+0x4c>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 67,137,4,25 // mov %eax,(%r9,%r11,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -38361,24 +38650,24 @@ _sk_store_a8_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,59 // je 1d609 <_sk_store_a8_sse2+0x9e>
+ .byte 116,59 // je 1db39 <_sk_store_a8_sse2+0x9e>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,22 // je 1d5ea <_sk_store_a8_sse2+0x7f>
+ .byte 116,22 // je 1db1a <_sk_store_a8_sse2+0x7f>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,217 // jne 1d5b3 <_sk_store_a8_sse2+0x48>
+ .byte 117,217 // jne 1dae3 <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,232 // movdqa %xmm8,-0x18(%rsp)
.byte 138,68,36,240 // mov -0x10(%rsp),%al
.byte 67,136,68,25,2 // mov %al,0x2(%r9,%r11,1)
- .byte 102,68,15,219,5,141,232,0,0 // pand 0xe88d(%rip),%xmm8 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,68,15,219,5,157,232,0,0 // pand 0xe89d(%rip),%xmm8 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,69,15,103,192 // packuswb %xmm8,%xmm8
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,25 // mov %ax,(%r9,%r11,1)
- .byte 235,170 // jmp 1d5b3 <_sk_store_a8_sse2+0x48>
+ .byte 235,170 // jmp 1dae3 <_sk_store_a8_sse2+0x48>
.byte 102,68,15,127,68,36,216 // movdqa %xmm8,-0x28(%rsp)
.byte 138,68,36,216 // mov -0x28(%rsp),%al
.byte 67,136,4,25 // mov %al,(%r9,%r11,1)
- .byte 235,153 // jmp 1d5b3 <_sk_store_a8_sse2+0x48>
+ .byte 235,153 // jmp 1dae3 <_sk_store_a8_sse2+0x48>
HIDDEN _sk_load_g8_sse2
.globl _sk_load_g8_sse2
@@ -38391,27 +38680,27 @@ _sk_load_g8_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 1d663 <_sk_load_g8_sse2+0x49>
+ .byte 117,49 // jne 1db93 <_sk_load_g8_sse2+0x49>
.byte 102,67,15,110,4,25 // movd (%r9,%r11,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
- .byte 102,15,219,5,56,232,0,0 // pand 0xe838(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,5,72,232,0,0 // pand 0xe848(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,126,233,0,0 // mulps 0xe97e(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,5,142,233,0,0 // mulps 0xe98e(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,117,231,0,0 // movaps 0xe775(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,133,231,0,0 // movaps 0xe785(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d6a6 <_sk_load_g8_sse2+0x8c>
+ .byte 116,54 // je 1dbd6 <_sk_load_g8_sse2+0x8c>
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d68f <_sk_load_g8_sse2+0x75>
+ .byte 116,21 // je 1dbbf <_sk_load_g8_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1d640 <_sk_load_g8_sse2+0x26>
+ .byte 117,192 // jne 1db70 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
@@ -38420,10 +38709,10 @@ _sk_load_g8_sse2:
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 102,15,97,200 // punpcklwd %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 235,154 // jmp 1d640 <_sk_load_g8_sse2+0x26>
+ .byte 235,154 // jmp 1db70 <_sk_load_g8_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,143 // jmp 1d640 <_sk_load_g8_sse2+0x26>
+ .byte 235,143 // jmp 1db70 <_sk_load_g8_sse2+0x26>
HIDDEN _sk_load_g8_dst_sse2
.globl _sk_load_g8_dst_sse2
@@ -38436,27 +38725,27 @@ _sk_load_g8_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,49 // jne 1d6fa <_sk_load_g8_dst_sse2+0x49>
+ .byte 117,49 // jne 1dc2a <_sk_load_g8_dst_sse2+0x49>
.byte 102,67,15,110,36,25 // movd (%r9,%r11,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
- .byte 102,15,219,37,161,231,0,0 // pand 0xe7a1(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,219,37,177,231,0,0 // pand 0xe7b1(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,231,232,0,0 // mulps 0xe8e7(%rip),%xmm4 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,37,247,232,0,0 // mulps 0xe8f7(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,222,230,0,0 // movaps 0xe6de(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,61,238,230,0,0 // movaps 0xe6ee(%rip),%xmm7 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,236 // movaps %xmm4,%xmm5
.byte 15,40,244 // movaps %xmm4,%xmm6
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,54 // je 1d73d <_sk_load_g8_dst_sse2+0x8c>
+ .byte 116,54 // je 1dc6d <_sk_load_g8_dst_sse2+0x8c>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d726 <_sk_load_g8_dst_sse2+0x75>
+ .byte 116,21 // je 1dc56 <_sk_load_g8_dst_sse2+0x75>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,192 // jne 1d6d7 <_sk_load_g8_dst_sse2+0x26>
+ .byte 117,192 // jne 1dc07 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,68,25,2 // movzbl 0x2(%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,69 // pshufd $0x45,%xmm4,%xmm4
@@ -38465,10 +38754,10 @@ _sk_load_g8_dst_sse2:
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 102,15,97,232 // punpcklwd %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 235,154 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,154 // jmp 1dc07 <_sk_load_g8_dst_sse2+0x26>
.byte 67,15,182,4,25 // movzbl (%r9,%r11,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 235,143 // jmp 1d6d7 <_sk_load_g8_dst_sse2+0x26>
+ .byte 235,143 // jmp 1dc07 <_sk_load_g8_dst_sse2+0x26>
HIDDEN _sk_gather_g8_sse2
.globl _sk_gather_g8_sse2
@@ -38510,9 +38799,9 @@ _sk_gather_g8_sse2:
.byte 102,15,96,193 // punpcklbw %xmm1,%xmm0
.byte 102,15,97,193 // punpcklwd %xmm1,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,245,231,0,0 // mulps 0xe7f5(%rip),%xmm0 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 15,89,5,5,232,0,0 // mulps 0xe805(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,236,229,0,0 // movaps 0xe5ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,252,229,0,0 // movaps 0xe5fc(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
.byte 91 // pop %rbx
@@ -38531,42 +38820,42 @@ _sk_load_565_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 1d85c <_sk_load_565_sse2+0x6e>
+ .byte 117,83 // jne 1dd8c <_sk_load_565_sse2+0x6e>
.byte 243,67,15,126,20,89 // movq (%r9,%r11,2),%xmm2
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,197,231,0,0 // movdqa 0xe7c5(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,5,213,231,0,0 // movdqa 0xe7d5(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,199,231,0,0 // mulps 0xe7c7(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,13,207,231,0,0 // movdqa 0xe7cf(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 15,89,5,215,231,0,0 // mulps 0xe7d7(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,13,223,231,0,0 // movdqa 0xe7df(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,209,231,0,0 // mulps 0xe7d1(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,15,219,21,217,231,0,0 // pand 0xe7d9(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 15,89,13,225,231,0,0 // mulps 0xe7e1(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,15,219,21,233,231,0,0 // pand 0xe7e9(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,223,231,0,0 // mulps 0xe7df(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,89,21,239,231,0,0 // mulps 0xe7ef(%rip),%xmm2 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,118,229,0,0 // movaps 0xe576(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,134,229,0,0 // movaps 0xe586(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d89b <_sk_load_565_sse2+0xad>
+ .byte 116,50 // je 1ddcb <_sk_load_565_sse2+0xad>
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d888 <_sk_load_565_sse2+0x9a>
+ .byte 116,21 // je 1ddb8 <_sk_load_565_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 1d813 <_sk_load_565_sse2+0x25>
+ .byte 117,154 // jne 1dd43 <_sk_load_565_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,208,69 // pshufd $0x45,%xmm0,%xmm2
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,208 // movsd %xmm0,%xmm2
- .byte 233,120,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1dd43 <_sk_load_565_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,106,255,255,255 // jmpq 1d813 <_sk_load_565_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1dd43 <_sk_load_565_sse2+0x25>
HIDDEN _sk_load_565_dst_sse2
.globl _sk_load_565_dst_sse2
@@ -38580,42 +38869,42 @@ _sk_load_565_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,83 // jne 1d917 <_sk_load_565_dst_sse2+0x6e>
+ .byte 117,83 // jne 1de47 <_sk_load_565_dst_sse2+0x6e>
.byte 243,67,15,126,52,89 // movq (%r9,%r11,2),%xmm6
.byte 102,15,97,240 // punpcklwd %xmm0,%xmm6
- .byte 102,15,111,37,10,231,0,0 // movdqa 0xe70a(%rip),%xmm4 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,37,26,231,0,0 // movdqa 0xe71a(%rip),%xmm4 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,12,231,0,0 // mulps 0xe70c(%rip),%xmm4 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,45,20,231,0,0 // movdqa 0xe714(%rip),%xmm5 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 15,89,37,28,231,0,0 // mulps 0xe71c(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,45,36,231,0,0 // movdqa 0xe724(%rip),%xmm5 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,15,219,238 // pand %xmm6,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,22,231,0,0 // mulps 0xe716(%rip),%xmm5 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,15,219,53,30,231,0,0 // pand 0xe71e(%rip),%xmm6 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 15,89,45,38,231,0,0 // mulps 0xe726(%rip),%xmm5 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,15,219,53,46,231,0,0 // pand 0xe72e(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,36,231,0,0 // mulps 0xe724(%rip),%xmm6 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,89,53,52,231,0,0 // mulps 0xe734(%rip),%xmm6 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,61,187,228,0,0 // movaps 0xe4bb(%rip),%xmm7 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,61,203,228,0,0 // movaps 0xe4cb(%rip),%xmm7 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1d956 <_sk_load_565_dst_sse2+0xad>
+ .byte 116,50 // je 1de86 <_sk_load_565_dst_sse2+0xad>
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1d943 <_sk_load_565_dst_sse2+0x9a>
+ .byte 116,21 // je 1de73 <_sk_load_565_dst_sse2+0x9a>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,154 // jne 1d8ce <_sk_load_565_dst_sse2+0x25>
+ .byte 117,154 // jne 1ddfe <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,244,69 // pshufd $0x45,%xmm4,%xmm6
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,244 // movsd %xmm4,%xmm6
- .byte 233,120,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25>
+ .byte 233,120,255,255,255 // jmpq 1ddfe <_sk_load_565_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,106,255,255,255 // jmpq 1d8ce <_sk_load_565_dst_sse2+0x25>
+ .byte 233,106,255,255,255 // jmpq 1ddfe <_sk_load_565_dst_sse2+0x25>
HIDDEN _sk_gather_565_sse2
.globl _sk_gather_565_sse2
@@ -38650,19 +38939,19 @@ _sk_gather_565_sse2:
.byte 102,15,196,208,3 // pinsrw $0x3,%eax,%xmm2
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,208 // punpcklwd %xmm0,%xmm2
- .byte 102,15,111,5,246,229,0,0 // movdqa 0xe5f6(%rip),%xmm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x102b>
+ .byte 102,15,111,5,6,230,0,0 // movdqa 0xe606(%rip),%xmm0 # 2c520 <_sk_overlay_sse2_8bit+0x103b>
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,248,229,0,0 // mulps 0xe5f8(%rip),%xmm0 # 2bff0 <_sk_overlay_sse2_8bit+0x103b>
- .byte 102,15,111,13,0,230,0,0 // movdqa 0xe600(%rip),%xmm1 # 2c000 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 15,89,5,8,230,0,0 // mulps 0xe608(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x104b>
+ .byte 102,15,111,13,16,230,0,0 // movdqa 0xe610(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0x105b>
.byte 102,15,219,202 // pand %xmm2,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,2,230,0,0 // mulps 0xe602(%rip),%xmm1 # 2c010 <_sk_overlay_sse2_8bit+0x105b>
- .byte 102,15,219,21,10,230,0,0 // pand 0xe60a(%rip),%xmm2 # 2c020 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 15,89,13,18,230,0,0 // mulps 0xe612(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0x106b>
+ .byte 102,15,219,21,26,230,0,0 // pand 0xe61a(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0x107b>
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,16,230,0,0 // mulps 0xe610(%rip),%xmm2 # 2c030 <_sk_overlay_sse2_8bit+0x107b>
+ .byte 15,89,21,32,230,0,0 // mulps 0xe620(%rip),%xmm2 # 2c570 <_sk_overlay_sse2_8bit+0x108b>
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,167,227,0,0 // movaps 0xe3a7(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,183,227,0,0 // movaps 0xe3b7(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -38677,12 +38966,12 @@ _sk_store_565_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,166,231,0,0 // movaps 0xe7a6(%rip),%xmm8 # 2c1f0 <_sk_overlay_sse2_8bit+0x123b>
+ .byte 68,15,40,5,182,231,0,0 // movaps 0xe7b6(%rip),%xmm8 # 2c730 <_sk_overlay_sse2_8bit+0x124b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
.byte 102,65,15,114,241,11 // pslld $0xb,%xmm9
- .byte 68,15,40,21,155,231,0,0 // movaps 0xe79b(%rip),%xmm10 # 2c200 <_sk_overlay_sse2_8bit+0x124b>
+ .byte 68,15,40,21,171,231,0,0 // movaps 0xe7ab(%rip),%xmm10 # 2c740 <_sk_overlay_sse2_8bit+0x125b>
.byte 68,15,89,209 // mulps %xmm1,%xmm10
.byte 102,69,15,91,210 // cvtps2dq %xmm10,%xmm10
.byte 102,65,15,114,242,5 // pslld $0x5,%xmm10
@@ -38694,7 +38983,7 @@ _sk_store_565_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1daa7 <_sk_store_565_sse2+0x7b>
+ .byte 117,10 // jne 1dfd7 <_sk_store_565_sse2+0x7b>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -38702,19 +38991,19 @@ _sk_store_565_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 1dadf <_sk_store_565_sse2+0xb3>
+ .byte 116,38 // je 1e00f <_sk_store_565_sse2+0xb3>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1dad1 <_sk_store_565_sse2+0xa5>
+ .byte 116,18 // je 1e001 <_sk_store_565_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 1daa3 <_sk_store_565_sse2+0x77>
+ .byte 117,222 // jne 1dfd3 <_sk_store_565_sse2+0x77>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 1daa3 <_sk_store_565_sse2+0x77>
+ .byte 235,196 // jmp 1dfd3 <_sk_store_565_sse2+0x77>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 1daa3 <_sk_store_565_sse2+0x77>
+ .byte 235,184 // jmp 1dfd3 <_sk_store_565_sse2+0x77>
HIDDEN _sk_load_4444_sse2
.globl _sk_load_4444_sse2
@@ -38728,45 +39017,45 @@ _sk_load_4444_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1db68 <_sk_load_4444_sse2+0x7d>
+ .byte 117,98 // jne 1e098 <_sk_load_4444_sse2+0x7d>
.byte 243,67,15,126,28,89 // movq (%r9,%r11,2),%xmm3
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,248,230,0,0 // movdqa 0xe6f8(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
+ .byte 102,15,111,5,8,231,0,0 // movdqa 0xe708(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x126b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,250,230,0,0 // mulps 0xe6fa(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
- .byte 102,15,111,13,2,231,0,0 // movdqa 0xe702(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 15,89,5,10,231,0,0 // mulps 0xe70a(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 102,15,111,13,18,231,0,0 // movdqa 0xe712(%rip),%xmm1 # 2c770 <_sk_overlay_sse2_8bit+0x128b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,4,231,0,0 // mulps 0xe704(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
- .byte 102,15,111,21,12,231,0,0 // movdqa 0xe70c(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 15,89,13,20,231,0,0 // mulps 0xe714(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 102,15,111,21,28,231,0,0 // movdqa 0xe71c(%rip),%xmm2 # 2c790 <_sk_overlay_sse2_8bit+0x12ab>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,14,231,0,0 // mulps 0xe70e(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
- .byte 102,15,219,29,22,231,0,0 // pand 0xe716(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 15,89,21,30,231,0,0 // mulps 0xe71e(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 102,15,219,29,38,231,0,0 // pand 0xe726(%rip),%xmm3 # 2c7b0 <_sk_overlay_sse2_8bit+0x12cb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,28,231,0,0 // mulps 0xe71c(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
+ .byte 15,89,29,44,231,0,0 // mulps 0xe72c(%rip),%xmm3 # 2c7c0 <_sk_overlay_sse2_8bit+0x12db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1dba7 <_sk_load_4444_sse2+0xbc>
+ .byte 116,50 // je 1e0d7 <_sk_load_4444_sse2+0xbc>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1db94 <_sk_load_4444_sse2+0xa9>
+ .byte 116,21 // je 1e0c4 <_sk_load_4444_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1db10 <_sk_load_4444_sse2+0x25>
+ .byte 117,139 // jne 1e040 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,112,216,69 // pshufd $0x45,%xmm0,%xmm3
.byte 102,67,15,110,4,89 // movd (%r9,%r11,2),%xmm0
.byte 102,15,97,192 // punpcklwd %xmm0,%xmm0
.byte 242,15,16,216 // movsd %xmm0,%xmm3
- .byte 233,105,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1e040 <_sk_load_4444_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 233,91,255,255,255 // jmpq 1db10 <_sk_load_4444_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1e040 <_sk_load_4444_sse2+0x25>
HIDDEN _sk_load_4444_dst_sse2
.globl _sk_load_4444_dst_sse2
@@ -38780,45 +39069,45 @@ _sk_load_4444_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1dc32 <_sk_load_4444_dst_sse2+0x7d>
+ .byte 117,98 // jne 1e162 <_sk_load_4444_dst_sse2+0x7d>
.byte 243,67,15,126,60,89 // movq (%r9,%r11,2),%xmm7
.byte 102,15,97,248 // punpcklwd %xmm0,%xmm7
- .byte 102,15,111,37,46,230,0,0 // movdqa 0xe62e(%rip),%xmm4 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
+ .byte 102,15,111,37,62,230,0,0 // movdqa 0xe63e(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x126b>
.byte 102,15,219,231 // pand %xmm7,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 15,89,37,48,230,0,0 // mulps 0xe630(%rip),%xmm4 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
- .byte 102,15,111,45,56,230,0,0 // movdqa 0xe638(%rip),%xmm5 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 15,89,37,64,230,0,0 // mulps 0xe640(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 102,15,111,45,72,230,0,0 // movdqa 0xe648(%rip),%xmm5 # 2c770 <_sk_overlay_sse2_8bit+0x128b>
.byte 102,15,219,239 // pand %xmm7,%xmm5
.byte 15,91,237 // cvtdq2ps %xmm5,%xmm5
- .byte 15,89,45,58,230,0,0 // mulps 0xe63a(%rip),%xmm5 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
- .byte 102,15,111,53,66,230,0,0 // movdqa 0xe642(%rip),%xmm6 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 15,89,45,74,230,0,0 // mulps 0xe64a(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 102,15,111,53,82,230,0,0 // movdqa 0xe652(%rip),%xmm6 # 2c790 <_sk_overlay_sse2_8bit+0x12ab>
.byte 102,15,219,247 // pand %xmm7,%xmm6
.byte 15,91,246 // cvtdq2ps %xmm6,%xmm6
- .byte 15,89,53,68,230,0,0 // mulps 0xe644(%rip),%xmm6 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
- .byte 102,15,219,61,76,230,0,0 // pand 0xe64c(%rip),%xmm7 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 15,89,53,84,230,0,0 // mulps 0xe654(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 102,15,219,61,92,230,0,0 // pand 0xe65c(%rip),%xmm7 # 2c7b0 <_sk_overlay_sse2_8bit+0x12cb>
.byte 15,91,255 // cvtdq2ps %xmm7,%xmm7
- .byte 15,89,61,82,230,0,0 // mulps 0xe652(%rip),%xmm7 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
+ .byte 15,89,61,98,230,0,0 // mulps 0xe662(%rip),%xmm7 # 2c7c0 <_sk_overlay_sse2_8bit+0x12db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,50 // je 1dc71 <_sk_load_4444_dst_sse2+0xbc>
+ .byte 116,50 // je 1e1a1 <_sk_load_4444_dst_sse2+0xbc>
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,21 // je 1dc5e <_sk_load_4444_dst_sse2+0xa9>
+ .byte 116,21 // je 1e18e <_sk_load_4444_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,139 // jne 1dbda <_sk_load_4444_dst_sse2+0x25>
+ .byte 117,139 // jne 1e10a <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,68,89,4 // movzwl 0x4(%r9,%r11,2),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,252,69 // pshufd $0x45,%xmm4,%xmm7
.byte 102,67,15,110,36,89 // movd (%r9,%r11,2),%xmm4
.byte 102,15,97,224 // punpcklwd %xmm0,%xmm4
.byte 242,15,16,252 // movsd %xmm4,%xmm7
- .byte 233,105,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,105,255,255,255 // jmpq 1e10a <_sk_load_4444_dst_sse2+0x25>
.byte 67,15,183,4,89 // movzwl (%r9,%r11,2),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,91,255,255,255 // jmpq 1dbda <_sk_load_4444_dst_sse2+0x25>
+ .byte 233,91,255,255,255 // jmpq 1e10a <_sk_load_4444_dst_sse2+0x25>
HIDDEN _sk_gather_4444_sse2
.globl _sk_gather_4444_sse2
@@ -38853,21 +39142,21 @@ _sk_gather_4444_sse2:
.byte 102,15,196,216,3 // pinsrw $0x3,%eax,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,97,216 // punpcklwd %xmm0,%xmm3
- .byte 102,15,111,5,11,229,0,0 // movdqa 0xe50b(%rip),%xmm0 # 2c210 <_sk_overlay_sse2_8bit+0x125b>
+ .byte 102,15,111,5,27,229,0,0 // movdqa 0xe51b(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x126b>
.byte 102,15,219,195 // pand %xmm3,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 15,89,5,13,229,0,0 // mulps 0xe50d(%rip),%xmm0 # 2c220 <_sk_overlay_sse2_8bit+0x126b>
- .byte 102,15,111,13,21,229,0,0 // movdqa 0xe515(%rip),%xmm1 # 2c230 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 15,89,5,29,229,0,0 // mulps 0xe51d(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x127b>
+ .byte 102,15,111,13,37,229,0,0 // movdqa 0xe525(%rip),%xmm1 # 2c770 <_sk_overlay_sse2_8bit+0x128b>
.byte 102,15,219,203 // pand %xmm3,%xmm1
.byte 15,91,201 // cvtdq2ps %xmm1,%xmm1
- .byte 15,89,13,23,229,0,0 // mulps 0xe517(%rip),%xmm1 # 2c240 <_sk_overlay_sse2_8bit+0x128b>
- .byte 102,15,111,21,31,229,0,0 // movdqa 0xe51f(%rip),%xmm2 # 2c250 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 15,89,13,39,229,0,0 // mulps 0xe527(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x129b>
+ .byte 102,15,111,21,47,229,0,0 // movdqa 0xe52f(%rip),%xmm2 # 2c790 <_sk_overlay_sse2_8bit+0x12ab>
.byte 102,15,219,211 // pand %xmm3,%xmm2
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
- .byte 15,89,21,33,229,0,0 // mulps 0xe521(%rip),%xmm2 # 2c260 <_sk_overlay_sse2_8bit+0x12ab>
- .byte 102,15,219,29,41,229,0,0 // pand 0xe529(%rip),%xmm3 # 2c270 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 15,89,21,49,229,0,0 // mulps 0xe531(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x12bb>
+ .byte 102,15,219,29,57,229,0,0 // pand 0xe539(%rip),%xmm3 # 2c7b0 <_sk_overlay_sse2_8bit+0x12cb>
.byte 15,91,219 // cvtdq2ps %xmm3,%xmm3
- .byte 15,89,29,47,229,0,0 // mulps 0xe52f(%rip),%xmm3 # 2c280 <_sk_overlay_sse2_8bit+0x12cb>
+ .byte 15,89,29,63,229,0,0 // mulps 0xe53f(%rip),%xmm3 # 2c7c0 <_sk_overlay_sse2_8bit+0x12db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 91 // pop %rbx
.byte 255,224 // jmpq *%rax
@@ -38883,7 +39172,7 @@ _sk_store_4444_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 76,99,218 // movslq %edx,%r11
- .byte 68,15,40,5,28,229,0,0 // movaps 0xe51c(%rip),%xmm8 # 2c290 <_sk_overlay_sse2_8bit+0x12db>
+ .byte 68,15,40,5,44,229,0,0 // movaps 0xe52c(%rip),%xmm8 # 2c7d0 <_sk_overlay_sse2_8bit+0x12eb>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -38905,7 +39194,7 @@ _sk_store_4444_sse2:
.byte 102,65,15,114,224,16 // psrad $0x10,%xmm8
.byte 102,69,15,107,192 // packssdw %xmm8,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1dde5 <_sk_store_4444_sse2+0x8f>
+ .byte 117,10 // jne 1e315 <_sk_store_4444_sse2+0x8f>
.byte 242,71,15,17,4,89 // movsd %xmm8,(%r9,%r11,2)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -38913,19 +39202,19 @@ _sk_store_4444_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,38 // je 1de1d <_sk_store_4444_sse2+0xc7>
+ .byte 116,38 // je 1e34d <_sk_store_4444_sse2+0xc7>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,18 // je 1de0f <_sk_store_4444_sse2+0xb9>
+ .byte 116,18 // je 1e33f <_sk_store_4444_sse2+0xb9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,222 // jne 1dde1 <_sk_store_4444_sse2+0x8b>
+ .byte 117,222 // jne 1e311 <_sk_store_4444_sse2+0x8b>
.byte 102,65,15,197,192,4 // pextrw $0x4,%xmm8,%eax
.byte 102,67,137,68,89,4 // mov %ax,0x4(%r9,%r11,2)
.byte 242,69,15,112,192,232 // pshuflw $0xe8,%xmm8,%xmm8
.byte 102,71,15,126,4,89 // movd %xmm8,(%r9,%r11,2)
- .byte 235,196 // jmp 1dde1 <_sk_store_4444_sse2+0x8b>
+ .byte 235,196 // jmp 1e311 <_sk_store_4444_sse2+0x8b>
.byte 102,68,15,126,192 // movd %xmm8,%eax
.byte 102,67,137,4,89 // mov %ax,(%r9,%r11,2)
- .byte 235,184 // jmp 1dde1 <_sk_store_4444_sse2+0x8b>
+ .byte 235,184 // jmp 1e311 <_sk_store_4444_sse2+0x8b>
HIDDEN _sk_load_8888_sse2
.globl _sk_load_8888_sse2
@@ -38939,13 +39228,13 @@ _sk_load_8888_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1dea7 <_sk_load_8888_sse2+0x7e>
+ .byte 117,98 // jne 1e3d7 <_sk_load_8888_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,21,45,224,0,0 // movdqa 0xe02d(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,21,61,224,0,0 // movdqa 0xe03d(%rip),%xmm2 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,105,225,0,0 // movaps 0xe169(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,121,225,0,0 // movaps 0xe179(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -38965,18 +39254,18 @@ _sk_load_8888_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1dedd <_sk_load_8888_sse2+0xb4>
+ .byte 116,41 // je 1e40d <_sk_load_8888_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1ded2 <_sk_load_8888_sse2+0xa9>
+ .byte 116,19 // je 1e402 <_sk_load_8888_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1de4b <_sk_load_8888_sse2+0x22>
+ .byte 117,134 // jne 1e37b <_sk_load_8888_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e37b <_sk_load_8888_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1de4b <_sk_load_8888_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e37b <_sk_load_8888_sse2+0x22>
HIDDEN _sk_load_8888_dst_sse2
.globl _sk_load_8888_dst_sse2
@@ -38990,13 +39279,13 @@ _sk_load_8888_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1df66 <_sk_load_8888_dst_sse2+0x7e>
+ .byte 117,98 // jne 1e496 <_sk_load_8888_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,53,110,223,0,0 // movdqa 0xdf6e(%rip),%xmm6 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,53,126,223,0,0 // movdqa 0xdf7e(%rip),%xmm6 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,225 // movdqa %xmm9,%xmm4
.byte 102,15,219,230 // pand %xmm6,%xmm4
.byte 15,91,228 // cvtdq2ps %xmm4,%xmm4
- .byte 68,15,40,5,170,224,0,0 // movaps 0xe0aa(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,186,224,0,0 // movaps 0xe0ba(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,224 // mulps %xmm8,%xmm4
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -39016,18 +39305,18 @@ _sk_load_8888_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1df9c <_sk_load_8888_dst_sse2+0xb4>
+ .byte 116,41 // je 1e4cc <_sk_load_8888_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1df91 <_sk_load_8888_dst_sse2+0xa9>
+ .byte 116,19 // je 1e4c1 <_sk_load_8888_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1df0a <_sk_load_8888_dst_sse2+0x22>
+ .byte 117,134 // jne 1e43a <_sk_load_8888_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e43a <_sk_load_8888_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1df0a <_sk_load_8888_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e43a <_sk_load_8888_dst_sse2+0x22>
HIDDEN _sk_gather_8888_sse2
.globl _sk_gather_8888_sse2
@@ -39061,11 +39350,11 @@ _sk_gather_8888_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,21,87,222,0,0 // movdqa 0xde57(%rip),%xmm2 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,21,103,222,0,0 // movdqa 0xde67(%rip),%xmm2 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,219,194 // pand %xmm2,%xmm0
.byte 15,91,192 // cvtdq2ps %xmm0,%xmm0
- .byte 68,15,40,5,147,223,0,0 // movaps 0xdf93(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,163,223,0,0 // movaps 0xdfa3(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39095,7 +39384,7 @@ _sk_store_8888_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,19,222,0,0 // movaps 0xde13(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,35,222,0,0 // movaps 0xde23(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39114,24 +39403,24 @@ _sk_store_8888_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1e0fd <_sk_store_8888_sse2+0x7f>
+ .byte 117,10 // jne 1e62d <_sk_store_8888_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 1e12b <_sk_store_8888_sse2+0xad>
+ .byte 116,33 // je 1e65b <_sk_store_8888_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1e123 <_sk_store_8888_sse2+0xa5>
+ .byte 116,19 // je 1e653 <_sk_store_8888_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 1e0f9 <_sk_store_8888_sse2+0x7b>
+ .byte 117,227 // jne 1e629 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b>
+ .byte 235,206 // jmp 1e629 <_sk_store_8888_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 1e0f9 <_sk_store_8888_sse2+0x7b>
+ .byte 235,198 // jmp 1e629 <_sk_store_8888_sse2+0x7b>
HIDDEN _sk_load_bgra_sse2
.globl _sk_load_bgra_sse2
@@ -39145,13 +39434,13 @@ _sk_load_bgra_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1e1b1 <_sk_load_bgra_sse2+0x7e>
+ .byte 117,98 // jne 1e6e1 <_sk_load_bgra_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,5,35,221,0,0 // movdqa 0xdd23(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,51,221,0,0 // movdqa 0xdd33(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,95,222,0,0 // movaps 0xde5f(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,111,222,0,0 // movaps 0xde6f(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39171,18 +39460,18 @@ _sk_load_bgra_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1e1e7 <_sk_load_bgra_sse2+0xb4>
+ .byte 116,41 // je 1e717 <_sk_load_bgra_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1e1dc <_sk_load_bgra_sse2+0xa9>
+ .byte 116,19 // je 1e70c <_sk_load_bgra_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1e155 <_sk_load_bgra_sse2+0x22>
+ .byte 117,134 // jne 1e685 <_sk_load_bgra_sse2+0x22>
.byte 102,65,15,110,68,129,8 // movd 0x8(%r9,%rax,4),%xmm0
.byte 102,68,15,112,200,69 // pshufd $0x45,%xmm0,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e685 <_sk_load_bgra_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1e155 <_sk_load_bgra_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e685 <_sk_load_bgra_sse2+0x22>
HIDDEN _sk_load_bgra_dst_sse2
.globl _sk_load_bgra_dst_sse2
@@ -39196,13 +39485,13 @@ _sk_load_bgra_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 117,98 // jne 1e270 <_sk_load_bgra_dst_sse2+0x7e>
+ .byte 117,98 // jne 1e7a0 <_sk_load_bgra_dst_sse2+0x7e>
.byte 243,69,15,111,12,129 // movdqu (%r9,%rax,4),%xmm9
- .byte 102,15,111,37,100,220,0,0 // movdqa 0xdc64(%rip),%xmm4 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,37,116,220,0,0 // movdqa 0xdc74(%rip),%xmm4 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 15,91,245 // cvtdq2ps %xmm5,%xmm6
- .byte 68,15,40,5,160,221,0,0 // movaps 0xdda0(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,176,221,0,0 // movaps 0xddb0(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,240 // mulps %xmm8,%xmm6
.byte 102,65,15,111,233 // movdqa %xmm9,%xmm5
.byte 102,15,114,213,8 // psrld $0x8,%xmm5
@@ -39222,18 +39511,18 @@ _sk_load_bgra_dst_sse2:
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,41 // je 1e2a6 <_sk_load_bgra_dst_sse2+0xb4>
+ .byte 116,41 // je 1e7d6 <_sk_load_bgra_dst_sse2+0xb4>
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1e29b <_sk_load_bgra_dst_sse2+0xa9>
+ .byte 116,19 // je 1e7cb <_sk_load_bgra_dst_sse2+0xa9>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,134 // jne 1e214 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 117,134 // jne 1e744 <_sk_load_bgra_dst_sse2+0x22>
.byte 102,65,15,110,100,129,8 // movd 0x8(%r9,%rax,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,69,15,18,12,129 // movlpd (%r9,%rax,4),%xmm9
- .byte 233,110,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,110,255,255,255 // jmpq 1e744 <_sk_load_bgra_dst_sse2+0x22>
.byte 102,69,15,110,12,129 // movd (%r9,%rax,4),%xmm9
- .byte 233,99,255,255,255 // jmpq 1e214 <_sk_load_bgra_dst_sse2+0x22>
+ .byte 233,99,255,255,255 // jmpq 1e744 <_sk_load_bgra_dst_sse2+0x22>
HIDDEN _sk_gather_bgra_sse2
.globl _sk_gather_bgra_sse2
@@ -39267,11 +39556,11 @@ _sk_gather_bgra_sse2:
.byte 102,67,15,110,12,145 // movd (%r9,%r10,4),%xmm1
.byte 102,68,15,98,201 // punpckldq %xmm1,%xmm9
.byte 102,68,15,98,200 // punpckldq %xmm0,%xmm9
- .byte 102,15,111,5,77,219,0,0 // movdqa 0xdb4d(%rip),%xmm0 # 2be80 <_sk_overlay_sse2_8bit+0xecb>
+ .byte 102,15,111,5,93,219,0,0 // movdqa 0xdb5d(%rip),%xmm0 # 2c3c0 <_sk_overlay_sse2_8bit+0xedb>
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,219,200 // pand %xmm0,%xmm1
.byte 15,91,209 // cvtdq2ps %xmm1,%xmm2
- .byte 68,15,40,5,137,220,0,0 // movaps 0xdc89(%rip),%xmm8 # 2bfd0 <_sk_overlay_sse2_8bit+0x101b>
+ .byte 68,15,40,5,153,220,0,0 // movaps 0xdc99(%rip),%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0x102b>
.byte 65,15,89,208 // mulps %xmm8,%xmm2
.byte 102,65,15,111,201 // movdqa %xmm9,%xmm1
.byte 102,15,114,209,8 // psrld $0x8,%xmm1
@@ -39301,7 +39590,7 @@ _sk_store_bgra_sse2:
.byte 73,193,225,2 // shl $0x2,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 68,15,40,5,9,219,0,0 // movaps 0xdb09(%rip),%xmm8 # 2beb0 <_sk_overlay_sse2_8bit+0xefb>
+ .byte 68,15,40,5,25,219,0,0 // movaps 0xdb19(%rip),%xmm8 # 2c3f0 <_sk_overlay_sse2_8bit+0xf0b>
.byte 68,15,40,202 // movaps %xmm2,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 102,69,15,91,201 // cvtps2dq %xmm9,%xmm9
@@ -39320,24 +39609,24 @@ _sk_store_bgra_sse2:
.byte 102,69,15,235,193 // por %xmm9,%xmm8
.byte 102,69,15,235,194 // por %xmm10,%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,10 // jne 1e407 <_sk_store_bgra_sse2+0x7f>
+ .byte 117,10 // jne 1e937 <_sk_store_bgra_sse2+0x7f>
.byte 243,69,15,127,4,129 // movdqu %xmm8,(%r9,%rax,4)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 69,137,194 // mov %r8d,%r10d
.byte 65,128,226,3 // and $0x3,%r10b
.byte 65,128,250,1 // cmp $0x1,%r10b
- .byte 116,33 // je 1e435 <_sk_store_bgra_sse2+0xad>
+ .byte 116,33 // je 1e965 <_sk_store_bgra_sse2+0xad>
.byte 65,128,250,2 // cmp $0x2,%r10b
- .byte 116,19 // je 1e42d <_sk_store_bgra_sse2+0xa5>
+ .byte 116,19 // je 1e95d <_sk_store_bgra_sse2+0xa5>
.byte 65,128,250,3 // cmp $0x3,%r10b
- .byte 117,227 // jne 1e403 <_sk_store_bgra_sse2+0x7b>
+ .byte 117,227 // jne 1e933 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,112,200,78 // pshufd $0x4e,%xmm8,%xmm9
.byte 102,69,15,126,76,129,8 // movd %xmm9,0x8(%r9,%rax,4)
.byte 102,69,15,214,4,129 // movq %xmm8,(%r9,%rax,4)
- .byte 235,206 // jmp 1e403 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,206 // jmp 1e933 <_sk_store_bgra_sse2+0x7b>
.byte 102,69,15,126,4,129 // movd %xmm8,(%r9,%rax,4)
- .byte 235,198 // jmp 1e403 <_sk_store_bgra_sse2+0x7b>
+ .byte 235,198 // jmp 1e933 <_sk_store_bgra_sse2+0x7b>
HIDDEN _sk_load_f16_sse2
.globl _sk_load_f16_sse2
@@ -39351,7 +39640,7 @@ _sk_load_f16_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 1e5bf <_sk_load_f16_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1eaef <_sk_load_f16_sse2+0x182>
.byte 102,65,15,16,4,193 // movupd (%r9,%rax,8),%xmm0
.byte 102,65,15,16,76,193,16 // movupd 0x10(%r9,%rax,8),%xmm1
.byte 102,68,15,40,192 // movapd %xmm0,%xmm8
@@ -39363,7 +39652,7 @@ _sk_load_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,1,222,0,0 // movdqa 0xde01(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
+ .byte 102,68,15,111,13,17,222,0,0 // movdqa 0xde11(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -39371,11 +39660,11 @@ _sk_load_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,246,221,0,0 // movdqa 0xddf6(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
+ .byte 102,68,15,111,29,6,222,0,0 // movdqa 0xde06(%rip),%xmm11 # 2c800 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,248,221,0,0 // movdqa 0xddf8(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 102,68,15,111,37,8,222,0,0 // movdqa 0xde08(%rip),%xmm12 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,155,223,0,0 // movdqa 0xdf9b(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
+ .byte 102,15,111,29,171,223,0,0 // movdqa 0xdfab(%rip),%xmm3 # 2c9c0 <_sk_overlay_sse2_8bit+0x14db>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -39423,17 +39712,17 @@ _sk_load_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,193 // movsd (%r9,%rax,8),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e5dc <_sk_load_f16_sse2+0x19f>
+ .byte 117,17 // jne 1eb0c <_sk_load_f16_sse2+0x19f>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,142,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1e99a <_sk_load_f16_sse2+0x2d>
.byte 102,65,15,22,68,193,8 // movhpd 0x8(%r9,%rax,8),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 1e46a <_sk_load_f16_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1e99a <_sk_load_f16_sse2+0x2d>
.byte 242,65,15,16,76,193,16 // movsd 0x10(%r9,%rax,8),%xmm1
- .byte 233,109,254,255,255 // jmpq 1e46a <_sk_load_f16_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1e99a <_sk_load_f16_sse2+0x2d>
HIDDEN _sk_load_f16_dst_sse2
.globl _sk_load_f16_dst_sse2
@@ -39447,7 +39736,7 @@ _sk_load_f16_dst_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,98,1,0,0 // jne 1e77f <_sk_load_f16_dst_sse2+0x182>
+ .byte 15,133,98,1,0,0 // jne 1ecaf <_sk_load_f16_dst_sse2+0x182>
.byte 102,65,15,16,36,193 // movupd (%r9,%rax,8),%xmm4
.byte 102,65,15,16,108,193,16 // movupd 0x10(%r9,%rax,8),%xmm5
.byte 102,68,15,40,196 // movapd %xmm4,%xmm8
@@ -39459,7 +39748,7 @@ _sk_load_f16_dst_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,238 // movdqa %xmm14,%xmm5
.byte 102,65,15,97,234 // punpcklwd %xmm10,%xmm5
- .byte 102,68,15,111,13,65,220,0,0 // movdqa 0xdc41(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
+ .byte 102,68,15,111,13,81,220,0,0 // movdqa 0xdc51(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,111,229 // movdqa %xmm5,%xmm4
.byte 102,65,15,219,225 // pand %xmm9,%xmm4
.byte 102,15,239,236 // pxor %xmm4,%xmm5
@@ -39467,11 +39756,11 @@ _sk_load_f16_dst_sse2:
.byte 102,68,15,111,237 // movdqa %xmm5,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,236 // por %xmm4,%xmm13
- .byte 102,68,15,111,29,54,220,0,0 // movdqa 0xdc36(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
+ .byte 102,68,15,111,29,70,220,0,0 // movdqa 0xdc46(%rip),%xmm11 # 2c800 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,56,220,0,0 // movdqa 0xdc38(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 102,68,15,111,37,72,220,0,0 // movdqa 0xdc48(%rip),%xmm12 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,239,236 // pxor %xmm12,%xmm5
- .byte 102,15,111,61,219,221,0,0 // movdqa 0xdddb(%rip),%xmm7 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
+ .byte 102,15,111,61,235,221,0,0 // movdqa 0xddeb(%rip),%xmm7 # 2c9c0 <_sk_overlay_sse2_8bit+0x14db>
.byte 102,15,111,231 // movdqa %xmm7,%xmm4
.byte 102,15,102,229 // pcmpgtd %xmm5,%xmm4
.byte 102,65,15,223,229 // pandn %xmm13,%xmm4
@@ -39519,17 +39808,17 @@ _sk_load_f16_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,36,193 // movsd (%r9,%rax,8),%xmm4
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1e79c <_sk_load_f16_dst_sse2+0x19f>
+ .byte 117,17 // jne 1eccc <_sk_load_f16_dst_sse2+0x19f>
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 102,15,20,229 // unpcklpd %xmm5,%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
- .byte 233,142,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,142,254,255,255 // jmpq 1eb5a <_sk_load_f16_dst_sse2+0x2d>
.byte 102,65,15,22,100,193,8 // movhpd 0x8(%r9,%rax,8),%xmm4
.byte 102,15,87,237 // xorpd %xmm5,%xmm5
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,121,254,255,255 // jb 1e62a <_sk_load_f16_dst_sse2+0x2d>
+ .byte 15,130,121,254,255,255 // jb 1eb5a <_sk_load_f16_dst_sse2+0x2d>
.byte 242,65,15,16,108,193,16 // movsd 0x10(%r9,%rax,8),%xmm5
- .byte 233,109,254,255,255 // jmpq 1e62a <_sk_load_f16_dst_sse2+0x2d>
+ .byte 233,109,254,255,255 // jmpq 1eb5a <_sk_load_f16_dst_sse2+0x2d>
HIDDEN _sk_gather_f16_sse2
.globl _sk_gather_f16_sse2
@@ -39571,7 +39860,7 @@ _sk_gather_f16_sse2:
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,97,202 // punpcklwd %xmm10,%xmm1
- .byte 102,68,15,111,13,58,218,0,0 // movdqa 0xda3a(%rip),%xmm9 # 2c2a0 <_sk_overlay_sse2_8bit+0x12eb>
+ .byte 102,68,15,111,13,74,218,0,0 // movdqa 0xda4a(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x12fb>
.byte 102,15,111,193 // movdqa %xmm1,%xmm0
.byte 102,65,15,219,193 // pand %xmm9,%xmm0
.byte 102,15,239,200 // pxor %xmm0,%xmm1
@@ -39579,11 +39868,11 @@ _sk_gather_f16_sse2:
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,65,15,114,245,13 // pslld $0xd,%xmm13
.byte 102,68,15,235,232 // por %xmm0,%xmm13
- .byte 102,68,15,111,29,47,218,0,0 // movdqa 0xda2f(%rip),%xmm11 # 2c2c0 <_sk_overlay_sse2_8bit+0x130b>
+ .byte 102,68,15,111,29,63,218,0,0 // movdqa 0xda3f(%rip),%xmm11 # 2c800 <_sk_overlay_sse2_8bit+0x131b>
.byte 102,69,15,254,235 // paddd %xmm11,%xmm13
- .byte 102,68,15,111,37,49,218,0,0 // movdqa 0xda31(%rip),%xmm12 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 102,68,15,111,37,65,218,0,0 // movdqa 0xda41(%rip),%xmm12 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,65,15,239,204 // pxor %xmm12,%xmm1
- .byte 102,15,111,29,212,219,0,0 // movdqa 0xdbd4(%rip),%xmm3 # 2c480 <_sk_overlay_sse2_8bit+0x14cb>
+ .byte 102,15,111,29,228,219,0,0 // movdqa 0xdbe4(%rip),%xmm3 # 2c9c0 <_sk_overlay_sse2_8bit+0x14db>
.byte 102,15,111,195 // movdqa %xmm3,%xmm0
.byte 102,15,102,193 // pcmpgtd %xmm1,%xmm0
.byte 102,65,15,223,197 // pandn %xmm13,%xmm0
@@ -39642,17 +39931,17 @@ _sk_store_f16_sse2:
.byte 73,193,225,3 // shl $0x3,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 72,99,194 // movslq %edx,%rax
- .byte 102,68,15,111,21,41,217,0,0 // movdqa 0xd929(%rip),%xmm10 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 102,68,15,111,21,57,217,0,0 // movdqa 0xd939(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 102,68,15,111,224 // movdqa %xmm0,%xmm12
.byte 102,69,15,219,226 // pand %xmm10,%xmm12
.byte 102,68,15,111,232 // movdqa %xmm0,%xmm13
.byte 102,69,15,239,236 // pxor %xmm12,%xmm13
- .byte 102,68,15,111,13,28,217,0,0 // movdqa 0xd91c(%rip),%xmm9 # 2c2e0 <_sk_overlay_sse2_8bit+0x132b>
+ .byte 102,68,15,111,13,44,217,0,0 // movdqa 0xd92c(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x133b>
.byte 102,65,15,114,212,16 // psrld $0x10,%xmm12
.byte 102,69,15,111,193 // movdqa %xmm9,%xmm8
.byte 102,69,15,102,197 // pcmpgtd %xmm13,%xmm8
.byte 102,65,15,114,213,13 // psrld $0xd,%xmm13
- .byte 102,68,15,111,29,13,217,0,0 // movdqa 0xd90d(%rip),%xmm11 # 2c2f0 <_sk_overlay_sse2_8bit+0x133b>
+ .byte 102,68,15,111,29,29,217,0,0 // movdqa 0xd91d(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x134b>
.byte 102,69,15,235,227 // por %xmm11,%xmm12
.byte 102,69,15,254,229 // paddd %xmm13,%xmm12
.byte 102,65,15,114,244,16 // pslld $0x10,%xmm12
@@ -39704,7 +39993,7 @@ _sk_store_f16_sse2:
.byte 102,69,15,111,200 // movdqa %xmm8,%xmm9
.byte 102,69,15,98,204 // punpckldq %xmm12,%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 1eb05 <_sk_store_f16_sse2+0x17e>
+ .byte 117,21 // jne 1f035 <_sk_store_f16_sse2+0x17e>
.byte 69,15,17,12,193 // movups %xmm9,(%r9,%rax,8)
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 243,69,15,127,68,193,16 // movdqu %xmm8,0x10(%r9,%rax,8)
@@ -39712,13 +40001,13 @@ _sk_store_f16_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,12,193 // movq %xmm9,(%r9,%rax,8)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 1eb01 <_sk_store_f16_sse2+0x17a>
+ .byte 116,240 // je 1f031 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,23,76,193,8 // movhpd %xmm9,0x8(%r9,%rax,8)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 1eb01 <_sk_store_f16_sse2+0x17a>
+ .byte 114,227 // jb 1f031 <_sk_store_f16_sse2+0x17a>
.byte 102,69,15,106,196 // punpckhdq %xmm12,%xmm8
.byte 102,69,15,214,68,193,16 // movq %xmm8,0x10(%r9,%rax,8)
- .byte 235,213 // jmp 1eb01 <_sk_store_f16_sse2+0x17a>
+ .byte 235,213 // jmp 1f031 <_sk_store_f16_sse2+0x17a>
HIDDEN _sk_load_u16_be_sse2
.globl _sk_load_u16_be_sse2
@@ -39733,7 +40022,7 @@ _sk_load_u16_be_sse2:
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,190,0,0,0 // jne 1ec11 <_sk_load_u16_be_sse2+0xe5>
+ .byte 15,133,190,0,0,0 // jne 1f141 <_sk_load_u16_be_sse2+0xe5>
.byte 102,65,15,16,4,65 // movupd (%r9,%rax,2),%xmm0
.byte 102,65,15,16,76,65,16 // movupd 0x10(%r9,%rax,2),%xmm1
.byte 102,15,40,208 // movapd %xmm0,%xmm2
@@ -39750,7 +40039,7 @@ _sk_load_u16_be_sse2:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 102,65,15,97,201 // punpcklwd %xmm9,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,5,188,212,0,0 // movaps 0xd4bc(%rip),%xmm8 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
+ .byte 68,15,40,5,204,212,0,0 // movaps 0xd4cc(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0x10bb>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -39778,17 +40067,17 @@ _sk_load_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 242,65,15,16,4,65 // movsd (%r9,%rax,2),%xmm0
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,17 // jne 1ec2e <_sk_load_u16_be_sse2+0x102>
+ .byte 117,17 // jne 1f15e <_sk_load_u16_be_sse2+0x102>
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 102,15,20,193 // unpcklpd %xmm1,%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
- .byte 233,50,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,50,255,255,255 // jmpq 1f090 <_sk_load_u16_be_sse2+0x34>
.byte 102,65,15,22,68,65,8 // movhpd 0x8(%r9,%rax,2),%xmm0
.byte 102,15,87,201 // xorpd %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 15,130,29,255,255,255 // jb 1eb60 <_sk_load_u16_be_sse2+0x34>
+ .byte 15,130,29,255,255,255 // jb 1f090 <_sk_load_u16_be_sse2+0x34>
.byte 242,65,15,16,76,65,16 // movsd 0x10(%r9,%rax,2),%xmm1
- .byte 233,17,255,255,255 // jmpq 1eb60 <_sk_load_u16_be_sse2+0x34>
+ .byte 233,17,255,255,255 // jmpq 1f090 <_sk_load_u16_be_sse2+0x34>
HIDDEN _sk_load_rgb_u16_be_sse2
.globl _sk_load_rgb_u16_be_sse2
@@ -39805,7 +40094,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 72,141,4,64 // lea (%rax,%rax,2),%rax
.byte 72,193,248,32 // sar $0x20,%rax
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,175,0,0,0 // jne 1ed29 <_sk_load_rgb_u16_be_sse2+0xda>
+ .byte 15,133,175,0,0,0 // jne 1f259 <_sk_load_rgb_u16_be_sse2+0xda>
.byte 243,65,15,111,20,65 // movdqu (%r9,%rax,2),%xmm2
.byte 243,65,15,111,92,65,8 // movdqu 0x8(%r9,%rax,2),%xmm3
.byte 102,15,115,219,4 // psrldq $0x4,%xmm3
@@ -39826,7 +40115,7 @@ _sk_load_rgb_u16_be_sse2:
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,65,15,97,200 // punpcklwd %xmm8,%xmm1
.byte 15,91,193 // cvtdq2ps %xmm1,%xmm0
- .byte 68,15,40,13,130,211,0,0 // movaps 0xd382(%rip),%xmm9 # 2c060 <_sk_overlay_sse2_8bit+0x10ab>
+ .byte 68,15,40,13,146,211,0,0 // movaps 0xd392(%rip),%xmm9 # 2c5a0 <_sk_overlay_sse2_8bit+0x10bb>
.byte 65,15,89,193 // mulps %xmm9,%xmm0
.byte 102,15,111,203 // movdqa %xmm3,%xmm1
.byte 102,15,113,241,8 // psllw $0x8,%xmm1
@@ -39843,27 +40132,27 @@ _sk_load_rgb_u16_be_sse2:
.byte 15,91,210 // cvtdq2ps %xmm2,%xmm2
.byte 65,15,89,209 // mulps %xmm9,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,169,208,0,0 // movaps 0xd0a9(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,185,208,0,0 // movaps 0xd0b9(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 255,224 // jmpq *%rax
.byte 102,65,15,110,20,65 // movd (%r9,%rax,2),%xmm2
.byte 102,65,15,196,84,65,4,2 // pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,13 // jne 1ed4e <_sk_load_rgb_u16_be_sse2+0xff>
+ .byte 117,13 // jne 1f27e <_sk_load_rgb_u16_be_sse2+0xff>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,239,192 // pxor %xmm0,%xmm0
- .byte 233,80,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,80,255,255,255 // jmpq 1f1ce <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,65,15,110,68,65,6 // movd 0x6(%r9,%rax,2),%xmm0
.byte 102,65,15,196,68,65,10,2 // pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,24 // jb 1ed7f <_sk_load_rgb_u16_be_sse2+0x130>
+ .byte 114,24 // jb 1f2af <_sk_load_rgb_u16_be_sse2+0x130>
.byte 102,65,15,110,92,65,12 // movd 0xc(%r9,%rax,2),%xmm3
.byte 102,65,15,196,92,65,16,2 // pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 233,31,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,31,255,255,255 // jmpq 1f1ce <_sk_load_rgb_u16_be_sse2+0x4f>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
- .byte 233,22,255,255,255 // jmpq 1ec9e <_sk_load_rgb_u16_be_sse2+0x4f>
+ .byte 233,22,255,255,255 // jmpq 1f1ce <_sk_load_rgb_u16_be_sse2+0x4f>
HIDDEN _sk_store_u16_be_sse2
.globl _sk_store_u16_be_sse2
@@ -39877,7 +40166,7 @@ _sk_store_u16_be_sse2:
.byte 77,1,201 // add %r9,%r9
.byte 76,3,8 // add (%rax),%r9
.byte 73,99,194 // movslq %r10d,%rax
- .byte 68,15,40,21,82,213,0,0 // movaps 0xd552(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0x134b>
+ .byte 68,15,40,21,98,213,0,0 // movaps 0xd562(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x135b>
.byte 68,15,40,192 // movaps %xmm0,%xmm8
.byte 69,15,89,194 // mulps %xmm10,%xmm8
.byte 102,69,15,91,192 // cvtps2dq %xmm8,%xmm8
@@ -39922,7 +40211,7 @@ _sk_store_u16_be_sse2:
.byte 102,69,15,111,208 // movdqa %xmm8,%xmm10
.byte 102,69,15,98,209 // punpckldq %xmm9,%xmm10
.byte 77,133,192 // test %r8,%r8
- .byte 117,21 // jne 1eea8 <_sk_store_u16_be_sse2+0x120>
+ .byte 117,21 // jne 1f3d8 <_sk_store_u16_be_sse2+0x120>
.byte 69,15,17,20,65 // movups %xmm10,(%r9,%rax,2)
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 243,69,15,127,68,65,16 // movdqu %xmm8,0x10(%r9,%rax,2)
@@ -39930,13 +40219,13 @@ _sk_store_u16_be_sse2:
.byte 255,224 // jmpq *%rax
.byte 102,69,15,214,20,65 // movq %xmm10,(%r9,%rax,2)
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,240 // je 1eea4 <_sk_store_u16_be_sse2+0x11c>
+ .byte 116,240 // je 1f3d4 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,23,84,65,8 // movhpd %xmm10,0x8(%r9,%rax,2)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,227 // jb 1eea4 <_sk_store_u16_be_sse2+0x11c>
+ .byte 114,227 // jb 1f3d4 <_sk_store_u16_be_sse2+0x11c>
.byte 102,69,15,106,193 // punpckhdq %xmm9,%xmm8
.byte 102,69,15,214,68,65,16 // movq %xmm8,0x10(%r9,%rax,2)
- .byte 235,213 // jmp 1eea4 <_sk_store_u16_be_sse2+0x11c>
+ .byte 235,213 // jmp 1f3d4 <_sk_store_u16_be_sse2+0x11c>
HIDDEN _sk_load_f32_sse2
.globl _sk_load_f32_sse2
@@ -39952,7 +40241,7 @@ _sk_load_f32_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 1ef3a <_sk_load_f32_sse2+0x6b>
+ .byte 117,66 // jne 1f46a <_sk_load_f32_sse2+0x6b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -39972,17 +40261,17 @@ _sk_load_f32_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 1ef4c <_sk_load_f32_sse2+0x7d>
+ .byte 117,8 // jne 1f47c <_sk_load_f32_sse2+0x7d>
.byte 15,87,219 // xorps %xmm3,%xmm3
.byte 15,87,192 // xorps %xmm0,%xmm0
- .byte 235,190 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
+ .byte 235,190 // jmp 1f43a <_sk_load_f32_sse2+0x3b>
.byte 65,15,16,68,129,16 // movups 0x10(%r9,%rax,4),%xmm0
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 1ef60 <_sk_load_f32_sse2+0x91>
+ .byte 114,8 // jb 1f490 <_sk_load_f32_sse2+0x91>
.byte 65,15,16,92,129,32 // movups 0x20(%r9,%rax,4),%xmm3
- .byte 235,170 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
+ .byte 235,170 // jmp 1f43a <_sk_load_f32_sse2+0x3b>
.byte 15,87,219 // xorps %xmm3,%xmm3
- .byte 235,165 // jmp 1ef0a <_sk_load_f32_sse2+0x3b>
+ .byte 235,165 // jmp 1f43a <_sk_load_f32_sse2+0x3b>
HIDDEN _sk_load_f32_dst_sse2
.globl _sk_load_f32_dst_sse2
@@ -39998,7 +40287,7 @@ _sk_load_f32_dst_sse2:
.byte 73,99,194 // movslq %r10d,%rax
.byte 69,15,16,4,129 // movups (%r9,%rax,4),%xmm8
.byte 77,133,192 // test %r8,%r8
- .byte 117,66 // jne 1efd0 <_sk_load_f32_dst_sse2+0x6b>
+ .byte 117,66 // jne 1f500 <_sk_load_f32_dst_sse2+0x6b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
.byte 69,15,16,76,129,48 // movups 0x30(%r9,%rax,4),%xmm9
@@ -40018,17 +40307,17 @@ _sk_load_f32_dst_sse2:
.byte 255,224 // jmpq *%rax
.byte 69,15,87,201 // xorps %xmm9,%xmm9
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 117,8 // jne 1efe2 <_sk_load_f32_dst_sse2+0x7d>
+ .byte 117,8 // jne 1f512 <_sk_load_f32_dst_sse2+0x7d>
.byte 15,87,255 // xorps %xmm7,%xmm7
.byte 15,87,228 // xorps %xmm4,%xmm4
- .byte 235,190 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,190 // jmp 1f4d0 <_sk_load_f32_dst_sse2+0x3b>
.byte 65,15,16,100,129,16 // movups 0x10(%r9,%rax,4),%xmm4
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,8 // jb 1eff6 <_sk_load_f32_dst_sse2+0x91>
+ .byte 114,8 // jb 1f526 <_sk_load_f32_dst_sse2+0x91>
.byte 65,15,16,124,129,32 // movups 0x20(%r9,%rax,4),%xmm7
- .byte 235,170 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,170 // jmp 1f4d0 <_sk_load_f32_dst_sse2+0x3b>
.byte 15,87,255 // xorps %xmm7,%xmm7
- .byte 235,165 // jmp 1efa0 <_sk_load_f32_dst_sse2+0x3b>
+ .byte 235,165 // jmp 1f4d0 <_sk_load_f32_dst_sse2+0x3b>
HIDDEN _sk_store_f32_sse2
.globl _sk_store_f32_sse2
@@ -40057,7 +40346,7 @@ _sk_store_f32_sse2:
.byte 102,69,15,20,203 // unpcklpd %xmm11,%xmm9
.byte 102,69,15,17,36,129 // movupd %xmm12,(%r9,%rax,4)
.byte 77,133,192 // test %r8,%r8
- .byte 117,29 // jne 1f078 <_sk_store_f32_sse2+0x7d>
+ .byte 117,29 // jne 1f5a8 <_sk_store_f32_sse2+0x7d>
.byte 102,69,15,21,211 // unpckhpd %xmm11,%xmm10
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
@@ -40065,12 +40354,12 @@ _sk_store_f32_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 73,131,248,1 // cmp $0x1,%r8
- .byte 116,246 // je 1f074 <_sk_store_f32_sse2+0x79>
+ .byte 116,246 // je 1f5a4 <_sk_store_f32_sse2+0x79>
.byte 69,15,17,68,129,16 // movups %xmm8,0x10(%r9,%rax,4)
.byte 73,131,248,3 // cmp $0x3,%r8
- .byte 114,234 // jb 1f074 <_sk_store_f32_sse2+0x79>
+ .byte 114,234 // jb 1f5a4 <_sk_store_f32_sse2+0x79>
.byte 102,69,15,17,76,129,32 // movupd %xmm9,0x20(%r9,%rax,4)
- .byte 235,225 // jmp 1f074 <_sk_store_f32_sse2+0x79>
+ .byte 235,225 // jmp 1f5a4 <_sk_store_f32_sse2+0x79>
HIDDEN _sk_clamp_x_sse2
.globl _sk_clamp_x_sse2
@@ -40116,7 +40405,7 @@ _sk_repeat_x_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,191,204,0,0 // andps 0xccbf(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,84,21,207,204,0,0 // andps 0xcccf(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -40142,7 +40431,7 @@ _sk_repeat_y_sse2:
.byte 243,69,15,91,194 // cvttps2dq %xmm10,%xmm8
.byte 69,15,91,216 // cvtdq2ps %xmm8,%xmm11
.byte 69,15,194,211,1 // cmpltps %xmm11,%xmm10
- .byte 68,15,84,21,101,204,0,0 // andps 0xcc65(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,84,21,117,204,0,0 // andps 0xcc75(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,218 // subps %xmm10,%xmm11
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
@@ -40168,13 +40457,13 @@ _sk_mirror_x_sse2:
.byte 65,15,92,193 // subps %xmm9,%xmm0
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,46,194,0,0 // mulss 0xc22e(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,29,46,194,0,0 // mulss 0xc22e(%rip),%xmm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,216 // mulps %xmm0,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,235,203,0,0 // andps 0xcbeb(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,84,29,251,203,0,0 // andps 0xcbfb(%rip),%xmm11 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -40203,13 +40492,13 @@ _sk_mirror_y_sse2:
.byte 65,15,92,201 // subps %xmm9,%xmm1
.byte 243,69,15,88,210 // addss %xmm10,%xmm10
.byte 69,15,198,210,0 // shufps $0x0,%xmm10,%xmm10
- .byte 243,68,15,89,29,169,193,0,0 // mulss 0xc1a9(%rip),%xmm11 # 2b3f4 <_sk_overlay_sse2_8bit+0x43f>
+ .byte 243,68,15,89,29,169,193,0,0 // mulss 0xc1a9(%rip),%xmm11 # 2b924 <_sk_overlay_sse2_8bit+0x43f>
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 68,15,89,217 // mulps %xmm1,%xmm11
.byte 243,69,15,91,195 // cvttps2dq %xmm11,%xmm8
.byte 69,15,91,224 // cvtdq2ps %xmm8,%xmm12
.byte 69,15,194,220,1 // cmpltps %xmm12,%xmm11
- .byte 68,15,84,29,102,203,0,0 // andps 0xcb66(%rip),%xmm11 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,84,29,118,203,0,0 // andps 0xcb76(%rip),%xmm11 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 69,15,92,227 // subps %xmm11,%xmm12
.byte 69,15,89,226 // mulps %xmm10,%xmm12
@@ -40232,7 +40521,7 @@ FUNCTION(_sk_clamp_x_1_sse2)
_sk_clamp_x_1_sse2:
.byte 69,15,87,192 // xorps %xmm8,%xmm8
.byte 68,15,95,192 // maxps %xmm0,%xmm8
- .byte 68,15,93,5,29,203,0,0 // minps 0xcb1d(%rip),%xmm8 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,93,5,45,203,0,0 // minps 0xcb2d(%rip),%xmm8 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 65,15,40,192 // movaps %xmm8,%xmm0
.byte 255,224 // jmpq *%rax
@@ -40245,7 +40534,7 @@ _sk_repeat_x_1_sse2:
.byte 69,15,91,192 // cvtdq2ps %xmm8,%xmm8
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,194,200,1 // cmpltps %xmm8,%xmm9
- .byte 68,15,84,13,251,202,0,0 // andps 0xcafb(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,84,13,11,203,0,0 // andps 0xcb0b(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,193 // subps %xmm9,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -40255,14 +40544,14 @@ HIDDEN _sk_mirror_x_1_sse2
.globl _sk_mirror_x_1_sse2
FUNCTION(_sk_mirror_x_1_sse2)
_sk_mirror_x_1_sse2:
- .byte 68,15,40,5,71,203,0,0 // movaps 0xcb47(%rip),%xmm8 # 2be30 <_sk_overlay_sse2_8bit+0xe7b>
+ .byte 68,15,40,5,87,203,0,0 // movaps 0xcb57(%rip),%xmm8 # 2c370 <_sk_overlay_sse2_8bit+0xe8b>
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,13,203,202,0,0 // movaps 0xcacb(%rip),%xmm9 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,13,219,202,0,0 // movaps 0xcadb(%rip),%xmm9 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,89,200 // mulps %xmm0,%xmm9
.byte 243,69,15,91,209 // cvttps2dq %xmm9,%xmm10
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,84,13,193,202,0,0 // andps 0xcac1(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,84,13,209,202,0,0 // andps 0xcad1(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,87,219 // xorps %xmm11,%xmm11
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,88,210 // addps %xmm10,%xmm10
@@ -40278,10 +40567,10 @@ HIDDEN _sk_luminance_to_alpha_sse2
FUNCTION(_sk_luminance_to_alpha_sse2)
_sk_luminance_to_alpha_sse2:
.byte 15,40,218 // movaps %xmm2,%xmm3
- .byte 15,89,5,215,207,0,0 // mulps 0xcfd7(%rip),%xmm0 # 2c310 <_sk_overlay_sse2_8bit+0x135b>
- .byte 15,89,13,224,207,0,0 // mulps 0xcfe0(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0x136b>
+ .byte 15,89,5,231,207,0,0 // mulps 0xcfe7(%rip),%xmm0 # 2c850 <_sk_overlay_sse2_8bit+0x136b>
+ .byte 15,89,13,240,207,0,0 // mulps 0xcff0(%rip),%xmm1 # 2c860 <_sk_overlay_sse2_8bit+0x137b>
.byte 15,88,200 // addps %xmm0,%xmm1
- .byte 15,89,29,230,207,0,0 // mulps 0xcfe6(%rip),%xmm3 # 2c330 <_sk_overlay_sse2_8bit+0x137b>
+ .byte 15,89,29,246,207,0,0 // mulps 0xcff6(%rip),%xmm3 # 2c870 <_sk_overlay_sse2_8bit+0x138b>
.byte 15,88,217 // addps %xmm1,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,87,192 // xorps %xmm0,%xmm0
@@ -40593,9 +40882,9 @@ _sk_evenly_spaced_gradient_sse2:
.byte 72,139,24 // mov (%rax),%rbx
.byte 76,139,112,8 // mov 0x8(%rax),%r14
.byte 72,255,203 // dec %rbx
- .byte 120,7 // js 1f7ea <_sk_evenly_spaced_gradient_sse2+0x18>
+ .byte 120,7 // js 1fd1a <_sk_evenly_spaced_gradient_sse2+0x18>
.byte 243,72,15,42,203 // cvtsi2ss %rbx,%xmm1
- .byte 235,21 // jmp 1f7ff <_sk_evenly_spaced_gradient_sse2+0x2d>
+ .byte 235,21 // jmp 1fd2f <_sk_evenly_spaced_gradient_sse2+0x2d>
.byte 73,137,217 // mov %rbx,%r9
.byte 73,209,233 // shr %r9
.byte 131,227,1 // and $0x1,%ebx
@@ -40693,15 +40982,15 @@ HIDDEN _sk_gauss_a_to_rgba_sse2
.globl _sk_gauss_a_to_rgba_sse2
FUNCTION(_sk_gauss_a_to_rgba_sse2)
_sk_gauss_a_to_rgba_sse2:
- .byte 15,40,5,181,201,0,0 // movaps 0xc9b5(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0x138b>
+ .byte 15,40,5,197,201,0,0 // movaps 0xc9c5(%rip),%xmm0 # 2c880 <_sk_overlay_sse2_8bit+0x139b>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,187,201,0,0 // addps 0xc9bb(%rip),%xmm0 # 2c350 <_sk_overlay_sse2_8bit+0x139b>
+ .byte 15,88,5,203,201,0,0 // addps 0xc9cb(%rip),%xmm0 # 2c890 <_sk_overlay_sse2_8bit+0x13ab>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,193,201,0,0 // addps 0xc9c1(%rip),%xmm0 # 2c360 <_sk_overlay_sse2_8bit+0x13ab>
+ .byte 15,88,5,209,201,0,0 // addps 0xc9d1(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x13bb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,199,201,0,0 // addps 0xc9c7(%rip),%xmm0 # 2c370 <_sk_overlay_sse2_8bit+0x13bb>
+ .byte 15,88,5,215,201,0,0 // addps 0xc9d7(%rip),%xmm0 # 2c8b0 <_sk_overlay_sse2_8bit+0x13cb>
.byte 15,89,195 // mulps %xmm3,%xmm0
- .byte 15,88,5,205,201,0,0 // addps 0xc9cd(%rip),%xmm0 # 2c380 <_sk_overlay_sse2_8bit+0x13cb>
+ .byte 15,88,5,221,201,0,0 // addps 0xc9dd(%rip),%xmm0 # 2c8c0 <_sk_overlay_sse2_8bit+0x13db>
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 15,40,208 // movaps %xmm0,%xmm2
@@ -40719,12 +41008,12 @@ _sk_gradient_sse2:
.byte 76,139,8 // mov (%rax),%r9
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 73,131,249,2 // cmp $0x2,%r9
- .byte 114,50 // jb 1fa06 <_sk_gradient_sse2+0x46>
+ .byte 114,50 // jb 1ff36 <_sk_gradient_sse2+0x46>
.byte 72,139,88,72 // mov 0x48(%rax),%rbx
.byte 73,255,201 // dec %r9
.byte 72,131,195,4 // add $0x4,%rbx
.byte 102,15,239,201 // pxor %xmm1,%xmm1
- .byte 15,40,21,246,195,0,0 // movaps 0xc3f6(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 15,40,21,6,196,0,0 // movaps 0xc406(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 243,15,16,27 // movss (%rbx),%xmm3
.byte 15,198,219,0 // shufps $0x0,%xmm3,%xmm3
.byte 15,194,216,2 // cmpleps %xmm0,%xmm3
@@ -40732,7 +41021,7 @@ _sk_gradient_sse2:
.byte 102,15,254,203 // paddd %xmm3,%xmm1
.byte 72,131,195,4 // add $0x4,%rbx
.byte 73,255,201 // dec %r9
- .byte 117,228 // jne 1f9ea <_sk_gradient_sse2+0x2a>
+ .byte 117,228 // jne 1ff1a <_sk_gradient_sse2+0x2a>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,211 // movq %xmm2,%r11
.byte 69,137,217 // mov %r11d,%r9d
@@ -40871,29 +41160,29 @@ _sk_xy_to_unit_angle_sse2:
.byte 69,15,94,220 // divps %xmm12,%xmm11
.byte 69,15,40,227 // movaps %xmm11,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
- .byte 68,15,40,45,87,199,0,0 // movaps 0xc757(%rip),%xmm13 # 2c390 <_sk_overlay_sse2_8bit+0x13db>
+ .byte 68,15,40,45,103,199,0,0 // movaps 0xc767(%rip),%xmm13 # 2c8d0 <_sk_overlay_sse2_8bit+0x13eb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,91,199,0,0 // addps 0xc75b(%rip),%xmm13 # 2c3a0 <_sk_overlay_sse2_8bit+0x13eb>
+ .byte 68,15,88,45,107,199,0,0 // addps 0xc76b(%rip),%xmm13 # 2c8e0 <_sk_overlay_sse2_8bit+0x13fb>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,95,199,0,0 // addps 0xc75f(%rip),%xmm13 # 2c3b0 <_sk_overlay_sse2_8bit+0x13fb>
+ .byte 68,15,88,45,111,199,0,0 // addps 0xc76f(%rip),%xmm13 # 2c8f0 <_sk_overlay_sse2_8bit+0x140b>
.byte 69,15,89,236 // mulps %xmm12,%xmm13
- .byte 68,15,88,45,99,199,0,0 // addps 0xc763(%rip),%xmm13 # 2c3c0 <_sk_overlay_sse2_8bit+0x140b>
+ .byte 68,15,88,45,115,199,0,0 // addps 0xc773(%rip),%xmm13 # 2c900 <_sk_overlay_sse2_8bit+0x141b>
.byte 69,15,89,235 // mulps %xmm11,%xmm13
.byte 69,15,194,202,1 // cmpltps %xmm10,%xmm9
- .byte 68,15,40,21,98,199,0,0 // movaps 0xc762(%rip),%xmm10 # 2c3d0 <_sk_overlay_sse2_8bit+0x141b>
+ .byte 68,15,40,21,114,199,0,0 // movaps 0xc772(%rip),%xmm10 # 2c910 <_sk_overlay_sse2_8bit+0x142b>
.byte 69,15,92,213 // subps %xmm13,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,205 // andnps %xmm13,%xmm9
.byte 69,15,86,202 // orps %xmm10,%xmm9
.byte 68,15,194,192,1 // cmpltps %xmm0,%xmm8
- .byte 68,15,40,21,53,193,0,0 // movaps 0xc135(%rip),%xmm10 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,21,69,193,0,0 // movaps 0xc145(%rip),%xmm10 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,92,209 // subps %xmm9,%xmm10
.byte 69,15,84,208 // andps %xmm8,%xmm10
.byte 69,15,85,193 // andnps %xmm9,%xmm8
.byte 69,15,86,194 // orps %xmm10,%xmm8
.byte 68,15,40,201 // movaps %xmm1,%xmm9
.byte 68,15,194,200,1 // cmpltps %xmm0,%xmm9
- .byte 68,15,40,21,36,193,0,0 // movaps 0xc124(%rip),%xmm10 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,21,52,193,0,0 // movaps 0xc134(%rip),%xmm10 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,208 // subps %xmm8,%xmm10
.byte 69,15,84,209 // andps %xmm9,%xmm10
.byte 69,15,85,200 // andnps %xmm8,%xmm9
@@ -40928,7 +41217,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,203,198,0,0 // mulps 0xc6cb(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
+ .byte 68,15,89,13,219,198,0,0 // mulps 0xc6db(%rip),%xmm9 # 2c920 <_sk_overlay_sse2_8bit+0x143b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -40936,7 +41225,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,182,198,0,0 // mulps 0xc6b6(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
+ .byte 68,15,89,21,198,198,0,0 // mulps 0xc6c6(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x144b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -40945,8 +41234,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,110,197,0,0 // xorps 0xc56e(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
- .byte 68,15,89,5,86,192,0,0 // mulps 0xc056(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,87,13,126,197,0,0 // xorps 0xc57e(%rip),%xmm9 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
+ .byte 68,15,89,5,102,192,0,0 // mulps 0xc066(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -40967,7 +41256,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,203 // mulss %xmm11,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,45,198,0,0 // mulps 0xc62d(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
+ .byte 68,15,89,13,61,198,0,0 // mulps 0xc63d(%rip),%xmm9 # 2c920 <_sk_overlay_sse2_8bit+0x143b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,225 // movaps %xmm1,%xmm12
.byte 69,15,89,228 // mulps %xmm12,%xmm12
@@ -40975,7 +41264,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 243,69,15,89,219 // mulss %xmm11,%xmm11
.byte 69,15,198,219,0 // shufps $0x0,%xmm11,%xmm11
.byte 69,15,92,227 // subps %xmm11,%xmm12
- .byte 68,15,89,21,24,198,0,0 // mulps 0xc618(%rip),%xmm10 # 2c3f0 <_sk_overlay_sse2_8bit+0x143b>
+ .byte 68,15,89,21,40,198,0,0 // mulps 0xc628(%rip),%xmm10 # 2c930 <_sk_overlay_sse2_8bit+0x144b>
.byte 69,15,89,212 // mulps %xmm12,%xmm10
.byte 65,15,40,193 // movaps %xmm9,%xmm0
.byte 15,89,192 // mulps %xmm0,%xmm0
@@ -40984,8 +41273,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2:
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,40,194 // movaps %xmm10,%xmm0
.byte 65,15,92,193 // subps %xmm9,%xmm0
- .byte 68,15,87,13,208,196,0,0 // xorps 0xc4d0(%rip),%xmm9 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
- .byte 68,15,89,5,184,191,0,0 // mulps 0xbfb8(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,87,13,224,196,0,0 // xorps 0xc4e0(%rip),%xmm9 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
+ .byte 68,15,89,5,200,191,0,0 // mulps 0xbfc8(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 65,15,89,192 // mulps %xmm8,%xmm0
.byte 69,15,92,202 // subps %xmm10,%xmm9
.byte 69,15,89,200 // mulps %xmm8,%xmm9
@@ -41003,7 +41292,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,200 // mulss %xmm8,%xmm9
.byte 69,15,198,201,0 // shufps $0x0,%xmm9,%xmm9
.byte 68,15,88,200 // addps %xmm0,%xmm9
- .byte 68,15,89,13,160,197,0,0 // mulps 0xc5a0(%rip),%xmm9 # 2c3e0 <_sk_overlay_sse2_8bit+0x142b>
+ .byte 68,15,89,13,176,197,0,0 // mulps 0xc5b0(%rip),%xmm9 # 2c920 <_sk_overlay_sse2_8bit+0x143b>
.byte 15,89,192 // mulps %xmm0,%xmm0
.byte 68,15,40,209 // movaps %xmm1,%xmm10
.byte 69,15,89,210 // mulps %xmm10,%xmm10
@@ -41011,7 +41300,7 @@ _sk_xy_to_2pt_conical_linear_sse2:
.byte 243,69,15,89,192 // mulss %xmm8,%xmm8
.byte 69,15,198,192,0 // shufps $0x0,%xmm8,%xmm8
.byte 65,15,92,192 // subps %xmm8,%xmm0
- .byte 15,87,5,108,196,0,0 // xorps 0xc46c(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0x131b>
+ .byte 15,87,5,124,196,0,0 // xorps 0xc47c(%rip),%xmm0 # 2c810 <_sk_overlay_sse2_8bit+0x132b>
.byte 65,15,94,193 // divps %xmm9,%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41054,7 +41343,7 @@ HIDDEN _sk_save_xy_sse2
FUNCTION(_sk_save_xy_sse2)
_sk_save_xy_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,242,190,0,0 // movaps 0xbef2(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,5,2,191,0,0 // movaps 0xbf02(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,17,0 // movups %xmm0,(%rax)
.byte 68,15,40,200 // movaps %xmm0,%xmm9
.byte 69,15,88,200 // addps %xmm8,%xmm9
@@ -41062,7 +41351,7 @@ _sk_save_xy_sse2:
.byte 69,15,91,210 // cvtdq2ps %xmm10,%xmm10
.byte 69,15,40,217 // movaps %xmm9,%xmm11
.byte 69,15,194,218,1 // cmpltps %xmm10,%xmm11
- .byte 68,15,40,37,221,190,0,0 // movaps 0xbedd(%rip),%xmm12 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 68,15,40,37,237,190,0,0 // movaps 0xbeed(%rip),%xmm12 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,84,220 // andps %xmm12,%xmm11
.byte 69,15,92,211 // subps %xmm11,%xmm10
.byte 69,15,92,202 // subps %xmm10,%xmm9
@@ -41109,8 +41398,8 @@ _sk_bilinear_nx_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,118,196,0,0 // addps 0xc476(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,62,190,0,0 // movaps 0xbe3e(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,5,134,196,0,0 // addps 0xc486(%rip),%xmm0 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,78,190,0,0 // movaps 0xbe4e(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41123,7 +41412,7 @@ _sk_bilinear_px_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,13,190,0,0 // addps 0xbe0d(%rip),%xmm0 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,88,5,29,190,0,0 // addps 0xbe1d(%rip),%xmm0 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41135,8 +41424,8 @@ _sk_bilinear_ny_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,47,196,0,0 // addps 0xc42f(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,247,189,0,0 // movaps 0xbdf7(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,13,63,196,0,0 // addps 0xc43f(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,7,190,0,0 // movaps 0xbe07(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41149,7 +41438,7 @@ _sk_bilinear_py_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,197,189,0,0 // addps 0xbdc5(%rip),%xmm1 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 15,88,13,213,189,0,0 // addps 0xbdd5(%rip),%xmm1 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41161,13 +41450,13 @@ _sk_bicubic_n3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,248,195,0,0 // addps 0xc3f8(%rip),%xmm0 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
- .byte 68,15,40,13,176,189,0,0 // movaps 0xbdb0(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,5,8,196,0,0 // addps 0xc408(%rip),%xmm0 # 2c950 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,40,13,192,189,0,0 // movaps 0xbdc0(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,236,195,0,0 // mulps 0xc3ec(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,13,132,191,0,0 // addps 0xbf84(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,13,252,195,0,0 // mulps 0xc3fc(%rip),%xmm9 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,13,148,191,0,0 // addps 0xbf94(%rip),%xmm9 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,128,0,0,0 // movups %xmm9,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41180,16 +41469,16 @@ _sk_bicubic_n1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,163,195,0,0 // addps 0xc3a3(%rip),%xmm0 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,107,189,0,0 // movaps 0xbd6b(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,5,179,195,0,0 // addps 0xc3b3(%rip),%xmm0 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,123,189,0,0 // movaps 0xbd7b(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,191,195,0,0 // movaps 0xc3bf(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,5,207,195,0,0 // movaps 0xc3cf(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,195,195,0,0 // addps 0xc3c3(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,5,211,195,0,0 // addps 0xc3d3(%rip),%xmm8 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,55,189,0,0 // addps 0xbd37(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,5,71,189,0,0 // addps 0xbd47(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,187,195,0,0 // addps 0xc3bb(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,5,203,195,0,0 // addps 0xc3cb(%rip),%xmm8 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41199,17 +41488,17 @@ HIDDEN _sk_bicubic_p1x_sse2
FUNCTION(_sk_bicubic_p1x_sse2)
_sk_bicubic_p1x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,21,189,0,0 // movaps 0xbd15(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,5,37,189,0,0 // movaps 0xbd25(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,72,64 // movups 0x40(%rax),%xmm9
.byte 65,15,88,192 // addps %xmm8,%xmm0
- .byte 68,15,40,21,113,195,0,0 // movaps 0xc371(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,21,129,195,0,0 // movaps 0xc381(%rip),%xmm10 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,117,195,0,0 // addps 0xc375(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,21,133,195,0,0 // addps 0xc385(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,113,195,0,0 // addps 0xc371(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,21,129,195,0,0 // addps 0xc381(%rip),%xmm10 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,144,128,0,0,0 // movups %xmm10,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41221,11 +41510,11 @@ _sk_bicubic_p3x_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,0 // movups (%rax),%xmm0
.byte 68,15,16,64,64 // movups 0x40(%rax),%xmm8
- .byte 15,88,5,68,195,0,0 // addps 0xc344(%rip),%xmm0 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 15,88,5,84,195,0,0 // addps 0xc354(%rip),%xmm0 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,20,195,0,0 // mulps 0xc314(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,5,172,190,0,0 // addps 0xbeac(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,5,36,195,0,0 // mulps 0xc324(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,5,188,190,0,0 // addps 0xbebc(%rip),%xmm8 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,128,0,0,0 // movups %xmm8,0x80(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41238,13 +41527,13 @@ _sk_bicubic_n3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,218,194,0,0 // addps 0xc2da(%rip),%xmm1 # 2c410 <_sk_overlay_sse2_8bit+0x145b>
- .byte 68,15,40,13,146,188,0,0 // movaps 0xbc92(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,13,234,194,0,0 // addps 0xc2ea(%rip),%xmm1 # 2c950 <_sk_overlay_sse2_8bit+0x146b>
+ .byte 68,15,40,13,162,188,0,0 // movaps 0xbca2(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
.byte 69,15,40,193 // movaps %xmm9,%xmm8
.byte 69,15,89,192 // mulps %xmm8,%xmm8
- .byte 68,15,89,13,206,194,0,0 // mulps 0xc2ce(%rip),%xmm9 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,13,102,190,0,0 // addps 0xbe66(%rip),%xmm9 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,13,222,194,0,0 // mulps 0xc2de(%rip),%xmm9 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,13,118,190,0,0 // addps 0xbe76(%rip),%xmm9 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,200 // mulps %xmm8,%xmm9
.byte 68,15,17,136,160,0,0,0 // movups %xmm9,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41257,16 +41546,16 @@ _sk_bicubic_n1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,132,194,0,0 // addps 0xc284(%rip),%xmm1 # 2c400 <_sk_overlay_sse2_8bit+0x144b>
- .byte 68,15,40,13,76,188,0,0 // movaps 0xbc4c(%rip),%xmm9 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,88,13,148,194,0,0 // addps 0xc294(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x145b>
+ .byte 68,15,40,13,92,188,0,0 // movaps 0xbc5c(%rip),%xmm9 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 69,15,92,200 // subps %xmm8,%xmm9
- .byte 68,15,40,5,160,194,0,0 // movaps 0xc2a0(%rip),%xmm8 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,5,176,194,0,0 // movaps 0xc2b0(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,164,194,0,0 // addps 0xc2a4(%rip),%xmm8 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,5,180,194,0,0 // addps 0xc2b4(%rip),%xmm8 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,24,188,0,0 // addps 0xbc18(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,88,5,40,188,0,0 // addps 0xbc28(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
- .byte 68,15,88,5,156,194,0,0 // addps 0xc29c(%rip),%xmm8 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,5,172,194,0,0 // addps 0xc2ac(%rip),%xmm8 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41276,17 +41565,17 @@ HIDDEN _sk_bicubic_p1y_sse2
FUNCTION(_sk_bicubic_p1y_sse2)
_sk_bicubic_p1y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 68,15,40,5,246,187,0,0 // movaps 0xbbf6(%rip),%xmm8 # 2bdc0 <_sk_overlay_sse2_8bit+0xe0b>
+ .byte 68,15,40,5,6,188,0,0 // movaps 0xbc06(%rip),%xmm8 # 2c300 <_sk_overlay_sse2_8bit+0xe1b>
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,72,96 // movups 0x60(%rax),%xmm9
.byte 65,15,88,200 // addps %xmm8,%xmm1
- .byte 68,15,40,21,81,194,0,0 // movaps 0xc251(%rip),%xmm10 # 2c430 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,40,21,97,194,0,0 // movaps 0xc261(%rip),%xmm10 # 2c970 <_sk_overlay_sse2_8bit+0x148b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,85,194,0,0 // addps 0xc255(%rip),%xmm10 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 68,15,88,21,101,194,0,0 // addps 0xc265(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,89,209 // mulps %xmm9,%xmm10
.byte 69,15,88,208 // addps %xmm8,%xmm10
.byte 69,15,89,209 // mulps %xmm9,%xmm10
- .byte 68,15,88,21,81,194,0,0 // addps 0xc251(%rip),%xmm10 # 2c450 <_sk_overlay_sse2_8bit+0x149b>
+ .byte 68,15,88,21,97,194,0,0 // addps 0xc261(%rip),%xmm10 # 2c990 <_sk_overlay_sse2_8bit+0x14ab>
.byte 68,15,17,144,160,0,0,0 // movups %xmm10,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
@@ -41298,11 +41587,11 @@ _sk_bicubic_p3y_sse2:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 15,16,72,32 // movups 0x20(%rax),%xmm1
.byte 68,15,16,64,96 // movups 0x60(%rax),%xmm8
- .byte 15,88,13,35,194,0,0 // addps 0xc223(%rip),%xmm1 # 2c440 <_sk_overlay_sse2_8bit+0x148b>
+ .byte 15,88,13,51,194,0,0 // addps 0xc233(%rip),%xmm1 # 2c980 <_sk_overlay_sse2_8bit+0x149b>
.byte 69,15,40,200 // movaps %xmm8,%xmm9
.byte 69,15,89,201 // mulps %xmm9,%xmm9
- .byte 68,15,89,5,243,193,0,0 // mulps 0xc1f3(%rip),%xmm8 # 2c420 <_sk_overlay_sse2_8bit+0x146b>
- .byte 68,15,88,5,139,189,0,0 // addps 0xbd8b(%rip),%xmm8 # 2bfc0 <_sk_overlay_sse2_8bit+0x100b>
+ .byte 68,15,89,5,3,194,0,0 // mulps 0xc203(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x147b>
+ .byte 68,15,88,5,155,189,0,0 // addps 0xbd9b(%rip),%xmm8 # 2c500 <_sk_overlay_sse2_8bit+0x101b>
.byte 69,15,89,193 // mulps %xmm9,%xmm8
.byte 68,15,17,128,160,0,0,0 // movups %xmm8,0xa0(%rax)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -41451,7 +41740,7 @@ _sk_clut_3D_sse2:
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,65,15,111,198 // movdqa %xmm14,%xmm0
.byte 102,15,254,195 // paddd %xmm3,%xmm0
- .byte 102,15,111,45,37,192,0,0 // movdqa 0xc025(%rip),%xmm5 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,45,53,192,0,0 // movdqa 0xc035(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,192,232 // pshufd $0xe8,%xmm0,%xmm0
@@ -41474,7 +41763,7 @@ _sk_clut_3D_sse2:
.byte 15,20,241 // unpcklps %xmm1,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,41,185,0,0 // paddd 0xb929(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,13,57,185,0,0 // paddd 0xb939(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,112,233,78 // pshufd $0x4e,%xmm1,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -41491,7 +41780,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,253 // unpcklps %xmm5,%xmm7
.byte 15,20,249 // unpcklps %xmm1,%xmm7
- .byte 102,15,254,5,255,184,0,0 // paddd 0xb8ff(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,5,15,185,0,0 // paddd 0xb90f(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -41508,7 +41797,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,200 // unpcklps %xmm0,%xmm1
- .byte 15,40,45,22,191,0,0 // movaps 0xbf16(%rip),%xmm5 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
+ .byte 15,40,45,38,191,0,0 // movaps 0xbf26(%rip),%xmm5 # 2c9a0 <_sk_overlay_sse2_8bit+0x14bb>
.byte 15,88,229 // addps %xmm5,%xmm4
.byte 15,41,100,36,192 // movaps %xmm4,-0x40(%rsp)
.byte 68,15,88,213 // addps %xmm5,%xmm10
@@ -41523,7 +41812,7 @@ _sk_clut_3D_sse2:
.byte 102,15,127,68,36,160 // movdqa %xmm0,-0x60(%rsp)
.byte 102,15,254,216 // paddd %xmm0,%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,15,111,5,223,190,0,0 // movdqa 0xbedf(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,5,239,190,0,0 // movdqa 0xbeef(%rip),%xmm0 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
.byte 102,15,112,211,232 // pshufd $0xe8,%xmm3,%xmm2
.byte 102,15,244,224 // pmuludq %xmm0,%xmm4
@@ -41545,7 +41834,7 @@ _sk_clut_3D_sse2:
.byte 15,20,227 // unpcklps %xmm3,%xmm4
.byte 15,20,229 // unpcklps %xmm5,%xmm4
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
- .byte 102,15,254,29,232,183,0,0 // paddd 0xb7e8(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,29,248,183,0,0 // paddd 0xb7f8(%rip),%xmm3 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,112,235,78 // pshufd $0x4e,%xmm3,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,218 // movq %xmm3,%r10
@@ -41562,7 +41851,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
.byte 15,20,216 // unpcklps %xmm0,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
- .byte 102,15,254,21,190,183,0,0 // paddd 0xb7be(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,21,206,183,0,0 // paddd 0xb7ce(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,194,78 // pshufd $0x4e,%xmm2,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -41624,7 +41913,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,193 // unpcklps %xmm1,%xmm8
.byte 68,15,20,199 // unpcklps %xmm7,%xmm8
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,21,137,182,0,0 // movdqa 0xb689(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,21,153,182,0,0 // movdqa 0xb699(%rip),%xmm10 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,202 // paddd %xmm10,%xmm1
.byte 102,15,112,249,78 // pshufd $0x4e,%xmm1,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
@@ -41642,7 +41931,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,205 // unpcklps %xmm5,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,111,45,90,182,0,0 // movdqa 0xb65a(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,111,45,106,182,0,0 // movdqa 0xb66a(%rip),%xmm5 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,254,197 // paddd %xmm5,%xmm0
.byte 102,15,112,232,78 // pshufd $0x4e,%xmm0,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -41700,7 +41989,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 68,15,20,223 // unpcklps %xmm7,%xmm11
.byte 68,15,20,221 // unpcklps %xmm5,%xmm11
- .byte 102,15,111,45,85,181,0,0 // movdqa 0xb555(%rip),%xmm5 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,111,45,101,181,0,0 // movdqa 0xb565(%rip),%xmm5 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,254,245 // paddd %xmm5,%xmm6
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,112,238,78 // pshufd $0x4e,%xmm6,%xmm5
@@ -41747,7 +42036,7 @@ _sk_clut_3D_sse2:
.byte 102,65,15,111,206 // movdqa %xmm14,%xmm1
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,5,246,186,0,0 // movdqa 0xbaf6(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,5,6,187,0,0 // movdqa 0xbb06(%rip),%xmm0 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,200 // pmuludq %xmm0,%xmm1
.byte 102,15,112,217,232 // pshufd $0xe8,%xmm1,%xmm3
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
@@ -41769,7 +42058,7 @@ _sk_clut_3D_sse2:
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,202 // unpcklps %xmm2,%xmm1
.byte 102,15,111,211 // movdqa %xmm3,%xmm2
- .byte 102,15,111,5,0,180,0,0 // movdqa 0xb400(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,5,16,180,0,0 // movdqa 0xb410(%rip),%xmm0 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -41845,7 +42134,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,4,139 // movss (%rbx,%r9,4),%xmm0
.byte 15,20,240 // unpcklps %xmm0,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,29,209,178,0,0 // paddd 0xb2d1(%rip),%xmm3 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,29,225,178,0,0 // paddd 0xb2e1(%rip),%xmm3 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,195,78 // pshufd $0x4e,%xmm3,%xmm0
.byte 102,73,15,126,193 // movq %xmm0,%r9
.byte 102,73,15,126,218 // movq %xmm3,%r10
@@ -41896,7 +42185,7 @@ _sk_clut_3D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,205,177,0,0 // paddd 0xb1cd(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,13,221,177,0,0 // paddd 0xb1dd(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -41913,7 +42202,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,20,139 // movss (%rbx,%r9,4),%xmm2
.byte 68,15,20,242 // unpcklps %xmm2,%xmm14
.byte 68,15,20,241 // unpcklps %xmm1,%xmm14
- .byte 102,15,254,5,160,177,0,0 // paddd 0xb1a0(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,5,176,177,0,0 // paddd 0xb1b0(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,200,78 // pshufd $0x4e,%xmm0,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -41951,7 +42240,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,37,211,176,0,0 // movdqa 0xb0d3(%rip),%xmm4 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,37,227,176,0,0 // movdqa 0xb0e3(%rip),%xmm4 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,226 // paddd %xmm2,%xmm4
.byte 102,15,112,204,78 // pshufd $0x4e,%xmm4,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -41969,7 +42258,7 @@ _sk_clut_3D_sse2:
.byte 243,66,15,16,36,139 // movss (%rbx,%r9,4),%xmm4
.byte 15,20,204 // unpcklps %xmm4,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,165,176,0,0 // paddd 0xb0a5(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,21,181,176,0,0 // paddd 0xb0b5(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,226,78 // pshufd $0x4e,%xmm2,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -42122,7 +42411,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,209 // paddd %xmm1,%xmm2
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
.byte 102,15,254,218 // paddd %xmm2,%xmm3
- .byte 102,68,15,111,21,143,180,0,0 // movdqa 0xb48f(%rip),%xmm10 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,68,15,111,21,159,180,0,0 // movdqa 0xb49f(%rip),%xmm10 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,112,235,245 // pshufd $0xf5,%xmm3,%xmm5
.byte 102,65,15,244,218 // pmuludq %xmm10,%xmm3
.byte 102,15,112,227,232 // pshufd $0xe8,%xmm3,%xmm4
@@ -42145,7 +42434,7 @@ _sk_clut_4D_sse2:
.byte 15,20,222 // unpcklps %xmm6,%xmm3
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 102,15,111,236 // movdqa %xmm4,%xmm5
- .byte 102,15,254,45,145,173,0,0 // paddd 0xad91(%rip),%xmm5 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,45,161,173,0,0 // paddd 0xada1(%rip),%xmm5 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,112,245,78 // pshufd $0x4e,%xmm5,%xmm6
.byte 102,73,15,126,241 // movq %xmm6,%r9
.byte 102,73,15,126,234 // movq %xmm5,%r10
@@ -42162,7 +42451,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,247 // unpcklps %xmm7,%xmm6
.byte 15,20,245 // unpcklps %xmm5,%xmm6
- .byte 102,15,254,37,103,173,0,0 // paddd 0xad67(%rip),%xmm4 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,37,119,173,0,0 // paddd 0xad77(%rip),%xmm4 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
.byte 102,73,15,126,226 // movq %xmm4,%r10
@@ -42179,7 +42468,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,239 // unpcklps %xmm7,%xmm5
.byte 15,20,236 // unpcklps %xmm4,%xmm5
- .byte 15,40,61,126,179,0,0 // movaps 0xb37e(%rip),%xmm7 # 2c460 <_sk_overlay_sse2_8bit+0x14ab>
+ .byte 15,40,61,142,179,0,0 // movaps 0xb38e(%rip),%xmm7 # 2c9a0 <_sk_overlay_sse2_8bit+0x14bb>
.byte 68,15,88,199 // addps %xmm7,%xmm8
.byte 68,15,41,68,36,176 // movaps %xmm8,-0x50(%rsp)
.byte 68,15,88,207 // addps %xmm7,%xmm9
@@ -42217,7 +42506,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,234 // unpcklps %xmm2,%xmm13
.byte 68,15,20,239 // unpcklps %xmm7,%xmm13
.byte 102,15,111,208 // movdqa %xmm0,%xmm2
- .byte 102,15,254,21,69,172,0,0 // paddd 0xac45(%rip),%xmm2 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,21,85,172,0,0 // paddd 0xac55(%rip),%xmm2 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -42234,7 +42523,7 @@ _sk_clut_4D_sse2:
.byte 243,70,15,16,12,139 // movss (%rbx,%r9,4),%xmm9
.byte 65,15,20,209 // unpcklps %xmm9,%xmm2
.byte 15,20,215 // unpcklps %xmm7,%xmm2
- .byte 102,15,254,5,26,172,0,0 // paddd 0xac1a(%rip),%xmm0 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,5,42,172,0,0 // paddd 0xac2a(%rip),%xmm0 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,248,78 // pshufd $0x4e,%xmm0,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,194 // movq %xmm0,%r10
@@ -42275,7 +42564,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
.byte 102,15,254,92,36,160 // paddd -0x60(%rsp),%xmm3
.byte 102,15,112,227,245 // pshufd $0xf5,%xmm3,%xmm4
- .byte 102,68,15,111,53,214,177,0,0 // movdqa 0xb1d6(%rip),%xmm14 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,68,15,111,53,230,177,0,0 // movdqa 0xb1e6(%rip),%xmm14 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,65,15,244,222 // pmuludq %xmm14,%xmm3
.byte 102,15,112,219,232 // pshufd $0xe8,%xmm3,%xmm3
.byte 102,65,15,244,230 // pmuludq %xmm14,%xmm4
@@ -42296,7 +42585,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,228 // unpcklps %xmm4,%xmm12
.byte 68,15,20,229 // unpcklps %xmm5,%xmm12
.byte 102,15,111,227 // movdqa %xmm3,%xmm4
- .byte 102,15,111,61,223,170,0,0 // movdqa 0xaadf(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,61,239,170,0,0 // movdqa 0xaaef(%rip),%xmm7 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,231 // paddd %xmm7,%xmm4
.byte 102,15,112,236,78 // pshufd $0x4e,%xmm4,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -42314,7 +42603,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,245 // unpcklps %xmm5,%xmm6
.byte 15,20,244 // unpcklps %xmm4,%xmm6
- .byte 102,68,15,111,5,176,170,0,0 // movdqa 0xaab0(%rip),%xmm8 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,5,192,170,0,0 // movdqa 0xaac0(%rip),%xmm8 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,65,15,254,216 // paddd %xmm8,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -42428,7 +42717,7 @@ _sk_clut_4D_sse2:
.byte 102,68,15,111,108,36,160 // movdqa -0x60(%rsp),%xmm13
.byte 102,65,15,254,205 // paddd %xmm13,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,28,175,0,0 // movdqa 0xaf1c(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,29,44,175,0,0 // movdqa 0xaf2c(%rip),%xmm3 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -42450,7 +42739,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,205 // unpcklps %xmm5,%xmm9
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
- .byte 102,15,111,29,35,168,0,0 // movdqa 0xa823(%rip),%xmm3 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,29,51,168,0,0 // movdqa 0xa833(%rip),%xmm3 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,211 // paddd %xmm3,%xmm2
.byte 102,15,112,234,78 // pshufd $0x4e,%xmm2,%xmm5
.byte 102,73,15,126,233 // movq %xmm5,%r9
@@ -42558,7 +42847,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,211 // movdqa %xmm11,%xmm2
.byte 102,65,15,254,213 // paddd %xmm13,%xmm2
.byte 102,15,112,218,245 // pshufd $0xf5,%xmm2,%xmm3
- .byte 102,15,111,5,228,172,0,0 // movdqa 0xace4(%rip),%xmm0 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,5,244,172,0,0 // movdqa 0xacf4(%rip),%xmm0 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,208 // pmuludq %xmm0,%xmm2
.byte 102,15,112,250,232 // pshufd $0xe8,%xmm2,%xmm7
.byte 102,15,244,216 // pmuludq %xmm0,%xmm3
@@ -42579,7 +42868,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 68,15,20,203 // unpcklps %xmm3,%xmm9
.byte 102,15,111,215 // movdqa %xmm7,%xmm2
- .byte 102,15,111,5,239,165,0,0 // movdqa 0xa5ef(%rip),%xmm0 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,5,255,165,0,0 // movdqa 0xa5ff(%rip),%xmm0 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,208 // paddd %xmm0,%xmm2
.byte 102,15,112,218,78 // pshufd $0x4e,%xmm2,%xmm3
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -42597,7 +42886,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,28,139 // movss (%rbx,%r9,4),%xmm3
.byte 15,20,243 // unpcklps %xmm3,%xmm6
.byte 15,20,242 // unpcklps %xmm2,%xmm6
- .byte 102,68,15,111,45,192,165,0,0 // movdqa 0xa5c0(%rip),%xmm13 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,45,208,165,0,0 // movdqa 0xa5d0(%rip),%xmm13 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,65,15,254,253 // paddd %xmm13,%xmm7
.byte 102,15,112,215,78 // pshufd $0x4e,%xmm7,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
@@ -42617,7 +42906,7 @@ _sk_clut_4D_sse2:
.byte 15,20,250 // unpcklps %xmm2,%xmm7
.byte 102,68,15,254,220 // paddd %xmm4,%xmm11
.byte 102,65,15,112,219,245 // pshufd $0xf5,%xmm11,%xmm3
- .byte 102,15,111,37,214,171,0,0 // movdqa 0xabd6(%rip),%xmm4 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,37,230,171,0,0 // movdqa 0xabe6(%rip),%xmm4 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,68,15,244,220 // pmuludq %xmm4,%xmm11
.byte 102,65,15,112,211,232 // pshufd $0xe8,%xmm11,%xmm2
.byte 102,15,244,220 // pmuludq %xmm4,%xmm3
@@ -42718,7 +43007,7 @@ _sk_clut_4D_sse2:
.byte 102,65,15,111,202 // movdqa %xmm10,%xmm1
.byte 102,15,254,200 // paddd %xmm0,%xmm1
.byte 102,15,112,209,245 // pshufd $0xf5,%xmm1,%xmm2
- .byte 102,15,111,29,24,170,0,0 // movdqa 0xaa18(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,29,40,170,0,0 // movdqa 0xaa28(%rip),%xmm3 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
.byte 102,15,112,201,232 // pshufd $0xe8,%xmm1,%xmm1
.byte 102,15,244,211 // pmuludq %xmm3,%xmm2
@@ -42740,7 +43029,7 @@ _sk_clut_4D_sse2:
.byte 15,20,212 // unpcklps %xmm4,%xmm2
.byte 15,20,211 // unpcklps %xmm3,%xmm2
.byte 102,15,111,217 // movdqa %xmm1,%xmm3
- .byte 102,15,111,61,33,163,0,0 // movdqa 0xa321(%rip),%xmm7 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,61,49,163,0,0 // movdqa 0xa331(%rip),%xmm7 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,223 // paddd %xmm7,%xmm3
.byte 102,15,112,227,78 // pshufd $0x4e,%xmm3,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -42758,7 +43047,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,44,139 // movss (%rbx,%r9,4),%xmm5
.byte 15,20,221 // unpcklps %xmm5,%xmm3
.byte 15,20,220 // unpcklps %xmm4,%xmm3
- .byte 102,68,15,111,13,242,162,0,0 // movdqa 0xa2f2(%rip),%xmm9 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,68,15,111,13,2,163,0,0 // movdqa 0xa302(%rip),%xmm9 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,65,15,254,201 // paddd %xmm9,%xmm1
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,73,15,126,225 // movq %xmm4,%r9
@@ -42870,7 +43159,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,246 // unpcklps %xmm6,%xmm14
.byte 68,15,20,243 // unpcklps %xmm3,%xmm14
.byte 102,15,111,220 // movdqa %xmm4,%xmm3
- .byte 102,68,15,111,21,229,160,0,0 // movdqa 0xa0e5(%rip),%xmm10 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,21,245,160,0,0 // movdqa 0xa0f5(%rip),%xmm10 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,218 // paddd %xmm10,%xmm3
.byte 102,15,112,243,78 // pshufd $0x4e,%xmm3,%xmm6
.byte 102,73,15,126,241 // movq %xmm6,%r9
@@ -42991,7 +43280,7 @@ _sk_clut_4D_sse2:
.byte 102,15,111,116,36,160 // movdqa -0x60(%rsp),%xmm6
.byte 102,15,254,198 // paddd %xmm6,%xmm0
.byte 102,15,112,200,245 // pshufd $0xf5,%xmm0,%xmm1
- .byte 102,15,111,29,95,165,0,0 // movdqa 0xa55f(%rip),%xmm3 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,29,111,165,0,0 // movdqa 0xa56f(%rip),%xmm3 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,195 // pmuludq %xmm3,%xmm0
.byte 102,15,112,208,232 // pshufd $0xe8,%xmm0,%xmm2
.byte 102,15,244,203 // pmuludq %xmm3,%xmm1
@@ -43013,7 +43302,7 @@ _sk_clut_4D_sse2:
.byte 15,20,195 // unpcklps %xmm3,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
.byte 102,15,111,202 // movdqa %xmm2,%xmm1
- .byte 102,68,15,111,5,103,158,0,0 // movdqa 0x9e67(%rip),%xmm8 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,68,15,111,5,119,158,0,0 // movdqa 0x9e77(%rip),%xmm8 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,65,15,254,200 // paddd %xmm8,%xmm1
.byte 102,15,112,217,78 // pshufd $0x4e,%xmm1,%xmm3
.byte 102,73,15,126,217 // movq %xmm3,%r9
@@ -43119,7 +43408,7 @@ _sk_clut_4D_sse2:
.byte 102,15,254,124,36,128 // paddd -0x80(%rsp),%xmm7
.byte 102,15,254,247 // paddd %xmm7,%xmm6
.byte 102,15,112,206,245 // pshufd $0xf5,%xmm6,%xmm1
- .byte 102,15,111,21,41,163,0,0 // movdqa 0xa329(%rip),%xmm2 # 2c470 <_sk_overlay_sse2_8bit+0x14bb>
+ .byte 102,15,111,21,57,163,0,0 // movdqa 0xa339(%rip),%xmm2 # 2c9b0 <_sk_overlay_sse2_8bit+0x14cb>
.byte 102,15,244,242 // pmuludq %xmm2,%xmm6
.byte 102,15,112,198,232 // pshufd $0xe8,%xmm6,%xmm0
.byte 102,15,244,202 // pmuludq %xmm2,%xmm1
@@ -43141,7 +43430,7 @@ _sk_clut_4D_sse2:
.byte 68,15,20,201 // unpcklps %xmm1,%xmm9
.byte 68,15,20,202 // unpcklps %xmm2,%xmm9
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,15,254,13,48,156,0,0 // paddd 0x9c30(%rip),%xmm1 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,254,13,64,156,0,0 // paddd 0x9c40(%rip),%xmm1 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,112,209,78 // pshufd $0x4e,%xmm1,%xmm2
.byte 102,73,15,126,209 // movq %xmm2,%r9
.byte 102,73,15,126,202 // movq %xmm1,%r10
@@ -43197,7 +43486,7 @@ _sk_clut_4D_sse2:
.byte 243,66,15,16,60,139 // movss (%rbx,%r9,4),%xmm7
.byte 15,20,199 // unpcklps %xmm7,%xmm0
.byte 15,20,193 // unpcklps %xmm1,%xmm0
- .byte 102,15,111,53,54,155,0,0 // movdqa 0x9b36(%rip),%xmm6 # 2bde0 <_sk_overlay_sse2_8bit+0xe2b>
+ .byte 102,15,111,53,70,155,0,0 // movdqa 0x9b46(%rip),%xmm6 # 2c320 <_sk_overlay_sse2_8bit+0xe3b>
.byte 102,15,254,242 // paddd %xmm2,%xmm6
.byte 102,15,112,206,78 // pshufd $0x4e,%xmm6,%xmm1
.byte 102,73,15,126,201 // movq %xmm1,%r9
@@ -43215,7 +43504,7 @@ _sk_clut_4D_sse2:
.byte 243,70,15,16,60,139 // movss (%rbx,%r9,4),%xmm15
.byte 65,15,20,207 // unpcklps %xmm15,%xmm1
.byte 15,20,207 // unpcklps %xmm7,%xmm1
- .byte 102,15,254,21,7,155,0,0 // paddd 0x9b07(%rip),%xmm2 # 2be00 <_sk_overlay_sse2_8bit+0xe4b>
+ .byte 102,15,254,21,23,155,0,0 // paddd 0x9b17(%rip),%xmm2 # 2c340 <_sk_overlay_sse2_8bit+0xe5b>
.byte 102,15,112,250,78 // pshufd $0x4e,%xmm2,%xmm7
.byte 102,73,15,126,249 // movq %xmm7,%r9
.byte 102,73,15,126,210 // movq %xmm2,%r10
@@ -43277,7 +43566,7 @@ _sk_clut_4D_sse2:
.byte 15,89,212 // mulps %xmm4,%xmm2
.byte 65,15,88,213 // addps %xmm13,%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,29,236,153,0,0 // movaps 0x99ec(%rip),%xmm3 # 2bdd0 <_sk_overlay_sse2_8bit+0xe1b>
+ .byte 15,40,29,252,153,0,0 // movaps 0x99fc(%rip),%xmm3 # 2c310 <_sk_overlay_sse2_8bit+0xe2b>
.byte 15,40,100,36,112 // movaps 0x70(%rsp),%xmm4
.byte 15,40,172,36,128,0,0,0 // movaps 0x80(%rsp),%xmm5
.byte 15,40,180,36,144,0,0,0 // movaps 0x90(%rsp),%xmm6
@@ -43308,7 +43597,7 @@ _sk_start_pipeline_hsw_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 224a1 <_sk_start_pipeline_hsw_8bit+0x95>
+ .byte 115,102 // jae 229d1 <_sk_start_pipeline_hsw_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,16 // lea 0x10(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -43318,7 +43607,7 @@ _sk_start_pipeline_hsw_8bit:
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
.byte 72,57,93,176 // cmp %rbx,-0x50(%rbp)
- .byte 119,30 // ja 22483 <_sk_start_pipeline_hsw_8bit+0x77>
+ .byte 119,30 // ja 229b3 <_sk_start_pipeline_hsw_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -43327,17 +43616,17 @@ _sk_start_pipeline_hsw_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,32 // add $0x20,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 22465 <_sk_start_pipeline_hsw_8bit+0x59>
+ .byte 118,226 // jbe 22995 <_sk_start_pipeline_hsw_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 22498 <_sk_start_pipeline_hsw_8bit+0x8c>
+ .byte 116,13 // je 229c8 <_sk_start_pipeline_hsw_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 2244b <_sk_start_pipeline_hsw_8bit+0x3f>
+ .byte 117,170 // jne 2297b <_sk_start_pipeline_hsw_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -43369,7 +43658,7 @@ HIDDEN _sk_set_rgb_hsw_8bit
FUNCTION(_sk_set_rgb_hsw_8bit)
_sk_set_rgb_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 197,250,16,37,86,143,0,0 // vmovss 0x8f56(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,250,16,37,86,143,0,0 // vmovss 0x8f56(%rip),%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,218,89,40 // vmulss (%rax),%xmm4,%xmm5
.byte 196,225,250,44,205 // vcvttss2si %xmm5,%rcx
.byte 197,218,89,104,4 // vmulss 0x4(%rax),%xmm4,%xmm5
@@ -43382,7 +43671,7 @@ _sk_set_rgb_hsw_8bit:
.byte 9,208 // or %edx,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,88,228 // vpbroadcastd %xmm4,%ymm4
- .byte 197,253,111,45,154,148,0,0 // vmovdqa 0x949a(%rip),%ymm5 # 2b9a0 <_sk_overlay_sse2_8bit+0x9eb>
+ .byte 197,253,111,45,170,148,0,0 // vmovdqa 0x94aa(%rip),%ymm5 # 2bee0 <_sk_overlay_sse2_8bit+0x9fb>
.byte 197,245,219,205 // vpand %ymm5,%ymm1,%ymm1
.byte 197,253,219,197 // vpand %ymm5,%ymm0,%ymm0
.byte 197,221,235,192 // vpor %ymm0,%ymm4,%ymm0
@@ -43394,10 +43683,10 @@ HIDDEN _sk_premul_hsw_8bit
.globl _sk_premul_hsw_8bit
FUNCTION(_sk_premul_hsw_8bit)
_sk_premul_hsw_8bit:
- .byte 197,253,111,37,158,148,0,0 // vmovdqa 0x949e(%rip),%ymm4 # 2b9c0 <_sk_overlay_sse2_8bit+0xa0b>
+ .byte 197,253,111,37,174,148,0,0 // vmovdqa 0x94ae(%rip),%ymm4 # 2bf00 <_sk_overlay_sse2_8bit+0xa1b>
.byte 196,226,125,0,236 // vpshufb %ymm4,%ymm0,%ymm5
.byte 196,226,117,0,228 // vpshufb %ymm4,%ymm1,%ymm4
- .byte 197,253,111,53,172,148,0,0 // vmovdqa 0x94ac(%rip),%ymm6 # 2b9e0 <_sk_overlay_sse2_8bit+0xa2b>
+ .byte 197,253,111,53,188,148,0,0 // vmovdqa 0x94bc(%rip),%ymm6 # 2bf20 <_sk_overlay_sse2_8bit+0xa3b>
.byte 197,221,235,230 // vpor %ymm6,%ymm4,%ymm4
.byte 197,213,235,238 // vpor %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -43437,7 +43726,7 @@ HIDDEN _sk_swap_rb_hsw_8bit
.globl _sk_swap_rb_hsw_8bit
FUNCTION(_sk_swap_rb_hsw_8bit)
_sk_swap_rb_hsw_8bit:
- .byte 197,253,111,37,36,148,0,0 // vmovdqa 0x9424(%rip),%ymm4 # 2ba00 <_sk_overlay_sse2_8bit+0xa4b>
+ .byte 197,253,111,37,52,148,0,0 // vmovdqa 0x9434(%rip),%ymm4 # 2bf40 <_sk_overlay_sse2_8bit+0xa5b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43466,7 +43755,7 @@ _sk_load_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 2262c <_sk_load_8888_hsw_8bit+0x32>
+ .byte 117,17 // jne 22b5c <_sk_load_8888_hsw_8bit+0x32>
.byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43476,14 +43765,14 @@ _sk_load_8888_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,231 // ja 22628 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 119,231 // ja 22b58 <_sk_load_8888_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22764 <_sk_load_8888_hsw_8bit+0x16a>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22c94 <_sk_load_8888_hsw_8bit+0x16a>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 235,203 // jmp 22b58 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43491,7 +43780,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,162 // jmp 22628 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 235,162 // jmp 22b58 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43504,7 +43793,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,83,255,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 233,83,255,255,255 // jmpq 22b58 <_sk_load_8888_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43513,7 +43802,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,23,255,255,255 // jmpq 22622 <_sk_load_8888_hsw_8bit+0x28>
+ .byte 233,23,255,255,255 // jmpq 22b52 <_sk_load_8888_hsw_8bit+0x28>
.byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43527,7 +43816,7 @@ _sk_load_8888_hsw_8bit:
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,199,254,255,255 // jmpq 22628 <_sk_load_8888_hsw_8bit+0x2e>
+ .byte 233,199,254,255,255 // jmpq 22b58 <_sk_load_8888_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -43580,7 +43869,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 227d2 <_sk_load_8888_dst_hsw_8bit+0x32>
+ .byte 117,17 // jne 22d02 <_sk_load_8888_dst_hsw_8bit+0x32>
.byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43590,14 +43879,14 @@ _sk_load_8888_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,231 // ja 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 119,231 // ja 22cfe <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22908 <_sk_load_8888_dst_hsw_8bit+0x168>
+ .byte 72,141,13,22,1,0,0 // lea 0x116(%rip),%rcx # 22e38 <_sk_load_8888_dst_hsw_8bit+0x168>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 235,203 // jmp 22cfe <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43605,7 +43894,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,162 // jmp 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 235,162 // jmp 22cfe <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43618,7 +43907,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,83,255,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 233,83,255,255,255 // jmpq 22cfe <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43627,7 +43916,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,23,255,255,255 // jmpq 227c8 <_sk_load_8888_dst_hsw_8bit+0x28>
+ .byte 233,23,255,255,255 // jmpq 22cf8 <_sk_load_8888_dst_hsw_8bit+0x28>
.byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43641,7 +43930,7 @@ _sk_load_8888_dst_hsw_8bit:
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,199,254,255,255 // jmpq 227ce <_sk_load_8888_dst_hsw_8bit+0x2e>
+ .byte 233,199,254,255,255 // jmpq 22cfe <_sk_load_8888_dst_hsw_8bit+0x2e>
.byte 144 // nop
.byte 243,254 // repz (bad)
.byte 255 // (bad)
@@ -43694,7 +43983,7 @@ _sk_store_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 22976 <_sk_store_8888_hsw_8bit+0x32>
+ .byte 117,17 // jne 22ea6 <_sk_store_8888_hsw_8bit+0x32>
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
.byte 196,161,126,127,76,130,32 // vmovdqu %ymm1,0x20(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43702,17 +43991,17 @@ _sk_store_8888_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 22972 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 119,239 // ja 22ea2 <_sk_store_8888_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22a40 <_sk_store_8888_hsw_8bit+0xfc>
+ .byte 72,141,13,178,0,0,0 // lea 0xb2(%rip),%rcx # 22f70 <_sk_store_8888_hsw_8bit+0xfc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,4,130 // vmovd %xmm0,(%rdx,%r8,4)
- .byte 235,211 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,211 // jmp 22ea2 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,163,121,22,68,130,8,2 // vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
.byte 196,161,121,214,4,130 // vmovq %xmm0,(%rdx,%r8,4)
- .byte 235,195 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,195 // jmp 22ea2 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,163,121,22,100,130,24,2 // vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4)
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
@@ -43720,12 +44009,12 @@ _sk_store_8888_hsw_8bit:
.byte 196,227,125,57,196,1 // vextracti128 $0x1,%ymm0,%xmm4
.byte 196,161,121,126,100,130,16 // vmovd %xmm4,0x10(%rdx,%r8,4)
.byte 196,161,122,127,4,130 // vmovdqu %xmm0,(%rdx,%r8,4)
- .byte 235,146 // jmp 22972 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 235,146 // jmp 22ea2 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,163,121,22,76,130,40,2 // vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4)
.byte 196,163,121,22,76,130,36,1 // vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4)
.byte 196,161,121,126,76,130,32 // vmovd %xmm1,0x20(%rdx,%r8,4)
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
- .byte 233,112,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 233,112,255,255,255 // jmpq 22ea2 <_sk_store_8888_hsw_8bit+0x2e>
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
.byte 196,163,121,22,100,130,56,2 // vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4)
.byte 196,227,125,57,204,1 // vextracti128 $0x1,%ymm1,%xmm4
@@ -43734,7 +44023,7 @@ _sk_store_8888_hsw_8bit:
.byte 196,161,121,126,100,130,48 // vmovd %xmm4,0x30(%rdx,%r8,4)
.byte 196,161,126,127,4,130 // vmovdqu %ymm0,(%rdx,%r8,4)
.byte 196,161,122,127,76,130,32 // vmovdqu %xmm1,0x20(%rdx,%r8,4)
- .byte 233,53,255,255,255 // jmpq 22972 <_sk_store_8888_hsw_8bit+0x2e>
+ .byte 233,53,255,255,255 // jmpq 22ea2 <_sk_store_8888_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 87 // push %rdi
.byte 255 // (bad)
@@ -43747,7 +44036,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 22a55 <_sk_store_8888_hsw_8bit+0x111>
+ .byte 125,255 // jge 22f85 <_sk_store_8888_hsw_8bit+0x111>
.byte 255 // (bad)
.byte 255,111,255 // ljmp *-0x1(%rdi)
.byte 255 // (bad)
@@ -43758,7 +44047,7 @@ _sk_store_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 22a6d <_sk_store_8888_hsw_8bit+0x129>
+ .byte 235,255 // jmp 22f9d <_sk_store_8888_hsw_8bit+0x129>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 222,255 // fdivrp %st,%st(7)
@@ -43784,10 +44073,10 @@ _sk_load_bgra_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 22ac0 <_sk_load_bgra_hsw_8bit+0x44>
+ .byte 117,35 // jne 22ff0 <_sk_load_bgra_hsw_8bit+0x44>
.byte 196,161,126,111,76,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm1
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
- .byte 197,253,111,37,110,143,0,0 // vmovdqa 0x8f6e(%rip),%ymm4 # 2ba20 <_sk_overlay_sse2_8bit+0xa6b>
+ .byte 197,253,111,37,126,143,0,0 // vmovdqa 0x8f7e(%rip),%ymm4 # 2bf60 <_sk_overlay_sse2_8bit+0xa7b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43797,14 +44086,14 @@ _sk_load_bgra_hsw_8bit:
.byte 197,253,239,192 // vpxor %ymm0,%ymm0,%ymm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,213 // ja 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 119,213 // ja 22fda <_sk_load_bgra_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22bf8 <_sk_load_bgra_hsw_8bit+0x17c>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 23128 <_sk_load_bgra_hsw_8bit+0x17c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,4,130 // vmovd (%rdx,%r8,4),%xmm0
- .byte 235,185 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 235,185 // jmp 22fda <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43812,7 +44101,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,125,2,196,3 // vpblendd $0x3,%ymm4,%ymm0,%ymm0
- .byte 235,144 // jmp 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 235,144 // jmp 22fda <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43825,7 +44114,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,125,56,196,1 // vinserti128 $0x1,%xmm4,%ymm0,%ymm0
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,192,240 // vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- .byte 233,65,255,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 233,65,255,255,255 // jmpq 22fda <_sk_load_bgra_hsw_8bit+0x2e>
.byte 196,161,121,110,68,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm0
.byte 196,226,121,89,192 // vpbroadcastq %xmm0,%xmm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43834,7 +44123,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,227,117,2,200,15 // vpblendd $0xf,%ymm0,%ymm1,%ymm1
.byte 196,161,121,110,68,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm0
.byte 196,227,117,2,200,1 // vpblendd $0x1,%ymm0,%ymm1,%ymm1
- .byte 233,5,255,255,255 // jmpq 22aa4 <_sk_load_bgra_hsw_8bit+0x28>
+ .byte 233,5,255,255,255 // jmpq 22fd4 <_sk_load_bgra_hsw_8bit+0x28>
.byte 196,161,121,110,68,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm0
.byte 196,226,125,89,192 // vpbroadcastq %xmm0,%ymm0
.byte 197,245,239,201 // vpxor %ymm1,%ymm1,%ymm1
@@ -43848,7 +44137,7 @@ _sk_load_bgra_hsw_8bit:
.byte 196,161,126,111,4,130 // vmovdqu (%rdx,%r8,4),%ymm0
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,201,240 // vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- .byte 233,181,254,255,255 // jmpq 22aaa <_sk_load_bgra_hsw_8bit+0x2e>
+ .byte 233,181,254,255,255 // jmpq 22fda <_sk_load_bgra_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -43899,10 +44188,10 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 22c78 <_sk_load_bgra_dst_hsw_8bit+0x44>
+ .byte 117,35 // jne 231a8 <_sk_load_bgra_dst_hsw_8bit+0x44>
.byte 196,161,126,111,92,130,32 // vmovdqu 0x20(%rdx,%r8,4),%ymm3
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
- .byte 197,253,111,37,214,141,0,0 // vmovdqa 0x8dd6(%rip),%ymm4 # 2ba40 <_sk_overlay_sse2_8bit+0xa8b>
+ .byte 197,253,111,37,230,141,0,0 // vmovdqa 0x8de6(%rip),%ymm4 # 2bf80 <_sk_overlay_sse2_8bit+0xa9b>
.byte 196,226,109,0,212 // vpshufb %ymm4,%ymm2,%ymm2
.byte 196,226,101,0,220 // vpshufb %ymm4,%ymm3,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -43912,14 +44201,14 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 197,237,239,210 // vpxor %ymm2,%ymm2,%ymm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,213 // ja 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 119,213 // ja 23192 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 22db0 <_sk_load_bgra_dst_hsw_8bit+0x17c>
+ .byte 72,141,13,24,1,0,0 // lea 0x118(%rip),%rcx # 232e0 <_sk_load_bgra_dst_hsw_8bit+0x17c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,110,20,130 // vmovd (%rdx,%r8,4),%xmm2
- .byte 235,185 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 235,185 // jmp 23192 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,8 // vmovd 0x8(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43927,7 +44216,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,162,121,53,36,130 // vpmovzxdq (%rdx,%r8,4),%xmm4
.byte 197,249,112,228,232 // vpshufd $0xe8,%xmm4,%xmm4
.byte 196,227,109,2,212,3 // vpblendd $0x3,%ymm4,%ymm2,%ymm2
- .byte 235,144 // jmp 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 235,144 // jmp 23192 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,24 // vmovd 0x18(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43940,7 +44229,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,109,56,212,1 // vinserti128 $0x1,%xmm4,%ymm2,%ymm2
.byte 196,161,122,111,36,130 // vmovdqu (%rdx,%r8,4),%xmm4
.byte 196,227,93,2,210,240 // vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- .byte 233,65,255,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 233,65,255,255,255 // jmpq 23192 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 196,161,121,110,84,130,40 // vmovd 0x28(%rdx,%r8,4),%xmm2
.byte 196,226,121,89,210 // vpbroadcastq %xmm2,%xmm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43949,7 +44238,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,227,101,2,218,15 // vpblendd $0xf,%ymm2,%ymm3,%ymm3
.byte 196,161,121,110,84,130,32 // vmovd 0x20(%rdx,%r8,4),%xmm2
.byte 196,227,101,2,218,1 // vpblendd $0x1,%ymm2,%ymm3,%ymm3
- .byte 233,5,255,255,255 // jmpq 22c5c <_sk_load_bgra_dst_hsw_8bit+0x28>
+ .byte 233,5,255,255,255 // jmpq 2318c <_sk_load_bgra_dst_hsw_8bit+0x28>
.byte 196,161,121,110,84,130,56 // vmovd 0x38(%rdx,%r8,4),%xmm2
.byte 196,226,125,89,210 // vpbroadcastq %xmm2,%ymm2
.byte 197,229,239,219 // vpxor %ymm3,%ymm3,%ymm3
@@ -43963,7 +44252,7 @@ _sk_load_bgra_dst_hsw_8bit:
.byte 196,161,126,111,20,130 // vmovdqu (%rdx,%r8,4),%ymm2
.byte 196,161,122,111,100,130,32 // vmovdqu 0x20(%rdx,%r8,4),%xmm4
.byte 196,227,93,2,219,240 // vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- .byte 233,181,254,255,255 // jmpq 22c62 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ .byte 233,181,254,255,255 // jmpq 23192 <_sk_load_bgra_dst_hsw_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 241 // icebp
.byte 254 // (bad)
@@ -44013,11 +44302,11 @@ _sk_store_bgra_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 197,253,111,37,80,140,0,0 // vmovdqa 0x8c50(%rip),%ymm4 # 2ba60 <_sk_overlay_sse2_8bit+0xaab>
+ .byte 197,253,111,37,96,140,0,0 // vmovdqa 0x8c60(%rip),%ymm4 # 2bfa0 <_sk_overlay_sse2_8bit+0xabb>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 22e30 <_sk_store_bgra_hsw_8bit+0x44>
+ .byte 117,17 // jne 23360 <_sk_store_bgra_hsw_8bit+0x44>
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
.byte 196,161,126,127,108,130,32 // vmovdqu %ymm5,0x20(%rdx,%r8,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44025,17 +44314,17 @@ _sk_store_bgra_hsw_8bit:
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 22e2c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 119,239 // ja 2335c <_sk_store_bgra_hsw_8bit+0x40>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 22ef8 <_sk_store_bgra_hsw_8bit+0x10c>
+ .byte 72,141,13,176,0,0,0 // lea 0xb0(%rip),%rcx # 23428 <_sk_store_bgra_hsw_8bit+0x10c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,36,130 // vmovd %xmm4,(%rdx,%r8,4)
- .byte 235,211 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,211 // jmp 2335c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,163,121,22,100,130,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4)
.byte 196,161,121,214,36,130 // vmovq %xmm4,(%rdx,%r8,4)
- .byte 235,195 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,195 // jmp 2335c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,163,121,22,108,130,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -44043,12 +44332,12 @@ _sk_store_bgra_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,161,121,126,108,130,16 // vmovd %xmm5,0x10(%rdx,%r8,4)
.byte 196,161,122,127,36,130 // vmovdqu %xmm4,(%rdx,%r8,4)
- .byte 235,146 // jmp 22e2c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 235,146 // jmp 2335c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,163,121,22,108,130,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4)
.byte 196,163,121,22,108,130,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4)
.byte 196,161,121,126,108,130,32 // vmovd %xmm5,0x20(%rdx,%r8,4)
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
- .byte 233,112,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 233,112,255,255,255 // jmpq 2335c <_sk_store_bgra_hsw_8bit+0x40>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,163,121,22,116,130,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -44057,7 +44346,7 @@ _sk_store_bgra_hsw_8bit:
.byte 196,161,121,126,116,130,48 // vmovd %xmm6,0x30(%rdx,%r8,4)
.byte 196,161,126,127,36,130 // vmovdqu %ymm4,(%rdx,%r8,4)
.byte 196,161,122,127,108,130,32 // vmovdqu %xmm5,0x20(%rdx,%r8,4)
- .byte 233,53,255,255,255 // jmpq 22e2c <_sk_store_bgra_hsw_8bit+0x40>
+ .byte 233,53,255,255,255 // jmpq 2335c <_sk_store_bgra_hsw_8bit+0x40>
.byte 144 // nop
.byte 89 // pop %rcx
.byte 255 // (bad)
@@ -44070,7 +44359,7 @@ _sk_store_bgra_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,255 // jg 22f0d <_sk_store_bgra_hsw_8bit+0x121>
+ .byte 127,255 // jg 2343d <_sk_store_bgra_hsw_8bit+0x121>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -44108,7 +44397,7 @@ _sk_load_a8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 22f74 <_sk_load_a8_hsw_8bit+0x40>
+ .byte 117,35 // jne 234a4 <_sk_load_a8_hsw_8bit+0x40>
.byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0
.byte 197,249,112,200,78 // vpshufd $0x4e,%xmm0,%xmm1
.byte 196,226,125,49,201 // vpmovzxbd %xmm1,%ymm1
@@ -44121,35 +44410,35 @@ _sk_load_a8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 22f57 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 119,210 // ja 23487 <_sk_load_a8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 23050 <_sk_load_a8_hsw_8bit+0x11c>
+ .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 23580 <_sk_load_a8_hsw_8bit+0x11c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,179 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,179 // jmp 23487 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 235,150 // jmp 22f57 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 235,150 // jmp 23487 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,105,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 23487 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,60,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,60,255,255,255 // jmpq 23487 <_sk_load_a8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -44157,7 +44446,7 @@ _sk_load_a8_hsw_8bit:
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,7,255,255,255 // jmpq 22f57 <_sk_load_a8_hsw_8bit+0x23>
+ .byte 233,7,255,255,255 // jmpq 23487 <_sk_load_a8_hsw_8bit+0x23>
.byte 73,255 // rex.WB (bad)
.byte 255 // (bad)
.byte 255,96,255 // jmpq *-0x1(%rax)
@@ -44167,7 +44456,7 @@ _sk_load_a8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 23065 <_sk_load_a8_hsw_8bit+0x131>
+ .byte 125,255 // jge 23595 <_sk_load_a8_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -44204,7 +44493,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 230cc <_sk_load_a8_dst_hsw_8bit+0x40>
+ .byte 117,35 // jne 235fc <_sk_load_a8_dst_hsw_8bit+0x40>
.byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2
.byte 197,249,112,218,78 // vpshufd $0x4e,%xmm2,%xmm3
.byte 196,226,125,49,219 // vpmovzxbd %xmm3,%ymm3
@@ -44217,35 +44506,35 @@ _sk_load_a8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,210 // ja 230af <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 119,210 // ja 235df <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 231a8 <_sk_load_a8_dst_hsw_8bit+0x11c>
+ .byte 72,141,13,192,0,0,0 // lea 0xc0(%rip),%rcx # 236d8 <_sk_load_a8_dst_hsw_8bit+0x11c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,179 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,179 // jmp 235df <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 235,150 // jmp 230af <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 235,150 // jmp 235df <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,105,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,105,255,255,255 // jmpq 235df <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,60,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,60,255,255,255 // jmpq 235df <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -44253,7 +44542,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,7,255,255,255 // jmpq 230af <_sk_load_a8_dst_hsw_8bit+0x23>
+ .byte 233,7,255,255,255 // jmpq 235df <_sk_load_a8_dst_hsw_8bit+0x23>
.byte 73,255 // rex.WB (bad)
.byte 255 // (bad)
.byte 255,96,255 // jmpq *-0x1(%rax)
@@ -44263,7 +44552,7 @@ _sk_load_a8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 125,255 // jge 231bd <_sk_load_a8_dst_hsw_8bit+0x131>
+ .byte 125,255 // jge 236ed <_sk_load_a8_dst_hsw_8bit+0x131>
.byte 255 // (bad)
.byte 255,113,255 // pushq -0x1(%rcx)
.byte 255 // (bad)
@@ -44299,49 +44588,49 @@ _sk_store_a8_hsw_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 197,253,111,37,124,136,0,0 // vmovdqa 0x887c(%rip),%ymm4 # 2ba80 <_sk_overlay_sse2_8bit+0xacb>
+ .byte 197,253,111,37,140,136,0,0 // vmovdqa 0x888c(%rip),%ymm4 # 2bfc0 <_sk_overlay_sse2_8bit+0xadb>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,227,253,0,237,232 // vpermq $0xe8,%ymm5,%ymm5
- .byte 197,249,111,53,121,146,0,0 // vmovdqa 0x9279(%rip),%xmm6 # 2c490 <_sk_overlay_sse2_8bit+0x14db>
+ .byte 197,249,111,53,137,146,0,0 // vmovdqa 0x9289(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 196,226,81,0,238 // vpshufb %xmm6,%xmm5,%xmm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,227,253,0,228,232 // vpermq $0xe8,%ymm4,%ymm4
.byte 196,226,89,0,230 // vpshufb %xmm6,%xmm4,%xmm4
.byte 197,217,108,229 // vpunpcklqdq %xmm5,%xmm4,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,10 // jne 2323f <_sk_store_a8_hsw_8bit+0x5b>
+ .byte 117,10 // jne 2376f <_sk_store_a8_hsw_8bit+0x5b>
.byte 196,161,122,127,36,2 // vmovdqu %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,15 // and $0xf,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,239 // ja 2323b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 119,239 // ja 2376b <_sk_store_a8_hsw_8bit+0x57>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 232e0 <_sk_store_a8_hsw_8bit+0xfc>
+ .byte 72,141,13,137,0,0,0 // lea 0x89(%rip),%rcx # 23810 <_sk_store_a8_hsw_8bit+0xfc>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,163,121,20,36,2,0 // vpextrb $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,210 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,210 // jmp 2376b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,2,2 // vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1)
.byte 196,163,121,21,36,2,0 // vpextrw $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,193 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,193 // jmp 2376b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,6,6 // vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1)
.byte 196,163,121,20,100,2,5,5 // vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1)
.byte 196,163,121,20,100,2,4,4 // vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1)
.byte 196,161,121,126,36,2 // vmovd %xmm4,(%rdx,%r8,1)
- .byte 235,161 // jmp 2323b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 235,161 // jmp 2376b <_sk_store_a8_hsw_8bit+0x57>
.byte 196,163,121,20,100,2,10,10 // vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1)
.byte 196,163,121,20,100,2,9,9 // vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1)
.byte 196,163,121,20,100,2,8,8 // vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1)
- .byte 235,32 // jmp 232d4 <_sk_store_a8_hsw_8bit+0xf0>
+ .byte 235,32 // jmp 23804 <_sk_store_a8_hsw_8bit+0xf0>
.byte 196,163,121,20,100,2,14,14 // vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1)
.byte 196,163,121,20,100,2,13,13 // vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1)
.byte 196,163,121,20,100,2,12,12 // vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1)
.byte 196,163,121,22,100,2,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1)
.byte 196,161,121,214,36,2 // vmovq %xmm4,(%rdx,%r8,1)
- .byte 233,92,255,255,255 // jmpq 2323b <_sk_store_a8_hsw_8bit+0x57>
+ .byte 233,92,255,255,255 // jmpq 2376b <_sk_store_a8_hsw_8bit+0x57>
.byte 144 // nop
.byte 128,255,255 // cmp $0xff,%bh
.byte 255,145,255,255,255,137 // callq *-0x76000001(%rcx)
@@ -44389,15 +44678,15 @@ _sk_load_g8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,61 // jne 23376 <_sk_load_g8_hsw_8bit+0x5a>
+ .byte 117,61 // jne 238a6 <_sk_load_g8_hsw_8bit+0x5a>
.byte 196,161,122,111,4,2 // vmovdqu (%rdx,%r8,1),%xmm0
.byte 196,226,125,49,200 // vpmovzxbd %xmm0,%ymm1
.byte 197,249,112,192,78 // vpshufd $0x4e,%xmm0,%xmm0
.byte 196,226,125,49,192 // vpmovzxbd %xmm0,%ymm0
- .byte 196,226,125,88,37,49,130,0,0 // vpbroadcastd 0x8231(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3>
+ .byte 196,226,125,88,37,49,130,0,0 // vpbroadcastd 0x8231(%rip),%ymm4 # 2bab8 <_sk_overlay_sse2_8bit+0x5d3>
.byte 196,226,125,64,236 // vpmulld %ymm4,%ymm0,%ymm5
.byte 196,226,117,64,196 // vpmulld %ymm4,%ymm1,%ymm0
- .byte 196,226,125,88,13,34,130,0,0 // vpbroadcastd 0x8222(%rip),%ymm1 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,88,13,34,130,0,0 // vpbroadcastd 0x8222(%rip),%ymm1 # 2babc <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,253,235,193 // vpor %ymm1,%ymm0,%ymm0
.byte 197,213,235,201 // vpor %ymm1,%ymm5,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44406,35 +44695,35 @@ _sk_load_g8_hsw_8bit:
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,184 // ja 2333f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 119,184 // ja 2386f <_sk_load_g8_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23458 <_sk_load_g8_hsw_8bit+0x13c>
+ .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23988 <_sk_load_g8_hsw_8bit+0x13c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,192 // vmovd %eax,%xmm0
- .byte 235,153 // jmp 2333f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 235,153 // jmp 2386f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,200 // vmovd %eax,%xmm1
.byte 196,227,121,14,193,1 // vpblendw $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,121,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,121,255,255,255 // jmpq 2386f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,121,110,12,2 // vmovd (%rdx,%r8,1),%xmm1
.byte 196,227,121,2,193,1 // vpblendd $0x1,%xmm1,%xmm0,%xmm0
- .byte 233,76,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,76,255,255,255 // jmpq 2386f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,227,113,2,192,12 // vpblendd $0xc,%xmm0,%xmm1,%xmm0
- .byte 233,31,255,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,31,255,255,255 // jmpq 2386f <_sk_load_g8_hsw_8bit+0x23>
.byte 197,249,239,192 // vpxor %xmm0,%xmm0,%xmm0
.byte 196,163,121,32,68,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
.byte 196,163,121,32,68,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -44442,7 +44731,7 @@ _sk_load_g8_hsw_8bit:
.byte 196,161,122,126,12,2 // vmovq (%rdx,%r8,1),%xmm1
.byte 196,163,113,34,76,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
.byte 196,227,113,2,192,8 // vpblendd $0x8,%xmm0,%xmm1,%xmm0
- .byte 233,234,254,255,255 // jmpq 2333f <_sk_load_g8_hsw_8bit+0x23>
+ .byte 233,234,254,255,255 // jmpq 2386f <_sk_load_g8_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 67,255 // rex.XB (bad)
.byte 255 // (bad)
@@ -44454,7 +44743,7 @@ _sk_load_g8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 2346d <_sk_load_g8_hsw_8bit+0x151>
+ .byte 122,255 // jp 2399d <_sk_load_g8_hsw_8bit+0x151>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -44490,15 +44779,15 @@ _sk_load_g8_dst_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,61 // jne 234ee <_sk_load_g8_dst_hsw_8bit+0x5a>
+ .byte 117,61 // jne 23a1e <_sk_load_g8_dst_hsw_8bit+0x5a>
.byte 196,161,122,111,20,2 // vmovdqu (%rdx,%r8,1),%xmm2
.byte 196,226,125,49,218 // vpmovzxbd %xmm2,%ymm3
.byte 197,249,112,210,78 // vpshufd $0x4e,%xmm2,%xmm2
.byte 196,226,125,49,210 // vpmovzxbd %xmm2,%ymm2
- .byte 196,226,125,88,37,185,128,0,0 // vpbroadcastd 0x80b9(%rip),%ymm4 # 2b588 <_sk_overlay_sse2_8bit+0x5d3>
+ .byte 196,226,125,88,37,185,128,0,0 // vpbroadcastd 0x80b9(%rip),%ymm4 # 2bab8 <_sk_overlay_sse2_8bit+0x5d3>
.byte 196,226,109,64,236 // vpmulld %ymm4,%ymm2,%ymm5
.byte 196,226,101,64,212 // vpmulld %ymm4,%ymm3,%ymm2
- .byte 196,226,125,88,29,170,128,0,0 // vpbroadcastd 0x80aa(%rip),%ymm3 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,88,29,170,128,0,0 // vpbroadcastd 0x80aa(%rip),%ymm3 # 2babc <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,237,235,211 // vpor %ymm3,%ymm2,%ymm2
.byte 197,213,235,219 // vpor %ymm3,%ymm5,%ymm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44507,35 +44796,35 @@ _sk_load_g8_dst_hsw_8bit:
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 119,184 // ja 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 119,184 // ja 239e7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 235d0 <_sk_load_g8_dst_hsw_8bit+0x13c>
+ .byte 72,141,13,198,0,0,0 // lea 0xc6(%rip),%rcx # 23b00 <_sk_load_g8_dst_hsw_8bit+0x13c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,208 // vmovd %eax,%xmm2
- .byte 235,153 // jmp 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 235,153 // jmp 239e7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,216 // vmovd %eax,%xmm3
.byte 196,227,105,14,211,1 // vpblendw $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,121,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,121,255,255,255 // jmpq 239e7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,121,110,28,2 // vmovd (%rdx,%r8,1),%xmm3
.byte 196,227,105,2,211,1 // vpblendd $0x1,%xmm3,%xmm2,%xmm2
- .byte 233,76,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,76,255,255,255 // jmpq 239e7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,227,97,2,210,12 // vpblendd $0xc,%xmm2,%xmm3,%xmm2
- .byte 233,31,255,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,31,255,255,255 // jmpq 239e7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 197,233,239,210 // vpxor %xmm2,%xmm2,%xmm2
.byte 196,163,105,32,84,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
.byte 196,163,105,32,84,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -44543,7 +44832,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 196,161,122,126,28,2 // vmovq (%rdx,%r8,1),%xmm3
.byte 196,163,97,34,92,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
.byte 196,227,97,2,210,8 // vpblendd $0x8,%xmm2,%xmm3,%xmm2
- .byte 233,234,254,255,255 // jmpq 234b7 <_sk_load_g8_dst_hsw_8bit+0x23>
+ .byte 233,234,254,255,255 // jmpq 239e7 <_sk_load_g8_dst_hsw_8bit+0x23>
.byte 15,31,0 // nopl (%rax)
.byte 67,255 // rex.XB (bad)
.byte 255 // (bad)
@@ -44555,7 +44844,7 @@ _sk_load_g8_dst_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 235e5 <_sk_load_g8_dst_hsw_8bit+0x151>
+ .byte 122,255 // jp 23b15 <_sk_load_g8_dst_hsw_8bit+0x151>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -44592,10 +44881,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,222,0,0,0 // jne 2370f <_sk_srcover_rgba_8888_hsw_8bit+0x103>
+ .byte 15,133,222,0,0,0 // jne 23c3f <_sk_srcover_rgba_8888_hsw_8bit+0x103>
.byte 196,33,126,111,76,138,32 // vmovdqu 0x20(%rdx,%r9,4),%ymm9
.byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11
- .byte 197,253,111,53,90,132,0,0 // vmovdqa 0x845a(%rip),%ymm6 # 2baa0 <_sk_overlay_sse2_8bit+0xaeb>
+ .byte 197,253,111,53,106,132,0,0 // vmovdqa 0x846a(%rip),%ymm6 # 2bfe0 <_sk_overlay_sse2_8bit+0xafb>
.byte 196,226,117,0,254 // vpshufb %ymm6,%ymm1,%ymm7
.byte 196,226,125,0,246 // vpshufb %ymm6,%ymm0,%ymm6
.byte 196,66,125,48,195 // vpmovzxbw %xmm11,%ymm8
@@ -44633,7 +44922,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 197,221,252,224 // vpaddb %ymm0,%ymm4,%ymm4
.byte 197,213,252,233 // vpaddb %ymm1,%ymm5,%ymm5
.byte 77,133,192 // test %r8,%r8
- .byte 117,72 // jne 23746 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
+ .byte 117,72 // jne 23c76 <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
.byte 196,161,126,127,108,138,32 // vmovdqu %ymm5,0x20(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -44644,25 +44933,25 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,65,37,239,219 // vpxor %ymm11,%ymm11,%ymm11
.byte 254,200 // dec %al
.byte 60,14 // cmp $0xe,%al
- .byte 15,135,22,255,255,255 // ja 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 15,135,22,255,255,255 // ja 23b6e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 2391c <_sk_srcover_rgba_8888_hsw_8bit+0x310>
+ .byte 72,141,13,234,1,0,0 // lea 0x1ea(%rip),%rcx # 23e4c <_sk_srcover_rgba_8888_hsw_8bit+0x310>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,33,121,110,28,138 // vmovd (%rdx,%r9,4),%xmm11
- .byte 233,248,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,248,254,255,255 // jmpq 23b6e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 65,128,224,15 // and $0xf,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,14 // cmp $0xe,%r8b
- .byte 119,184 // ja 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 119,184 // ja 23c3b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23958 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
+ .byte 72,141,13,250,1,0,0 // lea 0x1fa(%rip),%rcx # 23e88 <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 196,161,121,126,36,138 // vmovd %xmm4,(%rdx,%r9,4)
- .byte 235,156 // jmp 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 235,156 // jmp 23c3b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,161,121,110,100,138,8 // vmovd 0x8(%rdx,%r9,4),%xmm4
.byte 196,226,121,89,236 // vpbroadcastq %xmm4,%xmm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -44670,7 +44959,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,162,121,53,52,138 // vpmovzxdq (%rdx,%r9,4),%xmm6
.byte 197,249,112,246,232 // vpshufd $0xe8,%xmm6,%xmm6
.byte 196,99,37,2,222,3 // vpblendd $0x3,%ymm6,%ymm11,%ymm11
- .byte 233,162,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,162,254,255,255 // jmpq 23b6e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,161,121,110,100,138,24 // vmovd 0x18(%rdx,%r9,4),%xmm4
.byte 196,226,125,89,236 // vpbroadcastq %xmm4,%ymm5
.byte 196,65,53,239,201 // vpxor %ymm9,%ymm9,%ymm9
@@ -44683,7 +44972,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,37,56,222,1 // vinserti128 $0x1,%xmm6,%ymm11,%ymm11
.byte 196,161,122,111,52,138 // vmovdqu (%rdx,%r9,4),%xmm6
.byte 196,67,77,2,219,240 // vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- .byte 233,82,254,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,82,254,255,255 // jmpq 23b6e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,161,121,110,100,138,40 // vmovd 0x28(%rdx,%r9,4),%xmm4
.byte 196,226,121,89,228 // vpbroadcastq %xmm4,%xmm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -44692,7 +44981,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,99,53,2,205,15 // vpblendd $0xf,%ymm5,%ymm9,%ymm9
.byte 196,161,121,110,108,138,32 // vmovd 0x20(%rdx,%r9,4),%xmm5
.byte 196,99,53,2,205,1 // vpblendd $0x1,%ymm5,%ymm9,%ymm9
- .byte 233,22,254,255,255 // jmpq 23638 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
+ .byte 233,22,254,255,255 // jmpq 23b68 <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
.byte 196,161,121,110,100,138,56 // vmovd 0x38(%rdx,%r9,4),%xmm4
.byte 196,226,125,89,228 // vpbroadcastq %xmm4,%ymm4
.byte 197,213,239,237 // vpxor %ymm5,%ymm5,%ymm5
@@ -44706,10 +44995,10 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,33,126,111,28,138 // vmovdqu (%rdx,%r9,4),%ymm11
.byte 196,161,122,111,116,138,32 // vmovdqu 0x20(%rdx,%r9,4),%xmm6
.byte 196,67,77,2,201,240 // vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- .byte 233,198,253,255,255 // jmpq 2363e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ .byte 233,198,253,255,255 // jmpq 23b6e <_sk_srcover_rgba_8888_hsw_8bit+0x32>
.byte 196,163,121,22,100,138,8,2 // vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
.byte 196,161,121,214,36,138 // vmovq %xmm4,(%rdx,%r9,4)
- .byte 233,128,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,128,254,255,255 // jmpq 23c3b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,163,121,22,108,138,24,2 // vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
@@ -44717,12 +45006,12 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,227,125,57,229,1 // vextracti128 $0x1,%ymm4,%xmm5
.byte 196,161,121,126,108,138,16 // vmovd %xmm5,0x10(%rdx,%r9,4)
.byte 196,161,122,127,36,138 // vmovdqu %xmm4,(%rdx,%r9,4)
- .byte 233,76,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,76,254,255,255 // jmpq 23c3b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,163,121,22,108,138,40,2 // vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4)
.byte 196,163,121,22,108,138,36,1 // vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4)
.byte 196,161,121,126,108,138,32 // vmovd %xmm5,0x20(%rdx,%r9,4)
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
- .byte 233,42,254,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,42,254,255,255 // jmpq 23c3b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
.byte 196,163,121,22,116,138,56,2 // vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4)
.byte 196,227,125,57,238,1 // vextracti128 $0x1,%ymm5,%xmm6
@@ -44731,7 +45020,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 196,161,121,126,116,138,48 // vmovd %xmm6,0x30(%rdx,%r9,4)
.byte 196,161,126,127,36,138 // vmovdqu %ymm4,(%rdx,%r9,4)
.byte 196,161,122,127,108,138,32 // vmovdqu %xmm5,0x20(%rdx,%r9,4)
- .byte 233,239,253,255,255 // jmpq 2370b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ .byte 233,239,253,255,255 // jmpq 23c3b <_sk_srcover_rgba_8888_hsw_8bit+0xff>
.byte 31 // (bad)
.byte 254 // (bad)
.byte 255 // (bad)
@@ -44781,7 +45070,7 @@ _sk_srcover_rgba_8888_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 126,255 // jle 23975 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
+ .byte 126,255 // jle 23ea5 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
.byte 255 // (bad)
.byte 255,119,255 // pushq -0x1(%rdi)
.byte 255 // (bad)
@@ -44803,7 +45092,7 @@ FUNCTION(_sk_scale_1_float_hsw_8bit)
_sk_scale_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,130,122,0,0 // vmulss 0x7a82(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,218,89,37,130,122,0,0 // vmulss 0x7a82(%rip),%xmm4,%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -44813,7 +45102,7 @@ _sk_scale_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,37,233,128,0,0 // vpand 0x80e9(%rip),%ymm4,%ymm4 # 2bac0 <_sk_overlay_sse2_8bit+0xb0b>
+ .byte 197,221,219,37,249,128,0,0 // vpand 0x80f9(%rip),%ymm4,%ymm4 # 2c000 <_sk_overlay_sse2_8bit+0xb1b>
.byte 197,221,213,249 // vpmullw %ymm1,%ymm4,%ymm7
.byte 197,93,213,198 // vpmullw %ymm6,%ymm4,%ymm8
.byte 197,93,213,200 // vpmullw %ymm0,%ymm4,%ymm9
@@ -44847,12 +45136,12 @@ _sk_scale_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,191,0,0,0 // jne 23b0f <_sk_scale_u8_hsw_8bit+0xe0>
+ .byte 15,133,191,0,0,0 // jne 2403f <_sk_scale_u8_hsw_8bit+0xe0>
.byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,115,128,0,0 // vmovdqa 0x8073(%rip),%ymm6 # 2bae0 <_sk_overlay_sse2_8bit+0xb2b>
+ .byte 197,253,111,53,131,128,0,0 // vmovdqa 0x8083(%rip),%ymm6 # 2c020 <_sk_overlay_sse2_8bit+0xb3b>
.byte 196,226,93,0,230 // vpshufb %ymm6,%ymm4,%ymm4
.byte 196,226,85,0,238 // vpshufb %ymm6,%ymm5,%ymm5
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -44891,35 +45180,35 @@ _sk_scale_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,50,255,255,255 // ja 23a56 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 15,135,50,255,255,255 // ja 23f86 <_sk_scale_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23bf8 <_sk_scale_u8_hsw_8bit+0x1c9>
+ .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 24128 <_sk_scale_u8_hsw_8bit+0x1c9>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,16,255,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,16,255,255,255 // jmpq 23f86 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,240,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,240,254,255,255 // jmpq 23f86 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,195,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,195,254,255,255 // jmpq 23f86 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,150,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,150,254,255,255 // jmpq 23f86 <_sk_scale_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -44927,7 +45216,7 @@ _sk_scale_u8_hsw_8bit:
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,97,254,255,255 // jmpq 23a56 <_sk_scale_u8_hsw_8bit+0x27>
+ .byte 233,97,254,255,255 // jmpq 23f86 <_sk_scale_u8_hsw_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 64,255 // rex (bad)
.byte 255 // (bad)
@@ -44939,7 +45228,7 @@ _sk_scale_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23c0d <_sk_scale_u8_hsw_8bit+0x1de>
+ .byte 122,255 // jp 2413d <_sk_scale_u8_hsw_8bit+0x1de>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -44969,7 +45258,7 @@ FUNCTION(_sk_lerp_1_float_hsw_8bit)
_sk_lerp_1_float_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 197,250,16,32 // vmovss (%rax),%xmm4
- .byte 197,218,89,37,226,119,0,0 // vmulss 0x77e2(%rip),%xmm4,%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 197,218,89,37,226,119,0,0 // vmulss 0x77e2(%rip),%xmm4,%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 197,250,44,196 // vcvttss2si %xmm4,%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
.byte 196,226,125,120,228 // vpbroadcastb %xmm4,%ymm4
@@ -44979,7 +45268,7 @@ _sk_lerp_1_float_hsw_8bit:
.byte 196,226,125,48,241 // vpmovzxbw %xmm1,%ymm6
.byte 196,227,125,57,201,1 // vextracti128 $0x1,%ymm1,%xmm1
.byte 196,226,125,48,201 // vpmovzxbw %xmm1,%ymm1
- .byte 197,221,219,61,137,126,0,0 // vpand 0x7e89(%rip),%ymm4,%ymm7 # 2bb00 <_sk_overlay_sse2_8bit+0xb4b>
+ .byte 197,221,219,61,153,126,0,0 // vpand 0x7e99(%rip),%ymm4,%ymm7 # 2c040 <_sk_overlay_sse2_8bit+0xb5b>
.byte 197,69,213,193 // vpmullw %ymm1,%ymm7,%ymm8
.byte 197,69,213,206 // vpmullw %ymm6,%ymm7,%ymm9
.byte 197,69,213,208 // vpmullw %ymm0,%ymm7,%ymm10
@@ -45044,12 +45333,12 @@ _sk_lerp_u8_hsw_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,106,1,0,0 // jne 23eef <_sk_lerp_u8_hsw_8bit+0x18b>
+ .byte 15,133,106,1,0,0 // jne 2441f <_sk_lerp_u8_hsw_8bit+0x18b>
.byte 196,161,122,111,36,2 // vmovdqu (%rdx,%r8,1),%xmm4
.byte 196,226,125,49,236 // vpmovzxbd %xmm4,%ymm5
.byte 197,249,112,228,78 // vpshufd $0x4e,%xmm4,%xmm4
.byte 196,226,125,49,228 // vpmovzxbd %xmm4,%ymm4
- .byte 197,253,111,53,126,125,0,0 // vmovdqa 0x7d7e(%rip),%ymm6 # 2bb20 <_sk_overlay_sse2_8bit+0xb6b>
+ .byte 197,253,111,53,142,125,0,0 // vmovdqa 0x7d8e(%rip),%ymm6 # 2c060 <_sk_overlay_sse2_8bit+0xb7b>
.byte 196,98,93,0,206 // vpshufb %ymm6,%ymm4,%ymm9
.byte 196,98,85,0,222 // vpshufb %ymm6,%ymm5,%ymm11
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45123,35 +45412,35 @@ _sk_lerp_u8_hsw_8bit:
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,14 // cmp $0xe,%r9b
- .byte 15,135,135,254,255,255 // ja 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 15,135,135,254,255,255 // ja 242bb <_sk_lerp_u8_hsw_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 23fd8 <_sk_lerp_u8_hsw_8bit+0x274>
+ .byte 72,141,13,201,0,0,0 // lea 0xc9(%rip),%rcx # 24508 <_sk_lerp_u8_hsw_8bit+0x274>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 197,249,110,224 // vmovd %eax,%xmm4
- .byte 233,101,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,101,254,255,255 // jmpq 242bb <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,2,2 // vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
.byte 66,15,183,4,2 // movzwl (%rdx,%r8,1),%eax
.byte 197,249,110,232 // vmovd %eax,%xmm5
.byte 196,227,89,14,229,1 // vpblendw $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,69,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,69,254,255,255 // jmpq 242bb <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,6,6 // vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,5,5 // vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,4,4 // vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,121,110,44,2 // vmovd (%rdx,%r8,1),%xmm5
.byte 196,227,89,2,229,1 // vpblendd $0x1,%xmm5,%xmm4,%xmm4
- .byte 233,24,254,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,24,254,255,255 // jmpq 242bb <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,10,10 // vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,9,9 // vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,8,8 // vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,227,81,2,228,12 // vpblendd $0xc,%xmm4,%xmm5,%xmm4
- .byte 233,235,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,235,253,255,255 // jmpq 242bb <_sk_lerp_u8_hsw_8bit+0x27>
.byte 197,217,239,228 // vpxor %xmm4,%xmm4,%xmm4
.byte 196,163,89,32,100,2,14,14 // vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
.byte 196,163,89,32,100,2,13,13 // vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -45159,7 +45448,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 196,161,122,126,44,2 // vmovq (%rdx,%r8,1),%xmm5
.byte 196,163,81,34,108,2,8,2 // vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
.byte 196,227,81,2,228,8 // vpblendd $0x8,%xmm4,%xmm5,%xmm4
- .byte 233,182,253,255,255 // jmpq 23d8b <_sk_lerp_u8_hsw_8bit+0x27>
+ .byte 233,182,253,255,255 // jmpq 242bb <_sk_lerp_u8_hsw_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 64,255 // rex (bad)
.byte 255 // (bad)
@@ -45171,7 +45460,7 @@ _sk_lerp_u8_hsw_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 122,255 // jp 23fed <_sk_lerp_u8_hsw_8bit+0x289>
+ .byte 122,255 // jp 2451d <_sk_lerp_u8_hsw_8bit+0x289>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -45218,7 +45507,7 @@ HIDDEN _sk_black_color_hsw_8bit
FUNCTION(_sk_black_color_hsw_8bit)
_sk_black_color_hsw_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 196,226,125,24,5,85,117,0,0 // vbroadcastss 0x7555(%rip),%ymm0 # 2b58c <_sk_overlay_sse2_8bit+0x5d7>
+ .byte 196,226,125,24,5,85,117,0,0 // vbroadcastss 0x7555(%rip),%ymm0 # 2babc <_sk_overlay_sse2_8bit+0x5d7>
.byte 197,252,40,200 // vmovaps %ymm0,%ymm1
.byte 255,224 // jmpq *%rax
@@ -45244,7 +45533,7 @@ HIDDEN _sk_srcatop_hsw_8bit
.globl _sk_srcatop_hsw_8bit
FUNCTION(_sk_srcatop_hsw_8bit)
_sk_srcatop_hsw_8bit:
- .byte 197,125,111,5,227,122,0,0 // vmovdqa 0x7ae3(%rip),%ymm8 # 2bb40 <_sk_overlay_sse2_8bit+0xb8b>
+ .byte 197,125,111,5,243,122,0,0 // vmovdqa 0x7af3(%rip),%ymm8 # 2c080 <_sk_overlay_sse2_8bit+0xb9b>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,232 // vpshufb %ymm8,%ymm2,%ymm5
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -45321,7 +45610,7 @@ HIDDEN _sk_dstatop_hsw_8bit
.globl _sk_dstatop_hsw_8bit
FUNCTION(_sk_dstatop_hsw_8bit)
_sk_dstatop_hsw_8bit:
- .byte 197,125,111,5,158,121,0,0 // vmovdqa 0x799e(%rip),%ymm8 # 2bb60 <_sk_overlay_sse2_8bit+0xbab>
+ .byte 197,125,111,5,174,121,0,0 // vmovdqa 0x79ae(%rip),%ymm8 # 2c0a0 <_sk_overlay_sse2_8bit+0xbbb>
.byte 196,194,117,0,224 // vpshufb %ymm8,%ymm1,%ymm4
.byte 196,194,125,0,232 // vpshufb %ymm8,%ymm0,%ymm5
.byte 196,98,125,48,210 // vpmovzxbw %xmm2,%ymm10
@@ -45398,7 +45687,7 @@ HIDDEN _sk_srcin_hsw_8bit
.globl _sk_srcin_hsw_8bit
FUNCTION(_sk_srcin_hsw_8bit)
_sk_srcin_hsw_8bit:
- .byte 197,253,111,37,85,120,0,0 // vmovdqa 0x7855(%rip),%ymm4 # 2bb80 <_sk_overlay_sse2_8bit+0xbcb>
+ .byte 197,253,111,37,101,120,0,0 // vmovdqa 0x7865(%rip),%ymm4 # 2c0c0 <_sk_overlay_sse2_8bit+0xbdb>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,226,125,48,240 // vpmovzxbw %xmm0,%ymm6
@@ -45438,7 +45727,7 @@ HIDDEN _sk_dstin_hsw_8bit
.globl _sk_dstin_hsw_8bit
FUNCTION(_sk_dstin_hsw_8bit)
_sk_dstin_hsw_8bit:
- .byte 197,253,111,37,203,119,0,0 // vmovdqa 0x77cb(%rip),%ymm4 # 2bba0 <_sk_overlay_sse2_8bit+0xbeb>
+ .byte 197,253,111,37,219,119,0,0 // vmovdqa 0x77db(%rip),%ymm4 # 2c0e0 <_sk_overlay_sse2_8bit+0xbfb>
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,125,48,226 // vpmovzxbw %xmm2,%ymm4
@@ -45478,7 +45767,7 @@ HIDDEN _sk_srcout_hsw_8bit
.globl _sk_srcout_hsw_8bit
FUNCTION(_sk_srcout_hsw_8bit)
_sk_srcout_hsw_8bit:
- .byte 197,253,111,37,63,119,0,0 // vmovdqa 0x773f(%rip),%ymm4 # 2bbc0 <_sk_overlay_sse2_8bit+0xc0b>
+ .byte 197,253,111,37,79,119,0,0 // vmovdqa 0x774f(%rip),%ymm4 # 2c100 <_sk_overlay_sse2_8bit+0xc1b>
.byte 196,226,109,0,236 // vpshufb %ymm4,%ymm2,%ymm5
.byte 196,226,101,0,228 // vpshufb %ymm4,%ymm3,%ymm4
.byte 197,205,118,246 // vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -45521,7 +45810,7 @@ HIDDEN _sk_dstout_hsw_8bit
.globl _sk_dstout_hsw_8bit
FUNCTION(_sk_dstout_hsw_8bit)
_sk_dstout_hsw_8bit:
- .byte 197,253,111,37,169,118,0,0 // vmovdqa 0x76a9(%rip),%ymm4 # 2bbe0 <_sk_overlay_sse2_8bit+0xc2b>
+ .byte 197,253,111,37,185,118,0,0 // vmovdqa 0x76b9(%rip),%ymm4 # 2c120 <_sk_overlay_sse2_8bit+0xc3b>
.byte 196,226,125,0,196 // vpshufb %ymm4,%ymm0,%ymm0
.byte 196,226,117,0,204 // vpshufb %ymm4,%ymm1,%ymm1
.byte 197,221,118,228 // vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -45564,7 +45853,7 @@ HIDDEN _sk_srcover_hsw_8bit
.globl _sk_srcover_hsw_8bit
FUNCTION(_sk_srcover_hsw_8bit)
_sk_srcover_hsw_8bit:
- .byte 197,253,111,37,17,118,0,0 // vmovdqa 0x7611(%rip),%ymm4 # 2bc00 <_sk_overlay_sse2_8bit+0xc4b>
+ .byte 197,253,111,37,33,118,0,0 // vmovdqa 0x7621(%rip),%ymm4 # 2c140 <_sk_overlay_sse2_8bit+0xc5b>
.byte 196,226,117,0,236 // vpshufb %ymm4,%ymm1,%ymm5
.byte 196,226,125,0,228 // vpshufb %ymm4,%ymm0,%ymm4
.byte 196,98,125,48,202 // vpmovzxbw %xmm2,%ymm9
@@ -45608,7 +45897,7 @@ HIDDEN _sk_dstover_hsw_8bit
.globl _sk_dstover_hsw_8bit
FUNCTION(_sk_dstover_hsw_8bit)
_sk_dstover_hsw_8bit:
- .byte 197,253,111,37,114,117,0,0 // vmovdqa 0x7572(%rip),%ymm4 # 2bc20 <_sk_overlay_sse2_8bit+0xc6b>
+ .byte 197,253,111,37,130,117,0,0 // vmovdqa 0x7582(%rip),%ymm4 # 2c160 <_sk_overlay_sse2_8bit+0xc7b>
.byte 196,226,101,0,236 // vpshufb %ymm4,%ymm3,%ymm5
.byte 196,226,109,0,228 // vpshufb %ymm4,%ymm2,%ymm4
.byte 196,98,125,48,200 // vpmovzxbw %xmm0,%ymm9
@@ -45691,7 +45980,7 @@ FUNCTION(_sk_multiply_hsw_8bit)
_sk_multiply_hsw_8bit:
.byte 197,253,111,243 // vmovdqa %ymm3,%ymm6
.byte 197,253,111,218 // vmovdqa %ymm2,%ymm3
- .byte 197,125,111,13,51,116,0,0 // vmovdqa 0x7433(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0xc8b>
+ .byte 197,125,111,13,67,116,0,0 // vmovdqa 0x7443(%rip),%ymm9 # 2c180 <_sk_overlay_sse2_8bit+0xc9b>
.byte 196,194,101,0,225 // vpshufb %ymm9,%ymm3,%ymm4
.byte 196,194,77,0,233 // vpshufb %ymm9,%ymm6,%ymm5
.byte 196,65,45,118,210 // vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -45835,7 +46124,7 @@ HIDDEN _sk_xor__hsw_8bit
.globl _sk_xor__hsw_8bit
FUNCTION(_sk_xor__hsw_8bit)
_sk_xor__hsw_8bit:
- .byte 197,125,111,13,193,113,0,0 // vmovdqa 0x71c1(%rip),%ymm9 # 2bc60 <_sk_overlay_sse2_8bit+0xcab>
+ .byte 197,125,111,13,209,113,0,0 // vmovdqa 0x71d1(%rip),%ymm9 # 2c1a0 <_sk_overlay_sse2_8bit+0xcbb>
.byte 196,194,109,0,225 // vpshufb %ymm9,%ymm2,%ymm4
.byte 196,194,101,0,249 // vpshufb %ymm9,%ymm3,%ymm7
.byte 196,65,37,118,219 // vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -45923,7 +46212,7 @@ HIDDEN _sk_darken_hsw_8bit
.globl _sk_darken_hsw_8bit
FUNCTION(_sk_darken_hsw_8bit)
_sk_darken_hsw_8bit:
- .byte 197,125,111,5,99,112,0,0 // vmovdqa 0x7063(%rip),%ymm8 # 2bc80 <_sk_overlay_sse2_8bit+0xccb>
+ .byte 197,125,111,5,115,112,0,0 // vmovdqa 0x7073(%rip),%ymm8 # 2c1c0 <_sk_overlay_sse2_8bit+0xcdb>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -45996,7 +46285,7 @@ _sk_darken_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,4,104,0,0 // vpbroadcastd 0x6804(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db>
+ .byte 196,226,125,88,37,4,104,0,0 // vpbroadcastd 0x6804(%rip),%ymm4 # 2bac0 <_sk_overlay_sse2_8bit+0x5db>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46006,7 +46295,7 @@ HIDDEN _sk_lighten_hsw_8bit
.globl _sk_lighten_hsw_8bit
FUNCTION(_sk_lighten_hsw_8bit)
_sk_lighten_hsw_8bit:
- .byte 197,125,111,5,252,110,0,0 // vmovdqa 0x6efc(%rip),%ymm8 # 2bca0 <_sk_overlay_sse2_8bit+0xceb>
+ .byte 197,125,111,5,12,111,0,0 // vmovdqa 0x6f0c(%rip),%ymm8 # 2c1e0 <_sk_overlay_sse2_8bit+0xcfb>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46079,7 +46368,7 @@ _sk_lighten_hsw_8bit:
.byte 197,253,248,246 // vpsubb %ymm6,%ymm0,%ymm6
.byte 197,245,248,205 // vpsubb %ymm5,%ymm1,%ymm1
.byte 197,253,248,196 // vpsubb %ymm4,%ymm0,%ymm0
- .byte 196,226,125,88,37,125,102,0,0 // vpbroadcastd 0x667d(%rip),%ymm4 # 2b590 <_sk_overlay_sse2_8bit+0x5db>
+ .byte 196,226,125,88,37,125,102,0,0 // vpbroadcastd 0x667d(%rip),%ymm4 # 2bac0 <_sk_overlay_sse2_8bit+0x5db>
.byte 196,227,125,76,198,64 // vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
.byte 196,227,117,76,207,64 // vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46119,7 +46408,7 @@ _sk_exclusion_hsw_8bit:
.byte 196,227,77,56,252,1 // vinserti128 $0x1,%xmm4,%ymm6,%ymm7
.byte 196,227,77,70,228,49 // vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
.byte 197,197,103,228 // vpackuswb %ymm4,%ymm7,%ymm4
- .byte 197,253,111,53,254,108,0,0 // vmovdqa 0x6cfe(%rip),%ymm6 # 2bcc0 <_sk_overlay_sse2_8bit+0xd0b>
+ .byte 197,253,111,53,14,109,0,0 // vmovdqa 0x6d0e(%rip),%ymm6 # 2c200 <_sk_overlay_sse2_8bit+0xd1b>
.byte 197,221,219,254 // vpand %ymm6,%ymm4,%ymm7
.byte 197,213,219,246 // vpand %ymm6,%ymm5,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -46135,7 +46424,7 @@ HIDDEN _sk_difference_hsw_8bit
.globl _sk_difference_hsw_8bit
FUNCTION(_sk_difference_hsw_8bit)
_sk_difference_hsw_8bit:
- .byte 197,125,111,5,242,108,0,0 // vmovdqa 0x6cf2(%rip),%ymm8 # 2bce0 <_sk_overlay_sse2_8bit+0xd2b>
+ .byte 197,125,111,5,2,109,0,0 // vmovdqa 0x6d02(%rip),%ymm8 # 2c220 <_sk_overlay_sse2_8bit+0xd3b>
.byte 196,194,101,0,224 // vpshufb %ymm8,%ymm3,%ymm4
.byte 196,194,109,0,240 // vpshufb %ymm8,%ymm2,%ymm6
.byte 196,98,125,48,208 // vpmovzxbw %xmm0,%ymm10
@@ -46202,7 +46491,7 @@ _sk_difference_hsw_8bit:
.byte 197,197,103,237 // vpackuswb %ymm5,%ymm7,%ymm5
.byte 197,181,218,228 // vpminub %ymm4,%ymm9,%ymm4
.byte 197,165,218,237 // vpminub %ymm5,%ymm11,%ymm5
- .byte 197,253,111,53,188,107,0,0 // vmovdqa 0x6bbc(%rip),%ymm6 # 2bd00 <_sk_overlay_sse2_8bit+0xd4b>
+ .byte 197,253,111,53,204,107,0,0 // vmovdqa 0x6bcc(%rip),%ymm6 # 2c240 <_sk_overlay_sse2_8bit+0xd5b>
.byte 197,213,219,254 // vpand %ymm6,%ymm5,%ymm7
.byte 197,221,219,246 // vpand %ymm6,%ymm4,%ymm6
.byte 197,237,252,192 // vpaddb %ymm0,%ymm2,%ymm0
@@ -46228,7 +46517,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,227,125,57,203,1 // vextracti128 $0x1,%ymm1,%xmm3
.byte 196,98,125,48,195 // vpmovzxbw %xmm3,%ymm8
.byte 197,126,127,132,36,192,0,0,0 // vmovdqu %ymm8,0xc0(%rsp)
- .byte 197,253,111,29,113,107,0,0 // vmovdqa 0x6b71(%rip),%ymm3 # 2bd20 <_sk_overlay_sse2_8bit+0xd6b>
+ .byte 197,253,111,29,129,107,0,0 // vmovdqa 0x6b81(%rip),%ymm3 # 2c260 <_sk_overlay_sse2_8bit+0xd7b>
.byte 196,226,125,0,227 // vpshufb %ymm3,%ymm0,%ymm4
.byte 196,226,117,0,203 // vpshufb %ymm3,%ymm1,%ymm1
.byte 197,125,111,251 // vmovdqa %ymm3,%ymm15
@@ -46257,7 +46546,7 @@ _sk_hardlight_hsw_8bit:
.byte 196,65,125,111,231 // vmovdqa %ymm15,%ymm12
.byte 196,194,93,0,220 // vpshufb %ymm12,%ymm4,%ymm3
.byte 196,226,125,48,211 // vpmovzxbw %xmm3,%ymm2
- .byte 196,226,125,121,5,243,106,0,0 // vpbroadcastw 0x6af3(%rip),%ymm0 # 2bd40 <_sk_overlay_sse2_8bit+0xd8b>
+ .byte 196,226,125,121,5,3,107,0,0 // vpbroadcastw 0x6b03(%rip),%ymm0 # 2c280 <_sk_overlay_sse2_8bit+0xd9b>
.byte 197,109,239,248 // vpxor %ymm0,%ymm2,%ymm15
.byte 197,133,213,207 // vpmullw %ymm7,%ymm15,%ymm1
.byte 197,254,127,140,36,32,1,0,0 // vmovdqu %ymm1,0x120(%rsp)
@@ -46357,7 +46646,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,254,111,116,36,224 // vmovdqu -0x20(%rsp),%ymm6
.byte 197,205,253,52,36 // vpaddw (%rsp),%ymm6,%ymm6
.byte 196,193,53,253,252 // vpaddw %ymm12,%ymm9,%ymm7
- .byte 196,98,125,121,5,235,104,0,0 // vpbroadcastw 0x68eb(%rip),%ymm8 # 2bd42 <_sk_overlay_sse2_8bit+0xd8d>
+ .byte 196,98,125,121,5,251,104,0,0 // vpbroadcastw 0x68fb(%rip),%ymm8 # 2c282 <_sk_overlay_sse2_8bit+0xd9d>
.byte 196,193,93,253,224 // vpaddw %ymm8,%ymm4,%ymm4
.byte 197,229,253,220 // vpaddw %ymm4,%ymm3,%ymm3
.byte 196,193,85,253,224 // vpaddw %ymm8,%ymm5,%ymm4
@@ -46366,7 +46655,7 @@ _sk_hardlight_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,192,104,0,0 // vpbroadcastw 0x68c0(%rip),%ymm4 # 2bd44 <_sk_overlay_sse2_8bit+0xd8f>
+ .byte 196,226,125,121,37,208,104,0,0 // vpbroadcastw 0x68d0(%rip),%ymm4 # 2c284 <_sk_overlay_sse2_8bit+0xd9f>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,237,228,212 // vpmulhuw %ymm4,%ymm2,%ymm2
@@ -46393,7 +46682,7 @@ FUNCTION(_sk_overlay_hsw_8bit)
_sk_overlay_hsw_8bit:
.byte 72,129,236,152,1,0,0 // sub $0x198,%rsp
.byte 197,252,17,140,36,64,1,0,0 // vmovups %ymm1,0x140(%rsp)
- .byte 197,253,111,45,102,104,0,0 // vmovdqa 0x6866(%rip),%ymm5 # 2bd60 <_sk_overlay_sse2_8bit+0xdab>
+ .byte 197,253,111,45,118,104,0,0 // vmovdqa 0x6876(%rip),%ymm5 # 2c2a0 <_sk_overlay_sse2_8bit+0xdbb>
.byte 197,253,111,226 // vmovdqa %ymm2,%ymm4
.byte 196,227,125,57,225,1 // vextracti128 $0x1,%ymm4,%xmm1
.byte 196,98,125,48,193 // vpmovzxbw %xmm1,%ymm8
@@ -46428,7 +46717,7 @@ _sk_overlay_hsw_8bit:
.byte 197,93,117,251 // vpcmpeqw %ymm3,%ymm4,%ymm15
.byte 197,253,111,216 // vmovdqa %ymm0,%ymm3
.byte 196,226,125,48,227 // vpmovzxbw %xmm3,%ymm4
- .byte 196,226,125,121,5,192,103,0,0 // vpbroadcastw 0x67c0(%rip),%ymm0 # 2bd80 <_sk_overlay_sse2_8bit+0xdcb>
+ .byte 196,226,125,121,5,208,103,0,0 // vpbroadcastw 0x67d0(%rip),%ymm0 # 2c2c0 <_sk_overlay_sse2_8bit+0xddb>
.byte 197,117,239,232 // vpxor %ymm0,%ymm1,%ymm13
.byte 197,21,213,212 // vpmullw %ymm4,%ymm13,%ymm10
.byte 197,126,127,148,36,192,0,0,0 // vmovdqu %ymm10,0xc0(%rsp)
@@ -46529,7 +46818,7 @@ _sk_overlay_hsw_8bit:
.byte 197,254,111,116,36,192 // vmovdqu -0x40(%rsp),%ymm6
.byte 197,205,253,116,36,224 // vpaddw -0x20(%rsp),%ymm6,%ymm6
.byte 196,193,29,253,253 // vpaddw %ymm13,%ymm12,%ymm7
- .byte 196,98,125,121,5,203,101,0,0 // vpbroadcastw 0x65cb(%rip),%ymm8 # 2bd82 <_sk_overlay_sse2_8bit+0xdcd>
+ .byte 196,98,125,121,5,219,101,0,0 // vpbroadcastw 0x65db(%rip),%ymm8 # 2c2c2 <_sk_overlay_sse2_8bit+0xddd>
.byte 196,193,109,253,208 // vpaddw %ymm8,%ymm2,%ymm2
.byte 197,229,253,210 // vpaddw %ymm2,%ymm3,%ymm2
.byte 196,193,85,253,216 // vpaddw %ymm8,%ymm5,%ymm3
@@ -46538,7 +46827,7 @@ _sk_overlay_hsw_8bit:
.byte 197,245,253,204 // vpaddw %ymm4,%ymm1,%ymm1
.byte 196,193,69,253,224 // vpaddw %ymm8,%ymm7,%ymm4
.byte 197,253,253,196 // vpaddw %ymm4,%ymm0,%ymm0
- .byte 196,226,125,121,37,160,101,0,0 // vpbroadcastw 0x65a0(%rip),%ymm4 # 2bd84 <_sk_overlay_sse2_8bit+0xdcf>
+ .byte 196,226,125,121,37,176,101,0,0 // vpbroadcastw 0x65b0(%rip),%ymm4 # 2c2c4 <_sk_overlay_sse2_8bit+0xddf>
.byte 197,253,228,196 // vpmulhuw %ymm4,%ymm0,%ymm0
.byte 197,245,228,204 // vpmulhuw %ymm4,%ymm1,%ymm1
.byte 197,229,228,220 // vpmulhuw %ymm4,%ymm3,%ymm3
@@ -46583,7 +46872,7 @@ _sk_start_pipeline_sse41_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 258dd <_sk_start_pipeline_sse41_8bit+0x95>
+ .byte 115,102 // jae 25e0d <_sk_start_pipeline_sse41_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -46593,7 +46882,7 @@ _sk_start_pipeline_sse41_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
- .byte 119,30 // ja 258bf <_sk_start_pipeline_sse41_8bit+0x77>
+ .byte 119,30 // ja 25def <_sk_start_pipeline_sse41_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -46602,17 +46891,17 @@ _sk_start_pipeline_sse41_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,16 // add $0x10,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 258a1 <_sk_start_pipeline_sse41_8bit+0x59>
+ .byte 118,226 // jbe 25dd1 <_sk_start_pipeline_sse41_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 258d4 <_sk_start_pipeline_sse41_8bit+0x8c>
+ .byte 116,13 // je 25e04 <_sk_start_pipeline_sse41_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 25887 <_sk_start_pipeline_sse41_8bit+0x3f>
+ .byte 117,170 // jne 25db7 <_sk_start_pipeline_sse41_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -46644,7 +46933,7 @@ HIDDEN _sk_set_rgb_sse41_8bit
FUNCTION(_sk_set_rgb_sse41_8bit)
_sk_set_rgb_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,25,91,0,0 // movss 0x5b19(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,16,37,25,91,0,0 // movss 0x5b19(%rip),%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx
@@ -46659,7 +46948,7 @@ _sk_set_rgb_sse41_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,85,107,0,0 // movdqa 0x6b55(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,45,101,107,0,0 // movdqa 0x6b65(%rip),%xmm5 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -46673,12 +46962,12 @@ FUNCTION(_sk_premul_sse41_8bit)
_sk_premul_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,65,107,0,0 // movdqa 0x6b41(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,5,81,107,0,0 // movdqa 0x6b51(%rip),%xmm0 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,111,253 // movdqa %xmm5,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,244 // movdqa %xmm4,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
- .byte 102,15,111,5,23,107,0,0 // movdqa 0x6b17(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,5,39,107,0,0 // movdqa 0x6b27(%rip),%xmm0 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
@@ -46711,7 +47000,7 @@ HIDDEN _sk_swap_rb_sse41_8bit
.globl _sk_swap_rb_sse41_8bit
FUNCTION(_sk_swap_rb_sse41_8bit)
_sk_swap_rb_sse41_8bit:
- .byte 102,15,111,37,180,106,0,0 // movdqa 0x6ab4(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
+ .byte 102,15,111,37,196,106,0,0 // movdqa 0x6ac4(%rip),%xmm4 # 2ca00 <_sk_overlay_sse2_8bit+0x151b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46740,7 +47029,7 @@ _sk_load_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 25a5c <_sk_load_8888_sse41_8bit+0x32>
+ .byte 117,17 // jne 25f8c <_sk_load_8888_sse41_8bit+0x32>
.byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46750,24 +47039,24 @@ _sk_load_8888_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 25a58 <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 119,231 // ja 25f88 <_sk_load_8888_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 25ac8 <_sk_load_8888_sse41_8bit+0x9e>
+ .byte 72,141,13,76,0,0,0 // lea 0x4c(%rip),%rcx # 25ff8 <_sk_load_8888_sse41_8bit+0x9e>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 235,203 // jmp 25f88 <_sk_load_8888_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,177 // jmp 25a58 <_sk_load_8888_sse41_8bit+0x2e>
+ .byte 235,177 // jmp 25f88 <_sk_load_8888_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
.byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- .byte 235,139 // jmp 25a52 <_sk_load_8888_sse41_8bit+0x28>
+ .byte 235,139 // jmp 25f82 <_sk_load_8888_sse41_8bit+0x28>
.byte 144 // nop
.byte 189,255,255,255,209 // mov $0xd1ffffff,%ebp
.byte 255 // (bad)
@@ -46779,7 +47068,7 @@ _sk_load_8888_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 235,255 // jmp 25add <_sk_load_8888_sse41_8bit+0xb3>
+ .byte 235,255 // jmp 2600d <_sk_load_8888_sse41_8bit+0xb3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 223,255 // (bad)
@@ -46799,7 +47088,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,17 // jne 25b16 <_sk_load_8888_dst_sse41_8bit+0x32>
+ .byte 117,17 // jne 26046 <_sk_load_8888_dst_sse41_8bit+0x32>
.byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46809,24 +47098,24 @@ _sk_load_8888_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 119,231 // ja 26042 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 25b84 <_sk_load_8888_dst_sse41_8bit+0xa0>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 260b4 <_sk_load_8888_dst_sse41_8bit+0xa0>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 235,203 // jmp 26042 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,177 // jmp 25b12 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ .byte 235,177 // jmp 26042 <_sk_load_8888_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
.byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- .byte 235,139 // jmp 25b0c <_sk_load_8888_dst_sse41_8bit+0x28>
+ .byte 235,139 // jmp 2603c <_sk_load_8888_dst_sse41_8bit+0x28>
.byte 15,31,0 // nopl (%rax)
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -46838,7 +47127,7 @@ _sk_load_8888_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,221 // jmpq ffffffffde025b9c <_sk_overlay_sse2_8bit+0xffffffffddffabe7>
+ .byte 233,255,255,255,221 // jmpq ffffffffde0260cc <_sk_overlay_sse2_8bit+0xffffffffddffabe7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // .byte 0xff
@@ -46856,7 +47145,7 @@ _sk_store_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 25bd2 <_sk_store_8888_sse41_8bit+0x32>
+ .byte 117,17 // jne 26102 <_sk_store_8888_sse41_8bit+0x32>
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
.byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46864,22 +47153,22 @@ _sk_store_8888_sse41_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 25bce <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 119,239 // ja 260fe <_sk_store_8888_sse41_8bit+0x2e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 25c30 <_sk_store_8888_sse41_8bit+0x90>
+ .byte 72,141,13,70,0,0,0 // lea 0x46(%rip),%rcx # 26160 <_sk_store_8888_sse41_8bit+0x90>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4)
- .byte 235,211 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,211 // jmp 260fe <_sk_store_8888_sse41_8bit+0x2e>
.byte 102,66,15,58,22,68,138,8,2 // pextrd $0x2,%xmm0,0x8(%rdx,%r9,4)
.byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4)
- .byte 235,194 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,194 // jmp 260fe <_sk_store_8888_sse41_8bit+0x2e>
.byte 102,66,15,58,22,76,138,24,2 // pextrd $0x2,%xmm1,0x18(%rdx,%r9,4)
.byte 102,66,15,58,22,76,138,20,1 // pextrd $0x1,%xmm1,0x14(%rdx,%r9,4)
.byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4)
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
- .byte 235,161 // jmp 25bce <_sk_store_8888_sse41_8bit+0x2e>
+ .byte 235,161 // jmp 260fe <_sk_store_8888_sse41_8bit+0x2e>
.byte 15,31,0 // nopl (%rax)
.byte 195 // retq
.byte 255 // (bad)
@@ -46918,10 +47207,10 @@ _sk_load_bgra_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 25c90 <_sk_load_bgra_sse41_8bit+0x44>
+ .byte 117,35 // jne 261c0 <_sk_load_bgra_sse41_8bit+0x44>
.byte 243,66,15,111,76,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm1
.byte 243,66,15,111,4,130 // movdqu (%rdx,%r8,4),%xmm0
- .byte 102,15,111,37,62,104,0,0 // movdqa 0x683e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
+ .byte 102,15,111,37,78,104,0,0 // movdqa 0x684e(%rip),%xmm4 # 2ca00 <_sk_overlay_sse2_8bit+0x151b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46931,24 +47220,24 @@ _sk_load_bgra_sse41_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,213 // ja 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 119,213 // ja 261aa <_sk_load_bgra_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25d00 <_sk_load_bgra_sse41_8bit+0xb4>
+ .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 26230 <_sk_load_bgra_sse41_8bit+0xb4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,4,130 // movd (%rdx,%r8,4),%xmm0
- .byte 235,185 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 235,185 // jmp 261aa <_sk_load_bgra_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,196,15 // pblendw $0xf,%xmm4,%xmm0
- .byte 235,159 // jmp 25c7a <_sk_load_bgra_sse41_8bit+0x2e>
+ .byte 235,159 // jmp 261aa <_sk_load_bgra_sse41_8bit+0x2e>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 102,66,15,58,34,76,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
.byte 102,66,15,58,34,76,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- .byte 233,118,255,255,255 // jmpq 25c74 <_sk_load_bgra_sse41_8bit+0x28>
+ .byte 233,118,255,255,255 // jmpq 261a4 <_sk_load_bgra_sse41_8bit+0x28>
.byte 102,144 // xchg %ax,%ax
.byte 185,255,255,255,205 // mov $0xcdffffff,%ecx
.byte 255 // (bad)
@@ -46981,10 +47270,10 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,35 // jne 25d60 <_sk_load_bgra_dst_sse41_8bit+0x44>
+ .byte 117,35 // jne 26290 <_sk_load_bgra_dst_sse41_8bit+0x44>
.byte 243,66,15,111,92,130,16 // movdqu 0x10(%rdx,%r8,4),%xmm3
.byte 243,66,15,111,20,130 // movdqu (%rdx,%r8,4),%xmm2
- .byte 102,15,111,37,110,103,0,0 // movdqa 0x676e(%rip),%xmm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
+ .byte 102,15,111,37,126,103,0,0 // movdqa 0x677e(%rip),%xmm4 # 2ca00 <_sk_overlay_sse2_8bit+0x151b>
.byte 102,15,56,0,212 // pshufb %xmm4,%xmm2
.byte 102,15,56,0,220 // pshufb %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -46994,24 +47283,24 @@ _sk_load_bgra_dst_sse41_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,213 // ja 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 119,213 // ja 2627a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 25dd0 <_sk_load_bgra_dst_sse41_8bit+0xb4>
+ .byte 72,141,13,80,0,0,0 // lea 0x50(%rip),%rcx # 26300 <_sk_load_bgra_dst_sse41_8bit+0xb4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,110,20,130 // movd (%rdx,%r8,4),%xmm2
- .byte 235,185 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 235,185 // jmp 2627a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 243,66,15,126,36,130 // movq (%rdx,%r8,4),%xmm4
.byte 102,15,58,14,212,15 // pblendw $0xf,%xmm4,%xmm2
- .byte 235,159 // jmp 25d4a <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ .byte 235,159 // jmp 2627a <_sk_load_bgra_dst_sse41_8bit+0x2e>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 102,66,15,58,34,92,130,20,1 // pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
.byte 102,66,15,58,34,92,130,16,0 // pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- .byte 233,118,255,255,255 // jmpq 25d44 <_sk_load_bgra_dst_sse41_8bit+0x28>
+ .byte 233,118,255,255,255 // jmpq 26274 <_sk_load_bgra_dst_sse41_8bit+0x28>
.byte 102,144 // xchg %ax,%ax
.byte 185,255,255,255,205 // mov $0xcdffffff,%ecx
.byte 255 // (bad)
@@ -47043,13 +47332,13 @@ _sk_store_bgra_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 102,15,111,53,176,102,0,0 // movdqa 0x66b0(%rip),%xmm6 # 2c4c0 <_sk_overlay_sse2_8bit+0x150b>
+ .byte 102,15,111,53,192,102,0,0 // movdqa 0x66c0(%rip),%xmm6 # 2ca00 <_sk_overlay_sse2_8bit+0x151b>
.byte 102,15,111,233 // movdqa %xmm1,%xmm5
.byte 102,15,56,0,238 // pshufb %xmm6,%xmm5
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,230 // pshufb %xmm6,%xmm4
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 25e38 <_sk_store_bgra_sse41_8bit+0x4c>
+ .byte 117,17 // jne 26368 <_sk_store_bgra_sse41_8bit+0x4c>
.byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4)
.byte 243,66,15,127,108,138,16 // movdqu %xmm5,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47057,22 +47346,22 @@ _sk_store_bgra_sse41_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 25e34 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 119,239 // ja 26364 <_sk_store_bgra_sse41_8bit+0x48>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 25e94 <_sk_store_bgra_sse41_8bit+0xa8>
+ .byte 72,141,13,68,0,0,0 // lea 0x44(%rip),%rcx # 263c4 <_sk_store_bgra_sse41_8bit+0xa8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,36,138 // movd %xmm4,(%rdx,%r9,4)
- .byte 235,211 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,211 // jmp 26364 <_sk_store_bgra_sse41_8bit+0x48>
.byte 102,66,15,58,22,100,138,8,2 // pextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,36,138 // movq %xmm4,(%rdx,%r9,4)
- .byte 235,194 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,194 // jmp 26364 <_sk_store_bgra_sse41_8bit+0x48>
.byte 102,66,15,58,22,108,138,24,2 // pextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
.byte 102,66,15,58,22,108,138,20,1 // pextrd $0x1,%xmm5,0x14(%rdx,%r9,4)
.byte 102,66,15,126,108,138,16 // movd %xmm5,0x10(%rdx,%r9,4)
.byte 243,66,15,127,36,138 // movdqu %xmm4,(%rdx,%r9,4)
- .byte 235,161 // jmp 25e34 <_sk_store_bgra_sse41_8bit+0x48>
+ .byte 235,161 // jmp 26364 <_sk_store_bgra_sse41_8bit+0x48>
.byte 144 // nop
.byte 197,255,255 // (bad)
.byte 255,214 // callq *%rsi
@@ -47107,9 +47396,9 @@ _sk_load_a8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,42 // jne 25ef7 <_sk_load_a8_sse41_8bit+0x47>
+ .byte 117,42 // jne 26427 <_sk_load_a8_sse41_8bit+0x47>
.byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,180,94,0,0 // pand 0x5eb4(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,13,196,94,0,0 // pand 0x5ec4(%rip),%xmm1 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -47121,15 +47410,15 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 25ed4 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 119,204 // ja 26404 <_sk_load_a8_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 25f88 <_sk_load_a8_sse41_8bit+0xd8>
+ .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 264b8 <_sk_load_a8_sse41_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,173 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,173 // jmp 26404 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -47137,7 +47426,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 235,136 // jmp 25ed4 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 235,136 // jmp 26404 <_sk_load_a8_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -47148,7 +47437,7 @@ _sk_load_a8_sse41_8bit:
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,77,255,255,255 // jmpq 25ed4 <_sk_load_a8_sse41_8bit+0x24>
+ .byte 233,77,255,255,255 // jmpq 26404 <_sk_load_a8_sse41_8bit+0x24>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -47157,7 +47446,7 @@ _sk_load_a8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf025f98 <_sk_overlay_sse2_8bit+0xffffffffdeffafe3>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0264c8 <_sk_overlay_sse2_8bit+0xffffffffdeffafe3>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -47180,9 +47469,9 @@ _sk_load_a8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,42 // jne 25feb <_sk_load_a8_dst_sse41_8bit+0x47>
+ .byte 117,42 // jne 2651b <_sk_load_a8_dst_sse41_8bit+0x47>
.byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3
- .byte 102,15,219,29,192,93,0,0 // pand 0x5dc0(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,29,208,93,0,0 // pand 0x5dd0(%rip),%xmm3 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -47194,15 +47483,15 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,204 // ja 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 119,204 // ja 264f8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 2607c <_sk_load_a8_dst_sse41_8bit+0xd8>
+ .byte 72,141,13,117,0,0,0 // lea 0x75(%rip),%rcx # 265ac <_sk_load_a8_dst_sse41_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,173 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,173 // jmp 264f8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -47210,7 +47499,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 235,136 // jmp 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 235,136 // jmp 264f8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -47221,7 +47510,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,77,255,255,255 // jmpq 25fc8 <_sk_load_a8_dst_sse41_8bit+0x24>
+ .byte 233,77,255,255,255 // jmpq 264f8 <_sk_load_a8_dst_sse41_8bit+0x24>
.byte 144 // nop
.byte 148 // xchg %eax,%esp
.byte 255 // (bad)
@@ -47230,7 +47519,7 @@ _sk_load_a8_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf02608c <_sk_overlay_sse2_8bit+0xffffffffdeffb0d7>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf0265bc <_sk_overlay_sse2_8bit+0xffffffffdeffb0d7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -47252,39 +47541,39 @@ _sk_store_a8_sse41_8bit:
.byte 72,99,87,8 // movslq 0x8(%rdi),%rdx
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
- .byte 102,15,111,45,24,100,0,0 // movdqa 0x6418(%rip),%xmm5 # 2c4d0 <_sk_overlay_sse2_8bit+0x151b>
+ .byte 102,15,111,45,40,100,0,0 // movdqa 0x6428(%rip),%xmm5 # 2ca10 <_sk_overlay_sse2_8bit+0x152b>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,245 // pshufb %xmm5,%xmm6
.byte 102,15,111,224 // movdqa %xmm0,%xmm4
.byte 102,15,56,0,229 // pshufb %xmm5,%xmm4
.byte 102,15,108,230 // punpcklqdq %xmm6,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,19 // jne 260e6 <_sk_store_a8_sse41_8bit+0x4e>
- .byte 102,15,56,0,37,180,99,0,0 // pshufb 0x63b4(%rip),%xmm4 # 2c490 <_sk_overlay_sse2_8bit+0x14db>
+ .byte 117,19 // jne 26616 <_sk_store_a8_sse41_8bit+0x4e>
+ .byte 102,15,56,0,37,196,99,0,0 // pshufb 0x63c4(%rip),%xmm4 # 2c9d0 <_sk_overlay_sse2_8bit+0x14eb>
.byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 255,224 // jmpq *%rax
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 260e2 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 119,239 // ja 26612 <_sk_store_a8_sse41_8bit+0x4a>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 2615c <_sk_store_a8_sse41_8bit+0xc4>
+ .byte 72,141,13,94,0,0,0 // lea 0x5e(%rip),%rcx # 2668c <_sk_store_a8_sse41_8bit+0xc4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,58,20,36,2,0 // pextrb $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,209 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,209 // jmp 26612 <_sk_store_a8_sse41_8bit+0x4a>
.byte 102,66,15,58,20,100,2,2,4 // pextrb $0x4,%xmm4,0x2(%rdx,%r8,1)
- .byte 102,15,56,0,37,125,92,0,0 // pshufb 0x5c7d(%rip),%xmm4 # 2bda0 <_sk_overlay_sse2_8bit+0xdeb>
+ .byte 102,15,56,0,37,141,92,0,0 // pshufb 0x5c8d(%rip),%xmm4 # 2c2e0 <_sk_overlay_sse2_8bit+0xdfb>
.byte 102,66,15,58,21,36,2,0 // pextrw $0x0,%xmm4,(%rdx,%r8,1)
- .byte 235,181 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,181 // jmp 26612 <_sk_store_a8_sse41_8bit+0x4a>
.byte 102,66,15,58,20,100,2,6,12 // pextrb $0xc,%xmm4,0x6(%rdx,%r8,1)
.byte 102,66,15,58,20,100,2,5,10 // pextrb $0xa,%xmm4,0x5(%rdx,%r8,1)
.byte 102,66,15,58,20,100,2,4,8 // pextrb $0x8,%xmm4,0x4(%rdx,%r8,1)
- .byte 102,15,56,0,37,95,92,0,0 // pshufb 0x5c5f(%rip),%xmm4 # 2bdb0 <_sk_overlay_sse2_8bit+0xdfb>
+ .byte 102,15,56,0,37,111,92,0,0 // pshufb 0x5c6f(%rip),%xmm4 # 2c2f0 <_sk_overlay_sse2_8bit+0xe0b>
.byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1)
- .byte 235,137 // jmp 260e2 <_sk_store_a8_sse41_8bit+0x4a>
+ .byte 235,137 // jmp 26612 <_sk_store_a8_sse41_8bit+0x4a>
.byte 15,31,0 // nopl (%rax)
.byte 171 // stos %eax,%es:(%rdi)
.byte 255 // (bad)
@@ -47320,16 +47609,16 @@ _sk_load_g8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,66 // jne 261d7 <_sk_load_g8_sse41_8bit+0x5f>
+ .byte 117,66 // jne 26707 <_sk_load_g8_sse41_8bit+0x5f>
.byte 102,66,15,56,48,12,2 // pmovzxbw (%rdx,%r8,1),%xmm1
- .byte 102,15,219,13,236,91,0,0 // pand 0x5bec(%rip),%xmm1 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,13,252,91,0,0 // pand 0x5bfc(%rip),%xmm1 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,193 // pmovzxwd %xmm1,%xmm0
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
- .byte 102,15,111,37,39,99,0,0 // movdqa 0x6327(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
+ .byte 102,15,111,37,55,99,0,0 // movdqa 0x6337(%rip),%xmm4 # 2ca20 <_sk_overlay_sse2_8bit+0x153b>
.byte 102,15,56,64,204 // pmulld %xmm4,%xmm1
.byte 102,15,56,64,196 // pmulld %xmm4,%xmm0
- .byte 102,15,111,37,213,98,0,0 // movdqa 0x62d5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,37,229,98,0,0 // movdqa 0x62e5(%rip),%xmm4 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47338,15 +47627,15 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 2619c <_sk_load_g8_sse41_8bit+0x24>
+ .byte 119,180 // ja 266cc <_sk_load_g8_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2626c <_sk_load_g8_sse41_8bit+0xf4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2679c <_sk_load_g8_sse41_8bit+0xf4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,200 // movd %eax,%xmm1
- .byte 235,149 // jmp 2619c <_sk_load_g8_sse41_8bit+0x24>
+ .byte 235,149 // jmp 266cc <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,2 // pinsrw $0x2,%eax,%xmm1
@@ -47354,7 +47643,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,15,110,192 // movd %eax,%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,3 // pblendw $0x3,%xmm0,%xmm1
- .byte 233,109,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24>
+ .byte 233,109,255,255,255 // jmpq 266cc <_sk_load_g8_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,196,200,6 // pinsrw $0x6,%eax,%xmm1
@@ -47365,7 +47654,7 @@ _sk_load_g8_sse41_8bit:
.byte 102,66,15,110,4,2 // movd (%rdx,%r8,1),%xmm0
.byte 102,15,56,48,192 // pmovzxbw %xmm0,%xmm0
.byte 102,15,58,14,200,15 // pblendw $0xf,%xmm0,%xmm1
- .byte 233,50,255,255,255 // jmpq 2619c <_sk_load_g8_sse41_8bit+0x24>
+ .byte 233,50,255,255,255 // jmpq 266cc <_sk_load_g8_sse41_8bit+0x24>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -47374,7 +47663,7 @@ _sk_load_g8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde02627c <_sk_overlay_sse2_8bit+0xffffffffddffb2c7>
+ .byte 232,255,255,255,221 // callq ffffffffde0267ac <_sk_overlay_sse2_8bit+0xffffffffddffb2c7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -47397,16 +47686,16 @@ _sk_load_g8_dst_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,66 // jne 262e7 <_sk_load_g8_dst_sse41_8bit+0x5f>
+ .byte 117,66 // jne 26817 <_sk_load_g8_dst_sse41_8bit+0x5f>
.byte 102,66,15,56,48,28,2 // pmovzxbw (%rdx,%r8,1),%xmm3
- .byte 102,15,219,29,220,90,0,0 // pand 0x5adc(%rip),%xmm3 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,29,236,90,0,0 // pand 0x5aec(%rip),%xmm3 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,56,51,211 // pmovzxwd %xmm3,%xmm2
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
- .byte 102,15,111,37,23,98,0,0 // movdqa 0x6217(%rip),%xmm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
+ .byte 102,15,111,37,39,98,0,0 // movdqa 0x6227(%rip),%xmm4 # 2ca20 <_sk_overlay_sse2_8bit+0x153b>
.byte 102,15,56,64,220 // pmulld %xmm4,%xmm3
.byte 102,15,56,64,212 // pmulld %xmm4,%xmm2
- .byte 102,15,111,37,197,97,0,0 // movdqa 0x61c5(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,37,213,97,0,0 // movdqa 0x61d5(%rip),%xmm4 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47415,15 +47704,15 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,180 // ja 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 119,180 // ja 267dc <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 2637c <_sk_load_g8_dst_sse41_8bit+0xf4>
+ .byte 72,141,13,121,0,0,0 // lea 0x79(%rip),%rcx # 268ac <_sk_load_g8_dst_sse41_8bit+0xf4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,216 // movd %eax,%xmm3
- .byte 235,149 // jmp 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 235,149 // jmp 267dc <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,2 // pinsrw $0x2,%eax,%xmm3
@@ -47431,7 +47720,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,15,110,208 // movd %eax,%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,3 // pblendw $0x3,%xmm2,%xmm3
- .byte 233,109,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 233,109,255,255,255 // jmpq 267dc <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,196,216,6 // pinsrw $0x6,%eax,%xmm3
@@ -47442,7 +47731,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 102,66,15,110,20,2 // movd (%rdx,%r8,1),%xmm2
.byte 102,15,56,48,210 // pmovzxbw %xmm2,%xmm2
.byte 102,15,58,14,218,15 // pblendw $0xf,%xmm2,%xmm3
- .byte 233,50,255,255,255 // jmpq 262ac <_sk_load_g8_dst_sse41_8bit+0x24>
+ .byte 233,50,255,255,255 // jmpq 267dc <_sk_load_g8_dst_sse41_8bit+0x24>
.byte 102,144 // xchg %ax,%ax
.byte 144 // nop
.byte 255 // (bad)
@@ -47451,7 +47740,7 @@ _sk_load_g8_dst_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 232,255,255,255,221 // callq ffffffffde02638c <_sk_overlay_sse2_8bit+0xffffffffddffb3d7>
+ .byte 232,255,255,255,221 // callq ffffffffde0268bc <_sk_overlay_sse2_8bit+0xffffffffddffb3d7>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,210 // callq *%rdx
@@ -47475,11 +47764,11 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,206,0,0,0 // jne 2648b <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
+ .byte 15,133,206,0,0,0 // jne 269bb <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
.byte 243,70,15,111,68,138,16 // movdqu 0x10(%rdx,%r9,4),%xmm8
.byte 243,70,15,111,12,138 // movdqu (%rdx,%r9,4),%xmm9
.byte 77,133,192 // test %r8,%r8
- .byte 102,15,111,37,219,96,0,0 // movdqa 0x60db(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,37,235,96,0,0 // movdqa 0x60eb(%rip),%xmm4 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,111,241 // movdqa %xmm1,%xmm6
.byte 102,15,56,0,244 // pshufb %xmm4,%xmm6
.byte 102,15,111,248 // movdqa %xmm0,%xmm7
@@ -47513,7 +47802,7 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,68,15,248,204 // psubb %xmm4,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,72 // jne 264c2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
+ .byte 117,72 // jne 269f2 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
.byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -47524,43 +47813,43 @@ _sk_srcover_rgba_8888_sse41_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 254,200 // dec %al
.byte 60,6 // cmp $0x6,%al
- .byte 15,135,38,255,255,255 // ja 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 15,135,38,255,255,255 // ja 268fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 26568 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
+ .byte 72,141,13,186,0,0,0 // lea 0xba(%rip),%rcx # 26a98 <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,110,12,138 // movd (%rdx,%r9,4),%xmm9
- .byte 233,8,255,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 233,8,255,255,255 // jmpq 268fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,184 // ja 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 119,184 // ja 269b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 26584 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
+ .byte 72,141,13,170,0,0,0 // lea 0xaa(%rip),%rcx # 26ab4 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4)
- .byte 235,156 // jmp 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 235,156 // jmp 269b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 243,66,15,126,36,138 // movq (%rdx,%r9,4),%xmm4
.byte 102,68,15,58,14,204,15 // pblendw $0xf,%xmm4,%xmm9
- .byte 233,192,254,255,255 // jmpq 263ca <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ .byte 233,192,254,255,255 // jmpq 268fa <_sk_srcover_rgba_8888_sse41_8bit+0x32>
.byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 102,70,15,58,34,68,138,20,1 // pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8
.byte 102,70,15,58,34,68,138,16,0 // pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8
- .byte 233,150,254,255,255 // jmpq 263c4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
+ .byte 233,150,254,255,255 // jmpq 268f4 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
.byte 102,70,15,58,22,76,138,8,2 // pextrd $0x2,%xmm9,0x8(%rdx,%r9,4)
.byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4)
- .byte 233,69,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 233,69,255,255,255 // jmpq 269b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,70,15,58,22,68,138,24,2 // pextrd $0x2,%xmm8,0x18(%rdx,%r9,4)
.byte 102,70,15,58,22,68,138,20,1 // pextrd $0x1,%xmm8,0x14(%rdx,%r9,4)
.byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4)
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
- .byte 233,33,255,255,255 // jmpq 26487 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ .byte 233,33,255,255,255 // jmpq 269b7 <_sk_srcover_rgba_8888_sse41_8bit+0xef>
.byte 102,144 // xchg %ax,%ax
.byte 79,255 // rex.WRXB (bad)
.byte 255 // (bad)
@@ -47601,7 +47890,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,110,78,0,0 // mulss 0x4e6e(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,5,110,78,0,0 // mulss 0x4e6e(%rip),%xmm0 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 15,87,192 // xorps %xmm0,%xmm0
.byte 102,68,15,56,48,197 // pmovzxbw %xmm5,%xmm8
@@ -47609,7 +47898,7 @@ _sk_scale_1_float_sse41_8bit:
.byte 102,68,15,56,48,204 // pmovzxbw %xmm4,%xmm9
.byte 102,15,104,224 // punpckhbw %xmm0,%xmm4
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 102,15,56,0,53,18,95,0,0 // pshufb 0x5f12(%rip),%xmm6 # 2c4f0 <_sk_overlay_sse2_8bit+0x153b>
+ .byte 102,15,56,0,53,34,95,0,0 // pshufb 0x5f22(%rip),%xmm6 # 2ca30 <_sk_overlay_sse2_8bit+0x154b>
.byte 102,15,111,206 // movdqa %xmm6,%xmm1
.byte 102,65,15,213,201 // pmullw %xmm9,%xmm1
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
@@ -47642,13 +47931,13 @@ _sk_scale_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,160,0,0,0 // jne 266ef <_sk_scale_u8_sse41_8bit+0xc1>
+ .byte 15,133,160,0,0,0 // jne 26c1f <_sk_scale_u8_sse41_8bit+0xc1>
.byte 102,66,15,56,48,52,2 // pmovzxbw (%rdx,%r8,1),%xmm6
- .byte 102,15,219,53,50,87,0,0 // pand 0x5732(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,53,66,87,0,0 // pand 0x5742(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
- .byte 102,15,56,0,61,144,94,0,0 // pshufb 0x5e90(%rip),%xmm7 # 2c500 <_sk_overlay_sse2_8bit+0x154b>
- .byte 102,15,56,0,53,151,94,0,0 // pshufb 0x5e97(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0x155b>
+ .byte 102,15,56,0,61,160,94,0,0 // pshufb 0x5ea0(%rip),%xmm7 # 2ca40 <_sk_overlay_sse2_8bit+0x155b>
+ .byte 102,15,56,0,53,167,94,0,0 // pshufb 0x5ea7(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0x156b>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -47679,15 +47968,15 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,82,255,255,255 // ja 26656 <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 15,135,82,255,255,255 // ja 26b86 <_sk_scale_u8_sse41_8bit+0x28>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 2678c <_sk_scale_u8_sse41_8bit+0x15e>
+ .byte 72,141,13,125,0,0,0 // lea 0x7d(%rip),%rcx # 26cbc <_sk_scale_u8_sse41_8bit+0x15e>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,240 // movd %eax,%xmm6
- .byte 233,48,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,48,255,255,255 // jmpq 26b86 <_sk_scale_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,2 // pinsrw $0x2,%eax,%xmm6
@@ -47695,7 +47984,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,3 // pblendw $0x3,%xmm4,%xmm6
- .byte 233,8,255,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,8,255,255,255 // jmpq 26b86 <_sk_scale_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,15,196,240,6 // pinsrw $0x6,%eax,%xmm6
@@ -47706,7 +47995,7 @@ _sk_scale_u8_sse41_8bit:
.byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4
.byte 102,15,56,48,228 // pmovzxbw %xmm4,%xmm4
.byte 102,15,58,14,244,15 // pblendw $0xf,%xmm4,%xmm6
- .byte 233,205,254,255,255 // jmpq 26656 <_sk_scale_u8_sse41_8bit+0x28>
+ .byte 233,205,254,255,255 // jmpq 26b86 <_sk_scale_u8_sse41_8bit+0x28>
.byte 15,31,0 // nopl (%rax)
.byte 140,255 // mov %?,%edi
.byte 255 // (bad)
@@ -47733,7 +48022,7 @@ FUNCTION(_sk_lerp_1_float_sse41_8bit)
_sk_lerp_1_float_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,110,76,0,0 // mulss 0x4c6e(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,37,110,76,0,0 // mulss 0x4c6e(%rip),%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -47744,7 +48033,7 @@ _sk_lerp_1_float_sse41_8bit:
.byte 102,65,15,104,193 // punpckhbw %xmm9,%xmm0
.byte 102,68,15,56,48,217 // pmovzxbw %xmm1,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,56,0,61,47,93,0,0 // pshufb 0x5d2f(%rip),%xmm7 # 2c520 <_sk_overlay_sse2_8bit+0x156b>
+ .byte 102,15,56,0,61,63,93,0,0 // pshufb 0x5d3f(%rip),%xmm7 # 2ca60 <_sk_overlay_sse2_8bit+0x157b>
.byte 102,68,15,111,231 // movdqa %xmm7,%xmm12
.byte 102,69,15,213,227 // pmullw %xmm11,%xmm12
.byte 102,68,15,111,239 // movdqa %xmm7,%xmm13
@@ -47805,13 +48094,13 @@ _sk_lerp_u8_sse41_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,46,1,0,0 // jne 26a19 <_sk_lerp_u8_sse41_8bit+0x14f>
+ .byte 15,133,46,1,0,0 // jne 26f49 <_sk_lerp_u8_sse41_8bit+0x14f>
.byte 102,66,15,56,48,60,2 // pmovzxbw (%rdx,%r8,1),%xmm7
- .byte 102,15,219,61,150,84,0,0 // pand 0x5496(%rip),%xmm7 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,61,166,84,0,0 // pand 0x54a6(%rip),%xmm7 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,111,247 // movdqa %xmm7,%xmm6
- .byte 102,15,56,0,53,244,91,0,0 // pshufb 0x5bf4(%rip),%xmm6 # 2c500 <_sk_overlay_sse2_8bit+0x154b>
- .byte 102,15,56,0,61,251,91,0,0 // pshufb 0x5bfb(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0x155b>
+ .byte 102,15,56,0,53,4,92,0,0 // pshufb 0x5c04(%rip),%xmm6 # 2ca40 <_sk_overlay_sse2_8bit+0x155b>
+ .byte 102,15,56,0,61,11,92,0,0 // pshufb 0x5c0b(%rip),%xmm7 # 2ca50 <_sk_overlay_sse2_8bit+0x156b>
.byte 102,68,15,56,48,200 // pmovzxbw %xmm0,%xmm9
.byte 102,65,15,104,192 // punpckhbw %xmm8,%xmm0
.byte 102,68,15,56,48,209 // pmovzxbw %xmm1,%xmm10
@@ -47871,15 +48160,15 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,196,254,255,255 // ja 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 15,135,196,254,255,255 // ja 26e22 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 26ab4 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ .byte 72,141,13,123,0,0,0 // lea 0x7b(%rip),%rcx # 26fe4 <_sk_lerp_u8_sse41_8bit+0x1ea>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,248 // movd %eax,%xmm7
- .byte 233,162,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,162,254,255,255 // jmpq 26e22 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,2 // pinsrw $0x2,%eax,%xmm7
@@ -47887,7 +48176,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,3 // pblendw $0x3,%xmm5,%xmm7
- .byte 233,122,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,122,254,255,255 // jmpq 26e22 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,255 // pxor %xmm7,%xmm7
.byte 102,15,196,248,6 // pinsrw $0x6,%eax,%xmm7
@@ -47898,7 +48187,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5
.byte 102,15,56,48,237 // pmovzxbw %xmm5,%xmm5
.byte 102,15,58,14,253,15 // pblendw $0xf,%xmm5,%xmm7
- .byte 233,63,254,255,255 // jmpq 268f2 <_sk_lerp_u8_sse41_8bit+0x28>
+ .byte 233,63,254,255,255 // jmpq 26e22 <_sk_lerp_u8_sse41_8bit+0x28>
.byte 144 // nop
.byte 142,255 // mov %edi,%?
.byte 255 // (bad)
@@ -47906,7 +48195,7 @@ _sk_lerp_u8_sse41_8bit:
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,222 // jmpq ffffffffdf026ac4 <_sk_overlay_sse2_8bit+0xffffffffdeffbb0f>
+ .byte 233,255,255,255,222 // jmpq ffffffffdf026ff4 <_sk_overlay_sse2_8bit+0xffffffffdeffbb0f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,211 // callq *%rbx
@@ -47940,7 +48229,7 @@ HIDDEN _sk_black_color_sse41_8bit
FUNCTION(_sk_black_color_sse41_8bit)
_sk_black_color_sse41_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,179,89,0,0 // movaps 0x59b3(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 15,40,5,195,89,0,0 // movaps 0x59c3(%rip),%xmm0 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -47966,7 +48255,7 @@ HIDDEN _sk_srcatop_sse41_8bit
.globl _sk_srcatop_sse41_8bit
FUNCTION(_sk_srcatop_sse41_8bit)
_sk_srcatop_sse41_8bit:
- .byte 102,68,15,111,21,159,89,0,0 // movdqa 0x599f(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,21,175,89,0,0 // movdqa 0x59af(%rip),%xmm10 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,195 // pmovzxbw %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
@@ -48036,7 +48325,7 @@ HIDDEN _sk_dstatop_sse41_8bit
.globl _sk_dstatop_sse41_8bit
FUNCTION(_sk_dstatop_sse41_8bit)
_sk_dstatop_sse41_8bit:
- .byte 102,68,15,111,29,100,88,0,0 // movdqa 0x5864(%rip),%xmm11 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,29,116,88,0,0 // movdqa 0x5874(%rip),%xmm11 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,233 // movdqa %xmm1,%xmm13
.byte 102,69,15,56,0,235 // pshufb %xmm11,%xmm13
.byte 102,68,15,111,248 // movdqa %xmm0,%xmm15
@@ -48108,7 +48397,7 @@ FUNCTION(_sk_srcin_sse41_8bit)
_sk_srcin_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,27,87,0,0 // movdqa 0x571b(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,5,43,87,0,0 // movdqa 0x572b(%rip),%xmm0 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
.byte 102,15,56,0,240 // pshufb %xmm0,%xmm6
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
@@ -48143,7 +48432,7 @@ HIDDEN _sk_dstin_sse41_8bit
.globl _sk_dstin_sse41_8bit
FUNCTION(_sk_dstin_sse41_8bit)
_sk_dstin_sse41_8bit:
- .byte 102,15,111,37,142,86,0,0 // movdqa 0x568e(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,37,158,86,0,0 // movdqa 0x569e(%rip),%xmm4 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,69,15,239,210 // pxor %xmm10,%xmm10
@@ -48182,7 +48471,7 @@ FUNCTION(_sk_srcout_sse41_8bit)
_sk_srcout_sse41_8bit:
.byte 102,15,111,225 // movdqa %xmm1,%xmm4
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
- .byte 102,15,111,5,241,85,0,0 // movdqa 0x55f1(%rip),%xmm0 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,5,1,86,0,0 // movdqa 0x5601(%rip),%xmm0 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,111,250 // movdqa %xmm2,%xmm7
.byte 102,15,56,0,248 // pshufb %xmm0,%xmm7
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48220,7 +48509,7 @@ HIDDEN _sk_dstout_sse41_8bit
.globl _sk_dstout_sse41_8bit
FUNCTION(_sk_dstout_sse41_8bit)
_sk_dstout_sse41_8bit:
- .byte 102,15,111,37,88,85,0,0 // movdqa 0x5558(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,37,104,85,0,0 // movdqa 0x5568(%rip),%xmm4 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,196 // pshufb %xmm4,%xmm0
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,118,228 // pcmpeqd %xmm4,%xmm4
@@ -48260,7 +48549,7 @@ HIDDEN _sk_srcover_sse41_8bit
.globl _sk_srcover_sse41_8bit
FUNCTION(_sk_srcover_sse41_8bit)
_sk_srcover_sse41_8bit:
- .byte 102,15,111,53,183,84,0,0 // movdqa 0x54b7(%rip),%xmm6 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,53,199,84,0,0 // movdqa 0x54c7(%rip),%xmm6 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,68,15,56,0,222 // pshufb %xmm6,%xmm11
.byte 102,15,111,232 // movdqa %xmm0,%xmm5
@@ -48301,7 +48590,7 @@ HIDDEN _sk_dstover_sse41_8bit
.globl _sk_dstover_sse41_8bit
FUNCTION(_sk_dstover_sse41_8bit)
_sk_dstover_sse41_8bit:
- .byte 102,68,15,111,5,7,84,0,0 // movdqa 0x5407(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,5,23,84,0,0 // movdqa 0x5417(%rip),%xmm8 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,209 // movdqa %xmm1,%xmm10
.byte 102,68,15,56,48,201 // pmovzxbw %xmm1,%xmm9
.byte 102,15,252,203 // paddb %xmm3,%xmm1
@@ -48380,7 +48669,7 @@ _sk_multiply_sse41_8bit:
.byte 102,15,111,218 // movdqa %xmm2,%xmm3
.byte 102,15,111,209 // movdqa %xmm1,%xmm2
.byte 102,15,111,200 // movdqa %xmm0,%xmm1
- .byte 102,68,15,111,53,197,82,0,0 // movdqa 0x52c5(%rip),%xmm14 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,53,213,82,0,0 // movdqa 0x52d5(%rip),%xmm14 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,195 // movdqa %xmm3,%xmm8
.byte 102,15,111,235 // movdqa %xmm3,%xmm5
.byte 102,65,15,56,0,238 // pshufb %xmm14,%xmm5
@@ -48509,7 +48798,7 @@ HIDDEN _sk_xor__sse41_8bit
.globl _sk_xor__sse41_8bit
FUNCTION(_sk_xor__sse41_8bit)
_sk_xor__sse41_8bit:
- .byte 102,68,15,111,21,131,80,0,0 // movdqa 0x5083(%rip),%xmm10 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,21,147,80,0,0 // movdqa 0x5093(%rip),%xmm10 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,226 // movdqa %xmm2,%xmm12
.byte 102,68,15,56,48,194 // pmovzxbw %xmm2,%xmm8
.byte 102,15,111,234 // movdqa %xmm2,%xmm5
@@ -48591,7 +48880,7 @@ HIDDEN _sk_darken_sse41_8bit
FUNCTION(_sk_darken_sse41_8bit)
_sk_darken_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,42,79,0,0 // movdqa 0x4f2a(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,5,58,79,0,0 // movdqa 0x4f3a(%rip),%xmm8 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48658,7 +48947,7 @@ _sk_darken_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,94,78,0,0 // movaps 0x4e5e(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 15,40,5,110,78,0,0 // movaps 0x4e6e(%rip),%xmm0 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48670,7 +48959,7 @@ HIDDEN _sk_lighten_sse41_8bit
FUNCTION(_sk_lighten_sse41_8bit)
_sk_lighten_sse41_8bit:
.byte 102,68,15,111,240 // movdqa %xmm0,%xmm14
- .byte 102,68,15,111,5,187,77,0,0 // movdqa 0x4dbb(%rip),%xmm8 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,68,15,111,5,203,77,0,0 // movdqa 0x4dcb(%rip),%xmm8 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48737,7 +49026,7 @@ _sk_lighten_sse41_8bit:
.byte 102,15,248,231 // psubb %xmm7,%xmm4
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,68,15,248,245 // psubb %xmm5,%xmm14
- .byte 15,40,5,239,76,0,0 // movaps 0x4cef(%rip),%xmm0 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 15,40,5,255,76,0,0 // movaps 0x4cff(%rip),%xmm0 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,56,16,244 // pblendvb %xmm0,%xmm4,%xmm14
.byte 102,65,15,56,16,200 // pblendvb %xmm0,%xmm8,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -48777,7 +49066,7 @@ _sk_exclusion_sse41_8bit:
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,253 // packuswb %xmm5,%xmm7
.byte 102,15,103,230 // packuswb %xmm6,%xmm4
- .byte 102,15,111,45,69,76,0,0 // movdqa 0x4c45(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 102,15,111,45,85,76,0,0 // movdqa 0x4c55(%rip),%xmm5 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,248,204 // psubb %xmm4,%xmm1
.byte 102,15,219,229 // pand %xmm5,%xmm4
.byte 102,15,219,239 // pand %xmm7,%xmm5
@@ -48792,7 +49081,7 @@ HIDDEN _sk_difference_sse41_8bit
FUNCTION(_sk_difference_sse41_8bit)
_sk_difference_sse41_8bit:
.byte 102,68,15,111,193 // movdqa %xmm1,%xmm8
- .byte 102,15,111,13,156,75,0,0 // movdqa 0x4b9c(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,13,172,75,0,0 // movdqa 0x4bac(%rip),%xmm1 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,111,219 // movdqa %xmm3,%xmm11
.byte 102,68,15,56,48,203 // pmovzxbw %xmm3,%xmm9
.byte 102,15,111,243 // movdqa %xmm3,%xmm6
@@ -48830,7 +49119,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,113,215,8 // psrlw $0x8,%xmm7
.byte 102,15,103,254 // packuswb %xmm6,%xmm7
- .byte 102,15,111,37,225,74,0,0 // movdqa 0x4ae1(%rip),%xmm4 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,37,241,74,0,0 // movdqa 0x4af1(%rip),%xmm4 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,15,56,0,204 // pshufb %xmm4,%xmm1
.byte 102,15,56,0,236 // pshufb %xmm4,%xmm5
.byte 102,69,15,104,236 // punpckhbw %xmm12,%xmm13
@@ -48855,7 +49144,7 @@ _sk_difference_sse41_8bit:
.byte 102,15,103,241 // packuswb %xmm1,%xmm6
.byte 102,65,15,218,230 // pminub %xmm14,%xmm4
.byte 102,15,218,247 // pminub %xmm7,%xmm6
- .byte 102,15,111,13,228,74,0,0 // movdqa 0x4ae4(%rip),%xmm1 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 102,15,111,13,244,74,0,0 // movdqa 0x4af4(%rip),%xmm1 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,68,15,248,198 // psubb %xmm6,%xmm8
.byte 102,15,219,241 // pand %xmm1,%xmm6
.byte 102,15,219,204 // pand %xmm4,%xmm1
@@ -48884,7 +49173,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,69,15,56,48,221 // pmovzxbw %xmm13,%xmm11
.byte 102,68,15,127,92,36,48 // movdqa %xmm11,0x30(%rsp)
- .byte 102,15,111,13,238,73,0,0 // movdqa 0x49ee(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,13,254,73,0,0 // movdqa 0x49fe(%rip),%xmm1 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,68,15,56,0,233 // pshufb %xmm1,%xmm13
.byte 102,69,15,56,48,205 // pmovzxbw %xmm13,%xmm9
@@ -48933,7 +49222,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,65,15,56,58,242 // pminuw %xmm10,%xmm6
.byte 102,15,117,240 // pcmpeqw %xmm0,%xmm6
.byte 102,15,127,116,36,64 // movdqa %xmm6,0x40(%rsp)
- .byte 102,15,111,53,210,65,0,0 // movdqa 0x41d2(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,111,53,226,65,0,0 // movdqa 0x41e2(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,111,199 // movdqa %xmm7,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,192 // pmullw %xmm8,%xmm0
@@ -49040,7 +49329,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,15,253,124,36,144 // paddw -0x70(%rsp),%xmm7
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,98,71,0,0 // movdqa 0x4762(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
+ .byte 102,15,111,5,114,71,0,0 // movdqa 0x4772(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,68,15,253,219 // paddw %xmm3,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -49049,7 +49338,7 @@ _sk_hardlight_sse41_8bit:
.byte 102,15,253,252 // paddw %xmm4,%xmm7
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,72,71,0,0 // movdqa 0x4748(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
+ .byte 102,15,111,5,88,71,0,0 // movdqa 0x4758(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x15ab>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -49084,7 +49373,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,127,76,36,128 // movdqa %xmm1,-0x80(%rsp)
.byte 102,65,15,56,48,206 // pmovzxbw %xmm14,%xmm1
.byte 102,15,127,140,36,144,0,0,0 // movdqa %xmm1,0x90(%rsp)
- .byte 102,15,111,13,17,70,0,0 // movdqa 0x4611(%rip),%xmm1 # 2c4b0 <_sk_overlay_sse2_8bit+0x14fb>
+ .byte 102,15,111,13,33,70,0,0 // movdqa 0x4621(%rip),%xmm1 # 2c9f0 <_sk_overlay_sse2_8bit+0x150b>
.byte 102,68,15,56,0,249 // pshufb %xmm1,%xmm15
.byte 102,68,15,56,0,241 // pshufb %xmm1,%xmm14
.byte 102,65,15,56,48,238 // pmovzxbw %xmm14,%xmm5
@@ -49136,7 +49425,7 @@ _sk_overlay_sse41_8bit:
.byte 102,65,15,56,58,221 // pminuw %xmm13,%xmm3
.byte 102,15,117,216 // pcmpeqw %xmm0,%xmm3
.byte 102,15,127,92,36,48 // movdqa %xmm3,0x30(%rsp)
- .byte 102,15,111,53,227,61,0,0 // movdqa 0x3de3(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,111,53,243,61,0,0 // movdqa 0x3df3(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,15,213,196 // pmullw %xmm4,%xmm0
@@ -49245,7 +49534,7 @@ _sk_overlay_sse41_8bit:
.byte 102,15,253,116,36,32 // paddw 0x20(%rsp),%xmm6
.byte 102,68,15,253,4,36 // paddw (%rsp),%xmm8
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,111,67,0,0 // movdqa 0x436f(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
+ .byte 102,15,111,5,127,67,0,0 // movdqa 0x437f(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
.byte 102,69,15,253,217 // paddw %xmm9,%xmm11
.byte 102,15,253,240 // paddw %xmm0,%xmm6
@@ -49254,7 +49543,7 @@ _sk_overlay_sse41_8bit:
.byte 102,68,15,253,195 // paddw %xmm3,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,234 // paddw %xmm2,%xmm5
- .byte 102,15,111,5,83,67,0,0 // movdqa 0x4353(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
+ .byte 102,15,111,5,99,67,0,0 // movdqa 0x4363(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x15ab>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
@@ -49296,7 +49585,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 73,137,246 // mov %rsi,%r14
.byte 72,137,77,168 // mov %rcx,-0x58(%rbp)
.byte 73,57,207 // cmp %rcx,%r15
- .byte 115,102 // jae 282e9 <_sk_start_pipeline_sse2_8bit+0x95>
+ .byte 115,102 // jae 28819 <_sk_start_pipeline_sse2_8bit+0x95>
.byte 72,139,69,208 // mov -0x30(%rbp),%rax
.byte 72,141,64,8 // lea 0x8(%rax),%rax
.byte 72,137,69,176 // mov %rax,-0x50(%rbp)
@@ -49306,7 +49595,7 @@ _sk_start_pipeline_sse2_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 76,137,125,192 // mov %r15,-0x40(%rbp)
.byte 72,199,69,200,0,0,0,0 // movq $0x0,-0x38(%rbp)
- .byte 119,30 // ja 282cb <_sk_start_pipeline_sse2_8bit+0x77>
+ .byte 119,30 // ja 287fb <_sk_start_pipeline_sse2_8bit+0x77>
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
@@ -49315,17 +49604,17 @@ _sk_start_pipeline_sse2_8bit:
.byte 72,137,69,184 // mov %rax,-0x48(%rbp)
.byte 72,131,193,16 // add $0x10,%rcx
.byte 72,57,217 // cmp %rbx,%rcx
- .byte 118,226 // jbe 282ad <_sk_start_pipeline_sse2_8bit+0x59>
+ .byte 118,226 // jbe 287dd <_sk_start_pipeline_sse2_8bit+0x59>
.byte 72,137,217 // mov %rbx,%rcx
.byte 72,41,193 // sub %rax,%rcx
- .byte 116,13 // je 282e0 <_sk_start_pipeline_sse2_8bit+0x8c>
+ .byte 116,13 // je 28810 <_sk_start_pipeline_sse2_8bit+0x8c>
.byte 72,137,77,200 // mov %rcx,-0x38(%rbp)
.byte 76,137,231 // mov %r12,%rdi
.byte 76,137,246 // mov %r14,%rsi
.byte 65,255,213 // callq *%r13
.byte 73,255,199 // inc %r15
.byte 76,59,125,168 // cmp -0x58(%rbp),%r15
- .byte 117,170 // jne 28293 <_sk_start_pipeline_sse2_8bit+0x3f>
+ .byte 117,170 // jne 287c3 <_sk_start_pipeline_sse2_8bit+0x3f>
.byte 72,131,196,56 // add $0x38,%rsp
.byte 91 // pop %rbx
.byte 65,92 // pop %r12
@@ -49357,7 +49646,7 @@ HIDDEN _sk_set_rgb_sse2_8bit
FUNCTION(_sk_set_rgb_sse2_8bit)
_sk_set_rgb_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 243,15,16,37,13,49,0,0 // movss 0x310d(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,16,37,13,49,0,0 // movss 0x310d(%rip),%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,16,40 // movss (%rax),%xmm5
.byte 243,15,89,236 // mulss %xmm4,%xmm5
.byte 243,72,15,44,205 // cvttss2si %xmm5,%rcx
@@ -49372,7 +49661,7 @@ _sk_set_rgb_sse2_8bit:
.byte 9,208 // or %edx,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,112,228,0 // pshufd $0x0,%xmm4,%xmm4
- .byte 102,15,111,45,73,65,0,0 // movdqa 0x4149(%rip),%xmm5 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,45,89,65,0,0 // movdqa 0x4159(%rip),%xmm5 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,219,205 // pand %xmm5,%xmm1
.byte 102,15,219,197 // pand %xmm5,%xmm0
.byte 102,15,235,196 // por %xmm4,%xmm0
@@ -49397,7 +49686,7 @@ _sk_premul_sse2_8bit:
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
.byte 242,15,112,192,95 // pshuflw $0x5f,%xmm0,%xmm0
.byte 243,15,112,248,95 // pshufhw $0x5f,%xmm0,%xmm7
- .byte 102,15,111,5,237,64,0,0 // movdqa 0x40ed(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,5,253,64,0,0 // movdqa 0x40fd(%rip),%xmm0 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,235,248 // por %xmm0,%xmm7
.byte 102,15,235,240 // por %xmm0,%xmm6
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
@@ -49478,7 +49767,7 @@ _sk_load_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 284d3 <_sk_load_8888_sse2_8bit+0x31>
+ .byte 117,16 // jne 28a03 <_sk_load_8888_sse2_8bit+0x31>
.byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1
.byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49488,18 +49777,18 @@ _sk_load_8888_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 284cf <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 119,231 // ja 289ff <_sk_load_8888_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 28544 <_sk_load_8888_sse2_8bit+0xa2>
+ .byte 72,141,13,81,0,0,0 // lea 0x51(%rip),%rcx # 28a74 <_sk_load_8888_sse2_8bit+0xa2>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0
- .byte 235,203 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 235,203 // jmp 289ff <_sk_load_8888_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 235,183 // jmp 284cf <_sk_load_8888_sse2_8bit+0x2d>
+ .byte 235,183 // jmp 289ff <_sk_load_8888_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0
@@ -49508,7 +49797,7 @@ _sk_load_8888_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 235,134 // jmp 284c9 <_sk_load_8888_sse2_8bit+0x27>
+ .byte 235,134 // jmp 289f9 <_sk_load_8888_sse2_8bit+0x27>
.byte 144 // nop
.byte 184,255,255,255,204 // mov $0xccffffff,%eax
.byte 255 // (bad)
@@ -49540,7 +49829,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,16 // jne 28591 <_sk_load_8888_dst_sse2_8bit+0x31>
+ .byte 117,16 // jne 28ac1 <_sk_load_8888_dst_sse2_8bit+0x31>
.byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3
.byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49550,18 +49839,18 @@ _sk_load_8888_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,231 // ja 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 119,231 // ja 28abd <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 28604 <_sk_load_8888_dst_sse2_8bit+0xa4>
+ .byte 72,141,13,83,0,0,0 // lea 0x53(%rip),%rcx # 28b34 <_sk_load_8888_dst_sse2_8bit+0xa4>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2
- .byte 235,203 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 235,203 // jmp 28abd <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 235,183 // jmp 2858d <_sk_load_8888_dst_sse2_8bit+0x2d>
+ .byte 235,183 // jmp 28abd <_sk_load_8888_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2
@@ -49570,7 +49859,7 @@ _sk_load_8888_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 235,134 // jmp 28587 <_sk_load_8888_dst_sse2_8bit+0x27>
+ .byte 235,134 // jmp 28ab7 <_sk_load_8888_dst_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 182,255 // mov $0xff,%dh
.byte 255 // (bad)
@@ -49605,7 +49894,7 @@ _sk_store_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 28652 <_sk_store_8888_sse2_8bit+0x32>
+ .byte 117,17 // jne 28b82 <_sk_store_8888_sse2_8bit+0x32>
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
.byte 243,66,15,127,76,138,16 // movdqu %xmm1,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49613,25 +49902,25 @@ _sk_store_8888_sse2_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 2864e <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 119,239 // ja 28b7e <_sk_store_8888_sse2_8bit+0x2e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 286b8 <_sk_store_8888_sse2_8bit+0x98>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 28be8 <_sk_store_8888_sse2_8bit+0x98>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,4,138 // movd %xmm0,(%rdx,%r9,4)
- .byte 235,211 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,211 // jmp 28b7e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,15,112,224,78 // pshufd $0x4e,%xmm0,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,4,138 // movq %xmm0,(%rdx,%r9,4)
- .byte 235,191 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,191 // jmp 28b7e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,15,112,225,78 // pshufd $0x4e,%xmm1,%xmm4
.byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4)
.byte 102,15,112,225,229 // pshufd $0xe5,%xmm1,%xmm4
.byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4)
.byte 102,66,15,126,76,138,16 // movd %xmm1,0x10(%rdx,%r9,4)
.byte 243,66,15,127,4,138 // movdqu %xmm0,(%rdx,%r9,4)
- .byte 235,152 // jmp 2864e <_sk_store_8888_sse2_8bit+0x2e>
+ .byte 235,152 // jmp 28b7e <_sk_store_8888_sse2_8bit+0x2e>
.byte 102,144 // xchg %ax,%ax
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -49667,7 +49956,7 @@ _sk_load_bgra_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,92 // jne 28751 <_sk_load_bgra_sse2_8bit+0x7d>
+ .byte 117,92 // jne 28c81 <_sk_load_bgra_sse2_8bit+0x7d>
.byte 66,15,16,76,130,16 // movups 0x10(%rdx,%r8,4),%xmm1
.byte 102,66,15,16,4,130 // movupd (%rdx,%r8,4),%xmm0
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -49694,18 +49983,18 @@ _sk_load_bgra_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,155 // ja 28701 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 119,155 // ja 28c31 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 287cc <_sk_load_bgra_sse2_8bit+0xf8>
+ .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 28cfc <_sk_load_bgra_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,4,130 // movss (%rdx,%r8,4),%xmm0
- .byte 233,124,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 233,124,255,255,255 // jmpq 28c31 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,8 // movd 0x8(%rdx,%r8,4),%xmm0
.byte 102,15,112,192,69 // pshufd $0x45,%xmm0,%xmm0
.byte 102,66,15,18,4,130 // movlpd (%rdx,%r8,4),%xmm0
- .byte 233,101,255,255,255 // jmpq 28701 <_sk_load_bgra_sse2_8bit+0x2d>
+ .byte 233,101,255,255,255 // jmpq 28c31 <_sk_load_bgra_sse2_8bit+0x2d>
.byte 102,66,15,110,68,130,24 // movd 0x18(%rdx,%r8,4),%xmm0
.byte 102,15,112,200,69 // pshufd $0x45,%xmm0,%xmm1
.byte 243,66,15,16,68,130,20 // movss 0x14(%rdx,%r8,4),%xmm0
@@ -49714,7 +50003,7 @@ _sk_load_bgra_sse2_8bit:
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 243,66,15,16,68,130,16 // movss 0x10(%rdx,%r8,4),%xmm0
.byte 243,15,16,200 // movss %xmm0,%xmm1
- .byte 233,49,255,255,255 // jmpq 286fb <_sk_load_bgra_sse2_8bit+0x27>
+ .byte 233,49,255,255,255 // jmpq 28c2b <_sk_load_bgra_sse2_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -49751,7 +50040,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,92 // jne 28865 <_sk_load_bgra_dst_sse2_8bit+0x7d>
+ .byte 117,92 // jne 28d95 <_sk_load_bgra_dst_sse2_8bit+0x7d>
.byte 66,15,16,92,130,16 // movups 0x10(%rdx,%r8,4),%xmm3
.byte 102,66,15,16,20,130 // movupd (%rdx,%r8,4),%xmm2
.byte 102,15,239,228 // pxor %xmm4,%xmm4
@@ -49778,18 +50067,18 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,155 // ja 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 119,155 // ja 28d45 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 288e0 <_sk_load_bgra_dst_sse2_8bit+0xf8>
+ .byte 72,141,13,91,0,0,0 // lea 0x5b(%rip),%rcx # 28e10 <_sk_load_bgra_dst_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,66,15,16,20,130 // movss (%rdx,%r8,4),%xmm2
- .byte 233,124,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 233,124,255,255,255 // jmpq 28d45 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,8 // movd 0x8(%rdx,%r8,4),%xmm2
.byte 102,15,112,210,69 // pshufd $0x45,%xmm2,%xmm2
.byte 102,66,15,18,20,130 // movlpd (%rdx,%r8,4),%xmm2
- .byte 233,101,255,255,255 // jmpq 28815 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ .byte 233,101,255,255,255 // jmpq 28d45 <_sk_load_bgra_dst_sse2_8bit+0x2d>
.byte 102,66,15,110,84,130,24 // movd 0x18(%rdx,%r8,4),%xmm2
.byte 102,15,112,218,69 // pshufd $0x45,%xmm2,%xmm3
.byte 243,66,15,16,84,130,20 // movss 0x14(%rdx,%r8,4),%xmm2
@@ -49798,7 +50087,7 @@ _sk_load_bgra_dst_sse2_8bit:
.byte 15,40,218 // movaps %xmm2,%xmm3
.byte 243,66,15,16,84,130,16 // movss 0x10(%rdx,%r8,4),%xmm2
.byte 243,15,16,218 // movss %xmm2,%xmm3
- .byte 233,49,255,255,255 // jmpq 2880f <_sk_load_bgra_dst_sse2_8bit+0x27>
+ .byte 233,49,255,255,255 // jmpq 28d3f <_sk_load_bgra_dst_sse2_8bit+0x27>
.byte 102,144 // xchg %ax,%ax
.byte 174 // scas %es:(%rdi),%al
.byte 255 // (bad)
@@ -49854,7 +50143,7 @@ _sk_store_bgra_sse2_8bit:
.byte 243,15,112,237,198 // pshufhw $0xc6,%xmm5,%xmm5
.byte 102,15,103,238 // packuswb %xmm6,%xmm5
.byte 77,133,192 // test %r8,%r8
- .byte 117,17 // jne 28982 <_sk_store_bgra_sse2_8bit+0x86>
+ .byte 117,17 // jne 28eb2 <_sk_store_bgra_sse2_8bit+0x86>
.byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4)
.byte 243,66,15,127,100,138,16 // movdqu %xmm4,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -49862,25 +50151,25 @@ _sk_store_bgra_sse2_8bit:
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,239 // ja 2897e <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 119,239 // ja 28eae <_sk_store_bgra_sse2_8bit+0x82>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 289e8 <_sk_store_bgra_sse2_8bit+0xec>
+ .byte 72,141,13,78,0,0,0 // lea 0x4e(%rip),%rcx # 28f18 <_sk_store_bgra_sse2_8bit+0xec>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,66,15,126,44,138 // movd %xmm5,(%rdx,%r9,4)
- .byte 235,211 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,211 // jmp 28eae <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,15,112,229,78 // pshufd $0x4e,%xmm5,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,66,15,214,44,138 // movq %xmm5,(%rdx,%r9,4)
- .byte 235,191 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,191 // jmp 28eae <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,15,112,244,78 // pshufd $0x4e,%xmm4,%xmm6
.byte 102,66,15,126,116,138,24 // movd %xmm6,0x18(%rdx,%r9,4)
.byte 102,15,112,244,229 // pshufd $0xe5,%xmm4,%xmm6
.byte 102,66,15,126,116,138,20 // movd %xmm6,0x14(%rdx,%r9,4)
.byte 102,66,15,126,100,138,16 // movd %xmm4,0x10(%rdx,%r9,4)
.byte 243,66,15,127,44,138 // movdqu %xmm5,(%rdx,%r9,4)
- .byte 235,152 // jmp 2897e <_sk_store_bgra_sse2_8bit+0x82>
+ .byte 235,152 // jmp 28eae <_sk_store_bgra_sse2_8bit+0x82>
.byte 102,144 // xchg %ax,%ax
.byte 187,255,255,255,207 // mov $0xcfffffff,%ebx
.byte 255 // (bad)
@@ -49915,10 +50204,10 @@ _sk_load_a8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,48 // jne 28a51 <_sk_load_a8_sse2_8bit+0x4d>
+ .byte 117,48 // jne 28f81 <_sk_load_a8_sse2_8bit+0x4d>
.byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,84,5,93,51,0,0 // andpd 0x335d(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,84,5,109,51,0,0 // andpd 0x336d(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,40,200 // movapd %xmm0,%xmm1
.byte 102,15,105,204 // punpckhwd %xmm4,%xmm1
@@ -49931,15 +50220,15 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 28a2b <_sk_load_a8_sse2_8bit+0x27>
+ .byte 119,201 // ja 28f5b <_sk_load_a8_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28adc <_sk_load_a8_sse2_8bit+0xd8>
+ .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 2900c <_sk_load_a8_sse2_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 235,170 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27>
+ .byte 235,170 // jmp 28f5b <_sk_load_a8_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -49947,7 +50236,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 235,136 // jmp 28a2b <_sk_load_a8_sse2_8bit+0x27>
+ .byte 235,136 // jmp 28f5b <_sk_load_a8_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -49958,7 +50247,7 @@ _sk_load_a8_sse2_8bit:
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,80,255,255,255 // jmpq 28a2b <_sk_load_a8_sse2_8bit+0x27>
+ .byte 233,80,255,255,255 // jmpq 28f5b <_sk_load_a8_sse2_8bit+0x27>
.byte 144 // nop
.byte 154 // (bad)
.byte 255 // (bad)
@@ -49992,10 +50281,10 @@ _sk_load_a8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,48 // jne 28b45 <_sk_load_a8_dst_sse2_8bit+0x4d>
+ .byte 117,48 // jne 29075 <_sk_load_a8_dst_sse2_8bit+0x4d>
.byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,84,21,105,50,0,0 // andpd 0x3269(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,84,21,121,50,0,0 // andpd 0x3279(%rip),%xmm2 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,40,218 // movapd %xmm2,%xmm3
.byte 102,15,105,220 // punpckhwd %xmm4,%xmm3
@@ -50008,15 +50297,15 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,201 // ja 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 119,201 // ja 2904f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 28bd0 <_sk_load_a8_dst_sse2_8bit+0xd8>
+ .byte 72,141,13,111,0,0,0 // lea 0x6f(%rip),%rcx # 29100 <_sk_load_a8_dst_sse2_8bit+0xd8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 235,170 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 235,170 // jmp 2904f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -50024,7 +50313,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 235,136 // jmp 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 235,136 // jmp 2904f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -50035,7 +50324,7 @@ _sk_load_a8_dst_sse2_8bit:
.byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,80,255,255,255 // jmpq 28b1f <_sk_load_a8_dst_sse2_8bit+0x27>
+ .byte 233,80,255,255,255 // jmpq 2904f <_sk_load_a8_dst_sse2_8bit+0x27>
.byte 144 // nop
.byte 154 // (bad)
.byte 255 // (bad)
@@ -50078,8 +50367,8 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,114,228,16 // psrad $0x10,%xmm4
.byte 102,15,107,229 // packssdw %xmm5,%xmm4
.byte 77,133,201 // test %r9,%r9
- .byte 117,22 // jne 28c49 <_sk_store_a8_sse2_8bit+0x5d>
- .byte 102,15,219,37,85,49,0,0 // pand 0x3155(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 117,22 // jne 29179 <_sk_store_a8_sse2_8bit+0x5d>
+ .byte 102,15,219,37,101,49,0,0 // pand 0x3165(%rip),%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,66,15,214,36,2 // movq %xmm4,(%rdx,%r8,1)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50087,24 +50376,24 @@ _sk_store_a8_sse2_8bit:
.byte 65,128,225,7 // and $0x7,%r9b
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,239 // ja 28c45 <_sk_store_a8_sse2_8bit+0x59>
+ .byte 119,239 // ja 29175 <_sk_store_a8_sse2_8bit+0x59>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 28ce4 <_sk_store_a8_sse2_8bit+0xf8>
+ .byte 72,141,13,131,0,0,0 // lea 0x83(%rip),%rcx # 29214 <_sk_store_a8_sse2_8bit+0xf8>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,15,127,100,36,168 // movdqa %xmm4,-0x58(%rsp)
.byte 138,68,36,168 // mov -0x58(%rsp),%al
.byte 66,136,4,2 // mov %al,(%rdx,%r8,1)
- .byte 235,203 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59>
+ .byte 235,203 // jmp 29175 <_sk_store_a8_sse2_8bit+0x59>
.byte 102,15,127,100,36,184 // movdqa %xmm4,-0x48(%rsp)
.byte 138,68,36,188 // mov -0x44(%rsp),%al
.byte 66,136,68,2,2 // mov %al,0x2(%rdx,%r8,1)
- .byte 102,15,219,37,255,48,0,0 // pand 0x30ff(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,37,15,49,0,0 // pand 0x310f(%rip),%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,15,126,224 // movd %xmm4,%eax
.byte 102,66,137,4,2 // mov %ax,(%rdx,%r8,1)
- .byte 235,165 // jmp 28c45 <_sk_store_a8_sse2_8bit+0x59>
+ .byte 235,165 // jmp 29175 <_sk_store_a8_sse2_8bit+0x59>
.byte 102,15,127,100,36,232 // movdqa %xmm4,-0x18(%rsp)
.byte 138,68,36,244 // mov -0xc(%rsp),%al
.byte 66,136,68,2,6 // mov %al,0x6(%rdx,%r8,1)
@@ -50114,17 +50403,17 @@ _sk_store_a8_sse2_8bit:
.byte 102,15,127,100,36,200 // movdqa %xmm4,-0x38(%rsp)
.byte 138,68,36,208 // mov -0x30(%rsp),%al
.byte 66,136,68,2,4 // mov %al,0x4(%rdx,%r8,1)
- .byte 102,15,219,37,187,48,0,0 // pand 0x30bb(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,37,203,48,0,0 // pand 0x30cb(%rip),%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,103,228 // packuswb %xmm4,%xmm4
.byte 102,66,15,126,36,2 // movd %xmm4,(%rdx,%r8,1)
- .byte 233,97,255,255,255 // jmpq 28c45 <_sk_store_a8_sse2_8bit+0x59>
+ .byte 233,97,255,255,255 // jmpq 29175 <_sk_store_a8_sse2_8bit+0x59>
.byte 134,255 // xchg %bh,%bh
.byte 255 // (bad)
.byte 255,165,255,255,255,150 // jmpq *-0x69000001(%rbp)
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 233,255,255,255,218 // jmpq ffffffffdb028cf4 <_sk_overlay_sse2_8bit+0xffffffffdaffdd3f>
+ .byte 233,255,255,255,218 // jmpq ffffffffdb029224 <_sk_overlay_sse2_8bit+0xffffffffdaffdd3f>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,203 // dec %ebx
@@ -50148,15 +50437,15 @@ _sk_load_g8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,116 // jne 28d91 <_sk_load_g8_sse2_8bit+0x91>
+ .byte 117,116 // jne 292c1 <_sk_load_g8_sse2_8bit+0x91>
.byte 243,66,15,126,4,2 // movq (%rdx,%r8,1),%xmm0
.byte 102,15,96,192 // punpcklbw %xmm0,%xmm0
- .byte 102,15,84,5,97,48,0,0 // andpd 0x3061(%rip),%xmm0 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,84,5,113,48,0,0 // andpd 0x3071(%rip),%xmm0 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,201 // pxor %xmm1,%xmm1
.byte 102,15,40,224 // movapd %xmm0,%xmm4
.byte 102,15,97,225 // punpcklwd %xmm1,%xmm4
.byte 102,15,105,193 // punpckhwd %xmm1,%xmm0
- .byte 102,15,111,45,153,55,0,0 // movdqa 0x3799(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
+ .byte 102,15,111,45,169,55,0,0 // movdqa 0x37a9(%rip),%xmm5 # 2ca20 <_sk_overlay_sse2_8bit+0x153b>
.byte 102,15,112,240,245 // pshufd $0xf5,%xmm0,%xmm6
.byte 102,15,244,197 // pmuludq %xmm5,%xmm0
.byte 102,15,112,200,232 // pshufd $0xe8,%xmm0,%xmm1
@@ -50169,7 +50458,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,196 // punpckldq %xmm4,%xmm0
- .byte 102,15,111,37,27,55,0,0 // movdqa 0x371b(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,37,43,55,0,0 // movdqa 0x372b(%rip),%xmm4 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,235,196 // por %xmm4,%xmm0
.byte 102,15,235,204 // por %xmm4,%xmm1
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50178,15 +50467,15 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,133 // ja 28d27 <_sk_load_g8_sse2_8bit+0x27>
+ .byte 119,133 // ja 29257 <_sk_load_g8_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28e24 <_sk_load_g8_sse2_8bit+0x124>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29354 <_sk_load_g8_sse2_8bit+0x124>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,192 // movd %eax,%xmm0
- .byte 233,99,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,99,255,255,255 // jmpq 29257 <_sk_load_g8_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,2 // pinsrw $0x2,%eax,%xmm0
@@ -50194,7 +50483,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,15,110,200 // movd %eax,%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 243,15,16,193 // movss %xmm1,%xmm0
- .byte 233,62,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,62,255,255,255 // jmpq 29257 <_sk_load_g8_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,192 // pxor %xmm0,%xmm0
.byte 102,15,196,192,6 // pinsrw $0x6,%eax,%xmm0
@@ -50205,7 +50494,7 @@ _sk_load_g8_sse2_8bit:
.byte 102,66,15,110,12,2 // movd (%rdx,%r8,1),%xmm1
.byte 102,15,96,200 // punpcklbw %xmm0,%xmm1
.byte 242,15,16,193 // movsd %xmm1,%xmm0
- .byte 233,6,255,255,255 // jmpq 28d27 <_sk_load_g8_sse2_8bit+0x27>
+ .byte 233,6,255,255,255 // jmpq 29257 <_sk_load_g8_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -50240,15 +50529,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 117,116 // jne 28ed1 <_sk_load_g8_dst_sse2_8bit+0x91>
+ .byte 117,116 // jne 29401 <_sk_load_g8_dst_sse2_8bit+0x91>
.byte 243,66,15,126,20,2 // movq (%rdx,%r8,1),%xmm2
.byte 102,15,96,208 // punpcklbw %xmm0,%xmm2
- .byte 102,15,84,21,33,47,0,0 // andpd 0x2f21(%rip),%xmm2 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,84,21,49,47,0,0 // andpd 0x2f31(%rip),%xmm2 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,239,219 // pxor %xmm3,%xmm3
.byte 102,15,40,226 // movapd %xmm2,%xmm4
.byte 102,15,97,227 // punpcklwd %xmm3,%xmm4
.byte 102,15,105,211 // punpckhwd %xmm3,%xmm2
- .byte 102,15,111,45,89,54,0,0 // movdqa 0x3659(%rip),%xmm5 # 2c4e0 <_sk_overlay_sse2_8bit+0x152b>
+ .byte 102,15,111,45,105,54,0,0 // movdqa 0x3669(%rip),%xmm5 # 2ca20 <_sk_overlay_sse2_8bit+0x153b>
.byte 102,15,112,242,245 // pshufd $0xf5,%xmm2,%xmm6
.byte 102,15,244,213 // pmuludq %xmm5,%xmm2
.byte 102,15,112,218,232 // pshufd $0xe8,%xmm2,%xmm3
@@ -50261,7 +50550,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,244,245 // pmuludq %xmm5,%xmm6
.byte 102,15,112,230,232 // pshufd $0xe8,%xmm6,%xmm4
.byte 102,15,98,212 // punpckldq %xmm4,%xmm2
- .byte 102,15,111,37,219,53,0,0 // movdqa 0x35db(%rip),%xmm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 102,15,111,37,235,53,0,0 // movdqa 0x35eb(%rip),%xmm4 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 102,15,235,212 // por %xmm4,%xmm2
.byte 102,15,235,220 // por %xmm4,%xmm3
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50270,15 +50559,15 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 119,133 // ja 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 119,133 // ja 29397 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 28f64 <_sk_load_g8_dst_sse2_8bit+0x124>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29494 <_sk_load_g8_dst_sse2_8bit+0x124>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,208 // movd %eax,%xmm2
- .byte 233,99,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,99,255,255,255 // jmpq 29397 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,2 // pinsrw $0x2,%eax,%xmm2
@@ -50286,7 +50575,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,15,110,216 // movd %eax,%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 243,15,16,211 // movss %xmm3,%xmm2
- .byte 233,62,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,62,255,255,255 // jmpq 29397 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,210 // pxor %xmm2,%xmm2
.byte 102,15,196,208,6 // pinsrw $0x6,%eax,%xmm2
@@ -50297,7 +50586,7 @@ _sk_load_g8_dst_sse2_8bit:
.byte 102,66,15,110,28,2 // movd (%rdx,%r8,1),%xmm3
.byte 102,15,96,216 // punpcklbw %xmm0,%xmm3
.byte 242,15,16,211 // movsd %xmm3,%xmm2
- .byte 233,6,255,255,255 // jmpq 28e67 <_sk_load_g8_dst_sse2_8bit+0x27>
+ .byte 233,6,255,255,255 // jmpq 29397 <_sk_load_g8_dst_sse2_8bit+0x27>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -50333,7 +50622,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 72,193,226,2 // shl $0x2,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,192 // test %r8,%r8
- .byte 15,133,253,0,0,0 // jne 290a2 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
+ .byte 15,133,253,0,0,0 // jne 295d2 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
.byte 70,15,16,68,138,16 // movups 0x10(%rdx,%r9,4),%xmm8
.byte 102,70,15,16,12,138 // movupd (%rdx,%r9,4),%xmm9
.byte 77,133,192 // test %r8,%r8
@@ -50382,7 +50671,7 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,68,15,248,207 // psubb %xmm7,%xmm9
.byte 102,68,15,252,200 // paddb %xmm0,%xmm9
.byte 102,68,15,252,193 // paddb %xmm1,%xmm8
- .byte 117,72 // jne 290d9 <_sk_srcover_rgba_8888_sse2_8bit+0x159>
+ .byte 117,72 // jne 29609 <_sk_srcover_rgba_8888_sse2_8bit+0x159>
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
.byte 243,70,15,127,68,138,16 // movdqu %xmm8,0x10(%rdx,%r9,4)
.byte 72,173 // lods %ds:(%rsi),%rax
@@ -50393,29 +50682,29 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 102,69,15,239,201 // pxor %xmm9,%xmm9
.byte 254,200 // dec %al
.byte 60,6 // cmp $0x6,%al
- .byte 15,135,246,254,255,255 // ja 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 15,135,246,254,255,255 // ja 294e1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 15,182,192 // movzbl %al,%eax
- .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 29194 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
+ .byte 72,141,13,207,0,0,0 // lea 0xcf(%rip),%rcx # 296c4 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 243,70,15,16,12,138 // movss (%rdx,%r9,4),%xmm9
- .byte 233,216,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 233,216,254,255,255 // jmpq 294e1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 65,128,224,7 // and $0x7,%r8b
.byte 65,254,200 // dec %r8b
.byte 65,128,248,6 // cmp $0x6,%r8b
- .byte 119,184 // ja 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 119,184 // ja 295ce <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 65,15,182,192 // movzbl %r8b,%eax
- .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 291b0 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
+ .byte 72,141,13,191,0,0,0 // lea 0xbf(%rip),%rcx # 296e0 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 102,70,15,126,12,138 // movd %xmm9,(%rdx,%r9,4)
- .byte 235,156 // jmp 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 235,156 // jmp 295ce <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 102,66,15,110,100,138,8 // movd 0x8(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,204,69 // pshufd $0x45,%xmm4,%xmm9
.byte 102,70,15,18,12,138 // movlpd (%rdx,%r9,4),%xmm9
- .byte 233,151,254,255,255 // jmpq 28fb1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ .byte 233,151,254,255,255 // jmpq 294e1 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
.byte 102,66,15,110,100,138,24 // movd 0x18(%rdx,%r9,4),%xmm4
.byte 102,68,15,112,196,69 // pshufd $0x45,%xmm4,%xmm8
.byte 243,66,15,16,100,138,20 // movss 0x14(%rdx,%r9,4),%xmm4
@@ -50424,23 +50713,23 @@ _sk_srcover_rgba_8888_sse2_8bit:
.byte 68,15,40,196 // movaps %xmm4,%xmm8
.byte 243,66,15,16,100,138,16 // movss 0x10(%rdx,%r9,4),%xmm4
.byte 243,68,15,16,196 // movss %xmm4,%xmm8
- .byte 233,94,254,255,255 // jmpq 28fab <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
+ .byte 233,94,254,255,255 // jmpq 294db <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
.byte 102,65,15,112,225,78 // pshufd $0x4e,%xmm9,%xmm4
.byte 102,66,15,126,100,138,8 // movd %xmm4,0x8(%rdx,%r9,4)
.byte 102,70,15,214,12,138 // movq %xmm9,(%rdx,%r9,4)
- .byte 233,57,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 233,57,255,255,255 // jmpq 295ce <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 102,65,15,112,224,78 // pshufd $0x4e,%xmm8,%xmm4
.byte 102,66,15,126,100,138,24 // movd %xmm4,0x18(%rdx,%r9,4)
.byte 102,65,15,112,224,229 // pshufd $0xe5,%xmm8,%xmm4
.byte 102,66,15,126,100,138,20 // movd %xmm4,0x14(%rdx,%r9,4)
.byte 102,70,15,126,68,138,16 // movd %xmm8,0x10(%rdx,%r9,4)
.byte 243,70,15,127,12,138 // movdqu %xmm9,(%rdx,%r9,4)
- .byte 233,13,255,255,255 // jmpq 2909e <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ .byte 233,13,255,255,255 // jmpq 295ce <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
.byte 15,31,0 // nopl (%rax)
.byte 58,255 // cmp %bh,%bh
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 123,255 // jnp 29199 <_sk_srcover_rgba_8888_sse2_8bit+0x219>
+ .byte 123,255 // jnp 296c9 <_sk_srcover_rgba_8888_sse2_8bit+0x219>
.byte 255 // (bad)
.byte 255,110,255 // ljmp *-0x1(%rsi)
.byte 255 // (bad)
@@ -50478,7 +50767,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,68,15,111,200 // movdqa %xmm0,%xmm9
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,0 // movss (%rax),%xmm0
- .byte 243,15,89,5,64,34,0,0 // mulss 0x2240(%rip),%xmm0 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,5,64,34,0,0 // mulss 0x2240(%rip),%xmm0 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,192 // cvttss2si %xmm0,%eax
.byte 102,15,239,246 // pxor %xmm6,%xmm6
.byte 102,65,15,111,193 // movdqa %xmm9,%xmm0
@@ -50490,7 +50779,7 @@ _sk_scale_1_float_sse2_8bit:
.byte 102,15,96,246 // punpcklbw %xmm6,%xmm6
.byte 242,15,112,246,0 // pshuflw $0x0,%xmm6,%xmm6
.byte 102,15,112,246,80 // pshufd $0x50,%xmm6,%xmm6
- .byte 102,15,219,53,115,43,0,0 // pand 0x2b73(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,219,53,131,43,0,0 // pand 0x2b83(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,111,254 // movdqa %xmm6,%xmm7
.byte 102,65,15,213,248 // pmullw %xmm8,%xmm7
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
@@ -50523,10 +50812,10 @@ _sk_scale_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,239,0,0,0 // jne 2937d <_sk_scale_u8_sse2_8bit+0x110>
+ .byte 15,133,239,0,0,0 // jne 298ad <_sk_scale_u8_sse2_8bit+0x110>
.byte 243,66,15,126,36,2 // movq (%rdx,%r8,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
- .byte 102,15,84,37,240,42,0,0 // andpd 0x2af0(%rip),%xmm4 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,84,37,0,43,0,0 // andpd 0x2b00(%rip),%xmm4 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,40,236 // movapd %xmm4,%xmm5
.byte 102,65,15,105,232 // punpckhwd %xmm8,%xmm5
@@ -50579,15 +50868,15 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,6,255,255,255 // ja 29298 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 15,135,6,255,255,255 // ja 297c8 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29414 <_sk_scale_u8_sse2_8bit+0x1a7>
+ .byte 72,141,13,119,0,0,0 // lea 0x77(%rip),%rcx # 29944 <_sk_scale_u8_sse2_8bit+0x1a7>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,224 // movd %eax,%xmm4
- .byte 233,228,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,228,254,255,255 // jmpq 297c8 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,2 // pinsrw $0x2,%eax,%xmm4
@@ -50595,7 +50884,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,15,110,232 // movd %eax,%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 243,15,16,229 // movss %xmm5,%xmm4
- .byte 233,191,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,191,254,255,255 // jmpq 297c8 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,228 // pxor %xmm4,%xmm4
.byte 102,15,196,224,6 // pinsrw $0x6,%eax,%xmm4
@@ -50606,7 +50895,7 @@ _sk_scale_u8_sse2_8bit:
.byte 102,66,15,110,44,2 // movd (%rdx,%r8,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
.byte 242,15,16,229 // movsd %xmm5,%xmm4
- .byte 233,135,254,255,255 // jmpq 29298 <_sk_scale_u8_sse2_8bit+0x2b>
+ .byte 233,135,254,255,255 // jmpq 297c8 <_sk_scale_u8_sse2_8bit+0x2b>
.byte 15,31,0 // nopl (%rax)
.byte 146 // xchg %eax,%edx
.byte 255 // (bad)
@@ -50635,7 +50924,7 @@ FUNCTION(_sk_lerp_1_float_sse2_8bit)
_sk_lerp_1_float_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
.byte 243,15,16,32 // movss (%rax),%xmm4
- .byte 243,15,89,37,230,31,0,0 // mulss 0x1fe6(%rip),%xmm4 # 2b424 <_sk_overlay_sse2_8bit+0x46f>
+ .byte 243,15,89,37,230,31,0,0 // mulss 0x1fe6(%rip),%xmm4 # 2b954 <_sk_overlay_sse2_8bit+0x46f>
.byte 243,15,44,196 // cvttss2si %xmm4,%eax
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,228 // punpcklbw %xmm4,%xmm4
@@ -50648,7 +50937,7 @@ _sk_lerp_1_float_sse2_8bit:
.byte 102,68,15,111,217 // movdqa %xmm1,%xmm11
.byte 102,69,15,96,217 // punpcklbw %xmm9,%xmm11
.byte 102,65,15,104,201 // punpckhbw %xmm9,%xmm1
- .byte 102,15,111,53,17,41,0,0 // movdqa 0x2911(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,111,53,33,41,0,0 // movdqa 0x2921(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,65,15,219,240 // pand %xmm8,%xmm6
.byte 102,15,111,230 // movdqa %xmm6,%xmm4
.byte 102,15,213,225 // pmullw %xmm1,%xmm4
@@ -50713,10 +51002,10 @@ _sk_lerp_u8_sse2_8bit:
.byte 72,15,175,209 // imul %rcx,%rdx
.byte 72,3,16 // add (%rax),%rdx
.byte 77,133,201 // test %r9,%r9
- .byte 15,133,141,1,0,0 // jne 29714 <_sk_lerp_u8_sse2_8bit+0x1ae>
+ .byte 15,133,141,1,0,0 // jne 29c44 <_sk_lerp_u8_sse2_8bit+0x1ae>
.byte 243,66,15,126,44,2 // movq (%rdx,%r8,1),%xmm5
.byte 102,15,96,232 // punpcklbw %xmm0,%xmm5
- .byte 102,15,84,45,247,39,0,0 // andpd 0x27f7(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,84,45,7,40,0,0 // andpd 0x2807(%rip),%xmm5 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,69,15,239,192 // pxor %xmm8,%xmm8
.byte 102,15,40,229 // movapd %xmm5,%xmm4
.byte 102,65,15,105,224 // punpckhwd %xmm8,%xmm4
@@ -50802,15 +51091,15 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 65,254,201 // dec %r9b
.byte 65,128,249,6 // cmp $0x6,%r9b
- .byte 15,135,104,254,255,255 // ja 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 15,135,104,254,255,255 // ja 29ac1 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 65,15,182,193 // movzbl %r9b,%eax
- .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 297a8 <_sk_lerp_u8_sse2_8bit+0x242>
+ .byte 72,141,13,116,0,0,0 // lea 0x74(%rip),%rcx # 29cd8 <_sk_lerp_u8_sse2_8bit+0x242>
.byte 72,99,4,129 // movslq (%rcx,%rax,4),%rax
.byte 72,1,200 // add %rcx,%rax
.byte 255,224 // jmpq *%rax
.byte 66,15,182,4,2 // movzbl (%rdx,%r8,1),%eax
.byte 102,15,110,232 // movd %eax,%xmm5
- .byte 233,70,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,70,254,255,255 // jmpq 29ac1 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,2 // movzbl 0x2(%rdx,%r8,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,2 // pinsrw $0x2,%eax,%xmm5
@@ -50818,7 +51107,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,15,110,224 // movd %eax,%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 243,15,16,236 // movss %xmm4,%xmm5
- .byte 233,33,254,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,33,254,255,255 // jmpq 29ac1 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 66,15,182,68,2,6 // movzbl 0x6(%rdx,%r8,1),%eax
.byte 102,15,239,237 // pxor %xmm5,%xmm5
.byte 102,15,196,232,6 // pinsrw $0x6,%eax,%xmm5
@@ -50829,7 +51118,7 @@ _sk_lerp_u8_sse2_8bit:
.byte 102,66,15,110,36,2 // movd (%rdx,%r8,1),%xmm4
.byte 102,15,96,224 // punpcklbw %xmm0,%xmm4
.byte 242,15,16,236 // movsd %xmm4,%xmm5
- .byte 233,233,253,255,255 // jmpq 29591 <_sk_lerp_u8_sse2_8bit+0x2b>
+ .byte 233,233,253,255,255 // jmpq 29ac1 <_sk_lerp_u8_sse2_8bit+0x2b>
.byte 149 // xchg %eax,%ebp
.byte 255 // (bad)
.byte 255 // (bad)
@@ -50874,7 +51163,7 @@ HIDDEN _sk_black_color_sse2_8bit
FUNCTION(_sk_black_color_sse2_8bit)
_sk_black_color_sse2_8bit:
.byte 72,173 // lods %ds:(%rsi),%rax
- .byte 15,40,5,191,44,0,0 // movaps 0x2cbf(%rip),%xmm0 # 2c4a0 <_sk_overlay_sse2_8bit+0x14eb>
+ .byte 15,40,5,207,44,0,0 // movaps 0x2ccf(%rip),%xmm0 # 2c9e0 <_sk_overlay_sse2_8bit+0x14fb>
.byte 15,40,200 // movaps %xmm0,%xmm1
.byte 255,224 // jmpq *%rax
@@ -51775,7 +52064,7 @@ _sk_darken_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,78,30,0,0 // movdqa 0x1e4e(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 102,15,111,37,94,30,0,0 // movdqa 0x1e5e(%rip),%xmm4 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -51883,7 +52172,7 @@ _sk_lighten_sse2_8bit:
.byte 102,65,15,248,234 // psubb %xmm10,%xmm5
.byte 102,15,248,207 // psubb %xmm7,%xmm1
.byte 102,15,248,196 // psubb %xmm4,%xmm0
- .byte 102,15,111,37,98,28,0,0 // movdqa 0x1c62(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 102,15,111,37,114,28,0,0 // movdqa 0x1c72(%rip),%xmm4 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,111,252 // movdqa %xmm4,%xmm7
.byte 102,15,223,248 // pandn %xmm0,%xmm7
@@ -51933,7 +52222,7 @@ _sk_exclusion_sse2_8bit:
.byte 102,15,113,214,8 // psrlw $0x8,%xmm6
.byte 102,15,103,244 // packuswb %xmm4,%xmm6
.byte 102,15,103,239 // packuswb %xmm7,%xmm5
- .byte 102,15,111,37,149,27,0,0 // movdqa 0x1b95(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 102,15,111,37,165,27,0,0 // movdqa 0x1ba5(%rip),%xmm4 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,248,205 // psubb %xmm5,%xmm1
.byte 102,15,219,236 // pand %xmm4,%xmm5
.byte 102,15,219,230 // pand %xmm6,%xmm4
@@ -52032,7 +52321,7 @@ _sk_difference_sse2_8bit:
.byte 102,65,15,103,244 // packuswb %xmm12,%xmm6
.byte 102,65,15,218,226 // pminub %xmm10,%xmm4
.byte 102,65,15,218,243 // pminub %xmm11,%xmm6
- .byte 102,15,111,45,210,25,0,0 // movdqa 0x19d2(%rip),%xmm5 # 2c530 <_sk_overlay_sse2_8bit+0x157b>
+ .byte 102,15,111,45,226,25,0,0 // movdqa 0x19e2(%rip),%xmm5 # 2ca70 <_sk_overlay_sse2_8bit+0x158b>
.byte 102,15,248,206 // psubb %xmm6,%xmm1
.byte 102,15,219,245 // pand %xmm5,%xmm6
.byte 102,15,219,236 // pand %xmm4,%xmm5
@@ -52129,7 +52418,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,111,220 // movdqa %xmm4,%xmm11
.byte 102,69,15,217,211 // psubusw %xmm11,%xmm10
.byte 102,68,15,117,213 // pcmpeqw %xmm5,%xmm10
- .byte 102,15,111,45,109,16,0,0 // movdqa 0x106d(%rip),%xmm5 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,111,45,125,16,0,0 // movdqa 0x107d(%rip),%xmm5 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,111,198 // movdqa %xmm6,%xmm0
.byte 102,15,239,197 // pxor %xmm5,%xmm0
.byte 102,65,15,213,198 // pmullw %xmm14,%xmm0
@@ -52233,7 +52522,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,68,15,253,124,36,32 // paddw 0x20(%rsp),%xmm15
.byte 102,68,15,253,76,36,144 // paddw -0x70(%rsp),%xmm9
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
- .byte 102,15,111,5,17,22,0,0 // movdqa 0x1611(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
+ .byte 102,15,111,5,33,22,0,0 // movdqa 0x1621(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,15,253,208 // paddw %xmm0,%xmm2
.byte 102,68,15,253,210 // paddw %xmm2,%xmm10
.byte 102,68,15,253,248 // paddw %xmm0,%xmm15
@@ -52242,7 +52531,7 @@ _sk_hardlight_sse2_8bit:
.byte 102,69,15,253,193 // paddw %xmm9,%xmm8
.byte 102,15,253,232 // paddw %xmm0,%xmm5
.byte 102,15,253,233 // paddw %xmm1,%xmm5
- .byte 102,15,111,5,244,21,0,0 // movdqa 0x15f4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
+ .byte 102,15,111,5,4,22,0,0 // movdqa 0x1604(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x15ab>
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,192 // pmulhuw %xmm0,%xmm8
.byte 102,68,15,228,248 // pmulhuw %xmm0,%xmm15
@@ -52347,7 +52636,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,217,234 // psubusw %xmm2,%xmm5
.byte 102,15,117,236 // pcmpeqw %xmm4,%xmm5
.byte 102,15,127,108,36,32 // movdqa %xmm5,0x20(%rsp)
- .byte 102,15,111,53,61,12,0,0 // movdqa 0xc3d(%rip),%xmm6 # 2bd90 <_sk_overlay_sse2_8bit+0xddb>
+ .byte 102,15,111,53,77,12,0,0 // movdqa 0xc4d(%rip),%xmm6 # 2c2d0 <_sk_overlay_sse2_8bit+0xdeb>
.byte 102,15,111,194 // movdqa %xmm2,%xmm0
.byte 102,15,239,198 // pxor %xmm6,%xmm0
.byte 102,65,15,213,199 // pmullw %xmm15,%xmm0
@@ -52455,7 +52744,7 @@ _sk_overlay_sse2_8bit:
.byte 102,68,15,253,92,36,240 // paddw -0x10(%rsp),%xmm11
.byte 102,15,253,108,36,128 // paddw -0x80(%rsp),%xmm5
.byte 102,15,253,116,36,144 // paddw -0x70(%rsp),%xmm6
- .byte 102,15,111,5,208,17,0,0 // movdqa 0x11d0(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0x158b>
+ .byte 102,15,111,5,224,17,0,0 // movdqa 0x11e0(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0x159b>
.byte 102,68,15,253,224 // paddw %xmm0,%xmm12
.byte 102,68,15,253,227 // paddw %xmm3,%xmm12
.byte 102,68,15,253,216 // paddw %xmm0,%xmm11
@@ -52464,7 +52753,7 @@ _sk_overlay_sse2_8bit:
.byte 102,15,253,234 // paddw %xmm2,%xmm5
.byte 102,15,253,240 // paddw %xmm0,%xmm6
.byte 102,15,253,241 // paddw %xmm1,%xmm6
- .byte 102,15,111,5,180,17,0,0 // movdqa 0x11b4(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0x159b>
+ .byte 102,15,111,5,196,17,0,0 // movdqa 0x11c4(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x15ab>
.byte 102,15,228,240 // pmulhuw %xmm0,%xmm6
.byte 102,15,228,232 // pmulhuw %xmm0,%xmm5
.byte 102,68,15,228,216 // pmulhuw %xmm0,%xmm11
@@ -52498,14 +52787,14 @@ BALIGN4
.byte 252 // cld
.byte 190,0,0,128,191 // mov $0xbf800000,%esi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2b458 <.literal4+0x64>
+ .byte 224,64 // loopne 2b988 <.literal4+0x64>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
.byte 62,61,10,23,63,174 // ds cmp $0xae3f170a,%eax
- .byte 71,225,61 // rex.RXB loope 2b461 <.literal4+0x6d>
+ .byte 71,225,61 // rex.RXB loope 2b991 <.literal4+0x6d>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2b46b <.literal4+0x77>
+ .byte 127,67 // jg 2b99b <.literal4+0x77>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,92,143,50,63 // sbbl $0x3f,0x328f5c3d(%rsi)
.byte 10,215 // or %bh,%dl
@@ -52538,7 +52827,7 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2b481 <.literal4+0x8d>
+ .byte 224,7 // loopne 2b9b1 <.literal4+0x8d>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -52549,8 +52838,8 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 0,52,255 // add %dh,(%rdi,%rdi,8)
.byte 255 // (bad)
- .byte 127,0 // jg 2b494 <.literal4+0xa0>
- .byte 119,115 // ja 2b509 <.literal4+0x115>
+ .byte 127,0 // jg 2b9c4 <.literal4+0xa0>
+ .byte 119,115 // ja 2ba39 <.literal4+0x115>
.byte 248 // clc
.byte 194,117,191 // retq $0xbf75
.byte 191,63,249,68,180 // mov $0xb444f93f,%edi
@@ -52573,12 +52862,12 @@ BALIGN4
.byte 190,80,128,3,62 // mov $0x3e038050,%esi
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2b51f <.literal4+0x12b>
+ .byte 118,63 // jbe 2ba4f <.literal4+0x12b>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 0,0 // add %al,(%rax)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2b52e <.literal4+0x13a>
+ .byte 124,66 // jl 2ba5e <.literal4+0x13a>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,55,0,15 // mov %ecx,0xf003788(%rax)
@@ -52588,9 +52877,9 @@ BALIGN4
.byte 137,136,136,59,15,0 // mov %ecx,0xf3b88(%rax)
.byte 0,0 // add %al,(%rax)
.byte 137,136,136,61,0,0 // mov %ecx,0x3d88(%rax)
- .byte 112,65 // jo 2b551 <.literal4+0x15d>
+ .byte 112,65 // jo 2ba81 <.literal4+0x15d>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2b55b <.literal4+0x167>
+ .byte 127,71 // jg 2ba8b <.literal4+0x167>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,89 // ds pop %rcx
@@ -52617,15 +52906,15 @@ BALIGN4
.byte 0,0 // add %al,(%rax)
.byte 128,0,0 // addb $0x0,(%rax)
.byte 0,191,0,0,192,191 // add %bh,-0x40400000(%rdi)
- .byte 114,28 // jb 2b57a <.literal4+0x186>
+ .byte 114,28 // jb 2baaa <.literal4+0x186>
.byte 199 // (bad)
.byte 62,0,0 // add %al,%ds:(%rax)
.byte 192,63,85 // sarb $0x55,(%rdi)
.byte 85 // push %rbp
.byte 149 // xchg %eax,%ebp
.byte 191,57,142,99,61 // mov $0x3d638e39,%edi
- .byte 114,249 // jb 2b567 <.literal4+0x173>
- .byte 127,63 // jg 2b5af <_sk_overlay_sse2_8bit+0x5fa>
+ .byte 114,249 // jb 2ba97 <.literal4+0x173>
+ .byte 127,63 // jg 2badf <_sk_overlay_sse2_8bit+0x5fa>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,4 // add %al,0x4000000(%rax)
@@ -52661,16 +52950,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b5c8 <_sk_overlay_sse2_8bit+0xa000613>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bb08 <_sk_overlay_sse2_8bit+0xa000623>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b5d0 <_sk_overlay_sse2_8bit+0x1200061b>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bb10 <_sk_overlay_sse2_8bit+0x1200062b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b5d8 <_sk_overlay_sse2_8bit+0x1a000623>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bb18 <_sk_overlay_sse2_8bit+0x1a000633>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b5e0 <_sk_overlay_sse2_8bit+0x300062b>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bb20 <_sk_overlay_sse2_8bit+0x300063b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52713,16 +53002,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b628 <_sk_overlay_sse2_8bit+0xa000673>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bb68 <_sk_overlay_sse2_8bit+0xa000683>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b630 <_sk_overlay_sse2_8bit+0x1200067b>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bb70 <_sk_overlay_sse2_8bit+0x1200068b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b638 <_sk_overlay_sse2_8bit+0x1a000683>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bb78 <_sk_overlay_sse2_8bit+0x1a000693>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b640 <_sk_overlay_sse2_8bit+0x300068b>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bb80 <_sk_overlay_sse2_8bit+0x300069b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52765,16 +53054,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b688 <_sk_overlay_sse2_8bit+0xa0006d3>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bbc8 <_sk_overlay_sse2_8bit+0xa0006e3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b690 <_sk_overlay_sse2_8bit+0x120006db>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bbd0 <_sk_overlay_sse2_8bit+0x120006eb>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b698 <_sk_overlay_sse2_8bit+0x1a0006e3>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bbd8 <_sk_overlay_sse2_8bit+0x1a0006f3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b6a0 <_sk_overlay_sse2_8bit+0x30006eb>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bbe0 <_sk_overlay_sse2_8bit+0x30006fb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52817,16 +53106,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b6e8 <_sk_overlay_sse2_8bit+0xa000733>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bc28 <_sk_overlay_sse2_8bit+0xa000743>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b6f0 <_sk_overlay_sse2_8bit+0x1200073b>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bc30 <_sk_overlay_sse2_8bit+0x1200074b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b6f8 <_sk_overlay_sse2_8bit+0x1a000743>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bc38 <_sk_overlay_sse2_8bit+0x1a000753>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b700 <_sk_overlay_sse2_8bit+0x300074b>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bc40 <_sk_overlay_sse2_8bit+0x300075b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52869,16 +53158,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b748 <_sk_overlay_sse2_8bit+0xa000793>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bc88 <_sk_overlay_sse2_8bit+0xa0007a3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b750 <_sk_overlay_sse2_8bit+0x1200079b>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bc90 <_sk_overlay_sse2_8bit+0x120007ab>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b758 <_sk_overlay_sse2_8bit+0x1a0007a3>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bc98 <_sk_overlay_sse2_8bit+0x1a0007b3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b760 <_sk_overlay_sse2_8bit+0x30007ab>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bca0 <_sk_overlay_sse2_8bit+0x30007bb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52921,16 +53210,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b7a8 <_sk_overlay_sse2_8bit+0xa0007f3>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bce8 <_sk_overlay_sse2_8bit+0xa000803>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b7b0 <_sk_overlay_sse2_8bit+0x120007fb>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bcf0 <_sk_overlay_sse2_8bit+0x1200080b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b7b8 <_sk_overlay_sse2_8bit+0x1a000803>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bcf8 <_sk_overlay_sse2_8bit+0x1a000813>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b7c0 <_sk_overlay_sse2_8bit+0x300080b>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bd00 <_sk_overlay_sse2_8bit+0x300081b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -52973,16 +53262,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b808 <_sk_overlay_sse2_8bit+0xa000853>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bd48 <_sk_overlay_sse2_8bit+0xa000863>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b810 <_sk_overlay_sse2_8bit+0x1200085b>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bd50 <_sk_overlay_sse2_8bit+0x1200086b>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b818 <_sk_overlay_sse2_8bit+0x1a000863>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bd58 <_sk_overlay_sse2_8bit+0x1a000873>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b820 <_sk_overlay_sse2_8bit+0x300086b>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bd60 <_sk_overlay_sse2_8bit+0x300087b>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53025,16 +53314,16 @@ BALIGN32
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02b868 <_sk_overlay_sse2_8bit+0xa0008b3>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02bda8 <_sk_overlay_sse2_8bit+0xa0008c3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202b870 <_sk_overlay_sse2_8bit+0x120008bb>
+ .byte 255,13,255,255,255,17 // decl 0x11ffffff(%rip) # 1202bdb0 <_sk_overlay_sse2_8bit+0x120008cb>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02b878 <_sk_overlay_sse2_8bit+0x1a0008c3>
+ .byte 255,21,255,255,255,25 // callq *0x19ffffff(%rip) # 1a02bdb8 <_sk_overlay_sse2_8bit+0x1a0008d3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302b880 <_sk_overlay_sse2_8bit+0x30008cb>
+ .byte 255,29,255,255,255,2 // lcall *0x2ffffff(%rip) # 302bdc0 <_sk_overlay_sse2_8bit+0x30008db>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53871,11 +54160,11 @@ BALIGN16
.byte 0,128,191,0,0,128 // add %al,-0x7fffff41(%rax)
.byte 191,0,0,224,64 // mov $0x40e00000,%edi
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2be88 <.literal16+0xf8>
+ .byte 224,64 // loopne 2c3c8 <.literal16+0xf8>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2be8c <.literal16+0xfc>
+ .byte 224,64 // loopne 2c3cc <.literal16+0xfc>
.byte 0,0 // add %al,(%rax)
- .byte 224,64 // loopne 2be90 <.literal16+0x100>
+ .byte 224,64 // loopne 2c3d0 <.literal16+0x100>
.byte 154 // (bad)
.byte 153 // cltd
.byte 153 // cltd
@@ -53895,13 +54184,13 @@ BALIGN16
.byte 10,23 // or (%rdi),%dl
.byte 63 // (bad)
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2beb1 <.literal16+0x121>
+ .byte 71,225,61 // rex.RXB loope 2c3f1 <.literal16+0x121>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2beb5 <.literal16+0x125>
+ .byte 71,225,61 // rex.RXB loope 2c3f5 <.literal16+0x125>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2beb9 <.literal16+0x129>
+ .byte 71,225,61 // rex.RXB loope 2c3f9 <.literal16+0x129>
.byte 174 // scas %es:(%rdi),%al
- .byte 71,225,61 // rex.RXB loope 2bebd <.literal16+0x12d>
+ .byte 71,225,61 // rex.RXB loope 2c3fd <.literal16+0x12d>
.byte 255,0 // incl (%rax)
.byte 0,0 // add %al,(%rax)
.byte 255,0 // incl (%rax)
@@ -53912,10 +54201,10 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 1,255 // add %edi,%edi
.byte 255 // (bad)
- .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02be98 <_sk_overlay_sse2_8bit+0xa000ee3>
+ .byte 255,5,255,255,255,9 // incl 0x9ffffff(%rip) # a02c3d8 <_sk_overlay_sse2_8bit+0xa000ef3>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302bea0 <_sk_overlay_sse2_8bit+0x3000eeb>
+ .byte 255,13,255,255,255,2 // decl 0x2ffffff(%rip) # 302c3e0 <_sk_overlay_sse2_8bit+0x3000efb>
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,6 // incl (%rsi)
@@ -53930,11 +54219,11 @@ BALIGN16
.byte 255,0 // incl (%rax)
.byte 0,127,67 // add %bh,0x43(%rdi)
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2befb <.literal16+0x16b>
+ .byte 127,67 // jg 2c43b <.literal16+0x16b>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2beff <.literal16+0x16f>
+ .byte 127,67 // jg 2c43f <.literal16+0x16f>
.byte 0,0 // add %al,(%rax)
- .byte 127,67 // jg 2bf03 <.literal16+0x173>
+ .byte 127,67 // jg 2c443 <.literal16+0x173>
.byte 145 // xchg %eax,%ecx
.byte 131,158,61,145,131,158,61 // sbbl $0x3d,-0x617c6ec3(%rsi)
.byte 145 // xchg %eax,%ecx
@@ -54085,13 +54374,13 @@ BALIGN16
.byte 132,55 // test %dh,(%rdi)
.byte 8,33 // or %ah,(%rcx)
.byte 132,55 // test %dh,(%rdi)
- .byte 224,7 // loopne 2c009 <.literal16+0x279>
+ .byte 224,7 // loopne 2c549 <.literal16+0x279>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2c00d <.literal16+0x27d>
+ .byte 224,7 // loopne 2c54d <.literal16+0x27d>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2c011 <.literal16+0x281>
+ .byte 224,7 // loopne 2c551 <.literal16+0x281>
.byte 0,0 // add %al,(%rax)
- .byte 224,7 // loopne 2c015 <.literal16+0x285>
+ .byte 224,7 // loopne 2c555 <.literal16+0x285>
.byte 0,0 // add %al,(%rax)
.byte 33,8 // and %ecx,(%rax)
.byte 2,58 // add (%rdx),%bh
@@ -54151,17 +54440,17 @@ BALIGN16
.byte 0,0 // add %al,(%rax)
.byte 52,255 // xor $0xff,%al
.byte 255 // (bad)
- .byte 127,0 // jg 2c094 <.literal16+0x304>
+ .byte 127,0 // jg 2c5d4 <.literal16+0x304>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2c098 <.literal16+0x308>
+ .byte 127,0 // jg 2c5d8 <.literal16+0x308>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2c09c <.literal16+0x30c>
+ .byte 127,0 // jg 2c5dc <.literal16+0x30c>
.byte 255 // (bad)
.byte 255 // (bad)
- .byte 127,0 // jg 2c0a0 <.literal16+0x310>
- .byte 119,115 // ja 2c115 <.literal16+0x385>
+ .byte 127,0 // jg 2c5e0 <.literal16+0x310>
+ .byte 119,115 // ja 2c655 <.literal16+0x385>
.byte 248 // clc
.byte 194,119,115 // retq $0x7377
.byte 248 // clc
@@ -54172,7 +54461,7 @@ BALIGN16
.byte 194,117,191 // retq $0xbf75
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
- .byte 117,191 // jne 2c079 <.literal16+0x2e9>
+ .byte 117,191 // jne 2c5b9 <.literal16+0x2e9>
.byte 191,63,117,191,191 // mov $0xbfbf753f,%edi
.byte 63 // (bad)
.byte 249 // stc
@@ -54184,7 +54473,7 @@ BALIGN16
.byte 249 // stc
.byte 68,180,62 // rex.R mov $0x3e,%spl
.byte 163,233,220,63,163,233,220,63,163 // movabs %eax,0xa33fdce9a33fdce9
- .byte 233,220,63,163,233 // jmpq ffffffffe9a600ba <_sk_overlay_sse2_8bit+0xffffffffe9a35105>
+ .byte 233,220,63,163,233 // jmpq ffffffffe9a605fa <_sk_overlay_sse2_8bit+0xffffffffe9a35115>
.byte 220,63 // fdivrl (%rdi)
.byte 81 // push %rcx
.byte 140,242 // mov %?,%edx
@@ -54274,16 +54563,16 @@ BALIGN16
.byte 128,3,62 // addb $0x3e,(%rbx)
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c203 <.literal16+0x473>
+ .byte 118,63 // jbe 2c743 <.literal16+0x473>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c207 <.literal16+0x477>
+ .byte 118,63 // jbe 2c747 <.literal16+0x477>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c20b <.literal16+0x47b>
+ .byte 118,63 // jbe 2c74b <.literal16+0x47b>
.byte 31 // (bad)
.byte 215 // xlat %ds:(%rbx)
- .byte 118,63 // jbe 2c20f <.literal16+0x47f>
+ .byte 118,63 // jbe 2c74f <.literal16+0x47f>
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
.byte 246,64,83,63 // testb $0x3f,0x53(%rax)
@@ -54304,13 +54593,13 @@ BALIGN16
.byte 65,0,0 // add %al,(%r8)
.byte 248 // clc
.byte 65,0,0 // add %al,(%r8)
- .byte 124,66 // jl 2c246 <.literal16+0x4b6>
+ .byte 124,66 // jl 2c786 <.literal16+0x4b6>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2c24a <.literal16+0x4ba>
+ .byte 124,66 // jl 2c78a <.literal16+0x4ba>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2c24e <.literal16+0x4be>
+ .byte 124,66 // jl 2c78e <.literal16+0x4be>
.byte 0,0 // add %al,(%rax)
- .byte 124,66 // jl 2c252 <.literal16+0x4c2>
+ .byte 124,66 // jl 2c792 <.literal16+0x4c2>
.byte 0,240 // add %dh,%al
.byte 0,0 // add %al,(%rax)
.byte 0,240 // add %dh,%al
@@ -54356,13 +54645,13 @@ BALIGN16
.byte 136,136,61,137,136,136 // mov %cl,-0x777776c3(%rax)
.byte 61,137,136,136,61 // cmp $0x3d888889,%eax
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c2d5 <.literal16+0x545>
+ .byte 112,65 // jo 2c815 <.literal16+0x545>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c2d9 <.literal16+0x549>
+ .byte 112,65 // jo 2c819 <.literal16+0x549>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c2dd <.literal16+0x54d>
+ .byte 112,65 // jo 2c81d <.literal16+0x54d>
.byte 0,0 // add %al,(%rax)
- .byte 112,65 // jo 2c2e1 <.literal16+0x551>
+ .byte 112,65 // jo 2c821 <.literal16+0x551>
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
.byte 0,0 // add %al,(%rax)
.byte 0,128,0,0,0,128 // add %al,-0x80000000(%rax)
@@ -54401,13 +54690,13 @@ BALIGN16
.byte 64,254 // rex (bad)
.byte 255,0 // incl (%rax)
.byte 255 // (bad)
- .byte 127,71 // jg 2c34b <.literal16+0x5bb>
+ .byte 127,71 // jg 2c88b <.literal16+0x5bb>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c34f <.literal16+0x5bf>
+ .byte 127,71 // jg 2c88f <.literal16+0x5bf>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c353 <.literal16+0x5c3>
+ .byte 127,71 // jg 2c893 <.literal16+0x5c3>
.byte 0,255 // add %bh,%bh
- .byte 127,71 // jg 2c357 <.literal16+0x5c7>
+ .byte 127,71 // jg 2c897 <.literal16+0x5c7>
.byte 208 // (bad)
.byte 179,89 // mov $0x59,%bl
.byte 62,208 // ds (bad)
@@ -54437,10 +54726,10 @@ BALIGN16
.byte 61,152,221,147,61 // cmp $0x3d93dd98,%eax
.byte 152 // cwtl
.byte 221,147,61,45,16,17 // fstl 0x11102d3d(%rbx)
- .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2d45a <_sk_overlay_sse2_8bit+0x2dc024a5>
+ .byte 192,45,16,17,192,45,16 // shrb $0x10,0x2dc01110(%rip) # 2dc2d99a <_sk_overlay_sse2_8bit+0x2dc024b5>
.byte 17,192 // adc %eax,%eax
.byte 45,16,17,192,18 // sub $0x12c01110,%eax
- .byte 120,57 // js 2c38c <.literal16+0x5fc>
+ .byte 120,57 // js 2c8cc <.literal16+0x5fc>
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
.byte 64,18,120,57 // adc 0x39(%rax),%dil
@@ -54505,13 +54794,13 @@ BALIGN16
.byte 192,191,0,0,192,191,0 // sarb $0x0,-0x40400000(%rdi)
.byte 0,192 // add %al,%al
.byte 191,0,0,192,191 // mov $0xbfc00000,%edi
- .byte 114,28 // jb 2c43e <.literal16+0x6ae>
+ .byte 114,28 // jb 2c97e <.literal16+0x6ae>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2c442 <.literal16+0x6b2>
+ .byte 62,114,28 // jb,pt 2c982 <.literal16+0x6b2>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2c446 <.literal16+0x6b6>
+ .byte 62,114,28 // jb,pt 2c986 <.literal16+0x6b6>
.byte 199 // (bad)
- .byte 62,114,28 // jb,pt 2c44a <.literal16+0x6ba>
+ .byte 62,114,28 // jb,pt 2c98a <.literal16+0x6ba>
.byte 199 // (bad)
.byte 62,85 // ds push %rbp
.byte 85 // push %rbp
@@ -54530,15 +54819,15 @@ BALIGN16
.byte 0,192 // add %al,%al
.byte 63 // (bad)
.byte 57,142,99,61,57,142 // cmp %ecx,-0x71c6c29d(%rsi)
- .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d665295 <_sk_overlay_sse2_8bit+0x3d63a2e0>
+ .byte 99,61,57,142,99,61 // movslq 0x3d638e39(%rip),%edi # 3d6657d5 <_sk_overlay_sse2_8bit+0x3d63a2f0>
.byte 57,142,99,61,114,249 // cmp %ecx,-0x68dc29d(%rsi)
- .byte 127,63 // jg 2c4a3 <.literal16+0x713>
- .byte 114,249 // jb 2c45f <.literal16+0x6cf>
- .byte 127,63 // jg 2c4a7 <.literal16+0x717>
- .byte 114,249 // jb 2c463 <.literal16+0x6d3>
- .byte 127,63 // jg 2c4ab <.literal16+0x71b>
- .byte 114,249 // jb 2c467 <.literal16+0x6d7>
- .byte 127,63 // jg 2c4af <.literal16+0x71f>
+ .byte 127,63 // jg 2c9e3 <.literal16+0x713>
+ .byte 114,249 // jb 2c99f <.literal16+0x6cf>
+ .byte 127,63 // jg 2c9e7 <.literal16+0x717>
+ .byte 114,249 // jb 2c9a3 <.literal16+0x6d3>
+ .byte 127,63 // jg 2c9eb <.literal16+0x71b>
+ .byte 114,249 // jb 2c9a7 <.literal16+0x6d7>
+ .byte 127,63 // jg 2c9ef <.literal16+0x71f>
.byte 3,0 // add (%rax),%eax
.byte 0,0 // add %al,(%rax)
.byte 3,0 // add (%rax),%eax
@@ -54645,14 +54934,14 @@ BALIGN16
.byte 255 // (bad)
.byte 255 // (bad)
.byte 255,0 // incl (%rax)
- .byte 127,0 // jg 2c542 <.literal16+0x7b2>
- .byte 127,0 // jg 2c544 <.literal16+0x7b4>
- .byte 127,0 // jg 2c546 <.literal16+0x7b6>
- .byte 127,0 // jg 2c548 <.literal16+0x7b8>
- .byte 127,0 // jg 2c54a <.literal16+0x7ba>
- .byte 127,0 // jg 2c54c <.literal16+0x7bc>
- .byte 127,0 // jg 2c54e <.literal16+0x7be>
- .byte 127,0 // jg 2c550 <.literal16+0x7c0>
+ .byte 127,0 // jg 2ca82 <.literal16+0x7b2>
+ .byte 127,0 // jg 2ca84 <.literal16+0x7b4>
+ .byte 127,0 // jg 2ca86 <.literal16+0x7b6>
+ .byte 127,0 // jg 2ca88 <.literal16+0x7b8>
+ .byte 127,0 // jg 2ca8a <.literal16+0x7ba>
+ .byte 127,0 // jg 2ca8c <.literal16+0x7bc>
+ .byte 127,0 // jg 2ca8e <.literal16+0x7be>
+ .byte 127,0 // jg 2ca90 <.literal16+0x7c0>
.byte 129,128,129,128,129,128,129,128,129,128// addl $0x80818081,-0x7f7e7f7f(%rax)
.byte 129 // .byte 0x81
.byte 128 // .byte 0x80
diff --git a/src/jumper/SkJumper_generated_win.S b/src/jumper/SkJumper_generated_win.S
index f681ed5531..99ec6b9fa9 100644
--- a/src/jumper/SkJumper_generated_win.S
+++ b/src/jumper/SkJumper_generated_win.S
@@ -101,7 +101,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,249,110,194 ; vmovd %edx,%xmm0
DB 196,226,125,88,192 ; vpbroadcastd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,25,186,2,0 ; vbroadcastss 0x2ba19(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,89,191,2,0 ; vbroadcastss 0x2bf59(%rip),%ymm1 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -109,7 +109,7 @@ _sk_seed_shader_hsw LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,249,185,2,0 ; vbroadcastss 0x2b9f9(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,21,57,191,2,0 ; vbroadcastss 0x2bf39(%rip),%ymm2 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -126,13 +126,13 @@ _sk_dither_hsw LABEL PROC
DB 197,121,110,201 ; vmovd %ecx,%xmm9
DB 196,66,125,88,201 ; vpbroadcastd %xmm9,%ymm9
DB 196,65,53,239,200 ; vpxor %ymm8,%ymm9,%ymm9
- DB 196,98,125,88,21,192,185,2,0 ; vpbroadcastd 0x2b9c0(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,21,0,191,2,0 ; vpbroadcastd 0x2bf00(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,53,219,218 ; vpand %ymm10,%ymm9,%ymm11
DB 196,193,37,114,243,5 ; vpslld $0x5,%ymm11,%ymm11
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,193,45,114,242,4 ; vpslld $0x4,%ymm10,%ymm10
- DB 196,98,125,88,37,165,185,2,0 ; vpbroadcastd 0x2b9a5(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477>
- DB 196,98,125,88,45,160,185,2,0 ; vpbroadcastd 0x2b9a0(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,37,229,190,2,0 ; vpbroadcastd 0x2bee5(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x477>
+ DB 196,98,125,88,45,224,190,2,0 ; vpbroadcastd 0x2bee0(%rip),%ymm13 # 2c0c8 <_sk_overlay_sse2_8bit+0x47b>
DB 196,65,53,219,245 ; vpand %ymm13,%ymm9,%ymm14
DB 196,193,13,114,246,2 ; vpslld $0x2,%ymm14,%ymm14
DB 196,65,61,219,237 ; vpand %ymm13,%ymm8,%ymm13
@@ -147,8 +147,8 @@ _sk_dither_hsw LABEL PROC
DB 196,65,61,235,194 ; vpor %ymm10,%ymm8,%ymm8
DB 196,65,61,235,193 ; vpor %ymm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,82,185,2,0 ; vbroadcastss 0x2b952(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f>
- DB 196,98,125,24,21,77,185,2,0 ; vbroadcastss 0x2b94d(%rip),%ymm10 # 2bb90 <_sk_overlay_sse2_8bit+0x483>
+ DB 196,98,125,24,13,146,190,2,0 ; vbroadcastss 0x2be92(%rip),%ymm9 # 2c0cc <_sk_overlay_sse2_8bit+0x47f>
+ DB 196,98,125,24,21,141,190,2,0 ; vbroadcastss 0x2be8d(%rip),%ymm10 # 2c0d0 <_sk_overlay_sse2_8bit+0x483>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 196,98,125,24,0 ; vbroadcastss (%rax),%ymm8
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
@@ -178,7 +178,7 @@ _sk_uniform_color_hsw LABEL PROC
PUBLIC _sk_black_color_hsw
_sk_black_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,213,184,2,0 ; vbroadcastss 0x2b8d5(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,21,190,2,0 ; vbroadcastss 0x2be15(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -187,7 +187,7 @@ _sk_black_color_hsw LABEL PROC
PUBLIC _sk_white_color_hsw
_sk_white_color_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,188,184,2,0 ; vbroadcastss 0x2b8bc(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,252,189,2,0 ; vbroadcastss 0x2bdfc(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -225,7 +225,7 @@ _sk_clear_hsw LABEL PROC
PUBLIC _sk_srcatop_hsw
_sk_srcatop_hsw LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,91,184,2,0 ; vbroadcastss 0x2b85b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,155,189,2,0 ; vbroadcastss 0x2bd9b(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,226,61,184,196 ; vfmadd231ps %ymm4,%ymm8,%ymm0
DB 197,244,89,207 ; vmulps %ymm7,%ymm1,%ymm1
@@ -239,7 +239,7 @@ _sk_srcatop_hsw LABEL PROC
PUBLIC _sk_dstatop_hsw
_sk_dstatop_hsw LABEL PROC
- DB 196,98,125,24,5,42,184,2,0 ; vbroadcastss 0x2b82a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,106,189,2,0 ; vbroadcastss 0x2bd6a(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,226,101,184,196 ; vfmadd231ps %ymm4,%ymm3,%ymm0
@@ -272,7 +272,7 @@ _sk_dstin_hsw LABEL PROC
PUBLIC _sk_srcout_hsw
_sk_srcout_hsw LABEL PROC
- DB 196,98,125,24,5,205,183,2,0 ; vbroadcastss 0x2b7cd(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,13,189,2,0 ; vbroadcastss 0x2bd0d(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -283,7 +283,7 @@ _sk_srcout_hsw LABEL PROC
PUBLIC _sk_dstout_hsw
_sk_dstout_hsw LABEL PROC
- DB 196,226,125,24,5,172,183,2,0 ; vbroadcastss 0x2b7ac(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,236,188,2,0 ; vbroadcastss 0x2bcec(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -294,7 +294,7 @@ _sk_dstout_hsw LABEL PROC
PUBLIC _sk_srcover_hsw
_sk_srcover_hsw LABEL PROC
- DB 196,98,125,24,5,139,183,2,0 ; vbroadcastss 0x2b78b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,203,188,2,0 ; vbroadcastss 0x2bccb(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,194,85,184,200 ; vfmadd231ps %ymm8,%ymm5,%ymm1
@@ -305,7 +305,7 @@ _sk_srcover_hsw LABEL PROC
PUBLIC _sk_dstover_hsw
_sk_dstover_hsw LABEL PROC
- DB 196,98,125,24,5,102,183,2,0 ; vbroadcastss 0x2b766(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,166,188,2,0 ; vbroadcastss 0x2bca6(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
DB 196,226,61,168,205 ; vfmadd213ps %ymm5,%ymm8,%ymm1
@@ -325,7 +325,7 @@ _sk_modulate_hsw LABEL PROC
PUBLIC _sk_multiply_hsw
_sk_multiply_hsw LABEL PROC
- DB 196,98,125,24,5,45,183,2,0 ; vbroadcastss 0x2b72d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,109,188,2,0 ; vbroadcastss 0x2bc6d(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -346,7 +346,7 @@ _sk_multiply_hsw LABEL PROC
PUBLIC _sk_plus__hsw
_sk_plus__hsw LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,5,220,182,2,0 ; vbroadcastss 0x2b6dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,28,188,2,0 ; vbroadcastss 0x2bc1c(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
@@ -372,7 +372,7 @@ _sk_screen_hsw LABEL PROC
PUBLIC _sk_xor__hsw
_sk_xor__hsw LABEL PROC
- DB 196,98,125,24,5,135,182,2,0 ; vbroadcastss 0x2b687(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,199,187,2,0 ; vbroadcastss 0x2bbc7(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -404,7 +404,7 @@ _sk_darken_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,11,182,2,0 ; vbroadcastss 0x2b60b(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,75,187,2,0 ; vbroadcastss 0x2bb4b(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -427,7 +427,7 @@ _sk_lighten_hsw LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,182,181,2,0 ; vbroadcastss 0x2b5b6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,246,186,2,0 ; vbroadcastss 0x2baf6(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -453,7 +453,7 @@ _sk_difference_hsw LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,85,181,2,0 ; vbroadcastss 0x2b555(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,149,186,2,0 ; vbroadcastss 0x2ba95(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -473,7 +473,7 @@ _sk_exclusion_hsw LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,15,181,2,0 ; vbroadcastss 0x2b50f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,79,186,2,0 ; vbroadcastss 0x2ba4f(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 196,194,69,184,216 ; vfmadd231ps %ymm8,%ymm7,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -481,7 +481,7 @@ _sk_exclusion_hsw LABEL PROC
PUBLIC _sk_colorburn_hsw
_sk_colorburn_hsw LABEL PROC
- DB 196,98,125,24,5,249,180,2,0 ; vbroadcastss 0x2b4f9(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,57,186,2,0 ; vbroadcastss 0x2ba39(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -537,7 +537,7 @@ _sk_colorburn_hsw LABEL PROC
PUBLIC _sk_colordodge_hsw
_sk_colordodge_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,9,180,2,0 ; vbroadcastss 0x2b409(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,73,185,2,0 ; vbroadcastss 0x2b949(%rip),%ymm9 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -588,7 +588,7 @@ _sk_colordodge_hsw LABEL PROC
PUBLIC _sk_hardlight_hsw
_sk_hardlight_hsw LABEL PROC
- DB 196,98,125,24,5,35,179,2,0 ; vbroadcastss 0x2b323(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,99,184,2,0 ; vbroadcastss 0x2b863(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -637,7 +637,7 @@ _sk_hardlight_hsw LABEL PROC
PUBLIC _sk_overlay_hsw
_sk_overlay_hsw LABEL PROC
- DB 196,98,125,24,5,87,178,2,0 ; vbroadcastss 0x2b257(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,151,183,2,0 ; vbroadcastss 0x2b797(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -697,10 +697,10 @@ _sk_softlight_hsw LABEL PROC
DB 196,65,20,88,197 ; vaddps %ymm13,%ymm13,%ymm8
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,66,61,168,192 ; vfmadd213ps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,29,110,177,2,0 ; vbroadcastss 0x2b16e(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,29,174,182,2,0 ; vbroadcastss 0x2b6ae(%rip),%ymm11 # 2c0d4 <_sk_overlay_sse2_8bit+0x487>
DB 196,65,20,88,227 ; vaddps %ymm11,%ymm13,%ymm12
DB 196,65,28,89,192 ; vmulps %ymm8,%ymm12,%ymm8
- DB 196,98,125,24,37,95,177,2,0 ; vbroadcastss 0x2b15f(%rip),%ymm12 # 2bb98 <_sk_overlay_sse2_8bit+0x48b>
+ DB 196,98,125,24,37,159,182,2,0 ; vbroadcastss 0x2b69f(%rip),%ymm12 # 2c0d8 <_sk_overlay_sse2_8bit+0x48b>
DB 196,66,21,184,196 ; vfmadd231ps %ymm12,%ymm13,%ymm8
DB 196,65,124,82,245 ; vrsqrtps %ymm13,%ymm14
DB 196,65,124,83,246 ; vrcpps %ymm14,%ymm14
@@ -710,7 +710,7 @@ _sk_softlight_hsw LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,14,177,2,0 ; vbroadcastss 0x2b10e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,78,182,2,0 ; vbroadcastss 0x2b64e(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,60,92,237 ; vsubps %ymm13,%ymm8,%ymm13
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,98,125,168,235 ; vfmadd213ps %ymm3,%ymm0,%ymm13
@@ -823,11 +823,11 @@ _sk_hue_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,33,175,2,0 ; vbroadcastss 0x2af21(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,61,28,175,2,0 ; vbroadcastss 0x2af1c(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,97,180,2,0 ; vbroadcastss 0x2b461(%rip),%ymm14 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,61,92,180,2,0 ; vbroadcastss 0x2b45c(%rip),%ymm15 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,13,175,2,0 ; vbroadcastss 0x2af0d(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,77,180,2,0 ; vbroadcastss 0x2b44d(%rip),%ymm0 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -882,7 +882,7 @@ _sk_hue_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,206,173,2,0 ; vbroadcastss 0x2adce(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,13,14,179,2,0 ; vbroadcastss 0x2b30e(%rip),%ymm1 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -936,11 +936,11 @@ _sk_saturation_hsw LABEL PROC
DB 196,65,28,89,210 ; vmulps %ymm10,%ymm12,%ymm10
DB 196,65,44,94,214 ; vdivps %ymm14,%ymm10,%ymm10
DB 196,67,45,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm10,%ymm12
- DB 196,98,125,24,53,251,172,2,0 ; vbroadcastss 0x2acfb(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,61,246,172,2,0 ; vbroadcastss 0x2acf6(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,59,178,2,0 ; vbroadcastss 0x2b23b(%rip),%ymm14 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,61,54,178,2,0 ; vbroadcastss 0x2b236(%rip),%ymm15 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,66,93,184,238 ; vfmadd231ps %ymm14,%ymm4,%ymm13
- DB 196,226,125,24,5,231,172,2,0 ; vbroadcastss 0x2ace7(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,39,178,2,0 ; vbroadcastss 0x2b227(%rip),%ymm0 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 196,98,77,184,232 ; vfmadd231ps %ymm0,%ymm6,%ymm13
DB 196,65,116,89,215 ; vmulps %ymm15,%ymm1,%ymm10
DB 196,66,53,184,214 ; vfmadd231ps %ymm14,%ymm9,%ymm10
@@ -995,7 +995,7 @@ _sk_saturation_hsw LABEL PROC
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
DB 196,65,36,95,200 ; vmaxps %ymm8,%ymm11,%ymm9
DB 196,65,116,95,192 ; vmaxps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,13,168,171,2,0 ; vbroadcastss 0x2aba8(%rip),%ymm1 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,13,232,176,2,0 ; vbroadcastss 0x2b0e8(%rip),%ymm1 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,116,92,215 ; vsubps %ymm7,%ymm1,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,116,92,219 ; vsubps %ymm3,%ymm1,%ymm11
@@ -1023,11 +1023,11 @@ _sk_color_hsw LABEL PROC
DB 197,108,89,199 ; vmulps %ymm7,%ymm2,%ymm8
DB 197,116,89,215 ; vmulps %ymm7,%ymm1,%ymm10
DB 197,52,89,223 ; vmulps %ymm7,%ymm9,%ymm11
- DB 196,98,125,24,45,87,171,2,0 ; vbroadcastss 0x2ab57(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,53,82,171,2,0 ; vbroadcastss 0x2ab52(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,45,151,176,2,0 ; vbroadcastss 0x2b097(%rip),%ymm13 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,146,176,2,0 ; vbroadcastss 0x2b092(%rip),%ymm14 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,230 ; vmulps %ymm14,%ymm5,%ymm12
DB 196,66,93,184,229 ; vfmadd231ps %ymm13,%ymm4,%ymm12
- DB 196,98,125,24,61,67,171,2,0 ; vbroadcastss 0x2ab43(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,131,176,2,0 ; vbroadcastss 0x2b083(%rip),%ymm15 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 196,66,77,184,231 ; vfmadd231ps %ymm15,%ymm6,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1083,7 +1083,7 @@ _sk_color_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,249,169,2,0 ; vbroadcastss 0x2a9f9(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,57,175,2,0 ; vbroadcastss 0x2af39(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1111,11 +1111,11 @@ _sk_luminosity_hsw LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,213 ; vmulps %ymm5,%ymm3,%ymm10
DB 197,100,89,222 ; vmulps %ymm6,%ymm3,%ymm11
- DB 196,98,125,24,45,168,169,2,0 ; vbroadcastss 0x2a9a8(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
- DB 196,98,125,24,53,163,169,2,0 ; vbroadcastss 0x2a9a3(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,45,232,174,2,0 ; vbroadcastss 0x2aee8(%rip),%ymm13 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,227,174,2,0 ; vbroadcastss 0x2aee3(%rip),%ymm14 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,116,89,230 ; vmulps %ymm14,%ymm1,%ymm12
DB 196,66,109,184,229 ; vfmadd231ps %ymm13,%ymm2,%ymm12
- DB 196,98,125,24,61,148,169,2,0 ; vbroadcastss 0x2a994(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,212,174,2,0 ; vbroadcastss 0x2aed4(%rip),%ymm15 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 196,66,53,184,231 ; vfmadd231ps %ymm15,%ymm9,%ymm12
DB 196,65,44,89,206 ; vmulps %ymm14,%ymm10,%ymm9
DB 196,66,61,184,205 ; vfmadd231ps %ymm13,%ymm8,%ymm9
@@ -1171,7 +1171,7 @@ _sk_luminosity_hsw LABEL PROC
DB 196,193,116,95,206 ; vmaxps %ymm14,%ymm1,%ymm1
DB 196,65,44,95,198 ; vmaxps %ymm14,%ymm10,%ymm8
DB 196,65,124,95,206 ; vmaxps %ymm14,%ymm0,%ymm9
- DB 196,226,125,24,5,74,168,2,0 ; vbroadcastss 0x2a84a(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,138,173,2,0 ; vbroadcastss 0x2ad8a(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -1202,17 +1202,17 @@ _sk_srcover_rgba_8888_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 15,133,180,0,0,0 ; jne 144c <_sk_srcover_rgba_8888_hsw+0xd5>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,122,169,2,0 ; vpand 0x2a97a(%rip),%ymm7,%ymm4 # 2bd20 <_sk_overlay_sse2_8bit+0x613>
+ DB 197,197,219,37,186,174,2,0 ; vpand 0x2aeba(%rip),%ymm7,%ymm4 # 2c260 <_sk_overlay_sse2_8bit+0x613>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,69,0,45,141,169,2,0 ; vpshufb 0x2a98d(%rip),%ymm7,%ymm5 # 2bd40 <_sk_overlay_sse2_8bit+0x633>
+ DB 196,226,69,0,45,205,174,2,0 ; vpshufb 0x2aecd(%rip),%ymm7,%ymm5 # 2c280 <_sk_overlay_sse2_8bit+0x633>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,69,0,53,160,169,2,0 ; vpshufb 0x2a9a0(%rip),%ymm7,%ymm6 # 2bd60 <_sk_overlay_sse2_8bit+0x653>
+ DB 196,226,69,0,53,224,174,2,0 ; vpshufb 0x2aee0(%rip),%ymm7,%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0x653>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,166,167,2,0 ; vbroadcastss 0x2a7a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,230,172,2,0 ; vbroadcastss 0x2ace6(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,197,167,2,0 ; vbroadcastss 0x2a7c5(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,13,5,173,2,0 ; vbroadcastss 0x2ad05(%rip),%ymm9 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,93,184,192 ; vfmadd231ps %ymm8,%ymm4,%ymm0
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -1335,7 +1335,7 @@ _sk_clamp_0_hsw LABEL PROC
PUBLIC _sk_clamp_1_hsw
_sk_clamp_1_hsw LABEL PROC
- DB 196,98,125,24,5,178,165,2,0 ; vbroadcastss 0x2a5b2(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,242,170,2,0 ; vbroadcastss 0x2aaf2(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -1345,7 +1345,7 @@ _sk_clamp_1_hsw LABEL PROC
PUBLIC _sk_clamp_a_hsw
_sk_clamp_a_hsw LABEL PROC
- DB 196,98,125,24,5,145,165,2,0 ; vbroadcastss 0x2a591(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,209,170,2,0 ; vbroadcastss 0x2aad1(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -1355,7 +1355,7 @@ _sk_clamp_a_hsw LABEL PROC
PUBLIC _sk_clamp_a_dst_hsw
_sk_clamp_a_dst_hsw LABEL PROC
- DB 196,98,125,24,5,115,165,2,0 ; vbroadcastss 0x2a573(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,179,170,2,0 ; vbroadcastss 0x2aab3(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -1382,7 +1382,7 @@ _sk_swap_rb_hsw LABEL PROC
PUBLIC _sk_invert_hsw
_sk_invert_hsw LABEL PROC
- DB 196,98,125,24,5,46,165,2,0 ; vbroadcastss 0x2a52e(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,110,170,2,0 ; vbroadcastss 0x2aa6e(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -1428,7 +1428,7 @@ PUBLIC _sk_unpremul_hsw
_sk_unpremul_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,190,164,2,0 ; vbroadcastss 0x2a4be(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,254,169,2,0 ; vbroadcastss 0x2a9fe(%rip),%ymm10 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -1439,16 +1439,16 @@ _sk_unpremul_hsw LABEL PROC
PUBLIC _sk_from_srgb_hsw
_sk_from_srgb_hsw LABEL PROC
- DB 196,98,125,24,5,203,164,2,0 ; vbroadcastss 0x2a4cb(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,11,170,2,0 ; vbroadcastss 0x2aa0b(%rip),%ymm8 # 2c0ec <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,189,164,2,0 ; vbroadcastss 0x2a4bd(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
- DB 196,98,125,24,37,160,164,2,0 ; vbroadcastss 0x2a4a0(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,253,169,2,0 ; vbroadcastss 0x2a9fd(%rip),%ymm11 # 2c0f0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,37,224,169,2,0 ; vbroadcastss 0x2a9e0(%rip),%ymm12 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,125,168,235 ; vfmadd213ps %ymm11,%ymm0,%ymm13
- DB 196,98,125,24,53,165,164,2,0 ; vbroadcastss 0x2a4a5(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,53,229,169,2,0 ; vbroadcastss 0x2a9e5(%rip),%ymm14 # 2c0f4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,155,164,2,0 ; vbroadcastss 0x2a49b(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,21,219,169,2,0 ; vbroadcastss 0x2a9db(%rip),%ymm10 # 2c0f8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,124,194,194,1 ; vcmpltps %ymm10,%ymm0,%ymm0
DB 196,195,21,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm13,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -1469,16 +1469,16 @@ _sk_from_srgb_hsw LABEL PROC
PUBLIC _sk_from_srgb_dst_hsw
_sk_from_srgb_dst_hsw LABEL PROC
- DB 196,98,125,24,5,51,164,2,0 ; vbroadcastss 0x2a433(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,115,169,2,0 ; vbroadcastss 0x2a973(%rip),%ymm8 # 2c0ec <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,37,164,2,0 ; vbroadcastss 0x2a425(%rip),%ymm11 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
- DB 196,98,125,24,37,8,164,2,0 ; vbroadcastss 0x2a408(%rip),%ymm12 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,101,169,2,0 ; vbroadcastss 0x2a965(%rip),%ymm11 # 2c0f0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,37,72,169,2,0 ; vbroadcastss 0x2a948(%rip),%ymm12 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,93,168,235 ; vfmadd213ps %ymm11,%ymm4,%ymm13
- DB 196,98,125,24,53,13,164,2,0 ; vbroadcastss 0x2a40d(%rip),%ymm14 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,53,77,169,2,0 ; vbroadcastss 0x2a94d(%rip),%ymm14 # 2c0f4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,66,45,168,238 ; vfmadd213ps %ymm14,%ymm10,%ymm13
- DB 196,98,125,24,21,3,164,2,0 ; vbroadcastss 0x2a403(%rip),%ymm10 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,21,67,169,2,0 ; vbroadcastss 0x2a943(%rip),%ymm10 # 2c0f8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,92,194,226,1 ; vcmpltps %ymm10,%ymm4,%ymm4
DB 196,195,21,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm13,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -1500,19 +1500,19 @@ _sk_from_srgb_dst_hsw LABEL PROC
PUBLIC _sk_to_srgb_hsw
_sk_to_srgb_hsw LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,167,163,2,0 ; vbroadcastss 0x2a3a7(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af>
+ DB 196,98,125,24,5,231,168,2,0 ; vbroadcastss 0x2a8e7(%rip),%ymm8 # 2c0fc <_sk_overlay_sse2_8bit+0x4af>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,157,163,2,0 ; vbroadcastss 0x2a39d(%rip),%ymm11 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3>
- DB 196,98,125,24,37,152,163,2,0 ; vbroadcastss 0x2a398(%rip),%ymm12 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7>
+ DB 196,98,125,24,29,221,168,2,0 ; vbroadcastss 0x2a8dd(%rip),%ymm11 # 2c100 <_sk_overlay_sse2_8bit+0x4b3>
+ DB 196,98,125,24,37,216,168,2,0 ; vbroadcastss 0x2a8d8(%rip),%ymm12 # 2c104 <_sk_overlay_sse2_8bit+0x4b7>
DB 196,65,124,40,236 ; vmovaps %ymm12,%ymm13
DB 196,66,53,168,235 ; vfmadd213ps %ymm11,%ymm9,%ymm13
- DB 196,98,125,24,53,137,163,2,0 ; vbroadcastss 0x2a389(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb>
+ DB 196,98,125,24,53,201,168,2,0 ; vbroadcastss 0x2a8c9(%rip),%ymm14 # 2c108 <_sk_overlay_sse2_8bit+0x4bb>
DB 196,66,53,168,238 ; vfmadd213ps %ymm14,%ymm9,%ymm13
- DB 196,98,125,24,61,127,163,2,0 ; vbroadcastss 0x2a37f(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf>
+ DB 196,98,125,24,61,191,168,2,0 ; vbroadcastss 0x2a8bf(%rip),%ymm15 # 2c10c <_sk_overlay_sse2_8bit+0x4bf>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,20,89,201 ; vmulps %ymm9,%ymm13,%ymm9
- DB 196,98,125,24,45,107,163,2,0 ; vbroadcastss 0x2a36b(%rip),%ymm13 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3>
+ DB 196,98,125,24,45,171,168,2,0 ; vbroadcastss 0x2a8ab(%rip),%ymm13 # 2c110 <_sk_overlay_sse2_8bit+0x4c3>
DB 196,193,124,194,197,1 ; vcmpltps %ymm13,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -1544,26 +1544,26 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,134,162,2,0 ; vbroadcastss 0x2a286(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,29,198,167,2,0 ; vbroadcastss 0x2a7c6(%rip),%ymm11 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 197,116,194,234,1 ; vcmpltps %ymm2,%ymm1,%ymm13
- DB 196,98,125,24,53,199,162,2,0 ; vbroadcastss 0x2a2c7(%rip),%ymm14 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,53,7,168,2,0 ; vbroadcastss 0x2a807(%rip),%ymm14 # 2c114 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,65,4,87,255 ; vxorps %ymm15,%ymm15,%ymm15
DB 196,67,5,74,238,208 ; vblendvps %ymm13,%ymm14,%ymm15,%ymm13
DB 196,66,37,168,229 ; vfmadd213ps %ymm13,%ymm11,%ymm12
DB 197,236,92,208 ; vsubps %ymm0,%ymm2,%ymm2
DB 197,124,92,233 ; vsubps %ymm1,%ymm0,%ymm13
- DB 196,98,125,24,53,174,162,2,0 ; vbroadcastss 0x2a2ae(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,53,238,167,2,0 ; vbroadcastss 0x2a7ee(%rip),%ymm14 # 2c11c <_sk_overlay_sse2_8bit+0x4cf>
DB 196,66,37,168,238 ; vfmadd213ps %ymm14,%ymm11,%ymm13
- DB 196,98,125,24,53,156,162,2,0 ; vbroadcastss 0x2a29c(%rip),%ymm14 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,53,220,167,2,0 ; vbroadcastss 0x2a7dc(%rip),%ymm14 # 2c118 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,194,37,168,214 ; vfmadd213ps %ymm14,%ymm11,%ymm2
DB 197,188,194,201,0 ; vcmpeqps %ymm1,%ymm8,%ymm1
DB 196,227,21,74,202,16 ; vblendvps %ymm1,%ymm2,%ymm13,%ymm1
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,195,117,74,196,0 ; vblendvps %ymm0,%ymm12,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,29,19,162,2,0 ; vbroadcastss 0x2a213(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,83,167,2,0 ; vbroadcastss 0x2a753(%rip),%ymm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,89,211 ; vmulps %ymm11,%ymm1,%ymm2
DB 197,36,194,218,1 ; vcmpltps %ymm2,%ymm11,%ymm11
DB 196,65,12,92,224 ; vsubps %ymm8,%ymm14,%ymm12
@@ -1573,7 +1573,7 @@ _sk_rgb_to_hsl_hsw LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,199,128 ; vblendvps %ymm8,%ymm15,%ymm0,%ymm0
DB 196,195,117,74,207,128 ; vblendvps %ymm8,%ymm15,%ymm1,%ymm1
- DB 196,98,125,24,5,66,162,2,0 ; vbroadcastss 0x2a242(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,5,130,167,2,0 ; vbroadcastss 0x2a782(%rip),%ymm8 # 2c120 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -1588,30 +1588,30 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 197,252,40,224 ; vmovaps %ymm0,%ymm4
- DB 196,98,125,24,5,153,161,2,0 ; vbroadcastss 0x2a199(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,217,166,2,0 ; vbroadcastss 0x2a6d9(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,84,89,210 ; vmulps %ymm2,%ymm5,%ymm10
DB 196,65,84,92,218 ; vsubps %ymm10,%ymm5,%ymm11
DB 196,67,45,74,203,144 ; vblendvps %ymm9,%ymm11,%ymm10,%ymm9
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
- DB 196,98,125,24,13,216,161,2,0 ; vbroadcastss 0x2a1d8(%rip),%ymm9 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,13,24,167,2,0 ; vbroadcastss 0x2a718(%rip),%ymm9 # 2c118 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,66,109,170,202 ; vfmsub213ps %ymm10,%ymm2,%ymm9
- DB 196,98,125,24,29,214,161,2,0 ; vbroadcastss 0x2a1d6(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7>
+ DB 196,98,125,24,29,22,167,2,0 ; vbroadcastss 0x2a716(%rip),%ymm11 # 2c124 <_sk_overlay_sse2_8bit+0x4d7>
DB 196,65,92,88,219 ; vaddps %ymm11,%ymm4,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,45,168,161,2,0 ; vbroadcastss 0x2a1a8(%rip),%ymm13 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,45,232,166,2,0 ; vbroadcastss 0x2a6e8(%rip),%ymm13 # 2c114 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,193,4,89,197 ; vmulps %ymm13,%ymm15,%ymm0
- DB 196,98,125,24,53,162,161,2,0 ; vbroadcastss 0x2a1a2(%rip),%ymm14 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,53,226,166,2,0 ; vbroadcastss 0x2a6e2(%rip),%ymm14 # 2c11c <_sk_overlay_sse2_8bit+0x4cf>
DB 197,12,92,224 ; vsubps %ymm0,%ymm14,%ymm12
DB 196,66,37,168,225 ; vfmadd213ps %ymm9,%ymm11,%ymm12
- DB 196,226,125,24,29,156,161,2,0 ; vbroadcastss 0x2a19c(%rip),%ymm3 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db>
+ DB 196,226,125,24,29,220,166,2,0 ; vbroadcastss 0x2a6dc(%rip),%ymm3 # 2c128 <_sk_overlay_sse2_8bit+0x4db>
DB 196,193,100,194,255,2 ; vcmpleps %ymm15,%ymm3,%ymm7
DB 196,195,29,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm12,%ymm7
DB 196,65,60,194,231,2 ; vcmpleps %ymm15,%ymm8,%ymm12
DB 196,227,45,74,255,192 ; vblendvps %ymm12,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,37,115,161,2,0 ; vbroadcastss 0x2a173(%rip),%ymm12 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,37,179,166,2,0 ; vbroadcastss 0x2a6b3(%rip),%ymm12 # 2c120 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,65,28,194,255,2 ; vcmpleps %ymm15,%ymm12,%ymm15
DB 196,194,37,168,193 ; vfmadd213ps %ymm9,%ymm11,%ymm0
DB 196,99,125,74,255,240 ; vblendvps %ymm15,%ymm7,%ymm0,%ymm15
@@ -1627,7 +1627,7 @@ _sk_hsl_to_rgb_hsw LABEL PROC
DB 197,156,194,192,2 ; vcmpleps %ymm0,%ymm12,%ymm0
DB 196,194,37,168,249 ; vfmadd213ps %ymm9,%ymm11,%ymm7
DB 196,227,69,74,201,0 ; vblendvps %ymm0,%ymm1,%ymm7,%ymm1
- DB 196,226,125,24,5,39,161,2,0 ; vbroadcastss 0x2a127(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,226,125,24,5,103,166,2,0 ; vbroadcastss 0x2a667(%rip),%ymm0 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
DB 197,220,88,192 ; vaddps %ymm0,%ymm4,%ymm0
DB 196,227,125,8,224,1 ; vroundps $0x1,%ymm0,%ymm4
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
@@ -1678,10 +1678,10 @@ _sk_scale_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,59 ; jne 1bbc <_sk_scale_u8_hsw+0x54>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,129,169,2,0 ; vpand 0x2a981(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,57,219,5,193,174,2,0 ; vpand 0x2aec1(%rip),%xmm8,%xmm8 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,78,160,2,0 ; vbroadcastss 0x2a04e(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,142,165,2,0 ; vbroadcastss 0x2a58e(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -1758,20 +1758,20 @@ _sk_scale_565_hsw LABEL PROC
DB 15,133,162,0,0,0 ; jne 1d36 <_sk_scale_565_hsw+0xc2>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,76,159,2,0 ; vpbroadcastd 0x29f4c(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,88,13,140,164,2,0 ; vpbroadcastd 0x2a48c(%rip),%ymm9 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,61,159,2,0 ; vbroadcastss 0x29f3d(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,125,164,2,0 ; vbroadcastss 0x2a47d(%rip),%ymm10 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,51,159,2,0 ; vpbroadcastd 0x29f33(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,88,21,115,164,2,0 ; vpbroadcastd 0x2a473(%rip),%ymm10 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,36,159,2,0 ; vbroadcastss 0x29f24(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,100,164,2,0 ; vbroadcastss 0x2a464(%rip),%ymm11 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,26,159,2,0 ; vpbroadcastd 0x29f1a(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,88,29,90,164,2,0 ; vpbroadcastd 0x2a45a(%rip),%ymm11 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,11,159,2,0 ; vbroadcastss 0x29f0b(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,75,164,2,0 ; vbroadcastss 0x2a44b(%rip),%ymm11 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -1858,10 +1858,10 @@ _sk_lerp_u8_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,79 ; jne 1e73 <_sk_lerp_u8_hsw+0x68>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,222,166,2,0 ; vpand 0x2a6de(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,57,219,5,30,172,2,0 ; vpand 0x2ac1e(%rip),%xmm8,%xmm8 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,171,157,2,0 ; vbroadcastss 0x29dab(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,235,162,2,0 ; vbroadcastss 0x2a2eb(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,226,61,168,196 ; vfmadd213ps %ymm4,%ymm8,%ymm0
@@ -1942,20 +1942,20 @@ _sk_lerp_565_hsw LABEL PROC
DB 15,133,182,0,0,0 ; jne 1ffe <_sk_lerp_565_hsw+0xd6>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,66,125,51,192 ; vpmovzxwd %xmm8,%ymm8
- DB 196,98,125,88,13,152,156,2,0 ; vpbroadcastd 0x29c98(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,88,13,216,161,2,0 ; vpbroadcastd 0x2a1d8(%rip),%ymm9 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,61,219,201 ; vpand %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,137,156,2,0 ; vbroadcastss 0x29c89(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,201,161,2,0 ; vbroadcastss 0x2a1c9(%rip),%ymm10 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,88,21,127,156,2,0 ; vpbroadcastd 0x29c7f(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,88,21,191,161,2,0 ; vpbroadcastd 0x2a1bf(%rip),%ymm10 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,61,219,210 ; vpand %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,112,156,2,0 ; vbroadcastss 0x29c70(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,176,161,2,0 ; vbroadcastss 0x2a1b0(%rip),%ymm11 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,88,29,102,156,2,0 ; vpbroadcastd 0x29c66(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,88,29,166,161,2,0 ; vpbroadcastd 0x2a1a6(%rip),%ymm11 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,61,219,195 ; vpand %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,87,156,2,0 ; vbroadcastss 0x29c57(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,151,161,2,0 ; vbroadcastss 0x2a197(%rip),%ymm11 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -2026,21 +2026,21 @@ _sk_load_tables_hsw LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 117,103 ; jne 2115 <_sk_load_tables_hsw+0x71>
DB 196,193,126,111,28,145 ; vmovdqu (%r9,%rdx,4),%ymm3
- DB 197,229,219,13,196,156,2,0 ; vpand 0x29cc4(%rip),%ymm3,%ymm1 # 2bd80 <_sk_overlay_sse2_8bit+0x673>
+ DB 197,229,219,13,4,162,2,0 ; vpand 0x2a204(%rip),%ymm3,%ymm1 # 2c2c0 <_sk_overlay_sse2_8bit+0x673>
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 76,139,80,16 ; mov 0x10(%rax),%r10
DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
DB 196,194,109,146,4,137 ; vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
- DB 196,226,101,0,21,196,156,2,0 ; vpshufb 0x29cc4(%rip),%ymm3,%ymm2 # 2bda0 <_sk_overlay_sse2_8bit+0x693>
+ DB 196,226,101,0,21,4,162,2,0 ; vpshufb 0x2a204(%rip),%ymm3,%ymm2 # 2c2e0 <_sk_overlay_sse2_8bit+0x693>
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,194,53,146,12,146 ; vgatherdps %ymm9,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
- DB 196,98,101,0,13,204,156,2,0 ; vpshufb 0x29ccc(%rip),%ymm3,%ymm9 # 2bdc0 <_sk_overlay_sse2_8bit+0x6b3>
+ DB 196,98,101,0,13,12,162,2,0 ; vpshufb 0x2a20c(%rip),%ymm3,%ymm9 # 2c300 <_sk_overlay_sse2_8bit+0x6b3>
DB 196,162,61,146,20,136 ; vgatherdps %ymm8,(%rax,%ymm9,4),%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,228,154,2,0 ; vbroadcastss 0x29ae4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,36,160,2,0 ; vbroadcastss 0x2a024(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2120,7 +2120,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,108,200 ; vpunpcklqdq %xmm0,%xmm8,%xmm1
DB 197,185,109,208 ; vpunpckhqdq %xmm0,%xmm8,%xmm2
DB 197,49,108,195 ; vpunpcklqdq %xmm3,%xmm9,%xmm8
- DB 197,121,111,21,205,162,2,0 ; vmovdqa 0x2a2cd(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,121,111,21,13,168,2,0 ; vmovdqa 0x2a80d(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,113,219,194 ; vpand %xmm10,%xmm1,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -2142,7 +2142,7 @@ _sk_load_tables_u16_be_hsw LABEL PROC
DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
DB 196,226,125,51,219 ; vpmovzxwd %xmm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,90,153,2,0 ; vbroadcastss 0x2995a(%rip),%ymm8 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,5,154,158,2,0 ; vbroadcastss 0x29e9a(%rip),%ymm8 # 2c14c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2180,83 +2180,111 @@ _sk_load_tables_rgb_u16_be_hsw LABEL PROC
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
DB 15,133,193,0,0,0 ; jne 240a <_sk_load_tables_rgb_u16_be_hsw+0xd3>
- DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
- DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
- DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
- DB 196,129,122,111,92,81,32 ; vmovdqu 0x20(%r9,%r10,2),%xmm3
- DB 197,225,115,219,4 ; vpsrldq $0x4,%xmm3,%xmm3
- DB 197,185,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm8
- DB 197,177,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm9
- DB 197,161,115,217,6 ; vpsrldq $0x6,%xmm1,%xmm11
+ DB 196,1,122,111,28,81 ; vmovdqu (%r9,%r10,2),%xmm11
+ DB 196,129,122,111,92,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm3
+ DB 196,129,122,111,84,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm2
+ DB 196,129,122,111,68,81,32 ; vmovdqu 0x20(%r9,%r10,2),%xmm0
+ DB 197,249,115,216,4 ; vpsrldq $0x4,%xmm0,%xmm0
+ DB 196,193,57,115,219,6 ; vpsrldq $0x6,%xmm11,%xmm8
DB 197,169,115,219,6 ; vpsrldq $0x6,%xmm3,%xmm10
- DB 197,249,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm0
- DB 196,193,57,97,209 ; vpunpcklwd %xmm9,%xmm8,%xmm2
- DB 197,241,97,203 ; vpunpcklwd %xmm3,%xmm1,%xmm1
- DB 196,193,33,97,218 ; vpunpcklwd %xmm10,%xmm11,%xmm3
- DB 197,121,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm8
+ DB 197,153,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm12
+ DB 197,177,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm9
+ DB 197,161,97,219 ; vpunpcklwd %xmm3,%xmm11,%xmm3
+ DB 196,193,57,97,202 ; vpunpcklwd %xmm10,%xmm8,%xmm1
+ DB 197,233,97,192 ; vpunpcklwd %xmm0,%xmm2,%xmm0
+ DB 196,193,25,97,209 ; vpunpcklwd %xmm9,%xmm12,%xmm2
+ DB 197,97,97,193 ; vpunpcklwd %xmm1,%xmm3,%xmm8
+ DB 197,225,105,201 ; vpunpckhwd %xmm1,%xmm3,%xmm1
+ DB 197,249,97,218 ; vpunpcklwd %xmm2,%xmm0,%xmm3
DB 197,249,105,194 ; vpunpckhwd %xmm2,%xmm0,%xmm0
- DB 197,241,97,211 ; vpunpcklwd %xmm3,%xmm1,%xmm2
- DB 197,241,105,203 ; vpunpckhwd %xmm3,%xmm1,%xmm1
- DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
- DB 197,185,109,210 ; vpunpckhqdq %xmm2,%xmm8,%xmm2
- DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,93,161,2,0 ; vmovdqa 0x2a15d(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
- DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
+ DB 197,185,108,211 ; vpunpcklqdq %xmm3,%xmm8,%xmm2
+ DB 197,185,109,219 ; vpunpckhqdq %xmm3,%xmm8,%xmm3
+ DB 197,113,108,192 ; vpunpcklqdq %xmm0,%xmm1,%xmm8
+ DB 197,121,111,13,156,166,2,0 ; vmovdqa 0x2a69c(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
+ DB 196,193,105,219,193 ; vpand %xmm9,%xmm2,%xmm0
DB 196,226,125,51,200 ; vpmovzxwd %xmm0,%ymm1
- DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 76,139,80,16 ; mov 0x10(%rax),%r10
- DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
- DB 196,194,45,146,4,137 ; vgatherdps %ymm10,(%r9,%ymm1,4),%ymm0
- DB 196,193,105,219,201 ; vpand %xmm9,%xmm2,%xmm1
+ DB 197,237,118,210 ; vpcmpeqd %ymm2,%ymm2,%ymm2
+ DB 196,194,109,146,4,137 ; vgatherdps %ymm2,(%r9,%ymm1,4),%ymm0
+ DB 196,193,97,219,201 ; vpand %xmm9,%xmm3,%xmm1
DB 196,226,125,51,209 ; vpmovzxwd %xmm1,%ymm2
- DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
- DB 196,194,45,146,12,146 ; vgatherdps %ymm10,(%r10,%ymm2,4),%ymm1
+ DB 197,229,118,219 ; vpcmpeqd %ymm3,%ymm3,%ymm3
+ DB 196,194,101,146,12,146 ; vgatherdps %ymm3,(%r10,%ymm2,4),%ymm1
DB 72,139,64,24 ; mov 0x18(%rax),%rax
DB 196,193,57,219,209 ; vpand %xmm9,%xmm8,%xmm2
- DB 196,98,125,51,194 ; vpmovzxwd %xmm2,%ymm8
- DB 196,162,101,146,20,128 ; vgatherdps %ymm3,(%rax,%ymm8,4),%ymm2
+ DB 196,226,125,51,218 ; vpmovzxwd %xmm2,%ymm3
+ DB 196,226,45,146,20,152 ; vgatherdps %ymm10,(%rax,%ymm3,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,116,151,2,0 ; vbroadcastss 0x29774(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,180,156,2,0 ; vbroadcastss 0x29cb4(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
- DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
+ DB 196,1,121,196,92,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm11
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 2423 <_sk_load_tables_rgb_u16_be_hsw+0xec>
- DB 233,90,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
- DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
+ DB 117,32 ; jne 2443 <_sk_load_tables_rgb_u16_be_hsw+0x10c>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 233,59,255,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 196,129,121,110,68,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm0
+ DB 196,1,121,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm0,%xmm8
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 2452 <_sk_load_tables_rgb_u16_be_hsw+0x11b>
- DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
- DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
+ DB 114,49 ; jb 248e <_sk_load_tables_rgb_u16_be_hsw+0x157>
+ DB 196,129,121,110,68,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm0
+ DB 196,129,121,196,92,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm0,%xmm3
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 2457 <_sk_load_tables_rgb_u16_be_hsw+0x120>
- DB 233,43,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,38,255,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
- DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
+ DB 117,50 ; jne 24a9 <_sk_load_tables_rgb_u16_be_hsw+0x172>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 233,240,254,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 233,213,254,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 196,129,121,110,68,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm0
+ DB 196,1,121,196,84,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm0,%xmm10
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 2486 <_sk_load_tables_rgb_u16_be_hsw+0x14f>
- DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
- DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
+ DB 114,40 ; jb 24eb <_sk_load_tables_rgb_u16_be_hsw+0x1b4>
+ DB 196,129,121,110,68,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm0
+ DB 196,129,121,196,84,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm0,%xmm2
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 248b <_sk_load_tables_rgb_u16_be_hsw+0x154>
- DB 233,247,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,242,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
- DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
+ DB 117,32 ; jne 24fd <_sk_load_tables_rgb_u16_be_hsw+0x1c6>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 233,147,254,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 233,129,254,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 196,129,121,110,68,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm0
+ DB 196,1,121,196,100,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm0,%xmm12
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 24b4 <_sk_load_tables_rgb_u16_be_hsw+0x17d>
- DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
- DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,201,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
- DB 233,196,254,255,255 ; jmpq 237d <_sk_load_tables_rgb_u16_be_hsw+0x46>
+ DB 114,25 ; jb 2530 <_sk_load_tables_rgb_u16_be_hsw+0x1f9>
+ DB 196,129,121,110,68,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm0
+ DB 196,129,121,196,68,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm0,%xmm0
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
+ DB 233,78,254,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 233,69,254,255,255 ; jmpq 237e <_sk_load_tables_rgb_u16_be_hsw+0x47>
PUBLIC _sk_byte_tables_hsw
_sk_byte_tables_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,228,150,2,0 ; vbroadcastss 0x296e4(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,164,155,2,0 ; vbroadcastss 0x29ba4(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -2378,7 +2406,7 @@ _sk_byte_tables_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,205,148,2,0 ; vbroadcastss 0x294cd(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,141,153,2,0 ; vbroadcastss 0x2998d(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2492,7 +2520,7 @@ _sk_byte_tables_rgb_hsw LABEL PROC
DB 67,15,182,4,26 ; movzbl (%r10,%r11,1),%eax
DB 196,194,125,49,193 ; vpmovzxbd %xmm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,181,146,2,0 ; vbroadcastss 0x292b5(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,117,151,2,0 ; vbroadcastss 0x29775(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
@@ -2581,33 +2609,33 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,66,125,168,211 ; vfmadd213ps %ymm11,%ymm0,%ymm10
DB 196,226,125,24,0 ; vbroadcastss (%rax),%ymm0
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,171,145,2,0 ; vbroadcastss 0x291ab(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,166,145,2,0 ; vbroadcastss 0x291a6(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,107,150,2,0 ; vbroadcastss 0x2966b(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,102,150,2,0 ; vbroadcastss 0x29666(%rip),%ymm13 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,252,144,2,0 ; vbroadcastss 0x290fc(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,188,149,2,0 ; vbroadcastss 0x295bc(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,142,145,2,0 ; vbroadcastss 0x2918e(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,78,150,2,0 ; vbroadcastss 0x2964e(%rip),%ymm13 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,132,145,2,0 ; vbroadcastss 0x29184(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,68,150,2,0 ; vbroadcastss 0x29644(%rip),%ymm11 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,122,145,2,0 ; vbroadcastss 0x2917a(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,58,150,2,0 ; vbroadcastss 0x2963a(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,112,145,2,0 ; vbroadcastss 0x29170(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,48,150,2,0 ; vbroadcastss 0x29630(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,81,145,2,0 ; vbroadcastss 0x29151(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,17,150,2,0 ; vbroadcastss 0x29611(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,71,145,2,0 ; vbroadcastss 0x29147(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,7,150,2,0 ; vbroadcastss 0x29607(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,216 ; vfnmadd213ps %ymm0,%ymm10,%ymm11
- DB 196,226,125,24,5,61,145,2,0 ; vbroadcastss 0x2913d(%rip),%ymm0 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,5,253,149,2,0 ; vbroadcastss 0x295fd(%rip),%ymm0 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,124,92,194 ; vsubps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,51,145,2,0 ; vbroadcastss 0x29133(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,243,149,2,0 ; vbroadcastss 0x295f3(%rip),%ymm10 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,192 ; vdivps %ymm0,%ymm10,%ymm0
DB 197,164,88,192 ; vaddps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,21,38,145,2,0 ; vbroadcastss 0x29126(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,230,149,2,0 ; vbroadcastss 0x295e6(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2615,7 +2643,7 @@ _sk_parametric_r_hsw LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,61,144,2,0 ; vbroadcastss 0x2903d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,253,148,2,0 ; vbroadcastss 0x294fd(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2633,33 +2661,33 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,66,117,168,211 ; vfmadd213ps %ymm11,%ymm1,%ymm10
DB 196,226,125,24,8 ; vbroadcastss (%rax),%ymm1
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,133,144,2,0 ; vbroadcastss 0x29085(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,128,144,2,0 ; vbroadcastss 0x29080(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,69,149,2,0 ; vbroadcastss 0x29545(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,64,149,2,0 ; vbroadcastss 0x29540(%rip),%ymm13 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,214,143,2,0 ; vbroadcastss 0x28fd6(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,150,148,2,0 ; vbroadcastss 0x29496(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,104,144,2,0 ; vbroadcastss 0x29068(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,40,149,2,0 ; vbroadcastss 0x29528(%rip),%ymm13 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,94,144,2,0 ; vbroadcastss 0x2905e(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,30,149,2,0 ; vbroadcastss 0x2951e(%rip),%ymm11 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,84,144,2,0 ; vbroadcastss 0x29054(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,20,149,2,0 ; vbroadcastss 0x29514(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,74,144,2,0 ; vbroadcastss 0x2904a(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,10,149,2,0 ; vbroadcastss 0x2950a(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,43,144,2,0 ; vbroadcastss 0x2902b(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,235,148,2,0 ; vbroadcastss 0x294eb(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,33,144,2,0 ; vbroadcastss 0x29021(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,225,148,2,0 ; vbroadcastss 0x294e1(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,217 ; vfnmadd213ps %ymm1,%ymm10,%ymm11
- DB 196,226,125,24,13,23,144,2,0 ; vbroadcastss 0x29017(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,13,215,148,2,0 ; vbroadcastss 0x294d7(%rip),%ymm1 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,116,92,202 ; vsubps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,13,144,2,0 ; vbroadcastss 0x2900d(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,205,148,2,0 ; vbroadcastss 0x294cd(%rip),%ymm10 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 197,164,88,201 ; vaddps %ymm1,%ymm11,%ymm1
- DB 196,98,125,24,21,0,144,2,0 ; vbroadcastss 0x29000(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,192,148,2,0 ; vbroadcastss 0x294c0(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2667,7 +2695,7 @@ _sk_parametric_g_hsw LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,23,143,2,0 ; vbroadcastss 0x28f17(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,215,147,2,0 ; vbroadcastss 0x293d7(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2685,33 +2713,33 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,66,109,168,211 ; vfmadd213ps %ymm11,%ymm2,%ymm10
DB 196,226,125,24,16 ; vbroadcastss (%rax),%ymm2
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,95,143,2,0 ; vbroadcastss 0x28f5f(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,90,143,2,0 ; vbroadcastss 0x28f5a(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,31,148,2,0 ; vbroadcastss 0x2941f(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,26,148,2,0 ; vbroadcastss 0x2941a(%rip),%ymm13 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,176,142,2,0 ; vbroadcastss 0x28eb0(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,112,147,2,0 ; vbroadcastss 0x29370(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,66,143,2,0 ; vbroadcastss 0x28f42(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,2,148,2,0 ; vbroadcastss 0x29402(%rip),%ymm13 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,56,143,2,0 ; vbroadcastss 0x28f38(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,248,147,2,0 ; vbroadcastss 0x293f8(%rip),%ymm11 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,46,143,2,0 ; vbroadcastss 0x28f2e(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,238,147,2,0 ; vbroadcastss 0x293ee(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,36,143,2,0 ; vbroadcastss 0x28f24(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,228,147,2,0 ; vbroadcastss 0x293e4(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,5,143,2,0 ; vbroadcastss 0x28f05(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,197,147,2,0 ; vbroadcastss 0x293c5(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,251,142,2,0 ; vbroadcastss 0x28efb(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,187,147,2,0 ; vbroadcastss 0x293bb(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,218 ; vfnmadd213ps %ymm2,%ymm10,%ymm11
- DB 196,226,125,24,21,241,142,2,0 ; vbroadcastss 0x28ef1(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,21,177,147,2,0 ; vbroadcastss 0x293b1(%rip),%ymm2 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,108,92,210 ; vsubps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,231,142,2,0 ; vbroadcastss 0x28ee7(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,167,147,2,0 ; vbroadcastss 0x293a7(%rip),%ymm10 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,210 ; vdivps %ymm2,%ymm10,%ymm2
DB 197,164,88,210 ; vaddps %ymm2,%ymm11,%ymm2
- DB 196,98,125,24,21,218,142,2,0 ; vbroadcastss 0x28eda(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,154,147,2,0 ; vbroadcastss 0x2939a(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2719,7 +2747,7 @@ _sk_parametric_b_hsw LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,241,141,2,0 ; vbroadcastss 0x28df1(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,177,146,2,0 ; vbroadcastss 0x292b1(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2737,33 +2765,33 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,66,101,168,211 ; vfmadd213ps %ymm11,%ymm3,%ymm10
DB 196,226,125,24,24 ; vbroadcastss (%rax),%ymm3
DB 196,65,124,91,218 ; vcvtdq2ps %ymm10,%ymm11
- DB 196,98,125,24,37,57,142,2,0 ; vbroadcastss 0x28e39(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
- DB 196,98,125,24,45,52,142,2,0 ; vbroadcastss 0x28e34(%rip),%ymm13 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,249,146,2,0 ; vbroadcastss 0x292f9(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,45,244,146,2,0 ; vbroadcastss 0x292f4(%rip),%ymm13 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,65,44,84,213 ; vandps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,138,141,2,0 ; vbroadcastss 0x28d8a(%rip),%ymm13 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,45,74,146,2,0 ; vbroadcastss 0x2924a(%rip),%ymm13 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,86,213 ; vorps %ymm13,%ymm10,%ymm10
- DB 196,98,125,24,45,28,142,2,0 ; vbroadcastss 0x28e1c(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,220,146,2,0 ; vbroadcastss 0x292dc(%rip),%ymm13 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,184,236 ; vfmadd231ps %ymm12,%ymm11,%ymm13
- DB 196,98,125,24,29,18,142,2,0 ; vbroadcastss 0x28e12(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,210,146,2,0 ; vbroadcastss 0x292d2(%rip),%ymm11 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,45,172,221 ; vfnmadd213ps %ymm13,%ymm10,%ymm11
- DB 196,98,125,24,37,8,142,2,0 ; vbroadcastss 0x28e08(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,200,146,2,0 ; vbroadcastss 0x292c8(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,254,141,2,0 ; vbroadcastss 0x28dfe(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,190,146,2,0 ; vbroadcastss 0x292be(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,28,94,210 ; vdivps %ymm10,%ymm12,%ymm10
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,223,141,2,0 ; vbroadcastss 0x28ddf(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,159,146,2,0 ; vbroadcastss 0x2929f(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,213,141,2,0 ; vbroadcastss 0x28dd5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,149,146,2,0 ; vbroadcastss 0x29295(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,45,172,219 ; vfnmadd213ps %ymm3,%ymm10,%ymm11
- DB 196,226,125,24,29,203,141,2,0 ; vbroadcastss 0x28dcb(%rip),%ymm3 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,29,139,146,2,0 ; vbroadcastss 0x2928b(%rip),%ymm3 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,193,100,92,218 ; vsubps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,193,141,2,0 ; vbroadcastss 0x28dc1(%rip),%ymm10 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,21,129,146,2,0 ; vbroadcastss 0x29281(%rip),%ymm10 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 197,172,94,219 ; vdivps %ymm3,%ymm10,%ymm3
DB 197,164,88,219 ; vaddps %ymm3,%ymm11,%ymm3
- DB 196,98,125,24,21,180,141,2,0 ; vbroadcastss 0x28db4(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,116,146,2,0 ; vbroadcastss 0x29274(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -2771,7 +2799,7 @@ _sk_parametric_a_hsw LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,203,140,2,0 ; vbroadcastss 0x28ccb(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,139,145,2,0 ; vbroadcastss 0x2918b(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2788,35 +2816,35 @@ _sk_gamma_hsw LABEL PROC
DB 197,252,40,241 ; vmovaps %ymm1,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,124,91,208 ; vcvtdq2ps %ymm0,%ymm10
- DB 196,98,125,24,29,24,141,2,0 ; vbroadcastss 0x28d18(%rip),%ymm11 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
- DB 196,226,125,24,45,19,141,2,0 ; vbroadcastss 0x28d13(%rip),%ymm5 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,29,216,145,2,0 ; vbroadcastss 0x291d8(%rip),%ymm11 # 2c150 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,226,125,24,45,211,145,2,0 ; vbroadcastss 0x291d3(%rip),%ymm5 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 197,124,84,205 ; vandps %ymm5,%ymm0,%ymm9
- DB 196,226,125,24,37,106,140,2,0 ; vbroadcastss 0x28c6a(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,37,42,145,2,0 ; vbroadcastss 0x2912a(%rip),%ymm4 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,52,86,228 ; vorps %ymm4,%ymm9,%ymm12
- DB 196,98,125,24,45,253,140,2,0 ; vbroadcastss 0x28cfd(%rip),%ymm13 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,45,189,145,2,0 ; vbroadcastss 0x291bd(%rip),%ymm13 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,66,37,168,213 ; vfmadd213ps %ymm13,%ymm11,%ymm10
- DB 196,98,125,24,13,243,140,2,0 ; vbroadcastss 0x28cf3(%rip),%ymm9 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,13,179,145,2,0 ; vbroadcastss 0x291b3(%rip),%ymm9 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,66,29,188,209 ; vfnmadd231ps %ymm9,%ymm12,%ymm10
DB 197,124,91,246 ; vcvtdq2ps %ymm6,%ymm14
DB 196,66,37,168,245 ; vfmadd213ps %ymm13,%ymm11,%ymm14
DB 197,124,91,255 ; vcvtdq2ps %ymm7,%ymm15
DB 196,66,37,168,253 ; vfmadd213ps %ymm13,%ymm11,%ymm15
- DB 196,98,125,24,29,215,140,2,0 ; vbroadcastss 0x28cd7(%rip),%ymm11 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,29,151,145,2,0 ; vbroadcastss 0x29197(%rip),%ymm11 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,65,28,88,227 ; vaddps %ymm11,%ymm12,%ymm12
- DB 196,98,125,24,45,205,140,2,0 ; vbroadcastss 0x28ccd(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,45,141,145,2,0 ; vbroadcastss 0x2918d(%rip),%ymm13 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 196,65,20,94,228 ; vdivps %ymm12,%ymm13,%ymm12
DB 196,65,44,92,212 ; vsubps %ymm12,%ymm10,%ymm10
DB 196,98,125,24,32 ; vbroadcastss (%rax),%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
DB 196,67,125,8,194,1 ; vroundps $0x1,%ymm10,%ymm8
DB 196,65,44,92,192 ; vsubps %ymm8,%ymm10,%ymm8
- DB 196,226,125,24,21,169,140,2,0 ; vbroadcastss 0x28ca9(%rip),%ymm2 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,226,125,24,21,105,145,2,0 ; vbroadcastss 0x29169(%rip),%ymm2 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 197,44,88,210 ; vaddps %ymm2,%ymm10,%ymm10
- DB 196,226,125,24,29,160,140,2,0 ; vbroadcastss 0x28ca0(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,226,125,24,29,96,145,2,0 ; vbroadcastss 0x29160(%rip),%ymm3 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,98,61,188,211 ; vfnmadd231ps %ymm3,%ymm8,%ymm10
- DB 196,226,125,24,13,150,140,2,0 ; vbroadcastss 0x28c96(%rip),%ymm1 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,13,86,145,2,0 ; vbroadcastss 0x29156(%rip),%ymm1 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,116,92,192 ; vsubps %ymm8,%ymm1,%ymm8
- DB 196,226,125,24,5,140,140,2,0 ; vbroadcastss 0x28c8c(%rip),%ymm0 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,226,125,24,5,76,145,2,0 ; vbroadcastss 0x2914c(%rip),%ymm0 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,124,94,192 ; vdivps %ymm8,%ymm0,%ymm8
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 197,204,84,245 ; vandps %ymm5,%ymm6,%ymm6
@@ -2847,7 +2875,7 @@ _sk_gamma_hsw LABEL PROC
DB 197,244,92,205 ; vsubps %ymm5,%ymm1,%ymm1
DB 197,252,94,193 ; vdivps %ymm1,%ymm0,%ymm0
DB 197,236,88,192 ; vaddps %ymm0,%ymm2,%ymm0
- DB 196,226,125,24,13,253,139,2,0 ; vbroadcastss 0x28bfd(%rip),%ymm1 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,226,125,24,13,189,144,2,0 ; vbroadcastss 0x290bd(%rip),%ymm1 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 197,188,89,209 ; vmulps %ymm1,%ymm8,%ymm2
DB 197,204,89,217 ; vmulps %ymm1,%ymm6,%ymm3
DB 197,252,89,225 ; vmulps %ymm1,%ymm0,%ymm4
@@ -2865,26 +2893,26 @@ _sk_gamma_hsw LABEL PROC
PUBLIC _sk_lab_to_xyz_hsw
_sk_lab_to_xyz_hsw LABEL PROC
- DB 196,98,125,24,5,181,139,2,0 ; vbroadcastss 0x28bb5(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f>
- DB 196,98,125,24,13,24,139,2,0 ; vbroadcastss 0x28b18(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
- DB 196,98,125,24,21,167,139,2,0 ; vbroadcastss 0x28ba7(%rip),%ymm10 # 2bc40 <_sk_overlay_sse2_8bit+0x533>
+ DB 196,98,125,24,5,117,144,2,0 ; vbroadcastss 0x29075(%rip),%ymm8 # 2c17c <_sk_overlay_sse2_8bit+0x52f>
+ DB 196,98,125,24,13,216,143,2,0 ; vbroadcastss 0x28fd8(%rip),%ymm9 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,21,103,144,2,0 ; vbroadcastss 0x29067(%rip),%ymm10 # 2c180 <_sk_overlay_sse2_8bit+0x533>
DB 196,194,53,168,202 ; vfmadd213ps %ymm10,%ymm9,%ymm1
DB 196,194,53,168,210 ; vfmadd213ps %ymm10,%ymm9,%ymm2
- DB 196,98,125,24,13,152,139,2,0 ; vbroadcastss 0x28b98(%rip),%ymm9 # 2bc44 <_sk_overlay_sse2_8bit+0x537>
+ DB 196,98,125,24,13,88,144,2,0 ; vbroadcastss 0x29058(%rip),%ymm9 # 2c184 <_sk_overlay_sse2_8bit+0x537>
DB 196,66,125,184,200 ; vfmadd231ps %ymm8,%ymm0,%ymm9
- DB 196,226,125,24,5,142,139,2,0 ; vbroadcastss 0x28b8e(%rip),%ymm0 # 2bc48 <_sk_overlay_sse2_8bit+0x53b>
+ DB 196,226,125,24,5,78,144,2,0 ; vbroadcastss 0x2904e(%rip),%ymm0 # 2c188 <_sk_overlay_sse2_8bit+0x53b>
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
- DB 196,98,125,24,5,133,139,2,0 ; vbroadcastss 0x28b85(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f>
+ DB 196,98,125,24,5,69,144,2,0 ; vbroadcastss 0x29045(%rip),%ymm8 # 2c18c <_sk_overlay_sse2_8bit+0x53f>
DB 196,98,117,168,192 ; vfmadd213ps %ymm0,%ymm1,%ymm8
- DB 196,98,125,24,13,123,139,2,0 ; vbroadcastss 0x28b7b(%rip),%ymm9 # 2bc50 <_sk_overlay_sse2_8bit+0x543>
+ DB 196,98,125,24,13,59,144,2,0 ; vbroadcastss 0x2903b(%rip),%ymm9 # 2c190 <_sk_overlay_sse2_8bit+0x543>
DB 196,98,109,172,200 ; vfnmadd213ps %ymm0,%ymm2,%ymm9
DB 196,193,60,89,200 ; vmulps %ymm8,%ymm8,%ymm1
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
- DB 196,226,125,24,21,104,139,2,0 ; vbroadcastss 0x28b68(%rip),%ymm2 # 2bc54 <_sk_overlay_sse2_8bit+0x547>
+ DB 196,226,125,24,21,40,144,2,0 ; vbroadcastss 0x29028(%rip),%ymm2 # 2c194 <_sk_overlay_sse2_8bit+0x547>
DB 197,108,194,209,1 ; vcmpltps %ymm1,%ymm2,%ymm10
- DB 196,98,125,24,29,94,139,2,0 ; vbroadcastss 0x28b5e(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b>
+ DB 196,98,125,24,29,30,144,2,0 ; vbroadcastss 0x2901e(%rip),%ymm11 # 2c198 <_sk_overlay_sse2_8bit+0x54b>
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,37,84,139,2,0 ; vbroadcastss 0x28b54(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f>
+ DB 196,98,125,24,37,20,144,2,0 ; vbroadcastss 0x29014(%rip),%ymm12 # 2c19c <_sk_overlay_sse2_8bit+0x54f>
DB 196,65,60,89,196 ; vmulps %ymm12,%ymm8,%ymm8
DB 196,99,61,74,193,160 ; vblendvps %ymm10,%ymm1,%ymm8,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -2899,9 +2927,9 @@ _sk_lab_to_xyz_hsw LABEL PROC
DB 196,65,52,88,203 ; vaddps %ymm11,%ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
DB 196,227,53,74,208,32 ; vblendvps %ymm2,%ymm0,%ymm9,%ymm2
- DB 196,226,125,24,5,9,139,2,0 ; vbroadcastss 0x28b09(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553>
+ DB 196,226,125,24,5,201,143,2,0 ; vbroadcastss 0x28fc9(%rip),%ymm0 # 2c1a0 <_sk_overlay_sse2_8bit+0x553>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,0,139,2,0 ; vbroadcastss 0x28b00(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557>
+ DB 196,98,125,24,5,192,143,2,0 ; vbroadcastss 0x28fc0(%rip),%ymm8 # 2c1a4 <_sk_overlay_sse2_8bit+0x557>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -2916,12 +2944,12 @@ _sk_load_a8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 31bb <_sk_load_a8_hsw+0x4e>
+ DB 117,53 ; jne 323b <_sk_load_a8_hsw+0x4e>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,124,147,2,0 ; vpand 0x2937c(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,249,219,5,60,152,2,0 ; vpand 0x2983c(%rip),%xmm0,%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,74,138,2,0 ; vbroadcastss 0x28a4a(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,10,143,2,0 ; vbroadcastss 0x28f0a(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -2934,15 +2962,15 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 318c <_sk_load_a8_hsw+0x1f>
+ DB 119,189 ; ja 320c <_sk_load_a8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3254 <_sk_load_a8_hsw+0xe7>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 32d4 <_sk_load_a8_hsw+0xe7>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,158 ; jmp 318c <_sk_load_a8_hsw+0x1f>
+ DB 235,158 ; jmp 320c <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -2950,7 +2978,7 @@ _sk_load_a8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,118,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 320c <_sk_load_a8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -2961,7 +2989,7 @@ _sk_load_a8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,59,255,255,255 ; jmpq 318c <_sk_load_a8_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 320c <_sk_load_a8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -2993,12 +3021,12 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,53 ; jne 32be <_sk_load_a8_dst_hsw+0x4e>
+ DB 117,53 ; jne 333e <_sk_load_a8_dst_hsw+0x4e>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,121,146,2,0 ; vpand 0x29279(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,217,219,37,57,151,2,0 ; vpand 0x29739(%rip),%xmm4,%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,71,137,2,0 ; vbroadcastss 0x28947(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,7,142,2,0 ; vbroadcastss 0x28e07(%rip),%ymm5 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -3011,15 +3039,15 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,189 ; ja 328f <_sk_load_a8_dst_hsw+0x1f>
+ DB 119,189 ; ja 330f <_sk_load_a8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 3354 <_sk_load_a8_dst_hsw+0xe4>
+ DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # 33d4 <_sk_load_a8_dst_hsw+0xe4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,158 ; jmp 328f <_sk_load_a8_dst_hsw+0x1f>
+ DB 235,158 ; jmp 330f <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3027,7 +3055,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,118,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,118,255,255,255 ; jmpq 330f <_sk_load_a8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3038,7 +3066,7 @@ _sk_load_a8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,59,255,255,255 ; jmpq 328f <_sk_load_a8_dst_hsw+0x1f>
+ DB 233,59,255,255,255 ; jmpq 330f <_sk_load_a8_dst_hsw+0x1f>
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3097,7 +3125,7 @@ _sk_gather_a8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,202,135,2,0 ; vbroadcastss 0x287ca(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,138,140,2,0 ; vbroadcastss 0x28c8a(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -3114,14 +3142,14 @@ _sk_store_a8_hsw LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,81,135,2,0 ; vbroadcastss 0x28751(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,17,140,2,0 ; vbroadcastss 0x28c11(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3481 <_sk_store_a8_hsw+0x47>
+ DB 117,11 ; jne 3501 <_sk_store_a8_hsw+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3130,25 +3158,25 @@ _sk_store_a8_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 347c <_sk_store_a8_hsw+0x42>
+ DB 119,235 ; ja 34fc <_sk_store_a8_hsw+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 34f8 <_sk_store_a8_hsw+0xbe>
+ DB 76,141,29,87,0,0,0 ; lea 0x57(%rip),%r11 # 3578 <_sk_store_a8_hsw+0xbe>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp 347c <_sk_store_a8_hsw+0x42>
+ DB 235,201 ; jmp 34fc <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,92,144,2,0 ; vpshufb 0x2905c(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
+ DB 196,98,57,0,5,28,149,2,0 ; vpshufb 0x2951c(%rip),%xmm8,%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xe13>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp 347c <_sk_store_a8_hsw+0x42>
+ DB 235,175 ; jmp 34fc <_sk_store_a8_hsw+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,66,144,2,0 ; vpshufb 0x29042(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
+ DB 196,98,57,0,5,2,149,2,0 ; vpshufb 0x29502(%rip),%xmm8,%xmm8 # 2ca70 <_sk_overlay_sse2_8bit+0xe23>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp 347c <_sk_store_a8_hsw+0x42>
+ DB 235,134 ; jmp 34fc <_sk_store_a8_hsw+0x42>
DB 102,144 ; xchg %ax,%ax
DB 178,255 ; mov $0xff,%dl
DB 255 ; (bad)
@@ -3180,15 +3208,15 @@ _sk_load_g8_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 3567 <_sk_load_g8_hsw+0x53>
+ DB 117,58 ; jne 35e7 <_sk_load_g8_hsw+0x53>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,213,143,2,0 ; vpand 0x28fd5(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,249,219,5,149,148,2,0 ; vpand 0x29495(%rip),%xmm0,%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,163,134,2,0 ; vbroadcastss 0x286a3(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,99,139,2,0 ; vbroadcastss 0x28b63(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,32,134,2,0 ; vbroadcastss 0x28620(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,224,138,2,0 ; vbroadcastss 0x28ae0(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -3198,15 +3226,15 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 3533 <_sk_load_g8_hsw+0x1f>
+ DB 119,184 ; ja 35b3 <_sk_load_g8_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3600 <_sk_load_g8_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3680 <_sk_load_g8_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 3533 <_sk_load_g8_hsw+0x1f>
+ DB 235,153 ; jmp 35b3 <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -3214,7 +3242,7 @@ _sk_load_g8_hsw LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,113,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 35b3 <_sk_load_g8_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -3225,7 +3253,7 @@ _sk_load_g8_hsw LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,54,255,255,255 ; jmpq 3533 <_sk_load_g8_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 35b3 <_sk_load_g8_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3257,15 +3285,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,58 ; jne 366f <_sk_load_g8_dst_hsw+0x53>
+ DB 117,58 ; jne 36ef <_sk_load_g8_dst_hsw+0x53>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,205,142,2,0 ; vpand 0x28ecd(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,217,219,37,141,147,2,0 ; vpand 0x2938d(%rip),%xmm4,%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,226,125,51,228 ; vpmovzxwd %xmm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,155,133,2,0 ; vbroadcastss 0x2859b(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,91,138,2,0 ; vbroadcastss 0x28a5b(%rip),%ymm5 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,24,133,2,0 ; vbroadcastss 0x28518(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,216,137,2,0 ; vbroadcastss 0x289d8(%rip),%ymm7 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -3275,15 +3303,15 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,184 ; ja 363b <_sk_load_g8_dst_hsw+0x1f>
+ DB 119,184 ; ja 36bb <_sk_load_g8_dst_hsw+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3708 <_sk_load_g8_dst_hsw+0xec>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # 3788 <_sk_load_g8_dst_hsw+0xec>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,153 ; jmp 363b <_sk_load_g8_dst_hsw+0x1f>
+ DB 235,153 ; jmp 36bb <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -3291,7 +3319,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,113,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,113,255,255,255 ; jmpq 36bb <_sk_load_g8_dst_hsw+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -3302,7 +3330,7 @@ _sk_load_g8_dst_hsw LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,54,255,255,255 ; jmpq 363b <_sk_load_g8_dst_hsw+0x1f>
+ DB 233,54,255,255,255 ; jmpq 36bb <_sk_load_g8_dst_hsw+0x1f>
DB 15,31,0 ; nopl (%rax)
DB 143 ; (bad)
DB 255 ; (bad)
@@ -3362,10 +3390,10 @@ _sk_gather_g8_hsw LABEL PROC
DB 196,227,121,32,192,7 ; vpinsrb $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,22,132,2,0 ; vbroadcastss 0x28416(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,214,136,2,0 ; vbroadcastss 0x288d6(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,147,131,2,0 ; vbroadcastss 0x28393(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,83,136,2,0 ; vbroadcastss 0x28853(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -3381,26 +3409,26 @@ _sk_load_565_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 3882 <_sk_load_565_hsw+0x8f>
+ DB 117,115 ; jne 3902 <_sk_load_565_hsw+0x8f>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,209,131,2,0 ; vpbroadcastd 0x283d1(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,5,145,136,2,0 ; vpbroadcastd 0x28891(%rip),%ymm0 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,196,131,2,0 ; vbroadcastss 0x283c4(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,132,136,2,0 ; vbroadcastss 0x28884(%rip),%ymm1 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,187,131,2,0 ; vpbroadcastd 0x283bb(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,13,123,136,2,0 ; vpbroadcastd 0x2887b(%rip),%ymm1 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,174,131,2,0 ; vbroadcastss 0x283ae(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,110,136,2,0 ; vbroadcastss 0x2886e(%rip),%ymm3 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,165,131,2,0 ; vpbroadcastd 0x283a5(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,29,101,136,2,0 ; vpbroadcastd 0x28865(%rip),%ymm3 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,152,131,2,0 ; vbroadcastss 0x28398(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,88,136,2,0 ; vbroadcastss 0x28858(%rip),%ymm3 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,253,130,2,0 ; vbroadcastss 0x282fd(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,189,135,2,0 ; vbroadcastss 0x287bd(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3408,27 +3436,27 @@ _sk_load_565_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 3815 <_sk_load_565_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 3895 <_sk_load_565_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3908 <_sk_load_565_hsw+0x115>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # 3988 <_sk_load_565_hsw+0x115>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,89,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 3895 <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,60,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 3895 <_sk_load_565_hsw+0x22>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,15,255,255,255 ; jmpq 3815 <_sk_load_565_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 3895 <_sk_load_565_hsw+0x22>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3460,26 +3488,26 @@ _sk_load_565_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,115 ; jne 39b3 <_sk_load_565_dst_hsw+0x8f>
+ DB 117,115 ; jne 3a33 <_sk_load_565_dst_hsw+0x8f>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,244 ; vpmovzxwd %xmm4,%ymm6
- DB 196,226,125,88,37,160,130,2,0 ; vpbroadcastd 0x282a0(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,37,96,135,2,0 ; vpbroadcastd 0x28760(%rip),%ymm4 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,205,219,228 ; vpand %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,147,130,2,0 ; vbroadcastss 0x28293(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,45,83,135,2,0 ; vbroadcastss 0x28753(%rip),%ymm5 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,138,130,2,0 ; vpbroadcastd 0x2828a(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,45,74,135,2,0 ; vpbroadcastd 0x2874a(%rip),%ymm5 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 197,205,219,237 ; vpand %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,125,130,2,0 ; vbroadcastss 0x2827d(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,61,61,135,2,0 ; vbroadcastss 0x2873d(%rip),%ymm7 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,88,61,116,130,2,0 ; vpbroadcastd 0x28274(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,61,52,135,2,0 ; vpbroadcastd 0x28734(%rip),%ymm7 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,205,219,247 ; vpand %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,103,130,2,0 ; vbroadcastss 0x28267(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,61,39,135,2,0 ; vbroadcastss 0x28727(%rip),%ymm7 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,204,129,2,0 ; vbroadcastss 0x281cc(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,140,134,2,0 ; vbroadcastss 0x2868c(%rip),%ymm7 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -3487,27 +3515,27 @@ _sk_load_565_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,123,255,255,255 ; ja 3946 <_sk_load_565_dst_hsw+0x22>
+ DB 15,135,123,255,255,255 ; ja 39c6 <_sk_load_565_dst_hsw+0x22>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3a38 <_sk_load_565_dst_hsw+0x114>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3ab8 <_sk_load_565_dst_hsw+0x114>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,89,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
+ DB 233,89,255,255,255 ; jmpq 39c6 <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,60,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
+ DB 233,60,255,255,255 ; jmpq 39c6 <_sk_load_565_dst_hsw+0x22>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,15,255,255,255 ; jmpq 3946 <_sk_load_565_dst_hsw+0x22>
+ DB 233,15,255,255,255 ; jmpq 39c6 <_sk_load_565_dst_hsw+0x22>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3568,23 +3596,23 @@ _sk_gather_565_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,208 ; vpmovzxwd %xmm0,%ymm2
- DB 196,226,125,88,5,239,128,2,0 ; vpbroadcastd 0x280ef(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,88,5,175,133,2,0 ; vpbroadcastd 0x285af(%rip),%ymm0 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,237,219,192 ; vpand %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,226,128,2,0 ; vbroadcastss 0x280e2(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,162,133,2,0 ; vbroadcastss 0x285a2(%rip),%ymm1 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,217,128,2,0 ; vpbroadcastd 0x280d9(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,88,13,153,133,2,0 ; vpbroadcastd 0x28599(%rip),%ymm1 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 197,237,219,201 ; vpand %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,204,128,2,0 ; vbroadcastss 0x280cc(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,140,133,2,0 ; vbroadcastss 0x2858c(%rip),%ymm3 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,88,29,195,128,2,0 ; vpbroadcastd 0x280c3(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,88,29,131,133,2,0 ; vpbroadcastd 0x28583(%rip),%ymm3 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,237,219,211 ; vpand %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,182,128,2,0 ; vbroadcastss 0x280b6(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,118,133,2,0 ; vbroadcastss 0x28576(%rip),%ymm3 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,27,128,2,0 ; vbroadcastss 0x2801b(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,219,132,2,0 ; vbroadcastss 0x284db(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_hsw
@@ -3597,11 +3625,11 @@ _sk_store_565_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,229,128,2,0 ; vbroadcastss 0x280e5(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b>
+ DB 196,98,125,24,5,165,133,2,0 ; vbroadcastss 0x285a5(%rip),%ymm8 # 2c1a8 <_sk_overlay_sse2_8bit+0x55b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,11 ; vpslld $0xb,%ymm9,%ymm9
- DB 196,98,125,24,21,208,128,2,0 ; vbroadcastss 0x280d0(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f>
+ DB 196,98,125,24,21,144,133,2,0 ; vbroadcastss 0x28590(%rip),%ymm10 # 2c1ac <_sk_overlay_sse2_8bit+0x55f>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,45,114,242,5 ; vpslld $0x5,%ymm10,%ymm10
@@ -3612,7 +3640,7 @@ _sk_store_565_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 3bdb <_sk_store_565_hsw+0x78>
+ DB 117,11 ; jne 3c5b <_sk_store_565_hsw+0x78>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3621,22 +3649,22 @@ _sk_store_565_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 3bd6 <_sk_store_565_hsw+0x73>
+ DB 119,235 ; ja 3c56 <_sk_store_565_hsw+0x73>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3c38 <_sk_store_565_hsw+0xd5>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 3cb8 <_sk_store_565_hsw+0xd5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
+ DB 235,206 ; jmp 3c56 <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
+ DB 235,190 ; jmp 3c56 <_sk_store_565_hsw+0x73>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 3bd6 <_sk_store_565_hsw+0x73>
+ DB 235,158 ; jmp 3c56 <_sk_store_565_hsw+0x73>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3654,7 +3682,7 @@ _sk_store_565_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe1003c50 <_sk_overlay_sse2_8bit+0xffffffffe0fd8543>
+ DB 232,255,255,255,224 ; callq ffffffffe1003cd0 <_sk_overlay_sse2_8bit+0xffffffffe0fd8083>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3670,28 +3698,28 @@ _sk_load_4444_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3cff <_sk_load_4444_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3d7f <_sk_load_4444_hsw+0xab>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,232,127,2,0 ; vpbroadcastd 0x27fe8(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,5,168,132,2,0 ; vpbroadcastd 0x284a8(%rip),%ymm0 # 2c1b0 <_sk_overlay_sse2_8bit+0x563>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,219,127,2,0 ; vbroadcastss 0x27fdb(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,155,132,2,0 ; vbroadcastss 0x2849b(%rip),%ymm1 # 2c1b4 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,210,127,2,0 ; vpbroadcastd 0x27fd2(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,13,146,132,2,0 ; vpbroadcastd 0x28492(%rip),%ymm1 # 2c1b8 <_sk_overlay_sse2_8bit+0x56b>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,197,127,2,0 ; vbroadcastss 0x27fc5(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,133,132,2,0 ; vbroadcastss 0x28485(%rip),%ymm2 # 2c1bc <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,188,127,2,0 ; vpbroadcastd 0x27fbc(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,21,124,132,2,0 ; vpbroadcastd 0x2847c(%rip),%ymm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x573>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,175,127,2,0 ; vbroadcastss 0x27faf(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,111,132,2,0 ; vbroadcastss 0x2846f(%rip),%ymm8 # 2c1c4 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,165,127,2,0 ; vpbroadcastd 0x27fa5(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,101,132,2,0 ; vpbroadcastd 0x28465(%rip),%ymm8 # 2c1c8 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,151,127,2,0 ; vbroadcastss 0x27f97(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,87,132,2,0 ; vbroadcastss 0x28457(%rip),%ymm8 # 2c1cc <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3701,27 +3729,27 @@ _sk_load_4444_hsw LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 3c7a <_sk_load_4444_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3cfa <_sk_load_4444_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3d84 <_sk_load_4444_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3e04 <_sk_load_4444_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,65,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3cfa <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,36,255,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3cfa <_sk_load_4444_hsw+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,247,254,255,255 ; jmpq 3c7a <_sk_load_4444_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3cfa <_sk_load_4444_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3754,28 +3782,28 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,139,0,0,0 ; jne 3e4b <_sk_load_4444_dst_hsw+0xab>
+ DB 15,133,139,0,0,0 ; jne 3ecb <_sk_load_4444_dst_hsw+0xab>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 196,226,125,51,252 ; vpmovzxwd %xmm4,%ymm7
- DB 196,226,125,88,37,156,126,2,0 ; vpbroadcastd 0x27e9c(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,37,92,131,2,0 ; vpbroadcastd 0x2835c(%rip),%ymm4 # 2c1b0 <_sk_overlay_sse2_8bit+0x563>
DB 197,197,219,228 ; vpand %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,143,126,2,0 ; vbroadcastss 0x27e8f(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,45,79,131,2,0 ; vbroadcastss 0x2834f(%rip),%ymm5 # 2c1b4 <_sk_overlay_sse2_8bit+0x567>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,88,45,134,126,2,0 ; vpbroadcastd 0x27e86(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,45,70,131,2,0 ; vpbroadcastd 0x28346(%rip),%ymm5 # 2c1b8 <_sk_overlay_sse2_8bit+0x56b>
DB 197,197,219,237 ; vpand %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,121,126,2,0 ; vbroadcastss 0x27e79(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,53,57,131,2,0 ; vbroadcastss 0x28339(%rip),%ymm6 # 2c1bc <_sk_overlay_sse2_8bit+0x56f>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,88,53,112,126,2,0 ; vpbroadcastd 0x27e70(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,53,48,131,2,0 ; vpbroadcastd 0x28330(%rip),%ymm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x573>
DB 197,197,219,246 ; vpand %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,99,126,2,0 ; vbroadcastss 0x27e63(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,35,131,2,0 ; vbroadcastss 0x28323(%rip),%ymm8 # 2c1c4 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,88,5,89,126,2,0 ; vpbroadcastd 0x27e59(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,25,131,2,0 ; vpbroadcastd 0x28319(%rip),%ymm8 # 2c1c8 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,69,219,248 ; vpand %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,75,126,2,0 ; vbroadcastss 0x27e4b(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,11,131,2,0 ; vbroadcastss 0x2830b(%rip),%ymm8 # 2c1cc <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3785,27 +3813,27 @@ _sk_load_4444_dst_hsw LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,99,255,255,255 ; ja 3dc6 <_sk_load_4444_dst_hsw+0x26>
+ DB 15,135,99,255,255,255 ; ja 3e46 <_sk_load_4444_dst_hsw+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3ed0 <_sk_load_4444_dst_hsw+0x130>
+ DB 76,141,29,98,0,0,0 ; lea 0x62(%rip),%r11 # 3f50 <_sk_load_4444_dst_hsw+0x130>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,65,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,65,255,255,255 ; jmpq 3e46 <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,36,255,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,36,255,255,255 ; jmpq 3e46 <_sk_load_4444_dst_hsw+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,247,254,255,255 ; jmpq 3dc6 <_sk_load_4444_dst_hsw+0x26>
+ DB 233,247,254,255,255 ; jmpq 3e46 <_sk_load_4444_dst_hsw+0x26>
DB 144 ; nop
DB 167 ; cmpsl %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -3866,25 +3894,25 @@ _sk_gather_4444_hsw LABEL PROC
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 197,249,196,192,7 ; vpinsrw $0x7,%eax,%xmm0,%xmm0
DB 196,226,125,51,216 ; vpmovzxwd %xmm0,%ymm3
- DB 196,226,125,88,5,211,124,2,0 ; vpbroadcastd 0x27cd3(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,88,5,147,129,2,0 ; vpbroadcastd 0x28193(%rip),%ymm0 # 2c1b0 <_sk_overlay_sse2_8bit+0x563>
DB 197,229,219,192 ; vpand %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,198,124,2,0 ; vbroadcastss 0x27cc6(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,134,129,2,0 ; vbroadcastss 0x28186(%rip),%ymm1 # 2c1b4 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,88,13,189,124,2,0 ; vpbroadcastd 0x27cbd(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,88,13,125,129,2,0 ; vpbroadcastd 0x2817d(%rip),%ymm1 # 2c1b8 <_sk_overlay_sse2_8bit+0x56b>
DB 197,229,219,201 ; vpand %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,176,124,2,0 ; vbroadcastss 0x27cb0(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,112,129,2,0 ; vbroadcastss 0x28170(%rip),%ymm2 # 2c1bc <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,88,21,167,124,2,0 ; vpbroadcastd 0x27ca7(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,88,21,103,129,2,0 ; vpbroadcastd 0x28167(%rip),%ymm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x573>
DB 197,229,219,210 ; vpand %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,154,124,2,0 ; vbroadcastss 0x27c9a(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,90,129,2,0 ; vbroadcastss 0x2815a(%rip),%ymm8 # 2c1c4 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,88,5,144,124,2,0 ; vpbroadcastd 0x27c90(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,88,5,80,129,2,0 ; vpbroadcastd 0x28150(%rip),%ymm8 # 2c1c8 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,101,219,216 ; vpand %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,130,124,2,0 ; vbroadcastss 0x27c82(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,66,129,2,0 ; vbroadcastss 0x28142(%rip),%ymm8 # 2c1cc <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -3899,7 +3927,7 @@ _sk_store_4444_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,93,124,2,0 ; vbroadcastss 0x27c5d(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583>
+ DB 196,98,125,24,5,29,129,2,0 ; vbroadcastss 0x2811d(%rip),%ymm8 # 2c1d0 <_sk_overlay_sse2_8bit+0x583>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,53,114,241,12 ; vpslld $0xc,%ymm9,%ymm9
@@ -3917,7 +3945,7 @@ _sk_store_4444_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 4097 <_sk_store_4444_hsw+0x84>
+ DB 117,11 ; jne 4117 <_sk_store_4444_hsw+0x84>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -3926,22 +3954,22 @@ _sk_store_4444_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 4092 <_sk_store_4444_hsw+0x7f>
+ DB 119,235 ; ja 4112 <_sk_store_4444_hsw+0x7f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 40f4 <_sk_store_4444_hsw+0xe1>
+ DB 76,141,29,66,0,0,0 ; lea 0x42(%rip),%r11 # 4174 <_sk_store_4444_hsw+0xe1>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
+ DB 235,206 ; jmp 4112 <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
+ DB 235,190 ; jmp 4112 <_sk_store_4444_hsw+0x7f>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp 4092 <_sk_store_4444_hsw+0x7f>
+ DB 235,158 ; jmp 4112 <_sk_store_4444_hsw+0x7f>
DB 199 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
@@ -3959,7 +3987,7 @@ _sk_store_4444_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,224 ; callq ffffffffe100410c <_sk_overlay_sse2_8bit+0xffffffffe0fd89ff>
+ DB 232,255,255,255,224 ; callq ffffffffe100418c <_sk_overlay_sse2_8bit+0xffffffffe0fd853f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -3975,16 +4003,16 @@ _sk_load_8888_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 4184 <_sk_load_8888_hsw+0x74>
+ DB 117,87 ; jne 4204 <_sk_load_8888_hsw+0x74>
DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3
- DB 197,229,219,5,165,124,2,0 ; vpand 0x27ca5(%rip),%ymm3,%ymm0 # 2bde0 <_sk_overlay_sse2_8bit+0x6d3>
+ DB 197,229,219,5,101,129,2,0 ; vpand 0x28165(%rip),%ymm3,%ymm0 # 2c320 <_sk_overlay_sse2_8bit+0x6d3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,168,122,2,0 ; vbroadcastss 0x27aa8(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,104,127,2,0 ; vbroadcastss 0x27f68(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,170,124,2,0 ; vpshufb 0x27caa(%rip),%ymm3,%ymm1 # 2be00 <_sk_overlay_sse2_8bit+0x6f3>
+ DB 196,226,101,0,13,106,129,2,0 ; vpshufb 0x2816a(%rip),%ymm3,%ymm1 # 2c340 <_sk_overlay_sse2_8bit+0x6f3>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,184,124,2,0 ; vpshufb 0x27cb8(%rip),%ymm3,%ymm2 # 2be20 <_sk_overlay_sse2_8bit+0x713>
+ DB 196,226,101,0,21,120,129,2,0 ; vpshufb 0x28178(%rip),%ymm3,%ymm2 # 2c360 <_sk_overlay_sse2_8bit+0x713>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -3998,21 +4026,21 @@ _sk_load_8888_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 4133 <_sk_load_8888_hsw+0x23>
+ DB 119,155 ; ja 41b3 <_sk_load_8888_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4230 <_sk_load_8888_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 42b0 <_sk_load_8888_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3
- DB 233,124,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 41b3 <_sk_load_8888_hsw+0x23>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,85,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 41b3 <_sk_load_8888_hsw+0x23>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -4025,9 +4053,9 @@ _sk_load_8888_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,6,255,255,255 ; jmpq 4133 <_sk_load_8888_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 41b3 <_sk_load_8888_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 4231 <_sk_load_8888_hsw+0x121>
+ DB 124,255 ; jl 42b1 <_sk_load_8888_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4059,16 +4087,16 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 42c0 <_sk_load_8888_dst_hsw+0x74>
+ DB 117,87 ; jne 4340 <_sk_load_8888_dst_hsw+0x74>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,201,123,2,0 ; vpand 0x27bc9(%rip),%ymm7,%ymm4 # 2be40 <_sk_overlay_sse2_8bit+0x733>
+ DB 197,197,219,37,137,128,2,0 ; vpand 0x28089(%rip),%ymm7,%ymm4 # 2c380 <_sk_overlay_sse2_8bit+0x733>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,108,121,2,0 ; vbroadcastss 0x2796c(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,44,126,2,0 ; vbroadcastss 0x27e2c(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
- DB 196,226,69,0,45,206,123,2,0 ; vpshufb 0x27bce(%rip),%ymm7,%ymm5 # 2be60 <_sk_overlay_sse2_8bit+0x753>
+ DB 196,226,69,0,45,142,128,2,0 ; vpshufb 0x2808e(%rip),%ymm7,%ymm5 # 2c3a0 <_sk_overlay_sse2_8bit+0x753>
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
DB 196,193,84,89,232 ; vmulps %ymm8,%ymm5,%ymm5
- DB 196,226,69,0,53,220,123,2,0 ; vpshufb 0x27bdc(%rip),%ymm7,%ymm6 # 2be80 <_sk_overlay_sse2_8bit+0x773>
+ DB 196,226,69,0,53,156,128,2,0 ; vpshufb 0x2809c(%rip),%ymm7,%ymm6 # 2c3c0 <_sk_overlay_sse2_8bit+0x773>
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4082,21 +4110,21 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 426f <_sk_load_8888_dst_hsw+0x23>
+ DB 119,155 ; ja 42ef <_sk_load_8888_dst_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 436c <_sk_load_8888_dst_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 43ec <_sk_load_8888_dst_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,124,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 42ef <_sk_load_8888_dst_hsw+0x23>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,85,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 42ef <_sk_load_8888_dst_hsw+0x23>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4109,9 +4137,9 @@ _sk_load_8888_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,6,255,255,255 ; jmpq 426f <_sk_load_8888_dst_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 42ef <_sk_load_8888_dst_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 436d <_sk_load_8888_dst_hsw+0x121>
+ DB 124,255 ; jl 43ed <_sk_load_8888_dst_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4143,14 +4171,14 @@ _sk_gather_8888_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,234,122,2,0 ; vpand 0x27aea(%rip),%ymm3,%ymm0 # 2bea0 <_sk_overlay_sse2_8bit+0x793>
+ DB 197,229,219,5,170,127,2,0 ; vpand 0x27faa(%rip),%ymm3,%ymm0 # 2c3e0 <_sk_overlay_sse2_8bit+0x793>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,45,120,2,0 ; vbroadcastss 0x2782d(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,237,124,2,0 ; vbroadcastss 0x27ced(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,226,101,0,13,239,122,2,0 ; vpshufb 0x27aef(%rip),%ymm3,%ymm1 # 2bec0 <_sk_overlay_sse2_8bit+0x7b3>
+ DB 196,226,101,0,13,175,127,2,0 ; vpshufb 0x27faf(%rip),%ymm3,%ymm1 # 2c400 <_sk_overlay_sse2_8bit+0x7b3>
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,226,101,0,21,253,122,2,0 ; vpshufb 0x27afd(%rip),%ymm3,%ymm2 # 2bee0 <_sk_overlay_sse2_8bit+0x7d3>
+ DB 196,226,101,0,21,189,127,2,0 ; vpshufb 0x27fbd(%rip),%ymm3,%ymm2 # 2c420 <_sk_overlay_sse2_8bit+0x7d3>
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4169,7 +4197,7 @@ _sk_store_8888_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,137,119,2,0 ; vbroadcastss 0x27789(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,73,124,2,0 ; vbroadcastss 0x27c49(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4185,7 +4213,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 4478 <_sk_store_8888_hsw+0x7a>
+ DB 117,11 ; jne 44f8 <_sk_store_8888_hsw+0x7a>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -4194,17 +4222,17 @@ _sk_store_8888_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 4473 <_sk_store_8888_hsw+0x75>
+ DB 119,235 ; ja 44f3 <_sk_store_8888_hsw+0x75>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 44e8 <_sk_store_8888_hsw+0xea>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 4568 <_sk_store_8888_hsw+0xea>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp 4473 <_sk_store_8888_hsw+0x75>
+ DB 235,207 ; jmp 44f3 <_sk_store_8888_hsw+0x75>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp 4473 <_sk_store_8888_hsw+0x75>
+ DB 235,191 ; jmp 44f3 <_sk_store_8888_hsw+0x75>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4212,7 +4240,7 @@ _sk_store_8888_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp 4473 <_sk_store_8888_hsw+0x75>
+ DB 235,142 ; jmp 44f3 <_sk_store_8888_hsw+0x75>
DB 15,31,0 ; nopl (%rax)
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
@@ -4224,7 +4252,7 @@ _sk_store_8888_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,218 ; callq ffffffffdb0044fc <_sk_overlay_sse2_8bit+0xffffffffdafd8def>
+ DB 232,255,255,255,218 ; callq ffffffffdb00457c <_sk_overlay_sse2_8bit+0xffffffffdafd892f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,204 ; dec %esp
@@ -4243,16 +4271,16 @@ _sk_load_bgra_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 4578 <_sk_load_bgra_hsw+0x74>
+ DB 117,87 ; jne 45f8 <_sk_load_bgra_hsw+0x74>
DB 196,193,126,111,28,153 ; vmovdqu (%r9,%rbx,4),%ymm3
- DB 197,229,219,5,209,121,2,0 ; vpand 0x279d1(%rip),%ymm3,%ymm0 # 2bf00 <_sk_overlay_sse2_8bit+0x7f3>
+ DB 197,229,219,5,145,126,2,0 ; vpand 0x27e91(%rip),%ymm3,%ymm0 # 2c440 <_sk_overlay_sse2_8bit+0x7f3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,180,118,2,0 ; vbroadcastss 0x276b4(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,116,123,2,0 ; vbroadcastss 0x27b74(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,214,121,2,0 ; vpshufb 0x279d6(%rip),%ymm3,%ymm0 # 2bf20 <_sk_overlay_sse2_8bit+0x813>
+ DB 196,226,101,0,5,150,126,2,0 ; vpshufb 0x27e96(%rip),%ymm3,%ymm0 # 2c460 <_sk_overlay_sse2_8bit+0x813>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,228,121,2,0 ; vpshufb 0x279e4(%rip),%ymm3,%ymm0 # 2bf40 <_sk_overlay_sse2_8bit+0x833>
+ DB 196,226,101,0,5,164,126,2,0 ; vpshufb 0x27ea4(%rip),%ymm3,%ymm0 # 2c480 <_sk_overlay_sse2_8bit+0x833>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4266,21 +4294,21 @@ _sk_load_bgra_hsw LABEL PROC
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 4527 <_sk_load_bgra_hsw+0x23>
+ DB 119,155 ; ja 45a7 <_sk_load_bgra_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4624 <_sk_load_bgra_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 46a4 <_sk_load_bgra_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,28,153 ; vmovd (%r9,%rbx,4),%xmm3
- DB 233,124,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 45a7 <_sk_load_bgra_hsw+0x23>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
DB 196,227,117,2,216,4 ; vpblendd $0x4,%ymm0,%ymm1,%ymm3
DB 196,193,122,126,4,153 ; vmovq (%r9,%rbx,4),%xmm0
DB 196,227,101,2,216,3 ; vpblendd $0x3,%ymm0,%ymm3,%ymm3
- DB 233,85,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 45a7 <_sk_load_bgra_hsw+0x23>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -4293,9 +4321,9 @@ _sk_load_bgra_hsw LABEL PROC
DB 196,227,101,56,216,1 ; vinserti128 $0x1,%xmm0,%ymm3,%ymm3
DB 196,193,122,111,4,153 ; vmovdqu (%r9,%rbx,4),%xmm0
DB 196,227,125,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm0,%ymm3
- DB 233,6,255,255,255 ; jmpq 4527 <_sk_load_bgra_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 45a7 <_sk_load_bgra_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 4625 <_sk_load_bgra_hsw+0x121>
+ DB 124,255 ; jl 46a5 <_sk_load_bgra_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4327,16 +4355,16 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,87 ; jne 46b4 <_sk_load_bgra_dst_hsw+0x74>
+ DB 117,87 ; jne 4734 <_sk_load_bgra_dst_hsw+0x74>
DB 196,193,126,111,60,153 ; vmovdqu (%r9,%rbx,4),%ymm7
- DB 197,197,219,37,245,120,2,0 ; vpand 0x278f5(%rip),%ymm7,%ymm4 # 2bf60 <_sk_overlay_sse2_8bit+0x853>
+ DB 197,197,219,37,181,125,2,0 ; vpand 0x27db5(%rip),%ymm7,%ymm4 # 2c4a0 <_sk_overlay_sse2_8bit+0x853>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,120,117,2,0 ; vbroadcastss 0x27578(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,56,122,2,0 ; vbroadcastss 0x27a38(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,240 ; vmulps %ymm8,%ymm4,%ymm6
- DB 196,226,69,0,37,250,120,2,0 ; vpshufb 0x278fa(%rip),%ymm7,%ymm4 # 2bf80 <_sk_overlay_sse2_8bit+0x873>
+ DB 196,226,69,0,37,186,125,2,0 ; vpshufb 0x27dba(%rip),%ymm7,%ymm4 # 2c4c0 <_sk_overlay_sse2_8bit+0x873>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,232 ; vmulps %ymm8,%ymm4,%ymm5
- DB 196,226,69,0,37,8,121,2,0 ; vpshufb 0x27908(%rip),%ymm7,%ymm4 # 2bfa0 <_sk_overlay_sse2_8bit+0x893>
+ DB 196,226,69,0,37,200,125,2,0 ; vpshufb 0x27dc8(%rip),%ymm7,%ymm4 # 2c4e0 <_sk_overlay_sse2_8bit+0x893>
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 197,197,114,215,24 ; vpsrld $0x18,%ymm7,%ymm7
@@ -4350,21 +4378,21 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 197,197,239,255 ; vpxor %ymm7,%ymm7,%ymm7
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,155 ; ja 4663 <_sk_load_bgra_dst_hsw+0x23>
+ DB 119,155 ; ja 46e3 <_sk_load_bgra_dst_hsw+0x23>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 4760 <_sk_load_bgra_dst_hsw+0x120>
+ DB 76,141,29,141,0,0,0 ; lea 0x8d(%rip),%r11 # 47e0 <_sk_load_bgra_dst_hsw+0x120>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,60,153 ; vmovd (%r9,%rbx,4),%xmm7
- DB 233,124,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,124,255,255,255 ; jmpq 46e3 <_sk_load_bgra_dst_hsw+0x23>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
DB 196,227,85,2,252,4 ; vpblendd $0x4,%ymm4,%ymm5,%ymm7
DB 196,193,122,126,36,153 ; vmovq (%r9,%rbx,4),%xmm4
DB 196,227,69,2,252,3 ; vpblendd $0x3,%ymm4,%ymm7,%ymm7
- DB 233,85,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,85,255,255,255 ; jmpq 46e3 <_sk_load_bgra_dst_hsw+0x23>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -4377,9 +4405,9 @@ _sk_load_bgra_dst_hsw LABEL PROC
DB 196,227,69,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm7,%ymm7
DB 196,193,122,111,36,153 ; vmovdqu (%r9,%rbx,4),%xmm4
DB 196,227,93,2,255,240 ; vpblendd $0xf0,%ymm7,%ymm4,%ymm7
- DB 233,6,255,255,255 ; jmpq 4663 <_sk_load_bgra_dst_hsw+0x23>
+ DB 233,6,255,255,255 ; jmpq 46e3 <_sk_load_bgra_dst_hsw+0x23>
DB 15,31,0 ; nopl (%rax)
- DB 124,255 ; jl 4761 <_sk_load_bgra_dst_hsw+0x121>
+ DB 124,255 ; jl 47e1 <_sk_load_bgra_dst_hsw+0x121>
DB 255 ; (bad)
DB 255,157,255,255,255,135 ; lcall *-0x78000001(%rbp)
DB 255 ; (bad)
@@ -4411,14 +4439,14 @@ _sk_gather_bgra_hsw LABEL PROC
DB 197,245,254,192 ; vpaddd %ymm0,%ymm1,%ymm0
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,194,117,144,28,129 ; vpgatherdd %ymm1,(%r9,%ymm0,4),%ymm3
- DB 197,229,219,5,22,120,2,0 ; vpand 0x27816(%rip),%ymm3,%ymm0 # 2bfc0 <_sk_overlay_sse2_8bit+0x8b3>
+ DB 197,229,219,5,214,124,2,0 ; vpand 0x27cd6(%rip),%ymm3,%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0x8b3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,57,116,2,0 ; vbroadcastss 0x27439(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,249,120,2,0 ; vbroadcastss 0x278f9(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,208 ; vmulps %ymm8,%ymm0,%ymm2
- DB 196,226,101,0,5,27,120,2,0 ; vpshufb 0x2781b(%rip),%ymm3,%ymm0 # 2bfe0 <_sk_overlay_sse2_8bit+0x8d3>
+ DB 196,226,101,0,5,219,124,2,0 ; vpshufb 0x27cdb(%rip),%ymm3,%ymm0 # 2c520 <_sk_overlay_sse2_8bit+0x8d3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,200 ; vmulps %ymm8,%ymm0,%ymm1
- DB 196,226,101,0,5,41,120,2,0 ; vpshufb 0x27829(%rip),%ymm3,%ymm0 # 2c000 <_sk_overlay_sse2_8bit+0x8f3>
+ DB 196,226,101,0,5,233,124,2,0 ; vpshufb 0x27ce9(%rip),%ymm3,%ymm0 # 2c540 <_sk_overlay_sse2_8bit+0x8f3>
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,229,114,211,24 ; vpsrld $0x18,%ymm3,%ymm3
@@ -4437,7 +4465,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,149,115,2,0 ; vbroadcastss 0x27395(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,85,120,2,0 ; vbroadcastss 0x27855(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -4453,7 +4481,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,65,45,235,192 ; vpor %ymm8,%ymm10,%ymm8
DB 196,65,53,235,192 ; vpor %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne 486c <_sk_store_bgra_hsw+0x7a>
+ DB 117,11 ; jne 48ec <_sk_store_bgra_hsw+0x7a>
DB 196,65,126,127,4,153 ; vmovdqu %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -4462,17 +4490,17 @@ _sk_store_bgra_hsw LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja 4867 <_sk_store_bgra_hsw+0x75>
+ DB 119,235 ; ja 48e7 <_sk_store_bgra_hsw+0x75>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 48dc <_sk_store_bgra_hsw+0xea>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # 495c <_sk_store_bgra_hsw+0xea>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
+ DB 235,207 ; jmp 48e7 <_sk_store_bgra_hsw+0x75>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
+ DB 235,191 ; jmp 48e7 <_sk_store_bgra_hsw+0x75>
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
@@ -4480,7 +4508,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 196,67,125,57,193,1 ; vextracti128 $0x1,%ymm8,%xmm9
DB 196,65,121,126,76,153,16 ; vmovd %xmm9,0x10(%r9,%rbx,4)
DB 196,65,122,127,4,153 ; vmovdqu %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp 4867 <_sk_store_bgra_hsw+0x75>
+ DB 235,142 ; jmp 48e7 <_sk_store_bgra_hsw+0x75>
DB 15,31,0 ; nopl (%rax)
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
@@ -4492,7 +4520,7 @@ _sk_store_bgra_hsw LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,218 ; callq ffffffffdb0048f0 <_sk_overlay_sse2_8bit+0xffffffffdafd91e3>
+ DB 232,255,255,255,218 ; callq ffffffffdb004970 <_sk_overlay_sse2_8bit+0xffffffffdafd8d23>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,204 ; dec %esp
@@ -4510,7 +4538,7 @@ _sk_load_f16_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 4979 <_sk_load_f16_hsw+0x81>
+ DB 117,101 ; jne 49f9 <_sk_load_f16_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,92,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm3
@@ -4536,29 +4564,29 @@ _sk_load_f16_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 49df <_sk_load_f16_hsw+0xe7>
+ DB 116,85 ; je 4a5f <_sk_load_f16_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 49df <_sk_load_f16_hsw+0xe7>
+ DB 114,72 ; jb 4a5f <_sk_load_f16_hsw+0xe7>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 49ec <_sk_load_f16_hsw+0xf4>
+ DB 116,72 ; je 4a6c <_sk_load_f16_hsw+0xf4>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 49ec <_sk_load_f16_hsw+0xf4>
+ DB 114,59 ; jb 4a6c <_sk_load_f16_hsw+0xf4>
DB 196,193,123,16,92,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 492f <_sk_load_f16_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 49af <_sk_load_f16_hsw+0x37>
DB 196,193,97,22,92,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 492f <_sk_load_f16_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 49af <_sk_load_f16_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 49af <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,67,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 49af <_sk_load_f16_hsw+0x37>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,58,255,255,255 ; jmpq 492f <_sk_load_f16_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 49af <_sk_load_f16_hsw+0x37>
PUBLIC _sk_load_f16_dst_hsw
_sk_load_f16_dst_hsw LABEL PROC
@@ -4570,7 +4598,7 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,101 ; jne 4a76 <_sk_load_f16_dst_hsw+0x81>
+ DB 117,101 ; jne 4af6 <_sk_load_f16_dst_hsw+0x81>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,124,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm7
@@ -4596,29 +4624,29 @@ _sk_load_f16_dst_hsw LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4adc <_sk_load_f16_dst_hsw+0xe7>
+ DB 116,85 ; je 4b5c <_sk_load_f16_dst_hsw+0xe7>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4adc <_sk_load_f16_dst_hsw+0xe7>
+ DB 114,72 ; jb 4b5c <_sk_load_f16_dst_hsw+0xe7>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4ae9 <_sk_load_f16_dst_hsw+0xf4>
+ DB 116,72 ; je 4b69 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4ae9 <_sk_load_f16_dst_hsw+0xf4>
+ DB 114,59 ; jb 4b69 <_sk_load_f16_dst_hsw+0xf4>
DB 196,193,123,16,124,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm7
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,109,255,255,255 ; je 4a2c <_sk_load_f16_dst_hsw+0x37>
+ DB 15,132,109,255,255,255 ; je 4aac <_sk_load_f16_dst_hsw+0x37>
DB 196,193,65,22,124,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm7,%xmm7
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,92,255,255,255 ; jb 4a2c <_sk_load_f16_dst_hsw+0x37>
+ DB 15,130,92,255,255,255 ; jb 4aac <_sk_load_f16_dst_hsw+0x37>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,80,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
+ DB 233,80,255,255,255 ; jmpq 4aac <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,67,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
+ DB 233,67,255,255,255 ; jmpq 4aac <_sk_load_f16_dst_hsw+0x37>
DB 197,193,87,255 ; vxorpd %xmm7,%xmm7,%xmm7
- DB 233,58,255,255,255 ; jmpq 4a2c <_sk_load_f16_dst_hsw+0x37>
+ DB 233,58,255,255,255 ; jmpq 4aac <_sk_load_f16_dst_hsw+0x37>
PUBLIC _sk_gather_f16_hsw
_sk_gather_f16_hsw LABEL PROC
@@ -4677,7 +4705,7 @@ _sk_store_f16_hsw LABEL PROC
DB 196,65,57,98,205 ; vpunpckldq %xmm13,%xmm8,%xmm9
DB 196,65,57,106,197 ; vpunpckhdq %xmm13,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 4bf7 <_sk_store_f16_hsw+0x7b>
+ DB 117,31 ; jne 4c77 <_sk_store_f16_hsw+0x7b>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -4686,22 +4714,22 @@ _sk_store_f16_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 116,240 ; je 4c73 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 114,227 ; jb 4c73 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,218 ; je 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 116,218 ; je 4c73 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 114,205 ; jb 4c73 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,196 ; je 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 116,196 ; je 4c73 <_sk_store_f16_hsw+0x77>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 114,183 ; jb 4c73 <_sk_store_f16_hsw+0x77>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 235,174 ; jmp 4bf3 <_sk_store_f16_hsw+0x77>
+ DB 235,174 ; jmp 4c73 <_sk_store_f16_hsw+0x77>
PUBLIC _sk_load_u16_be_hsw
_sk_load_u16_be_hsw LABEL PROC
@@ -4714,7 +4742,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 4d38 <_sk_load_u16_be_hsw+0xf3>
+ DB 15,133,204,0,0,0 ; jne 4db8 <_sk_load_u16_be_hsw+0xf3>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -4733,7 +4761,7 @@ _sk_load_u16_be_hsw LABEL PROC
DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,63,111,2,0 ; vbroadcastss 0x26f3f(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,21,255,115,2,0 ; vbroadcastss 0x273ff(%rip),%ymm10 # 2c14c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -4761,29 +4789,29 @@ _sk_load_u16_be_hsw LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 4d9e <_sk_load_u16_be_hsw+0x159>
+ DB 116,85 ; je 4e1e <_sk_load_u16_be_hsw+0x159>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 4d9e <_sk_load_u16_be_hsw+0x159>
+ DB 114,72 ; jb 4e1e <_sk_load_u16_be_hsw+0x159>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 4dab <_sk_load_u16_be_hsw+0x166>
+ DB 116,72 ; je 4e2b <_sk_load_u16_be_hsw+0x166>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 4dab <_sk_load_u16_be_hsw+0x166>
+ DB 114,59 ; jb 4e2b <_sk_load_u16_be_hsw+0x166>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,6,255,255,255 ; je 4c87 <_sk_load_u16_be_hsw+0x42>
+ DB 15,132,6,255,255,255 ; je 4d07 <_sk_load_u16_be_hsw+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,245,254,255,255 ; jb 4c87 <_sk_load_u16_be_hsw+0x42>
+ DB 15,130,245,254,255,255 ; jb 4d07 <_sk_load_u16_be_hsw+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,233,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
+ DB 233,233,254,255,255 ; jmpq 4d07 <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,220,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
+ DB 233,220,254,255,255 ; jmpq 4d07 <_sk_load_u16_be_hsw+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,211,254,255,255 ; jmpq 4c87 <_sk_load_u16_be_hsw+0x42>
+ DB 233,211,254,255,255 ; jmpq 4d07 <_sk_load_u16_be_hsw+0x42>
PUBLIC _sk_load_rgb_u16_be_hsw
_sk_load_rgb_u16_be_hsw LABEL PROC
@@ -4798,82 +4826,110 @@ _sk_load_rgb_u16_be_hsw LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,204,0,0,0 ; jne 4eab <_sk_load_rgb_u16_be_hsw+0xf7>
- DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
- DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
- DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
- DB 196,193,122,111,92,65,32 ; vmovdqu 0x20(%r9,%rax,2),%xmm3
- DB 197,225,115,219,4 ; vpsrldq $0x4,%xmm3,%xmm3
- DB 197,185,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm8
- DB 197,177,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm9
- DB 197,161,115,217,6 ; vpsrldq $0x6,%xmm1,%xmm11
+ DB 15,133,203,0,0,0 ; jne 4f2a <_sk_load_rgb_u16_be_hsw+0xf6>
+ DB 196,65,122,111,28,65 ; vmovdqu (%r9,%rax,2),%xmm11
+ DB 196,193,122,111,92,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm3
+ DB 196,193,122,111,84,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm2
+ DB 196,193,122,111,68,65,32 ; vmovdqu 0x20(%r9,%rax,2),%xmm0
+ DB 197,249,115,216,4 ; vpsrldq $0x4,%xmm0,%xmm0
+ DB 196,193,57,115,219,6 ; vpsrldq $0x6,%xmm11,%xmm8
DB 197,169,115,219,6 ; vpsrldq $0x6,%xmm3,%xmm10
- DB 197,249,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm0
- DB 196,193,57,97,209 ; vpunpcklwd %xmm9,%xmm8,%xmm2
- DB 197,241,97,203 ; vpunpcklwd %xmm3,%xmm1,%xmm1
- DB 196,193,33,97,218 ; vpunpcklwd %xmm10,%xmm11,%xmm3
- DB 197,121,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm8
- DB 197,121,105,202 ; vpunpckhwd %xmm2,%xmm0,%xmm9
- DB 197,241,97,211 ; vpunpcklwd %xmm3,%xmm1,%xmm2
- DB 197,241,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm3
- DB 197,185,108,194 ; vpunpcklqdq %xmm2,%xmm8,%xmm0
- DB 197,241,113,240,8 ; vpsllw $0x8,%xmm0,%xmm1
+ DB 197,153,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm12
+ DB 197,177,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm9
+ DB 197,161,97,219 ; vpunpcklwd %xmm3,%xmm11,%xmm3
+ DB 196,193,57,97,202 ; vpunpcklwd %xmm10,%xmm8,%xmm1
+ DB 197,233,97,192 ; vpunpcklwd %xmm0,%xmm2,%xmm0
+ DB 196,193,25,97,209 ; vpunpcklwd %xmm9,%xmm12,%xmm2
+ DB 197,97,97,193 ; vpunpcklwd %xmm1,%xmm3,%xmm8
+ DB 197,97,105,201 ; vpunpckhwd %xmm1,%xmm3,%xmm9
+ DB 197,249,97,202 ; vpunpcklwd %xmm2,%xmm0,%xmm1
+ DB 197,121,105,210 ; vpunpckhwd %xmm2,%xmm0,%xmm10
+ DB 197,185,108,193 ; vpunpcklqdq %xmm1,%xmm8,%xmm0
+ DB 197,225,113,240,8 ; vpsllw $0x8,%xmm0,%xmm3
DB 197,249,113,208,8 ; vpsrlw $0x8,%xmm0,%xmm0
- DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
+ DB 197,225,235,192 ; vpor %xmm0,%xmm3,%xmm0
DB 196,226,125,51,192 ; vpmovzxwd %xmm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,179,109,2,0 ; vbroadcastss 0x26db3(%rip),%ymm10 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
- DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
- DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
+ DB 196,226,125,24,29,114,114,2,0 ; vbroadcastss 0x27272(%rip),%ymm3 # 2c14c <_sk_overlay_sse2_8bit+0x4ff>
+ DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
+ DB 197,185,109,201 ; vpunpckhqdq %xmm1,%xmm8,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
DB 197,241,113,209,8 ; vpsrlw $0x8,%xmm1,%xmm1
DB 197,233,235,201 ; vpor %xmm1,%xmm2,%xmm1
DB 196,226,125,51,201 ; vpmovzxwd %xmm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
- DB 197,177,108,211 ; vpunpcklqdq %xmm3,%xmm9,%xmm2
- DB 197,225,113,242,8 ; vpsllw $0x8,%xmm2,%xmm3
+ DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
+ DB 196,193,49,108,210 ; vpunpcklqdq %xmm10,%xmm9,%xmm2
+ DB 197,185,113,242,8 ; vpsllw $0x8,%xmm2,%xmm8
DB 197,233,113,210,8 ; vpsrlw $0x8,%xmm2,%xmm2
- DB 197,225,235,210 ; vpor %xmm2,%xmm3,%xmm2
+ DB 197,185,235,210 ; vpor %xmm2,%xmm8,%xmm2
DB 196,226,125,51,210 ; vpmovzxwd %xmm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
+ DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,211,108,2,0 ; vbroadcastss 0x26cd3(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,148,113,2,0 ; vbroadcastss 0x27194(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
- DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
+ DB 196,65,121,196,92,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm11
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 4ec4 <_sk_load_rgb_u16_be_hsw+0x110>
- DB 233,79,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
- DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
+ DB 117,32 ; jne 4f63 <_sk_load_rgb_u16_be_hsw+0x12f>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 233,49,255,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 196,193,121,110,68,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm0
+ DB 196,65,121,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm0,%xmm8
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 4ef3 <_sk_load_rgb_u16_be_hsw+0x13f>
- DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
- DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
+ DB 114,49 ; jb 4fae <_sk_load_rgb_u16_be_hsw+0x17a>
+ DB 196,193,121,110,68,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm0
+ DB 196,193,121,196,92,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm0,%xmm3
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 4ef8 <_sk_load_rgb_u16_be_hsw+0x144>
- DB 233,32,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,27,255,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
- DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
+ DB 117,50 ; jne 4fc9 <_sk_load_rgb_u16_be_hsw+0x195>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 233,230,254,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 233,203,254,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 196,193,121,110,68,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm0
+ DB 196,65,121,196,84,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm0,%xmm10
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 4f27 <_sk_load_rgb_u16_be_hsw+0x173>
- DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
- DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
+ DB 114,40 ; jb 500b <_sk_load_rgb_u16_be_hsw+0x1d7>
+ DB 196,193,121,110,68,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm0
+ DB 196,193,121,196,84,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm0,%xmm2
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 4f2c <_sk_load_rgb_u16_be_hsw+0x178>
- DB 233,236,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,231,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
- DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
+ DB 117,32 ; jne 501d <_sk_load_rgb_u16_be_hsw+0x1e9>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 233,137,254,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 233,119,254,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 196,193,121,110,68,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm0
+ DB 196,65,121,196,100,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm0,%xmm12
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 4f55 <_sk_load_rgb_u16_be_hsw+0x1a1>
- DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
- DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,190,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
- DB 233,185,254,255,255 ; jmpq 4e13 <_sk_load_rgb_u16_be_hsw+0x5f>
+ DB 114,25 ; jb 5050 <_sk_load_rgb_u16_be_hsw+0x21c>
+ DB 196,193,121,110,68,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm0
+ DB 196,193,121,196,68,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm0,%xmm0
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
+ DB 233,68,254,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 233,59,254,255,255 ; jmpq 4e94 <_sk_load_rgb_u16_be_hsw+0x60>
PUBLIC _sk_store_u16_be_hsw
_sk_store_u16_be_hsw LABEL PROC
@@ -4885,7 +4941,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,19,109,2,0 ; vbroadcastss 0x26d13(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587>
+ DB 196,98,125,24,5,84,113,2,0 ; vbroadcastss 0x27154(%rip),%ymm8 # 2c1d4 <_sk_overlay_sse2_8bit+0x587>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -4923,7 +4979,7 @@ _sk_store_u16_be_hsw LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne 5065 <_sk_store_u16_be_hsw+0x10b>
+ DB 117,31 ; jne 5164 <_sk_store_u16_be_hsw+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -4932,28 +4988,34 @@ _sk_store_u16_be_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 116,240 ; je 5160 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 114,227 ; jb 5160 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 116,218 ; je 5160 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 114,205 ; jb 5160 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 116,196 ; je 5160 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 114,183 ; jb 5160 <_sk_store_u16_be_hsw+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp 5061 <_sk_store_u16_be_hsw+0x107>
+ DB 235,174 ; jmp 5160 <_sk_store_u16_be_hsw+0x107>
PUBLIC _sk_load_f32_hsw
_sk_load_f32_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 513f <_sk_load_f32_hsw+0x8c>
+ DB 15,135,101,1,0,0 ; ja 5327 <_sk_load_f32_hsw+0x175>
+ DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
+ DB 197,253,17,36,36 ; vmovupd %ymm4,(%rsp)
+ DB 197,253,17,108,36,32 ; vmovupd %ymm5,0x20(%rsp)
+ DB 197,253,17,116,36,64 ; vmovupd %ymm6,0x40(%rsp)
+ DB 197,253,17,124,36,96 ; vmovupd %ymm7,0x60(%rsp)
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -4961,53 +5023,100 @@ _sk_load_f32_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,133,0,0,0 ; lea 0x85(%rip),%r11 # 5168 <_sk_load_f32_hsw+0xb5>
+ DB 76,141,29,52,1,0,0 ; lea 0x134(%rip),%r11 # 5338 <_sk_load_f32_hsw+0x186>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
- DB 255,224 ; jmpq *%rax
- DB 196,3,125,24,68,145,112,1 ; vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- DB 196,131,125,24,92,145,96,1 ; vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm3
- DB 196,131,125,24,76,145,80,1 ; vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm1
- DB 196,131,125,24,84,145,64,1 ; vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm2
- DB 196,129,121,16,68,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm0
- DB 196,195,125,13,192,12 ; vblendpd $0xc,%ymm8,%ymm0,%ymm0
- DB 196,1,121,16,68,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm8
- DB 196,99,61,13,203,12 ; vblendpd $0xc,%ymm3,%ymm8,%ymm9
- DB 196,129,121,16,92,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm3
- DB 196,99,101,13,209,12 ; vblendpd $0xc,%ymm1,%ymm3,%ymm10
+ DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
+ DB 196,65,53,87,201 ; vxorpd %ymm9,%ymm9,%ymm9
+ DB 197,237,87,210 ; vxorpd %ymm2,%ymm2,%ymm2
+ DB 196,65,37,87,219 ; vxorpd %ymm11,%ymm11,%ymm11
+ DB 196,65,29,87,228 ; vxorpd %ymm12,%ymm12,%ymm12
+ DB 196,65,61,87,192 ; vxorpd %ymm8,%ymm8,%ymm8
+ DB 196,65,13,87,246 ; vxorpd %ymm14,%ymm14,%ymm14
+ DB 197,205,87,246 ; vxorpd %ymm6,%ymm6,%ymm6
+ DB 196,65,5,87,255 ; vxorpd %ymm15,%ymm15,%ymm15
+ DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
+ DB 196,65,21,87,237 ; vxorpd %ymm13,%ymm13,%ymm13
+ DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
+ DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
+ DB 255,224 ; jmpq *%rax
+ DB 196,129,121,16,68,145,112 ; vmovupd 0x70(%r9,%r10,4),%xmm0
+ DB 196,227,125,6,192,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ DB 196,129,121,16,76,145,96 ; vmovupd 0x60(%r9,%r10,4),%xmm1
+ DB 196,227,125,6,225,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm4
+ DB 196,129,121,16,76,145,80 ; vmovupd 0x50(%r9,%r10,4),%xmm1
+ DB 196,227,125,6,209,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm2
+ DB 197,125,40,204 ; vmovapd %ymm4,%ymm9
+ DB 196,129,121,16,76,145,64 ; vmovupd 0x40(%r9,%r10,4),%xmm1
+ DB 196,99,125,6,193,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm8
+ DB 196,65,125,40,217 ; vmovapd %ymm9,%ymm11
+ DB 197,125,40,226 ; vmovapd %ymm2,%ymm12
+ DB 196,129,121,16,76,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm1
+ DB 196,227,117,13,192,12 ; vblendpd $0xc,%ymm0,%ymm1,%ymm0
+ DB 196,65,125,40,243 ; vmovapd %ymm11,%ymm14
+ DB 197,125,41,230 ; vmovapd %ymm12,%ymm6
+ DB 196,65,125,40,248 ; vmovapd %ymm8,%ymm15
+ DB 196,129,121,16,76,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm1
+ DB 196,195,117,13,206,12 ; vblendpd $0xc,%ymm14,%ymm1,%ymm1
+ DB 197,125,40,238 ; vmovapd %ymm6,%ymm13
+ DB 197,125,41,253 ; vmovapd %ymm15,%ymm5
+ DB 196,129,121,16,84,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm2
+ DB 196,67,109,13,213,12 ; vblendpd $0xc,%ymm13,%ymm2,%ymm10
+ DB 197,253,40,217 ; vmovapd %ymm1,%ymm3
+ DB 197,253,40,253 ; vmovapd %ymm5,%ymm7
DB 196,129,121,16,12,145 ; vmovupd (%r9,%r10,4),%xmm1
- DB 196,227,117,13,202,12 ; vblendpd $0xc,%ymm2,%ymm1,%ymm1
+ DB 196,227,117,13,207,12 ; vblendpd $0xc,%ymm7,%ymm1,%ymm1
+ DB 197,252,16,124,36,96 ; vmovups 0x60(%rsp),%ymm7
+ DB 197,252,16,116,36,64 ; vmovups 0x40(%rsp),%ymm6
+ DB 197,252,16,108,36,32 ; vmovups 0x20(%rsp),%ymm5
+ DB 197,252,16,36,36 ; vmovups (%rsp),%ymm4
+ DB 72,129,196,152,0,0,0 ; add $0x98,%rsp
DB 196,193,116,20,210 ; vunpcklps %ymm10,%ymm1,%ymm2
- DB 196,193,116,21,218 ; vunpckhps %ymm10,%ymm1,%ymm3
- DB 197,180,20,200 ; vunpcklps %ymm0,%ymm9,%ymm1
- DB 197,52,21,192 ; vunpckhps %ymm0,%ymm9,%ymm8
+ DB 196,65,116,21,194 ; vunpckhps %ymm10,%ymm1,%ymm8
+ DB 197,228,20,200 ; vunpcklps %ymm0,%ymm3,%ymm1
+ DB 197,228,21,216 ; vunpckhps %ymm0,%ymm3,%ymm3
DB 197,237,20,193 ; vunpcklpd %ymm1,%ymm2,%ymm0
DB 197,237,21,201 ; vunpckhpd %ymm1,%ymm2,%ymm1
- DB 196,193,101,20,208 ; vunpcklpd %ymm8,%ymm3,%ymm2
- DB 196,193,101,21,216 ; vunpckhpd %ymm8,%ymm3,%ymm3
+ DB 197,189,20,211 ; vunpcklpd %ymm3,%ymm8,%ymm2
+ DB 197,189,21,219 ; vunpckhpd %ymm3,%ymm8,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
- DB 144 ; nop
- DB 132,255 ; test %bh,%bh
+ DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
+ DB 235,203 ; jmp 5301 <_sk_load_f32_hsw+0x14f>
+ DB 102,144 ; xchg %ax,%ax
+ DB 25,255 ; sbb %edi,%edi
+ DB 255 ; (bad)
+ DB 255,159,255,255,255,138 ; lcall *-0x75000001(%rdi)
DB 255 ; (bad)
- DB 255,203 ; dec %ebx
DB 255 ; (bad)
+ DB 255,117,255 ; pushq -0x1(%rbp)
DB 255 ; (bad)
+ DB 255,90,255 ; lcall *-0x1(%rdx)
DB 255 ; (bad)
- DB 190,255,255,255,177 ; mov $0xb1ffffff,%esi
+ DB 255,68,255,255 ; incl -0x1(%rdi,%rdi,8)
+ DB 255,51 ; pushq (%rbx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,164,255,255,255,156,255 ; jmpq *-0x630001(%rdi,%rdi,8)
+ DB 255,38 ; jmpq *(%rsi)
DB 255 ; (bad)
- DB 255,148,255,255,255,140,255 ; callq *-0x730001(%rdi,%rdi,8)
DB 255 ; (bad)
DB 255 ; .byte 0xff
PUBLIC _sk_load_f32_dst_hsw
_sk_load_f32_dst_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja 5214 <_sk_load_f32_dst_hsw+0x8c>
+ DB 15,135,101,1,0,0 ; ja 54cd <_sk_load_f32_dst_hsw+0x175>
+ DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
+ DB 197,253,17,4,36 ; vmovupd %ymm0,(%rsp)
+ DB 197,253,17,76,36,32 ; vmovupd %ymm1,0x20(%rsp)
+ DB 197,253,17,84,36,64 ; vmovupd %ymm2,0x40(%rsp)
+ DB 197,253,17,92,36,96 ; vmovupd %ymm3,0x60(%rsp)
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -5015,45 +5124,81 @@ _sk_load_f32_dst_hsw LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # 523c <_sk_load_f32_dst_hsw+0xb4>
+ DB 76,141,29,50,1,0,0 ; lea 0x132(%rip),%r11 # 54dc <_sk_load_f32_dst_hsw+0x184>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
- DB 255,224 ; jmpq *%rax
- DB 196,3,125,24,68,145,112,1 ; vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- DB 196,131,125,24,124,145,96,1 ; vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm7
- DB 196,131,125,24,108,145,80,1 ; vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm5
- DB 196,131,125,24,116,145,64,1 ; vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm6
- DB 196,129,121,16,100,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm4
- DB 196,195,93,13,224,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm4
- DB 196,1,121,16,68,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm8
- DB 196,99,61,13,207,12 ; vblendpd $0xc,%ymm7,%ymm8,%ymm9
- DB 196,129,121,16,124,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm7
- DB 196,99,69,13,213,12 ; vblendpd $0xc,%ymm5,%ymm7,%ymm10
- DB 196,129,121,16,44,145 ; vmovupd (%r9,%r10,4),%xmm5
- DB 196,227,85,13,238,12 ; vblendpd $0xc,%ymm6,%ymm5,%ymm5
+ DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
+ DB 196,65,53,87,201 ; vxorpd %ymm9,%ymm9,%ymm9
+ DB 197,205,87,246 ; vxorpd %ymm6,%ymm6,%ymm6
+ DB 196,65,37,87,219 ; vxorpd %ymm11,%ymm11,%ymm11
+ DB 196,65,29,87,228 ; vxorpd %ymm12,%ymm12,%ymm12
+ DB 196,65,61,87,192 ; vxorpd %ymm8,%ymm8,%ymm8
+ DB 196,65,13,87,246 ; vxorpd %ymm14,%ymm14,%ymm14
+ DB 197,237,87,210 ; vxorpd %ymm2,%ymm2,%ymm2
+ DB 196,65,5,87,255 ; vxorpd %ymm15,%ymm15,%ymm15
+ DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
+ DB 196,65,21,87,237 ; vxorpd %ymm13,%ymm13,%ymm13
+ DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
+ DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
+ DB 255,224 ; jmpq *%rax
+ DB 196,129,121,16,68,145,112 ; vmovupd 0x70(%r9,%r10,4),%xmm0
+ DB 196,227,125,6,224,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm4
+ DB 196,129,121,16,68,145,96 ; vmovupd 0x60(%r9,%r10,4),%xmm0
+ DB 196,227,125,6,192,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ DB 196,129,121,16,76,145,80 ; vmovupd 0x50(%r9,%r10,4),%xmm1
+ DB 196,227,125,6,241,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm6
+ DB 197,125,40,200 ; vmovapd %ymm0,%ymm9
+ DB 196,129,121,16,68,145,64 ; vmovupd 0x40(%r9,%r10,4),%xmm0
+ DB 196,99,125,6,192,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm8
+ DB 196,65,125,40,217 ; vmovapd %ymm9,%ymm11
+ DB 197,125,40,230 ; vmovapd %ymm6,%ymm12
+ DB 196,129,121,16,68,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm0
+ DB 196,227,125,13,228,12 ; vblendpd $0xc,%ymm4,%ymm0,%ymm4
+ DB 196,65,125,40,243 ; vmovapd %ymm11,%ymm14
+ DB 197,125,41,226 ; vmovapd %ymm12,%ymm2
+ DB 196,65,125,40,248 ; vmovapd %ymm8,%ymm15
+ DB 196,129,121,16,68,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm0
+ DB 196,195,125,13,238,12 ; vblendpd $0xc,%ymm14,%ymm0,%ymm5
+ DB 197,125,40,234 ; vmovapd %ymm2,%ymm13
+ DB 197,125,41,249 ; vmovapd %ymm15,%ymm1
+ DB 196,129,121,16,68,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm0
+ DB 196,67,125,13,213,12 ; vblendpd $0xc,%ymm13,%ymm0,%ymm10
+ DB 197,253,40,253 ; vmovapd %ymm5,%ymm7
+ DB 197,253,40,217 ; vmovapd %ymm1,%ymm3
+ DB 196,129,121,16,4,145 ; vmovupd (%r9,%r10,4),%xmm0
+ DB 196,227,125,13,235,12 ; vblendpd $0xc,%ymm3,%ymm0,%ymm5
+ DB 197,252,16,92,36,96 ; vmovups 0x60(%rsp),%ymm3
+ DB 197,252,16,84,36,64 ; vmovups 0x40(%rsp),%ymm2
+ DB 197,252,16,76,36,32 ; vmovups 0x20(%rsp),%ymm1
+ DB 197,252,16,4,36 ; vmovups (%rsp),%ymm0
+ DB 72,129,196,152,0,0,0 ; add $0x98,%rsp
DB 196,193,84,20,242 ; vunpcklps %ymm10,%ymm5,%ymm6
- DB 196,193,84,21,250 ; vunpckhps %ymm10,%ymm5,%ymm7
- DB 197,180,20,236 ; vunpcklps %ymm4,%ymm9,%ymm5
- DB 197,52,21,196 ; vunpckhps %ymm4,%ymm9,%ymm8
+ DB 196,65,84,21,194 ; vunpckhps %ymm10,%ymm5,%ymm8
+ DB 197,196,20,236 ; vunpcklps %ymm4,%ymm7,%ymm5
+ DB 197,196,21,252 ; vunpckhps %ymm4,%ymm7,%ymm7
DB 197,205,20,229 ; vunpcklpd %ymm5,%ymm6,%ymm4
DB 197,205,21,237 ; vunpckhpd %ymm5,%ymm6,%ymm5
- DB 196,193,69,20,240 ; vunpcklpd %ymm8,%ymm7,%ymm6
- DB 196,193,69,21,248 ; vunpckhpd %ymm8,%ymm7,%ymm7
+ DB 197,189,20,247 ; vunpcklpd %ymm7,%ymm8,%ymm6
+ DB 197,189,21,255 ; vunpckhpd %ymm7,%ymm8,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
- DB 133,255 ; test %edi,%edi
+ DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
+ DB 235,203 ; jmp 54a7 <_sk_load_f32_dst_hsw+0x14f>
+ DB 27,255 ; sbb %edi,%edi
DB 255 ; (bad)
- DB 255,204 ; dec %esp
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 191,255,255,255,178 ; mov $0xb2ffffff,%edi
+ DB 255,161,255,255,255,140 ; jmpq *-0x73000001(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,165,255,255,255,157 ; jmpq *-0x62000001(%rbp)
+ DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
+ DB 255,92,255,255 ; lcall *-0x1(%rdi,%rdi,8)
+ DB 255,70,255 ; incl -0x1(%rsi)
DB 255 ; (bad)
- DB 255,149,255,255,255,141 ; callq *-0x72000001(%rbp)
+ DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 290054f8 <_sk_overlay_sse2_8bit+0x28fd98ab>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -5077,7 +5222,7 @@ _sk_store_f32_hsw LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne 52db <_sk_store_f32_hsw+0x7f>
+ DB 117,55 ; jne 557b <_sk_store_f32_hsw+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -5090,22 +5235,22 @@ _sk_store_f32_hsw LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 116,240 ; je 5577 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 114,227 ; jb 5577 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 116,218 ; je 5577 <_sk_store_f32_hsw+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 114,205 ; jb 5577 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 116,195 ; je 5577 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 114,181 ; jb 5577 <_sk_store_f32_hsw+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp 52d7 <_sk_store_f32_hsw+0x7b>
+ DB 235,171 ; jmp 5577 <_sk_store_f32_hsw+0x7b>
PUBLIC _sk_clamp_x_hsw
_sk_clamp_x_hsw LABEL PROC
@@ -5172,7 +5317,7 @@ _sk_mirror_x_hsw LABEL PROC
DB 196,65,124,92,218 ; vsubps %ymm10,%ymm0,%ymm11
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,98,125,24,192 ; vbroadcastss %xmm0,%ymm8
- DB 197,178,89,5,111,103,2,0 ; vmulss 0x2676f(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,5,15,106,2,0 ; vmulss 0x26a0f(%rip),%xmm9,%xmm0 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
DB 196,227,125,8,192,1 ; vroundps $0x1,%ymm0,%ymm0
@@ -5197,7 +5342,7 @@ _sk_mirror_y_hsw LABEL PROC
DB 196,65,116,92,218 ; vsubps %ymm10,%ymm1,%ymm11
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,98,125,24,193 ; vbroadcastss %xmm1,%ymm8
- DB 197,178,89,13,11,103,2,0 ; vmulss 0x2670b(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,13,171,105,2,0 ; vmulss 0x269ab(%rip),%xmm9,%xmm1 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,226,125,24,201 ; vbroadcastss %xmm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
DB 196,227,125,8,201,1 ; vroundps $0x1,%ymm1,%ymm1
@@ -5217,7 +5362,7 @@ PUBLIC _sk_clamp_x_1_hsw
_sk_clamp_x_1_hsw LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,192,102,2,0 ; vbroadcastss 0x266c0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,96,105,2,0 ; vbroadcastss 0x26960(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -5231,9 +5376,9 @@ _sk_repeat_x_1_hsw LABEL PROC
PUBLIC _sk_mirror_x_1_hsw
_sk_mirror_x_1_hsw LABEL PROC
- DB 196,98,125,24,5,183,102,2,0 ; vbroadcastss 0x266b7(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,5,87,105,2,0 ; vbroadcastss 0x26957(%rip),%ymm8 # 2c0d4 <_sk_overlay_sse2_8bit+0x487>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,141,102,2,0 ; vbroadcastss 0x2668d(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,45,105,2,0 ; vbroadcastss 0x2692d(%rip),%ymm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -5247,11 +5392,11 @@ _sk_mirror_x_1_hsw LABEL PROC
PUBLIC _sk_luminance_to_alpha_hsw
_sk_luminance_to_alpha_hsw LABEL PROC
- DB 196,226,125,24,29,121,103,2,0 ; vbroadcastss 0x26779(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b>
- DB 196,98,125,24,5,116,103,2,0 ; vbroadcastss 0x26774(%rip),%ymm8 # 2bc9c <_sk_overlay_sse2_8bit+0x58f>
+ DB 196,226,125,24,29,25,106,2,0 ; vbroadcastss 0x26a19(%rip),%ymm3 # 2c1d8 <_sk_overlay_sse2_8bit+0x58b>
+ DB 196,98,125,24,5,20,106,2,0 ; vbroadcastss 0x26a14(%rip),%ymm8 # 2c1dc <_sk_overlay_sse2_8bit+0x58f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 196,226,125,184,203 ; vfmadd231ps %ymm3,%ymm0,%ymm1
- DB 196,226,125,24,29,101,103,2,0 ; vbroadcastss 0x26765(%rip),%ymm3 # 2bca0 <_sk_overlay_sse2_8bit+0x593>
+ DB 196,226,125,24,29,5,106,2,0 ; vbroadcastss 0x26a05(%rip),%ymm3 # 2c1e0 <_sk_overlay_sse2_8bit+0x593>
DB 196,226,109,168,217 ; vfmadd213ps %ymm1,%ymm2,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -5435,9 +5580,9 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 76,139,72,8 ; mov 0x8(%rax),%r9
DB 77,137,211 ; mov %r10,%r11
DB 73,255,203 ; dec %r11
- DB 120,7 ; js 5834 <_sk_evenly_spaced_gradient_hsw+0x19>
+ DB 120,7 ; js 5ad4 <_sk_evenly_spaced_gradient_hsw+0x19>
DB 196,193,242,42,203 ; vcvtsi2ss %r11,%xmm1,%xmm1
- DB 235,22 ; jmp 584a <_sk_evenly_spaced_gradient_hsw+0x2f>
+ DB 235,22 ; jmp 5aea <_sk_evenly_spaced_gradient_hsw+0x2f>
DB 76,137,219 ; mov %r11,%rbx
DB 72,209,235 ; shr %rbx
DB 65,131,227,1 ; and $0x1,%r11d
@@ -5448,7 +5593,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 197,244,89,200 ; vmulps %ymm0,%ymm1,%ymm1
DB 197,126,91,217 ; vcvttps2dq %ymm1,%ymm11
DB 73,131,250,8 ; cmp $0x8,%r10
- DB 119,70 ; ja 58a3 <_sk_evenly_spaced_gradient_hsw+0x88>
+ DB 119,70 ; ja 5b43 <_sk_evenly_spaced_gradient_hsw+0x88>
DB 196,66,37,22,1 ; vpermps (%r9),%ymm11,%ymm8
DB 72,139,88,40 ; mov 0x28(%rax),%rbx
DB 196,98,37,22,11 ; vpermps (%rbx),%ymm11,%ymm9
@@ -5464,7 +5609,7 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
DB 196,226,37,22,27 ; vpermps (%rbx),%ymm11,%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,98,37,22,40 ; vpermps (%rax),%ymm11,%ymm13
- DB 235,110 ; jmp 5911 <_sk_evenly_spaced_gradient_hsw+0xf6>
+ DB 235,110 ; jmp 5bb1 <_sk_evenly_spaced_gradient_hsw+0xf6>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,153 ; vgatherdps %ymm1,(%r9,%ymm11,4),%ymm8
@@ -5499,14 +5644,14 @@ _sk_evenly_spaced_gradient_hsw LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_hsw
_sk_gauss_a_to_rgba_hsw LABEL PROC
- DB 196,226,125,24,5,109,99,2,0 ; vbroadcastss 0x2636d(%rip),%ymm0 # 2bca4 <_sk_overlay_sse2_8bit+0x597>
- DB 196,226,125,24,13,104,99,2,0 ; vbroadcastss 0x26368(%rip),%ymm1 # 2bca8 <_sk_overlay_sse2_8bit+0x59b>
+ DB 196,226,125,24,5,13,102,2,0 ; vbroadcastss 0x2660d(%rip),%ymm0 # 2c1e4 <_sk_overlay_sse2_8bit+0x597>
+ DB 196,226,125,24,13,8,102,2,0 ; vbroadcastss 0x26608(%rip),%ymm1 # 2c1e8 <_sk_overlay_sse2_8bit+0x59b>
DB 196,226,101,168,200 ; vfmadd213ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,94,99,2,0 ; vbroadcastss 0x2635e(%rip),%ymm0 # 2bcac <_sk_overlay_sse2_8bit+0x59f>
+ DB 196,226,125,24,5,254,101,2,0 ; vbroadcastss 0x265fe(%rip),%ymm0 # 2c1ec <_sk_overlay_sse2_8bit+0x59f>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
- DB 196,226,125,24,13,84,99,2,0 ; vbroadcastss 0x26354(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3>
+ DB 196,226,125,24,13,244,101,2,0 ; vbroadcastss 0x265f4(%rip),%ymm1 # 2c1f0 <_sk_overlay_sse2_8bit+0x5a3>
DB 196,226,101,184,200 ; vfmadd231ps %ymm0,%ymm3,%ymm1
- DB 196,226,125,24,5,74,99,2,0 ; vbroadcastss 0x2634a(%rip),%ymm0 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7>
+ DB 196,226,125,24,5,234,101,2,0 ; vbroadcastss 0x265ea(%rip),%ymm0 # 2c1f4 <_sk_overlay_sse2_8bit+0x5a7>
DB 196,226,101,184,193 ; vfmadd231ps %ymm1,%ymm3,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -5519,11 +5664,11 @@ _sk_gradient_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 73,131,249,1 ; cmp $0x1,%r9
- DB 15,134,180,0,0,0 ; jbe 5a42 <_sk_gradient_hsw+0xc3>
+ DB 15,134,180,0,0,0 ; jbe 5ce2 <_sk_gradient_hsw+0xc3>
DB 76,139,80,72 ; mov 0x48(%rax),%r10
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 65,187,1,0,0,0 ; mov $0x1,%r11d
- DB 196,226,125,24,21,219,97,2,0 ; vbroadcastss 0x261db(%rip),%ymm2 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,226,125,24,21,123,100,2,0 ; vbroadcastss 0x2647b(%rip),%ymm2 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
DB 196,130,125,24,28,154 ; vbroadcastss (%r10,%r11,4),%ymm3
DB 197,228,194,216,2 ; vcmpleps %ymm0,%ymm3,%ymm3
@@ -5531,10 +5676,10 @@ _sk_gradient_hsw LABEL PROC
DB 196,65,101,254,201 ; vpaddd %ymm9,%ymm3,%ymm9
DB 73,255,195 ; inc %r11
DB 77,57,217 ; cmp %r11,%r9
- DB 117,226 ; jne 59aa <_sk_gradient_hsw+0x2b>
+ DB 117,226 ; jne 5c4a <_sk_gradient_hsw+0x2b>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 73,131,249,8 ; cmp $0x8,%r9
- DB 118,121 ; jbe 5a4b <_sk_gradient_hsw+0xcc>
+ DB 118,121 ; jbe 5ceb <_sk_gradient_hsw+0xcc>
DB 196,65,13,118,246 ; vpcmpeqd %ymm14,%ymm14,%ymm14
DB 197,245,118,201 ; vpcmpeqd %ymm1,%ymm1,%ymm1
DB 196,2,117,146,4,138 ; vgatherdps %ymm1,(%r10,%ymm9,4),%ymm8
@@ -5558,7 +5703,7 @@ _sk_gradient_hsw LABEL PROC
DB 196,130,21,146,28,137 ; vgatherdps %ymm13,(%r9,%ymm9,4),%ymm3
DB 72,139,64,64 ; mov 0x40(%rax),%rax
DB 196,34,13,146,44,136 ; vgatherdps %ymm14,(%rax,%ymm9,4),%ymm13
- DB 235,77 ; jmp 5a8f <_sk_gradient_hsw+0x110>
+ DB 235,77 ; jmp 5d2f <_sk_gradient_hsw+0x110>
DB 76,139,80,8 ; mov 0x8(%rax),%r10
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 196,66,53,22,2 ; vpermps (%r10),%ymm9,%ymm8
@@ -5614,24 +5759,24 @@ _sk_xy_to_unit_angle_hsw LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,142,97,2,0 ; vbroadcastss 0x2618e(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab>
- DB 196,98,125,24,53,137,97,2,0 ; vbroadcastss 0x26189(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af>
+ DB 196,98,125,24,45,46,100,2,0 ; vbroadcastss 0x2642e(%rip),%ymm13 # 2c1f8 <_sk_overlay_sse2_8bit+0x5ab>
+ DB 196,98,125,24,53,41,100,2,0 ; vbroadcastss 0x26429(%rip),%ymm14 # 2c1fc <_sk_overlay_sse2_8bit+0x5af>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
- DB 196,98,125,24,45,127,97,2,0 ; vbroadcastss 0x2617f(%rip),%ymm13 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3>
+ DB 196,98,125,24,45,31,100,2,0 ; vbroadcastss 0x2641f(%rip),%ymm13 # 2c200 <_sk_overlay_sse2_8bit+0x5b3>
DB 196,66,29,184,238 ; vfmadd231ps %ymm14,%ymm12,%ymm13
- DB 196,98,125,24,53,117,97,2,0 ; vbroadcastss 0x26175(%rip),%ymm14 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7>
+ DB 196,98,125,24,53,21,100,2,0 ; vbroadcastss 0x26415(%rip),%ymm14 # 2c204 <_sk_overlay_sse2_8bit+0x5b7>
DB 196,66,29,184,245 ; vfmadd231ps %ymm13,%ymm12,%ymm14
DB 196,65,36,89,222 ; vmulps %ymm14,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,96,97,2,0 ; vbroadcastss 0x26160(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb>
+ DB 196,98,125,24,21,0,100,2,0 ; vbroadcastss 0x26400(%rip),%ymm10 # 2c208 <_sk_overlay_sse2_8bit+0x5bb>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,246,95,2,0 ; vbroadcastss 0x25ff6(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,150,98,2,0 ; vbroadcastss 0x26296(%rip),%ymm10 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,224,95,2,0 ; vbroadcastss 0x25fe0(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,128,98,2,0 ; vbroadcastss 0x26280(%rip),%ymm10 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -5655,23 +5800,23 @@ _sk_xy_to_2pt_conical_quadratic_max_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,224,96,2,0 ; vbroadcastss 0x260e0(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,128,99,2,0 ; vbroadcastss 0x26380(%rip),%ymm11 # 2c20c <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,191,96,2,0 ; vbroadcastss 0x260bf(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,95,99,2,0 ; vbroadcastss 0x2635f(%rip),%ymm9 # 2c210 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,162,96,2,0 ; vbroadcastss 0x260a2(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,66,99,2,0 ; vbroadcastss 0x26342(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,51,95,2,0 ; vbroadcastss 0x25f33(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,211,97,2,0 ; vbroadcastss 0x261d3(%rip),%ymm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5688,23 +5833,23 @@ _sk_xy_to_2pt_conical_quadratic_min_hsw LABEL PROC
DB 197,50,89,80,44 ; vmulss 0x2c(%rax),%xmm9,%xmm10
DB 196,66,125,24,210 ; vbroadcastss %xmm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,72,96,2,0 ; vbroadcastss 0x26048(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,232,98,2,0 ; vbroadcastss 0x262e8(%rip),%ymm11 # 2c20c <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
DB 196,98,125,184,216 ; vfmadd231ps %ymm0,%ymm0,%ymm11
DB 196,193,50,89,193 ; vmulss %xmm9,%xmm9,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,39,96,2,0 ; vbroadcastss 0x26027(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,199,98,2,0 ; vbroadcastss 0x262c7(%rip),%ymm9 # 2c210 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,194,45,184,194 ; vfmadd231ps %ymm10,%ymm10,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,10,96,2,0 ; vbroadcastss 0x2600a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,170,98,2,0 ; vbroadcastss 0x262aa(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,155,94,2,0 ; vbroadcastss 0x25e9b(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,59,97,2,0 ; vbroadcastss 0x2613b(%rip),%ymm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,44,89,208 ; vmulps %ymm8,%ymm10,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -5720,14 +5865,14 @@ _sk_xy_to_2pt_conical_linear_hsw LABEL PROC
DB 197,58,89,72,44 ; vmulss 0x2c(%rax),%xmm8,%xmm9
DB 196,66,125,24,201 ; vbroadcastss %xmm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,182,95,2,0 ; vbroadcastss 0x25fb6(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,21,86,98,2,0 ; vbroadcastss 0x26256(%rip),%ymm10 # 2c20c <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
DB 196,98,125,184,208 ; vfmadd231ps %ymm0,%ymm0,%ymm10
DB 196,193,58,89,192 ; vmulss %xmm8,%xmm8,%xmm0
DB 196,226,125,24,192 ; vbroadcastss %xmm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,153,95,2,0 ; vbroadcastss 0x25f99(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,5,57,98,2,0 ; vbroadcastss 0x26239(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5761,7 +5906,7 @@ _sk_apply_vector_mask_hsw LABEL PROC
PUBLIC _sk_save_xy_hsw
_sk_save_xy_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,217,93,2,0 ; vbroadcastss 0x25dd9(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,121,96,2,0 ; vbroadcastss 0x26079(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -5791,9 +5936,9 @@ _sk_accumulate_hsw LABEL PROC
PUBLIC _sk_bilinear_nx_hsw
_sk_bilinear_nx_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,201,94,2,0 ; vbroadcastss 0x25ec9(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,105,97,2,0 ; vbroadcastss 0x26169(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,96,93,2,0 ; vbroadcastss 0x25d60(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,0,96,2,0 ; vbroadcastss 0x26000(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5802,7 +5947,7 @@ _sk_bilinear_nx_hsw LABEL PROC
PUBLIC _sk_bilinear_px_hsw
_sk_bilinear_px_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,64,93,2,0 ; vbroadcastss 0x25d40(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,5,224,95,2,0 ; vbroadcastss 0x25fe0(%rip),%ymm0 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5812,9 +5957,9 @@ _sk_bilinear_px_hsw LABEL PROC
PUBLIC _sk_bilinear_ny_hsw
_sk_bilinear_ny_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,128,94,2,0 ; vbroadcastss 0x25e80(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,32,97,2,0 ; vbroadcastss 0x26120(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,22,93,2,0 ; vbroadcastss 0x25d16(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,182,95,2,0 ; vbroadcastss 0x25fb6(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5823,7 +5968,7 @@ _sk_bilinear_ny_hsw LABEL PROC
PUBLIC _sk_bilinear_py_hsw
_sk_bilinear_py_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,246,92,2,0 ; vbroadcastss 0x25cf6(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,150,95,2,0 ; vbroadcastss 0x25f96(%rip),%ymm1 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5833,13 +5978,13 @@ _sk_bilinear_py_hsw LABEL PROC
PUBLIC _sk_bicubic_n3x_hsw
_sk_bicubic_n3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,57,94,2,0 ; vbroadcastss 0x25e39(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,5,217,96,2,0 ; vbroadcastss 0x260d9(%rip),%ymm0 # 2c21c <_sk_overlay_sse2_8bit+0x5cf>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,204,92,2,0 ; vbroadcastss 0x25ccc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,108,95,2,0 ; vbroadcastss 0x25f6c(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,41,93,2,0 ; vbroadcastss 0x25d29(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,20,94,2,0 ; vbroadcastss 0x25e14(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,201,95,2,0 ; vbroadcastss 0x25fc9(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,180,96,2,0 ; vbroadcastss 0x260b4(%rip),%ymm11 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5849,16 +5994,16 @@ _sk_bicubic_n3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n1x_hsw
_sk_bicubic_n1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,235,93,2,0 ; vbroadcastss 0x25deb(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,139,96,2,0 ; vbroadcastss 0x2608b(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,130,92,2,0 ; vbroadcastss 0x25c82(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,34,95,2,0 ; vbroadcastss 0x25f22(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,220,93,2,0 ; vbroadcastss 0x25ddc(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,21,215,93,2,0 ; vbroadcastss 0x25dd7(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,124,96,2,0 ; vbroadcastss 0x2607c(%rip),%ymm9 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,119,96,2,0 ; vbroadcastss 0x26077(%rip),%ymm10 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,89,92,2,0 ; vbroadcastss 0x25c59(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,249,94,2,0 ; vbroadcastss 0x25ef9(%rip),%ymm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,191,93,2,0 ; vbroadcastss 0x25dbf(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,21,95,96,2,0 ; vbroadcastss 0x2605f(%rip),%ymm10 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,128,0,0,0 ; vmovups %ymm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5867,14 +6012,14 @@ _sk_bicubic_n1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p1x_hsw
_sk_bicubic_p1x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,47,92,2,0 ; vbroadcastss 0x25c2f(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,207,94,2,0 ; vbroadcastss 0x25ecf(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,137,93,2,0 ; vbroadcastss 0x25d89(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,29,132,93,2,0 ; vbroadcastss 0x25d84(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,41,96,2,0 ; vbroadcastss 0x26029(%rip),%ymm10 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,36,96,2,0 ; vbroadcastss 0x26024(%rip),%ymm11 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,117,93,2,0 ; vbroadcastss 0x25d75(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,5,21,96,2,0 ; vbroadcastss 0x26015(%rip),%ymm8 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5883,12 +6028,12 @@ _sk_bicubic_p1x_hsw LABEL PROC
PUBLIC _sk_bicubic_p3x_hsw
_sk_bicubic_p3x_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,81,93,2,0 ; vbroadcastss 0x25d51(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,5,241,95,2,0 ; vbroadcastss 0x25ff1(%rip),%ymm0 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,66,92,2,0 ; vbroadcastss 0x25c42(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,45,93,2,0 ; vbroadcastss 0x25d2d(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,226,94,2,0 ; vbroadcastss 0x25ee2(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,205,95,2,0 ; vbroadcastss 0x25fcd(%rip),%ymm11 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -5898,13 +6043,13 @@ _sk_bicubic_p3x_hsw LABEL PROC
PUBLIC _sk_bicubic_n3y_hsw
_sk_bicubic_n3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,8,93,2,0 ; vbroadcastss 0x25d08(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,13,168,95,2,0 ; vbroadcastss 0x25fa8(%rip),%ymm1 # 2c21c <_sk_overlay_sse2_8bit+0x5cf>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,154,91,2,0 ; vbroadcastss 0x25b9a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,58,94,2,0 ; vbroadcastss 0x25e3a(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,247,91,2,0 ; vbroadcastss 0x25bf7(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,226,92,2,0 ; vbroadcastss 0x25ce2(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,151,94,2,0 ; vbroadcastss 0x25e97(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,130,95,2,0 ; vbroadcastss 0x25f82(%rip),%ymm11 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,36,89,193 ; vmulps %ymm9,%ymm11,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -5914,16 +6059,16 @@ _sk_bicubic_n3y_hsw LABEL PROC
PUBLIC _sk_bicubic_n1y_hsw
_sk_bicubic_n1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,185,92,2,0 ; vbroadcastss 0x25cb9(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,89,95,2,0 ; vbroadcastss 0x25f59(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,79,91,2,0 ; vbroadcastss 0x25b4f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,239,93,2,0 ; vbroadcastss 0x25def(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,169,92,2,0 ; vbroadcastss 0x25ca9(%rip),%ymm9 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,21,164,92,2,0 ; vbroadcastss 0x25ca4(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,73,95,2,0 ; vbroadcastss 0x25f49(%rip),%ymm9 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,68,95,2,0 ; vbroadcastss 0x25f44(%rip),%ymm10 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,61,168,209 ; vfmadd213ps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,13,38,91,2,0 ; vbroadcastss 0x25b26(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,198,93,2,0 ; vbroadcastss 0x25dc6(%rip),%ymm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,66,61,184,202 ; vfmadd231ps %ymm10,%ymm8,%ymm9
- DB 196,98,125,24,21,140,92,2,0 ; vbroadcastss 0x25c8c(%rip),%ymm10 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,21,44,95,2,0 ; vbroadcastss 0x25f2c(%rip),%ymm10 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,61,184,209 ; vfmadd231ps %ymm9,%ymm8,%ymm10
DB 197,124,17,144,160,0,0,0 ; vmovups %ymm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5932,14 +6077,14 @@ _sk_bicubic_n1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p1y_hsw
_sk_bicubic_p1y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,252,90,2,0 ; vbroadcastss 0x25afc(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,156,93,2,0 ; vbroadcastss 0x25d9c(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,85,92,2,0 ; vbroadcastss 0x25c55(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
- DB 196,98,125,24,29,80,92,2,0 ; vbroadcastss 0x25c50(%rip),%ymm11 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,245,94,2,0 ; vbroadcastss 0x25ef5(%rip),%ymm10 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,240,94,2,0 ; vbroadcastss 0x25ef0(%rip),%ymm11 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,66,53,168,218 ; vfmadd213ps %ymm10,%ymm9,%ymm11
DB 196,66,53,168,216 ; vfmadd213ps %ymm8,%ymm9,%ymm11
- DB 196,98,125,24,5,65,92,2,0 ; vbroadcastss 0x25c41(%rip),%ymm8 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,5,225,94,2,0 ; vbroadcastss 0x25ee1(%rip),%ymm8 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,66,53,184,195 ; vfmadd231ps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -5948,12 +6093,12 @@ _sk_bicubic_p1y_hsw LABEL PROC
PUBLIC _sk_bicubic_p3y_hsw
_sk_bicubic_p3y_hsw LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,29,92,2,0 ; vbroadcastss 0x25c1d(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,13,189,94,2,0 ; vbroadcastss 0x25ebd(%rip),%ymm1 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,13,91,2,0 ; vbroadcastss 0x25b0d(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
- DB 196,98,125,24,29,248,91,2,0 ; vbroadcastss 0x25bf8(%rip),%ymm11 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,173,93,2,0 ; vbroadcastss 0x25dad(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,29,152,94,2,0 ; vbroadcastss 0x25e98(%rip),%ymm11 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,66,61,168,218 ; vfmadd213ps %ymm10,%ymm8,%ymm11
DB 196,65,52,89,195 ; vmulps %ymm11,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -6083,19 +6228,19 @@ _sk_clut_3D_hsw LABEL PROC
DB 197,254,127,76,36,32 ; vmovdqu %ymm1,0x20(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,117,254,204 ; vpaddd %ymm12,%ymm1,%ymm1
- DB 196,226,125,88,61,203,89,2,0 ; vpbroadcastd 0x259cb(%rip),%ymm7 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,226,125,88,61,107,92,2,0 ; vpbroadcastd 0x25c6b(%rip),%ymm7 # 2c234 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,226,117,64,207 ; vpmulld %ymm7,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,98,77,146,4,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm8
- DB 196,98,125,88,21,63,88,2,0 ; vpbroadcastd 0x2583f(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,21,223,90,2,0 ; vpbroadcastd 0x25adf(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,193,117,254,242 ; vpaddd %ymm10,%ymm1,%ymm6
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
DB 196,226,37,146,28,176 ; vgatherdps %ymm11,(%rax,%ymm6,4),%ymm3
- DB 196,98,125,88,29,46,88,2,0 ; vpbroadcastd 0x2582e(%rip),%ymm11 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,29,206,90,2,0 ; vpbroadcastd 0x25ace(%rip),%ymm11 # 2c0c8 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,117,254,203 ; vpaddd %ymm11,%ymm1,%ymm1
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
DB 196,226,77,146,36,136 ; vgatherdps %ymm6,(%rax,%ymm1,4),%ymm4
- DB 196,98,125,24,45,126,89,2,0 ; vbroadcastss 0x2597e(%rip),%ymm13 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,98,125,24,45,30,92,2,0 ; vbroadcastss 0x25c1e(%rip),%ymm13 # 2c230 <_sk_overlay_sse2_8bit+0x5e3>
DB 196,193,124,88,245 ; vaddps %ymm13,%ymm0,%ymm6
DB 197,254,91,246 ; vcvttps2dq %ymm6,%ymm6
DB 196,226,77,64,205 ; vpmulld %ymm5,%ymm6,%ymm1
@@ -6313,19 +6458,19 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,126,91,245 ; vcvttps2dq %ymm5,%ymm14
DB 196,98,13,64,233 ; vpmulld %ymm1,%ymm14,%ymm13
DB 197,149,254,198 ; vpaddd %ymm6,%ymm13,%ymm0
- DB 196,98,125,88,21,247,84,2,0 ; vpbroadcastd 0x254f7(%rip),%ymm10 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,125,88,21,151,87,2,0 ; vpbroadcastd 0x25797(%rip),%ymm10 # 2c234 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,125,64,194 ; vpmulld %ymm10,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,98,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm15
- DB 196,98,125,88,29,106,83,2,0 ; vpbroadcastd 0x2536a(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,88,29,10,86,2,0 ; vpbroadcastd 0x2560a(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,125,254,195 ; vpaddd %ymm11,%ymm0,%ymm8
DB 196,65,53,118,201 ; vpcmpeqd %ymm9,%ymm9,%ymm9
DB 196,162,53,146,20,128 ; vgatherdps %ymm9,(%rax,%ymm8,4),%ymm2
- DB 196,98,125,88,37,89,83,2,0 ; vpbroadcastd 0x25359(%rip),%ymm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,88,37,249,85,2,0 ; vpbroadcastd 0x255f9(%rip),%ymm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,125,254,196 ; vpaddd %ymm12,%ymm0,%ymm0
DB 196,65,61,118,192 ; vpcmpeqd %ymm8,%ymm8,%ymm8
DB 196,226,61,146,60,128 ; vgatherdps %ymm8,(%rax,%ymm0,4),%ymm7
- DB 196,98,125,24,13,168,84,2,0 ; vbroadcastss 0x254a8(%rip),%ymm9 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,98,125,24,13,72,87,2,0 ; vbroadcastss 0x25748(%rip),%ymm9 # 2c230 <_sk_overlay_sse2_8bit+0x5e3>
DB 196,65,84,88,193 ; vaddps %ymm9,%ymm5,%ymm8
DB 196,65,126,91,192 ; vcvttps2dq %ymm8,%ymm8
DB 196,226,61,64,193 ; vpmulld %ymm1,%ymm8,%ymm0
@@ -6650,7 +6795,7 @@ _sk_clut_4D_hsw LABEL PROC
DB 197,196,92,214 ; vsubps %ymm6,%ymm7,%ymm2
DB 196,226,61,168,214 ; vfmadd213ps %ymm6,%ymm8,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,55,76,2,0 ; vbroadcastss 0x24c37(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,215,78,2,0 ; vbroadcastss 0x24ed7(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,164,36,160,3,0,0 ; vmovups 0x3a0(%rsp),%ymm4
DB 197,252,16,172,36,192,3,0,0 ; vmovups 0x3c0(%rsp),%ymm5
DB 197,252,16,180,36,224,3,0,0 ; vmovups 0x3e0(%rsp),%ymm6
@@ -6691,13 +6836,13 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 7061 <_sk_start_pipeline_avx+0xed>
+ DB 115,110 ; jae 7301 <_sk_start_pipeline_avx+0xed>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
- DB 119,43 ; ja 7040 <_sk_start_pipeline_avx+0xcc>
+ DB 119,43 ; ja 72e0 <_sk_start_pipeline_avx+0xcc>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -6709,17 +6854,17 @@ _sk_start_pipeline_avx LABEL PROC
DB 73,131,196,16 ; add $0x10,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 701c <_sk_start_pipeline_avx+0xa8>
+ DB 118,220 ; jbe 72bc <_sk_start_pipeline_avx+0xa8>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 7055 <_sk_start_pipeline_avx+0xe1>
+ DB 116,13 ; je 72f5 <_sk_start_pipeline_avx+0xe1>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 7005 <_sk_start_pipeline_avx+0x91>
+ DB 117,164 ; jne 72a5 <_sk_start_pipeline_avx+0x91>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -6752,7 +6897,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,249,112,192,0 ; vpshufd $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,159,74,2,0 ; vbroadcastss 0x24a9f(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,63,77,2,0 ; vbroadcastss 0x24d3f(%rip),%ymm1 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,88,7 ; vaddps (%rdi),%ymm0,%ymm0
DB 197,249,110,209 ; vmovd %ecx,%xmm2
@@ -6761,7 +6906,7 @@ _sk_seed_shader_avx LABEL PROC
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
DB 197,236,88,201 ; vaddps %ymm1,%ymm2,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,21,121,74,2,0 ; vbroadcastss 0x24a79(%rip),%ymm2 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,21,25,77,2,0 ; vbroadcastss 0x24d19(%rip),%ymm2 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,228,87,219 ; vxorps %ymm3,%ymm3,%ymm3
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
@@ -6783,7 +6928,7 @@ _sk_dither_avx LABEL PROC
DB 196,65,121,112,201,0 ; vpshufd $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 196,65,52,87,208 ; vxorps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,34,74,2,0 ; vbroadcastss 0x24a22(%rip),%ymm11 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,24,29,194,76,2,0 ; vbroadcastss 0x24cc2(%rip),%ymm11 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,44,84,203 ; vandps %ymm11,%ymm10,%ymm9
DB 196,193,25,114,241,5 ; vpslld $0x5,%xmm9,%xmm12
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
@@ -6794,8 +6939,8 @@ _sk_dither_avx LABEL PROC
DB 196,67,125,25,219,1 ; vextractf128 $0x1,%ymm11,%xmm11
DB 196,193,33,114,243,4 ; vpslld $0x4,%xmm11,%xmm11
DB 196,67,29,24,219,1 ; vinsertf128 $0x1,%xmm11,%ymm12,%ymm11
- DB 196,98,125,24,37,227,73,2,0 ; vbroadcastss 0x249e3(%rip),%ymm12 # 2bb84 <_sk_overlay_sse2_8bit+0x477>
- DB 196,98,125,24,45,222,73,2,0 ; vbroadcastss 0x249de(%rip),%ymm13 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,125,24,37,131,76,2,0 ; vbroadcastss 0x24c83(%rip),%ymm12 # 2c0c4 <_sk_overlay_sse2_8bit+0x477>
+ DB 196,98,125,24,45,126,76,2,0 ; vbroadcastss 0x24c7e(%rip),%ymm13 # 2c0c8 <_sk_overlay_sse2_8bit+0x47b>
DB 196,65,44,84,245 ; vandps %ymm13,%ymm10,%ymm14
DB 196,193,1,114,246,2 ; vpslld $0x2,%xmm14,%xmm15
DB 196,67,125,25,246,1 ; vextractf128 $0x1,%ymm14,%xmm14
@@ -6822,9 +6967,9 @@ _sk_dither_avx LABEL PROC
DB 196,65,60,86,193 ; vorps %ymm9,%ymm8,%ymm8
DB 196,65,60,86,194 ; vorps %ymm10,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,73,73,2,0 ; vbroadcastss 0x24949(%rip),%ymm9 # 2bb8c <_sk_overlay_sse2_8bit+0x47f>
+ DB 196,98,125,24,13,233,75,2,0 ; vbroadcastss 0x24be9(%rip),%ymm9 # 2c0cc <_sk_overlay_sse2_8bit+0x47f>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,63,73,2,0 ; vbroadcastss 0x2493f(%rip),%ymm9 # 2bb90 <_sk_overlay_sse2_8bit+0x483>
+ DB 196,98,125,24,13,223,75,2,0 ; vbroadcastss 0x24bdf(%rip),%ymm9 # 2c0d0 <_sk_overlay_sse2_8bit+0x483>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 196,98,125,24,8 ; vbroadcastss (%rax),%ymm9
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
@@ -6854,7 +6999,7 @@ _sk_uniform_color_avx LABEL PROC
PUBLIC _sk_black_color_avx
_sk_black_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,199,72,2,0 ; vbroadcastss 0x248c7(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,103,75,2,0 ; vbroadcastss 0x24b67(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 197,236,87,210 ; vxorps %ymm2,%ymm2,%ymm2
@@ -6863,7 +7008,7 @@ _sk_black_color_avx LABEL PROC
PUBLIC _sk_white_color_avx
_sk_white_color_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,174,72,2,0 ; vbroadcastss 0x248ae(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,78,75,2,0 ; vbroadcastss 0x24b4e(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
@@ -6901,7 +7046,7 @@ _sk_clear_avx LABEL PROC
PUBLIC _sk_srcatop_avx
_sk_srcatop_avx LABEL PROC
DB 197,252,89,199 ; vmulps %ymm7,%ymm0,%ymm0
- DB 196,98,125,24,5,77,72,2,0 ; vbroadcastss 0x2484d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,237,74,2,0 ; vbroadcastss 0x24aed(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6920,7 +7065,7 @@ _sk_srcatop_avx LABEL PROC
PUBLIC _sk_dstatop_avx
_sk_dstatop_avx LABEL PROC
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
- DB 196,98,125,24,13,11,72,2,0 ; vbroadcastss 0x2480b(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,171,74,2,0 ; vbroadcastss 0x24aab(%rip),%ymm9 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,207 ; vsubps %ymm7,%ymm9,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,188,88,192 ; vaddps %ymm0,%ymm8,%ymm0
@@ -6956,7 +7101,7 @@ _sk_dstin_avx LABEL PROC
PUBLIC _sk_srcout_avx
_sk_srcout_avx LABEL PROC
- DB 196,98,125,24,5,166,71,2,0 ; vbroadcastss 0x247a6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,70,74,2,0 ; vbroadcastss 0x24a46(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -6967,7 +7112,7 @@ _sk_srcout_avx LABEL PROC
PUBLIC _sk_dstout_avx
_sk_dstout_avx LABEL PROC
- DB 196,226,125,24,5,133,71,2,0 ; vbroadcastss 0x24785(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,37,74,2,0 ; vbroadcastss 0x24a25(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,92,219 ; vsubps %ymm3,%ymm0,%ymm3
DB 197,228,89,196 ; vmulps %ymm4,%ymm3,%ymm0
DB 197,228,89,205 ; vmulps %ymm5,%ymm3,%ymm1
@@ -6978,7 +7123,7 @@ _sk_dstout_avx LABEL PROC
PUBLIC _sk_srcover_avx
_sk_srcover_avx LABEL PROC
- DB 196,98,125,24,5,100,71,2,0 ; vbroadcastss 0x24764(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,4,74,2,0 ; vbroadcastss 0x24a04(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,204 ; vmulps %ymm4,%ymm8,%ymm9
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -6993,7 +7138,7 @@ _sk_srcover_avx LABEL PROC
PUBLIC _sk_dstover_avx
_sk_dstover_avx LABEL PROC
- DB 196,98,125,24,5,51,71,2,0 ; vbroadcastss 0x24733(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,211,73,2,0 ; vbroadcastss 0x249d3(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,199 ; vsubps %ymm7,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
@@ -7017,7 +7162,7 @@ _sk_modulate_avx LABEL PROC
PUBLIC _sk_multiply_avx
_sk_multiply_avx LABEL PROC
- DB 196,98,125,24,5,238,70,2,0 ; vbroadcastss 0x246ee(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,142,73,2,0 ; vbroadcastss 0x2498e(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,208 ; vmulps %ymm0,%ymm9,%ymm10
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7046,7 +7191,7 @@ _sk_multiply_avx LABEL PROC
PUBLIC _sk_plus__avx
_sk_plus__avx LABEL PROC
DB 197,252,88,196 ; vaddps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,5,125,70,2,0 ; vbroadcastss 0x2467d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,29,73,2,0 ; vbroadcastss 0x2491d(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 197,244,88,205 ; vaddps %ymm5,%ymm1,%ymm1
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
@@ -7076,7 +7221,7 @@ _sk_screen_avx LABEL PROC
PUBLIC _sk_xor__avx
_sk_xor__avx LABEL PROC
- DB 196,98,125,24,5,28,70,2,0 ; vbroadcastss 0x2461c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,188,72,2,0 ; vbroadcastss 0x248bc(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,192 ; vmulps %ymm0,%ymm9,%ymm0
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7111,7 +7256,7 @@ _sk_darken_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,95,209 ; vmaxps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,152,69,2,0 ; vbroadcastss 0x24598(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,56,72,2,0 ; vbroadcastss 0x24838(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7135,7 +7280,7 @@ _sk_lighten_avx LABEL PROC
DB 197,100,89,206 ; vmulps %ymm6,%ymm3,%ymm9
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,64,69,2,0 ; vbroadcastss 0x24540(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,224,71,2,0 ; vbroadcastss 0x247e0(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7162,7 +7307,7 @@ _sk_difference_avx LABEL PROC
DB 196,193,108,93,209 ; vminps %ymm9,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,220,68,2,0 ; vbroadcastss 0x244dc(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,124,71,2,0 ; vbroadcastss 0x2477c(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7183,7 +7328,7 @@ _sk_exclusion_avx LABEL PROC
DB 197,236,89,214 ; vmulps %ymm6,%ymm2,%ymm2
DB 197,236,88,210 ; vaddps %ymm2,%ymm2,%ymm2
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
- DB 196,98,125,24,5,147,68,2,0 ; vbroadcastss 0x24493(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,51,71,2,0 ; vbroadcastss 0x24733(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
DB 197,60,89,199 ; vmulps %ymm7,%ymm8,%ymm8
DB 197,188,88,219 ; vaddps %ymm3,%ymm8,%ymm3
@@ -7192,7 +7337,7 @@ _sk_exclusion_avx LABEL PROC
PUBLIC _sk_colorburn_avx
_sk_colorburn_avx LABEL PROC
- DB 196,98,125,24,5,122,68,2,0 ; vbroadcastss 0x2447a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,26,71,2,0 ; vbroadcastss 0x2471a(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,52,89,216 ; vmulps %ymm0,%ymm9,%ymm11
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
@@ -7252,7 +7397,7 @@ _sk_colorburn_avx LABEL PROC
PUBLIC _sk_colordodge_avx
_sk_colordodge_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
- DB 196,98,125,24,13,126,67,2,0 ; vbroadcastss 0x2437e(%rip),%ymm9 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,13,30,70,2,0 ; vbroadcastss 0x2461e(%rip),%ymm9 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,52,92,215 ; vsubps %ymm7,%ymm9,%ymm10
DB 197,44,89,216 ; vmulps %ymm0,%ymm10,%ymm11
DB 197,52,92,203 ; vsubps %ymm3,%ymm9,%ymm9
@@ -7307,7 +7452,7 @@ _sk_colordodge_avx LABEL PROC
PUBLIC _sk_hardlight_avx
_sk_hardlight_avx LABEL PROC
- DB 196,98,125,24,5,137,66,2,0 ; vbroadcastss 0x24289(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,41,69,2,0 ; vbroadcastss 0x24529(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7360,7 +7505,7 @@ _sk_hardlight_avx LABEL PROC
PUBLIC _sk_overlay_avx
_sk_overlay_avx LABEL PROC
- DB 196,98,125,24,5,174,65,2,0 ; vbroadcastss 0x241ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,78,68,2,0 ; vbroadcastss 0x2444e(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,215 ; vsubps %ymm7,%ymm8,%ymm10
DB 197,44,89,200 ; vmulps %ymm0,%ymm10,%ymm9
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7425,10 +7570,10 @@ _sk_softlight_avx LABEL PROC
DB 196,65,60,88,192 ; vaddps %ymm8,%ymm8,%ymm8
DB 196,65,60,89,216 ; vmulps %ymm8,%ymm8,%ymm11
DB 196,65,60,88,195 ; vaddps %ymm11,%ymm8,%ymm8
- DB 196,98,125,24,29,177,64,2,0 ; vbroadcastss 0x240b1(%rip),%ymm11 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,29,81,67,2,0 ; vbroadcastss 0x24351(%rip),%ymm11 # 2c0d4 <_sk_overlay_sse2_8bit+0x487>
DB 196,65,28,88,235 ; vaddps %ymm11,%ymm12,%ymm13
DB 196,65,20,89,192 ; vmulps %ymm8,%ymm13,%ymm8
- DB 196,98,125,24,45,162,64,2,0 ; vbroadcastss 0x240a2(%rip),%ymm13 # 2bb98 <_sk_overlay_sse2_8bit+0x48b>
+ DB 196,98,125,24,45,66,67,2,0 ; vbroadcastss 0x24342(%rip),%ymm13 # 2c0d8 <_sk_overlay_sse2_8bit+0x48b>
DB 196,65,28,89,245 ; vmulps %ymm13,%ymm12,%ymm14
DB 196,65,12,88,192 ; vaddps %ymm8,%ymm14,%ymm8
DB 196,65,124,82,244 ; vrsqrtps %ymm12,%ymm14
@@ -7439,7 +7584,7 @@ _sk_softlight_avx LABEL PROC
DB 197,4,194,255,2 ; vcmpleps %ymm7,%ymm15,%ymm15
DB 196,67,13,74,240,240 ; vblendvps %ymm15,%ymm8,%ymm14,%ymm14
DB 197,116,88,249 ; vaddps %ymm1,%ymm1,%ymm15
- DB 196,98,125,24,5,76,64,2,0 ; vbroadcastss 0x2404c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,236,66,2,0 ; vbroadcastss 0x242ec(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,60,92,228 ; vsubps %ymm12,%ymm8,%ymm12
DB 197,132,92,195 ; vsubps %ymm3,%ymm15,%ymm0
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
@@ -7566,12 +7711,12 @@ _sk_hue_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,42,62,2,0 ; vbroadcastss 0x23e2a(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,202,64,2,0 ; vbroadcastss 0x240ca(%rip),%ymm14 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,32,62,2,0 ; vbroadcastss 0x23e20(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,61,192,64,2,0 ; vbroadcastss 0x240c0(%rip),%ymm15 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,17,62,2,0 ; vbroadcastss 0x23e11(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,177,64,2,0 ; vbroadcastss 0x240b1(%rip),%ymm0 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7632,7 +7777,7 @@ _sk_hue_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,190,60,2,0 ; vbroadcastss 0x23cbe(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,94,63,2,0 ; vbroadcastss 0x23f5e(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7689,12 +7834,12 @@ _sk_saturation_avx LABEL PROC
DB 196,65,28,89,219 ; vmulps %ymm11,%ymm12,%ymm11
DB 196,65,36,94,222 ; vdivps %ymm14,%ymm11,%ymm11
DB 196,67,37,74,224,240 ; vblendvps %ymm15,%ymm8,%ymm11,%ymm12
- DB 196,98,125,24,53,226,59,2,0 ; vbroadcastss 0x23be2(%rip),%ymm14 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,53,130,62,2,0 ; vbroadcastss 0x23e82(%rip),%ymm14 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,222 ; vmulps %ymm14,%ymm4,%ymm11
- DB 196,98,125,24,61,216,59,2,0 ; vbroadcastss 0x23bd8(%rip),%ymm15 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,61,120,62,2,0 ; vbroadcastss 0x23e78(%rip),%ymm15 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,239 ; vmulps %ymm15,%ymm5,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
- DB 196,226,125,24,5,201,59,2,0 ; vbroadcastss 0x23bc9(%rip),%ymm0 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,226,125,24,5,105,62,2,0 ; vbroadcastss 0x23e69(%rip),%ymm0 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 197,76,89,232 ; vmulps %ymm0,%ymm6,%ymm13
DB 196,65,36,88,221 ; vaddps %ymm13,%ymm11,%ymm11
DB 196,65,52,89,238 ; vmulps %ymm14,%ymm9,%ymm13
@@ -7755,7 +7900,7 @@ _sk_saturation_avx LABEL PROC
DB 196,65,36,95,208 ; vmaxps %ymm8,%ymm11,%ymm10
DB 196,195,109,74,209,240 ; vblendvps %ymm15,%ymm9,%ymm2,%ymm2
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,118,58,2,0 ; vbroadcastss 0x23a76(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,22,61,2,0 ; vbroadcastss 0x23d16(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,207 ; vsubps %ymm7,%ymm8,%ymm9
DB 197,180,89,201 ; vmulps %ymm1,%ymm9,%ymm1
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
@@ -7784,12 +7929,12 @@ _sk_color_avx LABEL PROC
DB 197,252,17,68,36,32 ; vmovups %ymm0,0x20(%rsp)
DB 197,124,89,199 ; vmulps %ymm7,%ymm0,%ymm8
DB 197,116,89,207 ; vmulps %ymm7,%ymm1,%ymm9
- DB 196,98,125,24,45,34,58,2,0 ; vbroadcastss 0x23a22(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,45,194,60,2,0 ; vbroadcastss 0x23cc2(%rip),%ymm13 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,213 ; vmulps %ymm13,%ymm4,%ymm10
- DB 196,98,125,24,53,24,58,2,0 ; vbroadcastss 0x23a18(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,184,60,2,0 ; vbroadcastss 0x23cb8(%rip),%ymm14 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,84,89,222 ; vmulps %ymm14,%ymm5,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,9,58,2,0 ; vbroadcastss 0x23a09(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,169,60,2,0 ; vbroadcastss 0x23ca9(%rip),%ymm15 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 196,65,76,89,223 ; vmulps %ymm15,%ymm6,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7852,7 +7997,7 @@ _sk_color_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,164,56,2,0 ; vbroadcastss 0x238a4(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,68,59,2,0 ; vbroadcastss 0x23b44(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,84,36,32 ; vmulps 0x20(%rsp),%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7882,12 +8027,12 @@ _sk_luminosity_avx LABEL PROC
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 197,100,89,196 ; vmulps %ymm4,%ymm3,%ymm8
DB 197,100,89,205 ; vmulps %ymm5,%ymm3,%ymm9
- DB 196,98,125,24,45,76,56,2,0 ; vbroadcastss 0x2384c(%rip),%ymm13 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,45,236,58,2,0 ; vbroadcastss 0x23aec(%rip),%ymm13 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,108,89,213 ; vmulps %ymm13,%ymm2,%ymm10
- DB 196,98,125,24,53,66,56,2,0 ; vbroadcastss 0x23842(%rip),%ymm14 # 2bba0 <_sk_overlay_sse2_8bit+0x493>
+ DB 196,98,125,24,53,226,58,2,0 ; vbroadcastss 0x23ae2(%rip),%ymm14 # 2c0e0 <_sk_overlay_sse2_8bit+0x493>
DB 196,65,116,89,222 ; vmulps %ymm14,%ymm1,%ymm11
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,61,51,56,2,0 ; vbroadcastss 0x23833(%rip),%ymm15 # 2bba4 <_sk_overlay_sse2_8bit+0x497>
+ DB 196,98,125,24,61,211,58,2,0 ; vbroadcastss 0x23ad3(%rip),%ymm15 # 2c0e4 <_sk_overlay_sse2_8bit+0x497>
DB 196,65,28,89,223 ; vmulps %ymm15,%ymm12,%ymm11
DB 196,193,44,88,195 ; vaddps %ymm11,%ymm10,%ymm0
DB 196,65,60,89,221 ; vmulps %ymm13,%ymm8,%ymm11
@@ -7950,7 +8095,7 @@ _sk_luminosity_avx LABEL PROC
DB 196,65,44,95,207 ; vmaxps %ymm15,%ymm10,%ymm9
DB 196,195,37,74,192,0 ; vblendvps %ymm0,%ymm8,%ymm11,%ymm0
DB 196,65,124,95,199 ; vmaxps %ymm15,%ymm0,%ymm8
- DB 196,226,125,24,5,206,54,2,0 ; vbroadcastss 0x236ce(%rip),%ymm0 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,5,110,57,2,0 ; vbroadcastss 0x2396e(%rip),%ymm0 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,124,92,215 ; vsubps %ymm7,%ymm0,%ymm10
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 197,124,92,219 ; vsubps %ymm3,%ymm0,%ymm11
@@ -7982,9 +8127,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,43,1,0,0 ; jne 8648 <_sk_srcover_rgba_8888_avx+0x14c>
+ DB 15,133,43,1,0,0 ; jne 88e8 <_sk_srcover_rgba_8888_avx+0x14c>
DB 196,65,125,16,4,153 ; vmovupd (%r9,%rbx,4),%ymm8
- DB 197,125,40,13,245,58,2,0 ; vmovapd 0x23af5(%rip),%ymm9 # 2c020 <_sk_overlay_sse2_8bit+0x913>
+ DB 197,125,40,13,149,61,2,0 ; vmovapd 0x23d95(%rip),%ymm9 # 2c560 <_sk_overlay_sse2_8bit+0x913>
DB 196,193,61,84,225 ; vandpd %ymm9,%ymm8,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
DB 196,193,81,114,208,8 ; vpsrld $0x8,%xmm8,%xmm5
@@ -8002,9 +8147,9 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 197,193,114,215,24 ; vpsrld $0x18,%xmm7,%xmm7
DB 196,227,61,24,255,1 ; vinsertf128 $0x1,%xmm7,%ymm8,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,240,53,2,0 ; vbroadcastss 0x235f0(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,144,56,2,0 ; vbroadcastss 0x23890(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,195 ; vsubps %ymm3,%ymm8,%ymm8
- DB 196,98,125,24,13,15,54,2,0 ; vbroadcastss 0x2360f(%rip),%ymm9 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,13,175,56,2,0 ; vbroadcastss 0x238af(%rip),%ymm9 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,60,89,212 ; vmulps %ymm4,%ymm8,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
@@ -8037,7 +8182,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,53,86,202 ; vorpd %ymm10,%ymm9,%ymm9
DB 196,65,61,86,193 ; vorpd %ymm9,%ymm8,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne 8680 <_sk_srcover_rgba_8888_avx+0x184>
+ DB 117,67 ; jne 8920 <_sk_srcover_rgba_8888_avx+0x184>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -8047,33 +8192,33 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,194,254,255,255 ; ja 8523 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 15,135,194,254,255,255 ; ja 87c3 <_sk_srcover_rgba_8888_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,4,1,0,0 ; lea 0x104(%rip),%r11 # 8770 <_sk_srcover_rgba_8888_avx+0x274>
+ DB 76,141,29,4,1,0,0 ; lea 0x104(%rip),%r11 # 8a10 <_sk_srcover_rgba_8888_avx+0x274>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,4,153 ; vmovss (%r9,%rbx,4),%xmm8
- DB 233,163,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,163,254,255,255 ; jmpq 87c3 <_sk_srcover_rgba_8888_avx+0x27>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,179 ; ja 8643 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 119,179 ; ja 88e3 <_sk_srcover_rgba_8888_avx+0x147>
DB 65,15,182,194 ; movzbl %r10b,%eax
- DB 76,141,21,241,0,0,0 ; lea 0xf1(%rip),%r10 # 878c <_sk_srcover_rgba_8888_avx+0x290>
+ DB 76,141,21,241,0,0,0 ; lea 0xf1(%rip),%r10 # 8a2c <_sk_srcover_rgba_8888_avx+0x290>
DB 73,99,4,130 ; movslq (%r10,%rax,4),%rax
DB 76,1,208 ; add %r10,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,151 ; jmp 8643 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 235,151 ; jmp 88e3 <_sk_srcover_rgba_8888_avx+0x147>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,196,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm8
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,61,13,196,1 ; vblendpd $0x1,%ymm4,%ymm8,%ymm8
- DB 233,80,254,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,80,254,255,255 ; jmpq 87c3 <_sk_srcover_rgba_8888_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -8087,10 +8232,10 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,99,61,24,196,1 ; vinsertf128 $0x1,%xmm4,%ymm8,%ymm8
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,192,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm8
- DB 233,251,253,255,255 ; jmpq 8523 <_sk_srcover_rgba_8888_avx+0x27>
+ DB 233,251,253,255,255 ; jmpq 87c3 <_sk_srcover_rgba_8888_avx+0x27>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 233,8,255,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 233,8,255,255,255 ; jmpq 88e3 <_sk_srcover_rgba_8888_avx+0x147>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -8098,7 +8243,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 233,212,254,255,255 ; jmpq 8643 <_sk_srcover_rgba_8888_avx+0x147>
+ DB 233,212,254,255,255 ; jmpq 88e3 <_sk_srcover_rgba_8888_avx+0x147>
DB 144 ; nop
DB 5,255,255,255,82 ; add $0x52ffffff,%eax
DB 255 ; (bad)
@@ -8110,7 +8255,7 @@ _sk_srcover_rgba_8888_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,255 ; jg 8785 <_sk_srcover_rgba_8888_avx+0x289>
+ DB 127,255 ; jg 8a25 <_sk_srcover_rgba_8888_avx+0x289>
DB 255 ; (bad)
DB 255,99,255 ; jmpq *-0x1(%rbx)
DB 255 ; (bad)
@@ -8143,7 +8288,7 @@ _sk_clamp_0_avx LABEL PROC
PUBLIC _sk_clamp_1_avx
_sk_clamp_1_avx LABEL PROC
- DB 196,98,125,24,5,174,51,2,0 ; vbroadcastss 0x233ae(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,78,54,2,0 ; vbroadcastss 0x2364e(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
@@ -8153,7 +8298,7 @@ _sk_clamp_1_avx LABEL PROC
PUBLIC _sk_clamp_a_avx
_sk_clamp_a_avx LABEL PROC
- DB 196,98,125,24,5,141,51,2,0 ; vbroadcastss 0x2338d(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,45,54,2,0 ; vbroadcastss 0x2362d(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 197,252,93,195 ; vminps %ymm3,%ymm0,%ymm0
DB 197,244,93,203 ; vminps %ymm3,%ymm1,%ymm1
@@ -8163,7 +8308,7 @@ _sk_clamp_a_avx LABEL PROC
PUBLIC _sk_clamp_a_dst_avx
_sk_clamp_a_dst_avx LABEL PROC
- DB 196,98,125,24,5,111,51,2,0 ; vbroadcastss 0x2336f(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,15,54,2,0 ; vbroadcastss 0x2360f(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,68,93,248 ; vminps %ymm8,%ymm7,%ymm7
DB 197,220,93,231 ; vminps %ymm7,%ymm4,%ymm4
DB 197,212,93,239 ; vminps %ymm7,%ymm5,%ymm5
@@ -8190,7 +8335,7 @@ _sk_swap_rb_avx LABEL PROC
PUBLIC _sk_invert_avx
_sk_invert_avx LABEL PROC
- DB 196,98,125,24,5,42,51,2,0 ; vbroadcastss 0x2332a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,202,53,2,0 ; vbroadcastss 0x235ca(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,188,92,192 ; vsubps %ymm0,%ymm8,%ymm0
DB 197,188,92,201 ; vsubps %ymm1,%ymm8,%ymm1
DB 197,188,92,210 ; vsubps %ymm2,%ymm8,%ymm2
@@ -8236,7 +8381,7 @@ PUBLIC _sk_unpremul_avx
_sk_unpremul_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,65,100,194,200,0 ; vcmpeqps %ymm8,%ymm3,%ymm9
- DB 196,98,125,24,21,186,50,2,0 ; vbroadcastss 0x232ba(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,90,53,2,0 ; vbroadcastss 0x2355a(%rip),%ymm10 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,94,211 ; vdivps %ymm3,%ymm10,%ymm10
DB 196,67,45,74,192,144 ; vblendvps %ymm9,%ymm8,%ymm10,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
@@ -8247,17 +8392,17 @@ _sk_unpremul_avx LABEL PROC
PUBLIC _sk_from_srgb_avx
_sk_from_srgb_avx LABEL PROC
- DB 196,98,125,24,5,199,50,2,0 ; vbroadcastss 0x232c7(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,103,53,2,0 ; vbroadcastss 0x23567(%rip),%ymm8 # 2c0ec <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 197,124,89,208 ; vmulps %ymm0,%ymm0,%ymm10
- DB 196,98,125,24,29,165,50,2,0 ; vbroadcastss 0x232a5(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,69,53,2,0 ; vbroadcastss 0x23545(%rip),%ymm11 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,124,89,227 ; vmulps %ymm11,%ymm0,%ymm12
- DB 196,98,125,24,45,171,50,2,0 ; vbroadcastss 0x232ab(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,45,75,53,2,0 ; vbroadcastss 0x2354b(%rip),%ymm13 # 2c0f0 <_sk_overlay_sse2_8bit+0x4a3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,156,50,2,0 ; vbroadcastss 0x2329c(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,37,60,53,2,0 ; vbroadcastss 0x2353c(%rip),%ymm12 # 2c0f4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,146,50,2,0 ; vbroadcastss 0x23292(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,53,50,53,2,0 ; vbroadcastss 0x23532(%rip),%ymm14 # 2c0f8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,124,194,198,1 ; vcmpltps %ymm14,%ymm0,%ymm0
DB 196,195,45,74,193,0 ; vblendvps %ymm0,%ymm9,%ymm10,%ymm0
DB 196,65,116,89,200 ; vmulps %ymm8,%ymm1,%ymm9
@@ -8281,17 +8426,17 @@ _sk_from_srgb_avx LABEL PROC
PUBLIC _sk_from_srgb_dst_avx
_sk_from_srgb_dst_avx LABEL PROC
- DB 196,98,125,24,5,27,50,2,0 ; vbroadcastss 0x2321b(%rip),%ymm8 # 2bbac <_sk_overlay_sse2_8bit+0x49f>
+ DB 196,98,125,24,5,187,52,2,0 ; vbroadcastss 0x234bb(%rip),%ymm8 # 2c0ec <_sk_overlay_sse2_8bit+0x49f>
DB 196,65,92,89,200 ; vmulps %ymm8,%ymm4,%ymm9
DB 197,92,89,212 ; vmulps %ymm4,%ymm4,%ymm10
- DB 196,98,125,24,29,249,49,2,0 ; vbroadcastss 0x231f9(%rip),%ymm11 # 2bb9c <_sk_overlay_sse2_8bit+0x48f>
+ DB 196,98,125,24,29,153,52,2,0 ; vbroadcastss 0x23499(%rip),%ymm11 # 2c0dc <_sk_overlay_sse2_8bit+0x48f>
DB 196,65,92,89,227 ; vmulps %ymm11,%ymm4,%ymm12
- DB 196,98,125,24,45,255,49,2,0 ; vbroadcastss 0x231ff(%rip),%ymm13 # 2bbb0 <_sk_overlay_sse2_8bit+0x4a3>
+ DB 196,98,125,24,45,159,52,2,0 ; vbroadcastss 0x2349f(%rip),%ymm13 # 2c0f0 <_sk_overlay_sse2_8bit+0x4a3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,44,89,212 ; vmulps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,37,240,49,2,0 ; vbroadcastss 0x231f0(%rip),%ymm12 # 2bbb4 <_sk_overlay_sse2_8bit+0x4a7>
+ DB 196,98,125,24,37,144,52,2,0 ; vbroadcastss 0x23490(%rip),%ymm12 # 2c0f4 <_sk_overlay_sse2_8bit+0x4a7>
DB 196,65,44,88,212 ; vaddps %ymm12,%ymm10,%ymm10
- DB 196,98,125,24,53,230,49,2,0 ; vbroadcastss 0x231e6(%rip),%ymm14 # 2bbb8 <_sk_overlay_sse2_8bit+0x4ab>
+ DB 196,98,125,24,53,134,52,2,0 ; vbroadcastss 0x23486(%rip),%ymm14 # 2c0f8 <_sk_overlay_sse2_8bit+0x4ab>
DB 196,193,92,194,230,1 ; vcmpltps %ymm14,%ymm4,%ymm4
DB 196,195,45,74,225,64 ; vblendvps %ymm4,%ymm9,%ymm10,%ymm4
DB 196,65,84,89,200 ; vmulps %ymm8,%ymm5,%ymm9
@@ -8316,20 +8461,20 @@ _sk_from_srgb_dst_avx LABEL PROC
PUBLIC _sk_to_srgb_avx
_sk_to_srgb_avx LABEL PROC
DB 197,124,82,200 ; vrsqrtps %ymm0,%ymm9
- DB 196,98,125,24,5,123,49,2,0 ; vbroadcastss 0x2317b(%rip),%ymm8 # 2bbbc <_sk_overlay_sse2_8bit+0x4af>
+ DB 196,98,125,24,5,27,52,2,0 ; vbroadcastss 0x2341b(%rip),%ymm8 # 2c0fc <_sk_overlay_sse2_8bit+0x4af>
DB 196,65,124,89,208 ; vmulps %ymm8,%ymm0,%ymm10
- DB 196,98,125,24,29,117,49,2,0 ; vbroadcastss 0x23175(%rip),%ymm11 # 2bbc4 <_sk_overlay_sse2_8bit+0x4b7>
+ DB 196,98,125,24,29,21,52,2,0 ; vbroadcastss 0x23415(%rip),%ymm11 # 2c104 <_sk_overlay_sse2_8bit+0x4b7>
DB 196,65,52,89,227 ; vmulps %ymm11,%ymm9,%ymm12
- DB 196,98,125,24,45,99,49,2,0 ; vbroadcastss 0x23163(%rip),%ymm13 # 2bbc0 <_sk_overlay_sse2_8bit+0x4b3>
+ DB 196,98,125,24,45,3,52,2,0 ; vbroadcastss 0x23403(%rip),%ymm13 # 2c100 <_sk_overlay_sse2_8bit+0x4b3>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,52,89,228 ; vmulps %ymm12,%ymm9,%ymm12
- DB 196,98,125,24,53,88,49,2,0 ; vbroadcastss 0x23158(%rip),%ymm14 # 2bbc8 <_sk_overlay_sse2_8bit+0x4bb>
+ DB 196,98,125,24,53,248,51,2,0 ; vbroadcastss 0x233f8(%rip),%ymm14 # 2c108 <_sk_overlay_sse2_8bit+0x4bb>
DB 196,65,28,88,230 ; vaddps %ymm14,%ymm12,%ymm12
- DB 196,98,125,24,61,78,49,2,0 ; vbroadcastss 0x2314e(%rip),%ymm15 # 2bbcc <_sk_overlay_sse2_8bit+0x4bf>
+ DB 196,98,125,24,61,238,51,2,0 ; vbroadcastss 0x233ee(%rip),%ymm15 # 2c10c <_sk_overlay_sse2_8bit+0x4bf>
DB 196,65,52,88,207 ; vaddps %ymm15,%ymm9,%ymm9
DB 196,65,124,83,201 ; vrcpps %ymm9,%ymm9
DB 196,65,52,89,204 ; vmulps %ymm12,%ymm9,%ymm9
- DB 196,98,125,24,37,58,49,2,0 ; vbroadcastss 0x2313a(%rip),%ymm12 # 2bbd0 <_sk_overlay_sse2_8bit+0x4c3>
+ DB 196,98,125,24,37,218,51,2,0 ; vbroadcastss 0x233da(%rip),%ymm12 # 2c110 <_sk_overlay_sse2_8bit+0x4c3>
DB 196,193,124,194,196,1 ; vcmpltps %ymm12,%ymm0,%ymm0
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 197,124,82,201 ; vrsqrtps %ymm1,%ymm9
@@ -8364,7 +8509,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,116,93,202 ; vminps %ymm2,%ymm1,%ymm9
DB 196,65,124,93,201 ; vminps %ymm9,%ymm0,%ymm9
DB 196,65,60,92,209 ; vsubps %ymm9,%ymm8,%ymm10
- DB 196,98,125,24,29,70,48,2,0 ; vbroadcastss 0x23046(%rip),%ymm11 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,29,230,50,2,0 ; vbroadcastss 0x232e6(%rip),%ymm11 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,65,36,94,218 ; vdivps %ymm10,%ymm11,%ymm11
DB 197,116,92,226 ; vsubps %ymm2,%ymm1,%ymm12
DB 196,65,28,89,227 ; vmulps %ymm11,%ymm12,%ymm12
@@ -8374,19 +8519,19 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,115,48,2,0 ; vbroadcastss 0x23073(%rip),%ymm11 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,29,19,51,2,0 ; vbroadcastss 0x23313(%rip),%ymm11 # 2c11c <_sk_overlay_sse2_8bit+0x4cf>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,97,48,2,0 ; vbroadcastss 0x23061(%rip),%ymm11 # 2bbd8 <_sk_overlay_sse2_8bit+0x4cb>
+ DB 196,98,125,24,29,1,51,2,0 ; vbroadcastss 0x23301(%rip),%ymm11 # 2c118 <_sk_overlay_sse2_8bit+0x4cb>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,227,117,74,202,224 ; vblendvps %ymm14,%ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,73,48,2,0 ; vbroadcastss 0x23049(%rip),%ymm2 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,226,125,24,21,233,50,2,0 ; vbroadcastss 0x232e9(%rip),%ymm2 # 2c114 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,65,12,87,246 ; vxorps %ymm14,%ymm14,%ymm14
DB 196,227,13,74,210,208 ; vblendvps %ymm13,%ymm2,%ymm14,%ymm2
DB 197,188,194,192,0 ; vcmpeqps %ymm0,%ymm8,%ymm0
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
DB 196,227,117,74,194,0 ; vblendvps %ymm0,%ymm2,%ymm1,%ymm0
DB 196,193,60,88,201 ; vaddps %ymm9,%ymm8,%ymm1
- DB 196,98,125,24,37,196,47,2,0 ; vbroadcastss 0x22fc4(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,100,50,2,0 ; vbroadcastss 0x23264(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,89,212 ; vmulps %ymm12,%ymm1,%ymm2
DB 197,28,194,226,1 ; vcmpltps %ymm2,%ymm12,%ymm12
DB 196,65,36,92,216 ; vsubps %ymm8,%ymm11,%ymm11
@@ -8396,7 +8541,7 @@ _sk_rgb_to_hsl_avx LABEL PROC
DB 197,172,94,201 ; vdivps %ymm1,%ymm10,%ymm1
DB 196,195,125,74,198,128 ; vblendvps %ymm8,%ymm14,%ymm0,%ymm0
DB 196,195,117,74,206,128 ; vblendvps %ymm8,%ymm14,%ymm1,%ymm1
- DB 196,98,125,24,5,243,47,2,0 ; vbroadcastss 0x22ff3(%rip),%ymm8 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,5,147,50,2,0 ; vbroadcastss 0x23293(%rip),%ymm8 # 2c120 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -8411,7 +8556,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,252,17,28,36 ; vmovups %ymm3,(%rsp)
DB 197,252,40,225 ; vmovaps %ymm1,%ymm4
DB 197,252,40,216 ; vmovaps %ymm0,%ymm3
- DB 196,98,125,24,5,74,47,2,0 ; vbroadcastss 0x22f4a(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,234,49,2,0 ; vbroadcastss 0x231ea(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,60,194,202,2 ; vcmpleps %ymm2,%ymm8,%ymm9
DB 197,92,89,210 ; vmulps %ymm2,%ymm4,%ymm10
DB 196,65,92,92,218 ; vsubps %ymm10,%ymm4,%ymm11
@@ -8419,23 +8564,23 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,52,88,210 ; vaddps %ymm2,%ymm9,%ymm10
DB 197,108,88,202 ; vaddps %ymm2,%ymm2,%ymm9
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,29,140,47,2,0 ; vbroadcastss 0x22f8c(%rip),%ymm11 # 2bbe4 <_sk_overlay_sse2_8bit+0x4d7>
+ DB 196,98,125,24,29,44,50,2,0 ; vbroadcastss 0x2322c(%rip),%ymm11 # 2c124 <_sk_overlay_sse2_8bit+0x4d7>
DB 196,65,100,88,219 ; vaddps %ymm11,%ymm3,%ymm11
DB 196,67,125,8,227,1 ; vroundps $0x1,%ymm11,%ymm12
DB 196,65,36,92,252 ; vsubps %ymm12,%ymm11,%ymm15
DB 196,65,44,92,217 ; vsubps %ymm9,%ymm10,%ymm11
- DB 196,98,125,24,37,94,47,2,0 ; vbroadcastss 0x22f5e(%rip),%ymm12 # 2bbd4 <_sk_overlay_sse2_8bit+0x4c7>
+ DB 196,98,125,24,37,254,49,2,0 ; vbroadcastss 0x231fe(%rip),%ymm12 # 2c114 <_sk_overlay_sse2_8bit+0x4c7>
DB 196,193,4,89,196 ; vmulps %ymm12,%ymm15,%ymm0
- DB 196,98,125,24,45,88,47,2,0 ; vbroadcastss 0x22f58(%rip),%ymm13 # 2bbdc <_sk_overlay_sse2_8bit+0x4cf>
+ DB 196,98,125,24,45,248,49,2,0 ; vbroadcastss 0x231f8(%rip),%ymm13 # 2c11c <_sk_overlay_sse2_8bit+0x4cf>
DB 197,20,92,240 ; vsubps %ymm0,%ymm13,%ymm14
DB 196,65,36,89,246 ; vmulps %ymm14,%ymm11,%ymm14
DB 196,65,52,88,246 ; vaddps %ymm14,%ymm9,%ymm14
- DB 196,226,125,24,13,77,47,2,0 ; vbroadcastss 0x22f4d(%rip),%ymm1 # 2bbe8 <_sk_overlay_sse2_8bit+0x4db>
+ DB 196,226,125,24,13,237,49,2,0 ; vbroadcastss 0x231ed(%rip),%ymm1 # 2c128 <_sk_overlay_sse2_8bit+0x4db>
DB 196,193,116,194,255,2 ; vcmpleps %ymm15,%ymm1,%ymm7
DB 196,195,13,74,249,112 ; vblendvps %ymm7,%ymm9,%ymm14,%ymm7
DB 196,65,60,194,247,2 ; vcmpleps %ymm15,%ymm8,%ymm14
DB 196,227,45,74,255,224 ; vblendvps %ymm14,%ymm7,%ymm10,%ymm7
- DB 196,98,125,24,53,36,47,2,0 ; vbroadcastss 0x22f24(%rip),%ymm14 # 2bbe0 <_sk_overlay_sse2_8bit+0x4d3>
+ DB 196,98,125,24,53,196,49,2,0 ; vbroadcastss 0x231c4(%rip),%ymm14 # 2c120 <_sk_overlay_sse2_8bit+0x4d3>
DB 196,65,12,194,255,2 ; vcmpleps %ymm15,%ymm14,%ymm15
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,180,88,192 ; vaddps %ymm0,%ymm9,%ymm0
@@ -8454,7 +8599,7 @@ _sk_hsl_to_rgb_avx LABEL PROC
DB 197,164,89,247 ; vmulps %ymm7,%ymm11,%ymm6
DB 197,180,88,246 ; vaddps %ymm6,%ymm9,%ymm6
DB 196,227,77,74,237,0 ; vblendvps %ymm0,%ymm5,%ymm6,%ymm5
- DB 196,226,125,24,5,206,46,2,0 ; vbroadcastss 0x22ece(%rip),%ymm0 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,226,125,24,5,110,49,2,0 ; vbroadcastss 0x2316e(%rip),%ymm0 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
DB 197,228,88,192 ; vaddps %ymm0,%ymm3,%ymm0
DB 196,227,125,8,216,1 ; vroundps $0x1,%ymm0,%ymm3
DB 197,252,92,195 ; vsubps %ymm3,%ymm0,%ymm0
@@ -8505,15 +8650,15 @@ _sk_scale_u8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,75 ; jne 8e2b <_sk_scale_u8_avx+0x64>
+ DB 117,75 ; jne 90cb <_sk_scale_u8_avx+0x64>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,34,55,2,0 ; vpand 0x23722(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,57,219,5,194,57,2,0 ; vpand 0x239c2(%rip),%xmm8,%xmm8 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,223,45,2,0 ; vbroadcastss 0x22ddf(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,127,48,2,0 ; vbroadcastss 0x2307f(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 197,188,89,201 ; vmulps %ymm1,%ymm8,%ymm1
@@ -8527,15 +8672,15 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,166 ; ja 8de6 <_sk_scale_u8_avx+0x1f>
+ DB 119,166 ; ja 9086 <_sk_scale_u8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 8ec4 <_sk_scale_u8_avx+0xfd>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # 9164 <_sk_scale_u8_avx+0xfd>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 235,135 ; jmp 8de6 <_sk_scale_u8_avx+0x1f>
+ DB 235,135 ; jmp 9086 <_sk_scale_u8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8543,7 +8688,7 @@ _sk_scale_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,94,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f>
+ DB 233,94,255,255,255 ; jmpq 9086 <_sk_scale_u8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8554,7 +8699,7 @@ _sk_scale_u8_avx LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,34,255,255,255 ; jmpq 8de6 <_sk_scale_u8_avx+0x1f>
+ DB 233,34,255,255,255 ; jmpq 9086 <_sk_scale_u8_avx+0x1f>
DB 144 ; nop
DB 255 ; (bad)
DB 255 ; (bad)
@@ -8587,26 +8732,26 @@ _sk_scale_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,178,0,0,0 ; jne 8fb2 <_sk_scale_565_avx+0xd2>
+ DB 15,133,178,0,0,0 ; jne 9252 <_sk_scale_565_avx+0xd2>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,208,44,2,0 ; vbroadcastss 0x22cd0(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,24,13,112,47,2,0 ; vbroadcastss 0x22f70(%rip),%ymm9 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,193,44,2,0 ; vbroadcastss 0x22cc1(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,97,47,2,0 ; vbroadcastss 0x22f61(%rip),%ymm10 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,183,44,2,0 ; vbroadcastss 0x22cb7(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,24,21,87,47,2,0 ; vbroadcastss 0x22f57(%rip),%ymm10 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,168,44,2,0 ; vbroadcastss 0x22ca8(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,72,47,2,0 ; vbroadcastss 0x22f48(%rip),%ymm11 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,158,44,2,0 ; vbroadcastss 0x22c9e(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,24,29,62,47,2,0 ; vbroadcastss 0x22f3e(%rip),%ymm11 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,143,44,2,0 ; vbroadcastss 0x22c8f(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,47,47,2,0 ; vbroadcastss 0x22f2f(%rip),%ymm11 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -8626,27 +8771,27 @@ _sk_scale_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,59,255,255,255 ; ja 8f06 <_sk_scale_565_avx+0x26>
+ DB 15,135,59,255,255,255 ; ja 91a6 <_sk_scale_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 903c <_sk_scale_565_avx+0x15c>
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 92dc <_sk_scale_565_avx+0x15c>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,25,255,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 233,25,255,255,255 ; jmpq 91a6 <_sk_scale_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,251,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 233,251,254,255,255 ; jmpq 91a6 <_sk_scale_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,205,254,255,255 ; jmpq 8f06 <_sk_scale_565_avx+0x26>
+ DB 233,205,254,255,255 ; jmpq 91a6 <_sk_scale_565_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
@@ -8695,15 +8840,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,111 ; jne 911f <_sk_lerp_u8_avx+0x88>
+ DB 117,111 ; jne 93bf <_sk_lerp_u8_avx+0x88>
DB 196,66,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm8
- DB 197,57,219,5,82,52,2,0 ; vpand 0x23452(%rip),%xmm8,%xmm8 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,57,219,5,242,54,2,0 ; vpand 0x236f2(%rip),%xmm8,%xmm8 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,13,15,43,2,0 ; vbroadcastss 0x22b0f(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,175,45,2,0 ; vbroadcastss 0x22daf(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,252,92,196 ; vsubps %ymm4,%ymm0,%ymm0
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
@@ -8725,15 +8870,15 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,130 ; ja 90b6 <_sk_lerp_u8_avx+0x1f>
+ DB 119,130 ; ja 9356 <_sk_lerp_u8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 91bc <_sk_lerp_u8_avx+0x125>
+ DB 76,141,29,125,0,0,0 ; lea 0x7d(%rip),%r11 # 945c <_sk_lerp_u8_avx+0x125>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,96,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
+ DB 233,96,255,255,255 ; jmpq 9356 <_sk_lerp_u8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,2 ; vpinsrw $0x2,%eax,%xmm8,%xmm8
@@ -8741,7 +8886,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 197,121,110,200 ; vmovd %eax,%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,55,255,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
+ DB 233,55,255,255,255 ; jmpq 9356 <_sk_lerp_u8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 197,57,196,192,6 ; vpinsrw $0x6,%eax,%xmm8,%xmm8
@@ -8752,7 +8897,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 196,65,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm9
DB 196,66,121,48,201 ; vpmovzxbw %xmm9,%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,251,254,255,255 ; jmpq 90b6 <_sk_lerp_u8_avx+0x1f>
+ DB 233,251,254,255,255 ; jmpq 9356 <_sk_lerp_u8_avx+0x1f>
DB 144 ; nop
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -8760,7 +8905,7 @@ _sk_lerp_u8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0091cc <_sk_overlay_sse2_8bit+0xffffffffdefddabf>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00946c <_sk_overlay_sse2_8bit+0xffffffffdefdd81f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -8782,26 +8927,26 @@ _sk_lerp_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,214,0,0,0 ; jne 92ce <_sk_lerp_565_avx+0xf6>
+ DB 15,133,214,0,0,0 ; jne 956e <_sk_lerp_565_avx+0xf6>
DB 196,65,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,65,57,105,201 ; vpunpckhwd %xmm9,%xmm8,%xmm9
DB 196,66,121,51,192 ; vpmovzxwd %xmm8,%xmm8
DB 196,67,61,24,193,1 ; vinsertf128 $0x1,%xmm9,%ymm8,%ymm8
- DB 196,98,125,24,13,216,41,2,0 ; vbroadcastss 0x229d8(%rip),%ymm9 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,98,125,24,13,120,44,2,0 ; vbroadcastss 0x22c78(%rip),%ymm9 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 196,65,60,84,201 ; vandps %ymm9,%ymm8,%ymm9
DB 196,65,124,91,201 ; vcvtdq2ps %ymm9,%ymm9
- DB 196,98,125,24,21,201,41,2,0 ; vbroadcastss 0x229c9(%rip),%ymm10 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,98,125,24,21,105,44,2,0 ; vbroadcastss 0x22c69(%rip),%ymm10 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,191,41,2,0 ; vbroadcastss 0x229bf(%rip),%ymm10 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,98,125,24,21,95,44,2,0 ; vbroadcastss 0x22c5f(%rip),%ymm10 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 196,65,60,84,210 ; vandps %ymm10,%ymm8,%ymm10
DB 196,65,124,91,210 ; vcvtdq2ps %ymm10,%ymm10
- DB 196,98,125,24,29,176,41,2,0 ; vbroadcastss 0x229b0(%rip),%ymm11 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,98,125,24,29,80,44,2,0 ; vbroadcastss 0x22c50(%rip),%ymm11 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
- DB 196,98,125,24,29,166,41,2,0 ; vbroadcastss 0x229a6(%rip),%ymm11 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,98,125,24,29,70,44,2,0 ; vbroadcastss 0x22c46(%rip),%ymm11 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 196,65,60,84,195 ; vandps %ymm11,%ymm8,%ymm8
DB 196,65,124,91,192 ; vcvtdq2ps %ymm8,%ymm8
- DB 196,98,125,24,29,151,41,2,0 ; vbroadcastss 0x22997(%rip),%ymm11 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,98,125,24,29,55,44,2,0 ; vbroadcastss 0x22c37(%rip),%ymm11 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 197,100,194,223,1 ; vcmpltps %ymm7,%ymm3,%ymm11
DB 196,65,44,93,224 ; vminps %ymm8,%ymm10,%ymm12
@@ -8829,27 +8974,27 @@ _sk_lerp_565_avx LABEL PROC
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,23,255,255,255 ; ja 91fe <_sk_lerp_565_avx+0x26>
+ DB 15,135,23,255,255,255 ; ja 949e <_sk_lerp_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 9358 <_sk_lerp_565_avx+0x180>
+ DB 76,141,29,102,0,0,0 ; lea 0x66(%rip),%r11 # 95f8 <_sk_lerp_565_avx+0x180>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,121,110,192 ; vmovd %eax,%xmm8
- DB 233,245,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
+ DB 233,245,254,255,255 ; jmpq 949e <_sk_lerp_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm9
DB 196,67,57,14,193,3 ; vpblendw $0x3,%xmm9,%xmm8,%xmm8
- DB 233,215,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
+ DB 233,215,254,255,255 ; jmpq 949e <_sk_lerp_565_avx+0x26>
DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
DB 196,65,57,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,57,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm8,%xmm8
DB 196,65,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm9
DB 196,67,49,14,192,240 ; vpblendw $0xf0,%xmm8,%xmm9,%xmm8
- DB 233,169,254,255,255 ; jmpq 91fe <_sk_lerp_565_avx+0x26>
+ DB 233,169,254,255,255 ; jmpq 949e <_sk_lerp_565_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 163,255,255,255,190,255,255,255,177 ; movabs %eax,0xb1ffffffbeffffff
DB 255 ; (bad)
@@ -8876,9 +9021,9 @@ _sk_load_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,7,2,0,0 ; jne 9592 <_sk_load_tables_avx+0x21e>
+ DB 15,133,7,2,0,0 ; jne 9832 <_sk_load_tables_avx+0x21e>
DB 196,65,125,16,20,145 ; vmovupd (%r9,%rdx,4),%ymm10
- DB 197,125,40,13,167,44,2,0 ; vmovapd 0x22ca7(%rip),%ymm9 # 2c040 <_sk_overlay_sse2_8bit+0x933>
+ DB 197,125,40,13,71,47,2,0 ; vmovapd 0x22f47(%rip),%ymm9 # 2c580 <_sk_overlay_sse2_8bit+0x933>
DB 196,193,45,84,201 ; vandpd %ymm9,%ymm10,%ymm1
DB 196,227,125,25,200,1 ; vextractf128 $0x1,%ymm1,%xmm0
DB 196,193,249,126,193 ; vmovq %xmm0,%r9
@@ -8970,7 +9115,7 @@ _sk_load_tables_avx LABEL PROC
DB 196,193,65,114,213,24 ; vpsrld $0x18,%xmm13,%xmm7
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,111,38,2,0 ; vbroadcastss 0x2266f(%rip),%ymm7 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,61,15,41,2,0 ; vbroadcastss 0x2290f(%rip),%ymm7 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -8981,21 +9126,21 @@ _sk_load_tables_avx LABEL PROC
DB 196,65,44,87,210 ; vxorps %ymm10,%ymm10,%ymm10
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,230,253,255,255 ; ja 9391 <_sk_load_tables_avx+0x1d>
+ DB 15,135,230,253,255,255 ; ja 9631 <_sk_load_tables_avx+0x1d>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 9648 <_sk_load_tables_avx+0x2d4>
+ DB 76,141,29,146,0,0,0 ; lea 0x92(%rip),%r11 # 98e8 <_sk_load_tables_avx+0x2d4>
DB 79,99,20,147 ; movslq (%r11,%r10,4),%r10
DB 77,1,218 ; add %r11,%r10
DB 65,255,226 ; jmpq *%r10
DB 196,65,122,16,20,145 ; vmovss (%r9,%rdx,4),%xmm10
- DB 233,198,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
+ DB 233,198,253,255,255 ; jmpq 9631 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,145,8 ; vmovd 0x8(%r9,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,208,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm10
DB 196,193,123,16,4,145 ; vmovsd (%r9,%rdx,4),%xmm0
DB 196,99,45,13,208,1 ; vblendpd $0x1,%ymm0,%ymm10,%ymm10
- DB 233,159,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
+ DB 233,159,253,255,255 ; jmpq 9631 <_sk_load_tables_avx+0x1d>
DB 196,193,121,110,68,145,24 ; vmovd 0x18(%r9,%rdx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -9009,9 +9154,9 @@ _sk_load_tables_avx LABEL PROC
DB 196,99,45,24,208,1 ; vinsertf128 $0x1,%xmm0,%ymm10,%ymm10
DB 196,193,121,16,4,145 ; vmovupd (%r9,%rdx,4),%xmm0
DB 196,67,125,13,210,12 ; vblendpd $0xc,%ymm10,%ymm0,%ymm10
- DB 233,74,253,255,255 ; jmpq 9391 <_sk_load_tables_avx+0x1d>
+ DB 233,74,253,255,255 ; jmpq 9631 <_sk_load_tables_avx+0x1d>
DB 144 ; nop
- DB 120,255 ; js 9649 <_sk_load_tables_avx+0x2d5>
+ DB 120,255 ; js 98e9 <_sk_load_tables_avx+0x2d5>
DB 255 ; (bad)
DB 255,153,255,255,255,131 ; lcall *-0x7c000001(%rcx)
DB 255 ; (bad)
@@ -9040,7 +9185,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,60,36 ; vmovups %ymm7,(%rsp)
- DB 15,133,87,2,0,0 ; jne 98da <_sk_load_tables_u16_be_avx+0x276>
+ DB 15,133,87,2,0,0 ; jne 9b7a <_sk_load_tables_u16_be_avx+0x276>
DB 196,1,121,16,4,81 ; vmovupd (%r9,%r10,2),%xmm8
DB 196,129,121,16,84,81,16 ; vmovupd 0x10(%r9,%r10,2),%xmm2
DB 196,129,121,16,92,81,32 ; vmovupd 0x20(%r9,%r10,2),%xmm3
@@ -9055,7 +9200,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 197,113,105,219 ; vpunpckhwd %xmm3,%xmm1,%xmm11
DB 197,177,108,200 ; vpunpcklqdq %xmm0,%xmm9,%xmm1
DB 197,49,109,224 ; vpunpckhqdq %xmm0,%xmm9,%xmm12
- DB 197,121,111,21,64,46,2,0 ; vmovdqa 0x22e40(%rip),%xmm10 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,121,111,21,224,48,2,0 ; vmovdqa 0x230e0(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 196,193,113,219,202 ; vpand %xmm10,%xmm1,%xmm1
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 196,193,113,105,209 ; vpunpckhwd %xmm9,%xmm1,%xmm2
@@ -9153,7 +9298,7 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
DB 196,227,101,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,226,125,24,61,67,35,2,0 ; vbroadcastss 0x22343(%rip),%ymm7 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,226,125,24,61,227,37,2,0 ; vbroadcastss 0x225e3(%rip),%ymm7 # 2c14c <_sk_overlay_sse2_8bit+0x4ff>
DB 197,228,89,223 ; vmulps %ymm7,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,16,60,36 ; vmovups (%rsp),%ymm7
@@ -9162,29 +9307,29 @@ _sk_load_tables_u16_be_avx LABEL PROC
DB 196,1,123,16,4,81 ; vmovsd (%r9,%r10,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je 9940 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 116,85 ; je 9be0 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,1,57,22,68,81,8 ; vmovhpd 0x8(%r9,%r10,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb 9940 <_sk_load_tables_u16_be_avx+0x2dc>
+ DB 114,72 ; jb 9be0 <_sk_load_tables_u16_be_avx+0x2dc>
DB 196,129,123,16,84,81,16 ; vmovsd 0x10(%r9,%r10,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je 994d <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 116,72 ; je 9bed <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,105,22,84,81,24 ; vmovhpd 0x18(%r9,%r10,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb 994d <_sk_load_tables_u16_be_avx+0x2e9>
+ DB 114,59 ; jb 9bed <_sk_load_tables_u16_be_avx+0x2e9>
DB 196,129,123,16,92,81,32 ; vmovsd 0x20(%r9,%r10,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,123,253,255,255 ; je 969e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,132,123,253,255,255 ; je 993e <_sk_load_tables_u16_be_avx+0x3a>
DB 196,129,97,22,92,81,40 ; vmovhpd 0x28(%r9,%r10,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,106,253,255,255 ; jb 969e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 15,130,106,253,255,255 ; jb 993e <_sk_load_tables_u16_be_avx+0x3a>
DB 196,1,122,126,76,81,48 ; vmovq 0x30(%r9,%r10,2),%xmm9
- DB 233,94,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,94,253,255,255 ; jmpq 993e <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,81,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,81,253,255,255 ; jmpq 993e <_sk_load_tables_u16_be_avx+0x3a>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,72,253,255,255 ; jmpq 969e <_sk_load_tables_u16_be_avx+0x3a>
+ DB 233,72,253,255,255 ; jmpq 993e <_sk_load_tables_u16_be_avx+0x3a>
PUBLIC _sk_load_tables_rgb_u16_be_avx
_sk_load_tables_rgb_u16_be_avx LABEL PROC
@@ -9195,29 +9340,29 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 77,133,192 ; test %r8,%r8
DB 197,252,17,124,36,32 ; vmovups %ymm7,0x20(%rsp)
DB 197,252,17,52,36 ; vmovups %ymm6,(%rsp)
- DB 15,133,74,2,0,0 ; jne 9bc1 <_sk_load_tables_rgb_u16_be_avx+0x26b>
- DB 196,129,122,111,4,81 ; vmovdqu (%r9,%r10,2),%xmm0
- DB 196,129,122,111,84,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm2
- DB 196,129,122,111,76,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm1
- DB 196,129,122,111,92,81,32 ; vmovdqu 0x20(%r9,%r10,2),%xmm3
- DB 197,225,115,219,4 ; vpsrldq $0x4,%xmm3,%xmm3
- DB 197,185,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm8
- DB 197,177,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm9
- DB 197,161,115,217,6 ; vpsrldq $0x6,%xmm1,%xmm11
+ DB 15,133,75,2,0,0 ; jne 9e62 <_sk_load_tables_rgb_u16_be_avx+0x26c>
+ DB 196,1,122,111,28,81 ; vmovdqu (%r9,%r10,2),%xmm11
+ DB 196,129,122,111,92,81,12 ; vmovdqu 0xc(%r9,%r10,2),%xmm3
+ DB 196,129,122,111,84,81,24 ; vmovdqu 0x18(%r9,%r10,2),%xmm2
+ DB 196,129,122,111,68,81,32 ; vmovdqu 0x20(%r9,%r10,2),%xmm0
+ DB 197,249,115,216,4 ; vpsrldq $0x4,%xmm0,%xmm0
+ DB 196,193,57,115,219,6 ; vpsrldq $0x6,%xmm11,%xmm8
DB 197,169,115,219,6 ; vpsrldq $0x6,%xmm3,%xmm10
- DB 197,249,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm0
- DB 196,193,57,97,209 ; vpunpcklwd %xmm9,%xmm8,%xmm2
- DB 197,241,97,203 ; vpunpcklwd %xmm3,%xmm1,%xmm1
- DB 196,193,33,97,218 ; vpunpcklwd %xmm10,%xmm11,%xmm3
- DB 197,121,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm8
+ DB 197,153,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm12
+ DB 197,177,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm9
+ DB 197,161,97,219 ; vpunpcklwd %xmm3,%xmm11,%xmm3
+ DB 196,193,57,97,202 ; vpunpcklwd %xmm10,%xmm8,%xmm1
+ DB 197,233,97,192 ; vpunpcklwd %xmm0,%xmm2,%xmm0
+ DB 196,193,25,97,209 ; vpunpcklwd %xmm9,%xmm12,%xmm2
+ DB 197,97,97,193 ; vpunpcklwd %xmm1,%xmm3,%xmm8
+ DB 197,225,105,201 ; vpunpckhwd %xmm1,%xmm3,%xmm1
+ DB 197,249,97,218 ; vpunpcklwd %xmm2,%xmm0,%xmm3
DB 197,249,105,194 ; vpunpckhwd %xmm2,%xmm0,%xmm0
- DB 197,241,97,211 ; vpunpcklwd %xmm3,%xmm1,%xmm2
- DB 197,241,105,203 ; vpunpckhwd %xmm3,%xmm1,%xmm1
- DB 197,185,108,218 ; vpunpcklqdq %xmm2,%xmm8,%xmm3
- DB 197,57,109,218 ; vpunpckhqdq %xmm2,%xmm8,%xmm11
- DB 197,121,108,193 ; vpunpcklqdq %xmm1,%xmm0,%xmm8
- DB 197,121,111,13,47,43,2,0 ; vmovdqa 0x22b2f(%rip),%xmm9 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
- DB 196,193,97,219,193 ; vpand %xmm9,%xmm3,%xmm0
+ DB 197,185,108,211 ; vpunpcklqdq %xmm3,%xmm8,%xmm2
+ DB 197,57,109,219 ; vpunpckhqdq %xmm3,%xmm8,%xmm11
+ DB 197,113,108,192 ; vpunpcklqdq %xmm0,%xmm1,%xmm8
+ DB 197,121,111,13,206,45,2,0 ; vmovdqa 0x22dce(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
+ DB 196,193,105,219,193 ; vpand %xmm9,%xmm2,%xmm0
DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
DB 196,193,121,105,202 ; vpunpckhwd %xmm10,%xmm0,%xmm1
DB 196,193,249,126,201 ; vmovq %xmm1,%r9
@@ -9306,49 +9451,77 @@ _sk_load_tables_rgb_u16_be_avx LABEL PROC
DB 196,195,105,33,211,48 ; vinsertps $0x30,%xmm11,%xmm2,%xmm2
DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,204,31,2,0 ; vbroadcastss 0x21fcc(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,107,34,2,0 ; vbroadcastss 0x2226b(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,52,36 ; vmovups (%rsp),%ymm6
DB 197,252,16,124,36,32 ; vmovups 0x20(%rsp),%ymm7
DB 72,131,196,88 ; add $0x58,%rsp
DB 255,224 ; jmpq *%rax
DB 196,129,121,110,4,81 ; vmovd (%r9,%r10,2),%xmm0
- DB 196,129,121,196,68,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm0
+ DB 196,1,121,196,92,81,4,2 ; vpinsrw $0x2,0x4(%r9,%r10,2),%xmm0,%xmm11
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne 9bda <_sk_load_tables_rgb_u16_be_avx+0x284>
- DB 233,209,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 196,129,121,110,76,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm1
- DB 196,1,113,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm1,%xmm8
+ DB 117,32 ; jne 9e9b <_sk_load_tables_rgb_u16_be_avx+0x2a5>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 233,177,253,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 196,129,121,110,68,81,6 ; vmovd 0x6(%r9,%r10,2),%xmm0
+ DB 196,1,121,196,68,81,10,2 ; vpinsrw $0x2,0xa(%r9,%r10,2),%xmm0,%xmm8
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb 9c09 <_sk_load_tables_rgb_u16_be_avx+0x2b3>
- DB 196,129,121,110,76,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm1
- DB 196,129,113,196,84,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm1,%xmm2
+ DB 114,49 ; jb 9ee6 <_sk_load_tables_rgb_u16_be_avx+0x2f0>
+ DB 196,129,121,110,68,81,12 ; vmovd 0xc(%r9,%r10,2),%xmm0
+ DB 196,129,121,196,92,81,16,2 ; vpinsrw $0x2,0x10(%r9,%r10,2),%xmm0,%xmm3
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne 9c0e <_sk_load_tables_rgb_u16_be_avx+0x2b8>
- DB 233,162,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,157,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 196,129,121,110,76,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm1
- DB 196,1,113,196,76,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm1,%xmm9
+ DB 117,50 ; jne 9f01 <_sk_load_tables_rgb_u16_be_avx+0x30b>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 233,102,253,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 233,75,253,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 196,129,121,110,68,81,18 ; vmovd 0x12(%r9,%r10,2),%xmm0
+ DB 196,1,121,196,84,81,22,2 ; vpinsrw $0x2,0x16(%r9,%r10,2),%xmm0,%xmm10
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb 9c3d <_sk_load_tables_rgb_u16_be_avx+0x2e7>
- DB 196,129,121,110,76,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm1
- DB 196,129,113,196,76,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm1,%xmm1
+ DB 114,40 ; jb 9f43 <_sk_load_tables_rgb_u16_be_avx+0x34d>
+ DB 196,129,121,110,68,81,24 ; vmovd 0x18(%r9,%r10,2),%xmm0
+ DB 196,129,121,196,84,81,28,2 ; vpinsrw $0x2,0x1c(%r9,%r10,2),%xmm0,%xmm2
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne 9c42 <_sk_load_tables_rgb_u16_be_avx+0x2ec>
- DB 233,110,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,105,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 196,129,121,110,92,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm3
- DB 196,1,97,196,92,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm3,%xmm11
+ DB 117,32 ; jne 9f55 <_sk_load_tables_rgb_u16_be_avx+0x35f>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 233,9,253,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 233,247,252,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 196,129,121,110,68,81,30 ; vmovd 0x1e(%r9,%r10,2),%xmm0
+ DB 196,1,121,196,100,81,34,2 ; vpinsrw $0x2,0x22(%r9,%r10,2),%xmm0,%xmm12
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb 9c6b <_sk_load_tables_rgb_u16_be_avx+0x315>
- DB 196,129,121,110,92,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm3
- DB 196,129,97,196,92,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm3,%xmm3
- DB 233,64,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
- DB 233,59,253,255,255 ; jmpq 99ab <_sk_load_tables_rgb_u16_be_avx+0x55>
+ DB 114,25 ; jb 9f88 <_sk_load_tables_rgb_u16_be_avx+0x392>
+ DB 196,129,121,110,68,81,36 ; vmovd 0x24(%r9,%r10,2),%xmm0
+ DB 196,129,121,196,68,81,40,2 ; vpinsrw $0x2,0x28(%r9,%r10,2),%xmm0,%xmm0
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
+ DB 233,196,252,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 233,187,252,255,255 ; jmpq 9c4c <_sk_load_tables_rgb_u16_be_avx+0x56>
PUBLIC _sk_byte_tables_avx
_sk_byte_tables_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,45,31,2,0 ; vbroadcastss 0x21f2d(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,76,33,2,0 ; vbroadcastss 0x2214c(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 197,125,91,200 ; vcvtps2dq %ymm0,%ymm9
DB 196,65,249,126,201 ; vmovq %xmm9,%r9
@@ -9467,7 +9640,7 @@ _sk_byte_tables_avx LABEL PROC
DB 196,194,121,49,204 ; vpmovzxbd %xmm12,%xmm1
DB 196,194,121,49,213 ; vpmovzxbd %xmm13,%xmm2
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
- DB 196,98,125,24,13,27,29,2,0 ; vbroadcastss 0x21d1b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,58,31,2,0 ; vbroadcastss 0x21f3a(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
DB 196,193,116,89,201 ; vmulps %ymm9,%ymm1,%ymm1
@@ -9581,7 +9754,7 @@ _sk_byte_tables_rgb_avx LABEL PROC
DB 196,194,121,49,203 ; vpmovzxbd %xmm11,%xmm1
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,248,26,2,0 ; vbroadcastss 0x21af8(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,23,29,2,0 ; vbroadcastss 0x21d17(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,194,121,49,202 ; vpmovzxbd %xmm10,%xmm1
DB 196,194,121,49,212 ; vpmovzxbd %xmm12,%xmm2
@@ -9776,36 +9949,36 @@ _sk_parametric_r_avx LABEL PROC
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,216 ; vcvtdq2ps %ymm0,%ymm11
- DB 196,98,125,24,37,193,23,2,0 ; vbroadcastss 0x217c1(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,224,25,2,0 ; vbroadcastss 0x219e0(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,183,23,2,0 ; vbroadcastss 0x217b7(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,214,25,2,0 ; vbroadcastss 0x219d6(%rip),%ymm12 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,124,84,196 ; vandps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,13,23,2,0 ; vbroadcastss 0x2170d(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,44,25,2,0 ; vbroadcastss 0x2192c(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,124,86,196 ; vorps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,159,23,2,0 ; vbroadcastss 0x2179f(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,190,25,2,0 ; vbroadcastss 0x219be(%rip),%ymm12 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,149,23,2,0 ; vbroadcastss 0x21795(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,180,25,2,0 ; vbroadcastss 0x219b4(%rip),%ymm12 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,124,89,228 ; vmulps %ymm12,%ymm0,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,134,23,2,0 ; vbroadcastss 0x21786(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,165,25,2,0 ; vbroadcastss 0x219a5(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,37,124,23,2,0 ; vbroadcastss 0x2177c(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,155,25,2,0 ; vbroadcastss 0x2199b(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,192 ; vdivps %ymm0,%ymm12,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
DB 197,172,89,192 ; vmulps %ymm0,%ymm10,%ymm0
DB 196,99,125,8,208,1 ; vroundps $0x1,%ymm0,%ymm10
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,96,23,2,0 ; vbroadcastss 0x21760(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,127,25,2,0 ; vbroadcastss 0x2197f(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,195 ; vaddps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,86,23,2,0 ; vbroadcastss 0x21756(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,117,25,2,0 ; vbroadcastss 0x21975(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,124,92,195 ; vsubps %ymm11,%ymm0,%ymm0
- DB 196,98,125,24,29,71,23,2,0 ; vbroadcastss 0x21747(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,102,25,2,0 ; vbroadcastss 0x21966(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,61,23,2,0 ; vbroadcastss 0x2173d(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,92,25,2,0 ; vbroadcastss 0x2195c(%rip),%ymm11 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,124,88,194 ; vaddps %ymm10,%ymm0,%ymm0
- DB 196,98,125,24,21,46,23,2,0 ; vbroadcastss 0x2172e(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,77,25,2,0 ; vbroadcastss 0x2194d(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,124,89,194 ; vmulps %ymm10,%ymm0,%ymm0
DB 197,253,91,192 ; vcvtps2dq %ymm0,%ymm0
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9813,7 +9986,7 @@ _sk_parametric_r_avx LABEL PROC
DB 196,195,125,74,193,128 ; vblendvps %ymm8,%ymm9,%ymm0,%ymm0
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,124,95,192 ; vmaxps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,69,22,2,0 ; vbroadcastss 0x21645(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,100,24,2,0 ; vbroadcastss 0x21864(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9833,36 +10006,36 @@ _sk_parametric_g_avx LABEL PROC
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,217 ; vcvtdq2ps %ymm1,%ymm11
- DB 196,98,125,24,37,134,22,2,0 ; vbroadcastss 0x21686(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,165,24,2,0 ; vbroadcastss 0x218a5(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,124,22,2,0 ; vbroadcastss 0x2167c(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,155,24,2,0 ; vbroadcastss 0x2189b(%rip),%ymm12 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,116,84,204 ; vandps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,210,21,2,0 ; vbroadcastss 0x215d2(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,241,23,2,0 ; vbroadcastss 0x217f1(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,116,86,204 ; vorps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,100,22,2,0 ; vbroadcastss 0x21664(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,131,24,2,0 ; vbroadcastss 0x21883(%rip),%ymm12 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,90,22,2,0 ; vbroadcastss 0x2165a(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,121,24,2,0 ; vbroadcastss 0x21879(%rip),%ymm12 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,116,89,228 ; vmulps %ymm12,%ymm1,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,75,22,2,0 ; vbroadcastss 0x2164b(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,106,24,2,0 ; vbroadcastss 0x2186a(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,116,88,204 ; vaddps %ymm12,%ymm1,%ymm1
- DB 196,98,125,24,37,65,22,2,0 ; vbroadcastss 0x21641(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,96,24,2,0 ; vbroadcastss 0x21860(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,201 ; vdivps %ymm1,%ymm12,%ymm1
DB 197,164,92,201 ; vsubps %ymm1,%ymm11,%ymm1
DB 197,172,89,201 ; vmulps %ymm1,%ymm10,%ymm1
DB 196,99,125,8,209,1 ; vroundps $0x1,%ymm1,%ymm10
DB 196,65,116,92,210 ; vsubps %ymm10,%ymm1,%ymm10
- DB 196,98,125,24,29,37,22,2,0 ; vbroadcastss 0x21625(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,68,24,2,0 ; vbroadcastss 0x21844(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,27,22,2,0 ; vbroadcastss 0x2161b(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,58,24,2,0 ; vbroadcastss 0x2183a(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,116,92,203 ; vsubps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,29,12,22,2,0 ; vbroadcastss 0x2160c(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,43,24,2,0 ; vbroadcastss 0x2182b(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,2,22,2,0 ; vbroadcastss 0x21602(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,33,24,2,0 ; vbroadcastss 0x21821(%rip),%ymm11 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,21,243,21,2,0 ; vbroadcastss 0x215f3(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,18,24,2,0 ; vbroadcastss 0x21812(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,116,89,202 ; vmulps %ymm10,%ymm1,%ymm1
DB 197,253,91,201 ; vcvtps2dq %ymm1,%ymm1
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9870,7 +10043,7 @@ _sk_parametric_g_avx LABEL PROC
DB 196,195,117,74,201,128 ; vblendvps %ymm8,%ymm9,%ymm1,%ymm1
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,116,95,200 ; vmaxps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,5,10,21,2,0 ; vbroadcastss 0x2150a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,41,23,2,0 ; vbroadcastss 0x21729(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,116,93,200 ; vminps %ymm8,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9890,36 +10063,36 @@ _sk_parametric_b_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,218 ; vcvtdq2ps %ymm2,%ymm11
- DB 196,98,125,24,37,75,21,2,0 ; vbroadcastss 0x2154b(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,106,23,2,0 ; vbroadcastss 0x2176a(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,65,21,2,0 ; vbroadcastss 0x21541(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,96,23,2,0 ; vbroadcastss 0x21760(%rip),%ymm12 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,108,84,212 ; vandps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,151,20,2,0 ; vbroadcastss 0x21497(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,182,22,2,0 ; vbroadcastss 0x216b6(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,108,86,212 ; vorps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,41,21,2,0 ; vbroadcastss 0x21529(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,72,23,2,0 ; vbroadcastss 0x21748(%rip),%ymm12 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,31,21,2,0 ; vbroadcastss 0x2151f(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,62,23,2,0 ; vbroadcastss 0x2173e(%rip),%ymm12 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,108,89,228 ; vmulps %ymm12,%ymm2,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,16,21,2,0 ; vbroadcastss 0x21510(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,47,23,2,0 ; vbroadcastss 0x2172f(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,108,88,212 ; vaddps %ymm12,%ymm2,%ymm2
- DB 196,98,125,24,37,6,21,2,0 ; vbroadcastss 0x21506(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,37,23,2,0 ; vbroadcastss 0x21725(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,210 ; vdivps %ymm2,%ymm12,%ymm2
DB 197,164,92,210 ; vsubps %ymm2,%ymm11,%ymm2
DB 197,172,89,210 ; vmulps %ymm2,%ymm10,%ymm2
DB 196,99,125,8,210,1 ; vroundps $0x1,%ymm2,%ymm10
DB 196,65,108,92,210 ; vsubps %ymm10,%ymm2,%ymm10
- DB 196,98,125,24,29,234,20,2,0 ; vbroadcastss 0x214ea(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,9,23,2,0 ; vbroadcastss 0x21709(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,224,20,2,0 ; vbroadcastss 0x214e0(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,255,22,2,0 ; vbroadcastss 0x216ff(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,108,92,211 ; vsubps %ymm11,%ymm2,%ymm2
- DB 196,98,125,24,29,209,20,2,0 ; vbroadcastss 0x214d1(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,240,22,2,0 ; vbroadcastss 0x216f0(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,199,20,2,0 ; vbroadcastss 0x214c7(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,230,22,2,0 ; vbroadcastss 0x216e6(%rip),%ymm11 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,108,88,210 ; vaddps %ymm10,%ymm2,%ymm2
- DB 196,98,125,24,21,184,20,2,0 ; vbroadcastss 0x214b8(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,215,22,2,0 ; vbroadcastss 0x216d7(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,108,89,210 ; vmulps %ymm10,%ymm2,%ymm2
DB 197,253,91,210 ; vcvtps2dq %ymm2,%ymm2
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9927,7 +10100,7 @@ _sk_parametric_b_avx LABEL PROC
DB 196,195,109,74,209,128 ; vblendvps %ymm8,%ymm9,%ymm2,%ymm2
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,108,95,208 ; vmaxps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,207,19,2,0 ; vbroadcastss 0x213cf(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,238,21,2,0 ; vbroadcastss 0x215ee(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,108,93,208 ; vminps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -9947,36 +10120,36 @@ _sk_parametric_a_avx LABEL PROC
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
DB 196,98,125,24,16 ; vbroadcastss (%rax),%ymm10
DB 197,124,91,219 ; vcvtdq2ps %ymm3,%ymm11
- DB 196,98,125,24,37,16,20,2,0 ; vbroadcastss 0x21410(%rip),%ymm12 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,37,47,22,2,0 ; vbroadcastss 0x2162f(%rip),%ymm12 # 2c150 <_sk_overlay_sse2_8bit+0x503>
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,6,20,2,0 ; vbroadcastss 0x21406(%rip),%ymm12 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,37,37,22,2,0 ; vbroadcastss 0x21625(%rip),%ymm12 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,100,84,220 ; vandps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,92,19,2,0 ; vbroadcastss 0x2135c(%rip),%ymm12 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,37,123,21,2,0 ; vbroadcastss 0x2157b(%rip),%ymm12 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,193,100,86,220 ; vorps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,238,19,2,0 ; vbroadcastss 0x213ee(%rip),%ymm12 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,37,13,22,2,0 ; vbroadcastss 0x2160d(%rip),%ymm12 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,65,36,88,220 ; vaddps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,228,19,2,0 ; vbroadcastss 0x213e4(%rip),%ymm12 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,37,3,22,2,0 ; vbroadcastss 0x21603(%rip),%ymm12 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,65,100,89,228 ; vmulps %ymm12,%ymm3,%ymm12
DB 196,65,36,92,220 ; vsubps %ymm12,%ymm11,%ymm11
- DB 196,98,125,24,37,213,19,2,0 ; vbroadcastss 0x213d5(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,244,21,2,0 ; vbroadcastss 0x215f4(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,100,88,220 ; vaddps %ymm12,%ymm3,%ymm3
- DB 196,98,125,24,37,203,19,2,0 ; vbroadcastss 0x213cb(%rip),%ymm12 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,37,234,21,2,0 ; vbroadcastss 0x215ea(%rip),%ymm12 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 197,156,94,219 ; vdivps %ymm3,%ymm12,%ymm3
DB 197,164,92,219 ; vsubps %ymm3,%ymm11,%ymm3
DB 197,172,89,219 ; vmulps %ymm3,%ymm10,%ymm3
DB 196,99,125,8,211,1 ; vroundps $0x1,%ymm3,%ymm10
DB 196,65,100,92,210 ; vsubps %ymm10,%ymm3,%ymm10
- DB 196,98,125,24,29,175,19,2,0 ; vbroadcastss 0x213af(%rip),%ymm11 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,29,206,21,2,0 ; vbroadcastss 0x215ce(%rip),%ymm11 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,100,88,219 ; vaddps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,165,19,2,0 ; vbroadcastss 0x213a5(%rip),%ymm11 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,98,125,24,29,196,21,2,0 ; vbroadcastss 0x215c4(%rip),%ymm11 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 196,65,44,89,219 ; vmulps %ymm11,%ymm10,%ymm11
DB 196,193,100,92,219 ; vsubps %ymm11,%ymm3,%ymm3
- DB 196,98,125,24,29,150,19,2,0 ; vbroadcastss 0x21396(%rip),%ymm11 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,98,125,24,29,181,21,2,0 ; vbroadcastss 0x215b5(%rip),%ymm11 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 196,65,36,92,210 ; vsubps %ymm10,%ymm11,%ymm10
- DB 196,98,125,24,29,140,19,2,0 ; vbroadcastss 0x2138c(%rip),%ymm11 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,98,125,24,29,171,21,2,0 ; vbroadcastss 0x215ab(%rip),%ymm11 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 196,65,36,94,210 ; vdivps %ymm10,%ymm11,%ymm10
DB 196,193,100,88,218 ; vaddps %ymm10,%ymm3,%ymm3
- DB 196,98,125,24,21,125,19,2,0 ; vbroadcastss 0x2137d(%rip),%ymm10 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,98,125,24,21,156,21,2,0 ; vbroadcastss 0x2159c(%rip),%ymm10 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 196,193,100,89,218 ; vmulps %ymm10,%ymm3,%ymm3
DB 197,253,91,219 ; vcvtps2dq %ymm3,%ymm3
DB 196,98,125,24,80,20 ; vbroadcastss 0x14(%rax),%ymm10
@@ -9984,7 +10157,7 @@ _sk_parametric_a_avx LABEL PROC
DB 196,195,101,74,217,128 ; vblendvps %ymm8,%ymm9,%ymm3,%ymm3
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 196,193,100,95,216 ; vmaxps %ymm8,%ymm3,%ymm3
- DB 196,98,125,24,5,148,18,2,0 ; vbroadcastss 0x21294(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,179,20,2,0 ; vbroadcastss 0x214b3(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,100,93,216 ; vminps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10001,34 +10174,34 @@ _sk_gamma_avx LABEL PROC
DB 197,252,40,233 ; vmovaps %ymm1,%ymm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,91,200 ; vcvtdq2ps %ymm0,%ymm1
- DB 196,98,125,24,5,221,18,2,0 ; vbroadcastss 0x212dd(%rip),%ymm8 # 2bc10 <_sk_overlay_sse2_8bit+0x503>
+ DB 196,98,125,24,5,252,20,2,0 ; vbroadcastss 0x214fc(%rip),%ymm8 # 2c150 <_sk_overlay_sse2_8bit+0x503>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,211,18,2,0 ; vbroadcastss 0x212d3(%rip),%ymm9 # 2bc14 <_sk_overlay_sse2_8bit+0x507>
+ DB 196,98,125,24,13,242,20,2,0 ; vbroadcastss 0x214f2(%rip),%ymm9 # 2c154 <_sk_overlay_sse2_8bit+0x507>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
- DB 196,226,125,24,37,41,18,2,0 ; vbroadcastss 0x21229(%rip),%ymm4 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,37,72,20,2,0 ; vbroadcastss 0x21448(%rip),%ymm4 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,86,196 ; vorps %ymm4,%ymm0,%ymm0
- DB 196,98,125,24,21,188,18,2,0 ; vbroadcastss 0x212bc(%rip),%ymm10 # 2bc18 <_sk_overlay_sse2_8bit+0x50b>
+ DB 196,98,125,24,21,219,20,2,0 ; vbroadcastss 0x214db(%rip),%ymm10 # 2c158 <_sk_overlay_sse2_8bit+0x50b>
DB 196,193,116,88,202 ; vaddps %ymm10,%ymm1,%ymm1
- DB 196,98,125,24,29,178,18,2,0 ; vbroadcastss 0x212b2(%rip),%ymm11 # 2bc1c <_sk_overlay_sse2_8bit+0x50f>
+ DB 196,98,125,24,29,209,20,2,0 ; vbroadcastss 0x214d1(%rip),%ymm11 # 2c15c <_sk_overlay_sse2_8bit+0x50f>
DB 196,193,124,89,211 ; vmulps %ymm11,%ymm0,%ymm2
DB 197,244,92,202 ; vsubps %ymm2,%ymm1,%ymm1
- DB 196,98,125,24,37,164,18,2,0 ; vbroadcastss 0x212a4(%rip),%ymm12 # 2bc20 <_sk_overlay_sse2_8bit+0x513>
+ DB 196,98,125,24,37,195,20,2,0 ; vbroadcastss 0x214c3(%rip),%ymm12 # 2c160 <_sk_overlay_sse2_8bit+0x513>
DB 196,193,124,88,196 ; vaddps %ymm12,%ymm0,%ymm0
- DB 196,98,125,24,45,154,18,2,0 ; vbroadcastss 0x2129a(%rip),%ymm13 # 2bc24 <_sk_overlay_sse2_8bit+0x517>
+ DB 196,98,125,24,45,185,20,2,0 ; vbroadcastss 0x214b9(%rip),%ymm13 # 2c164 <_sk_overlay_sse2_8bit+0x517>
DB 197,148,94,192 ; vdivps %ymm0,%ymm13,%ymm0
DB 197,244,92,192 ; vsubps %ymm0,%ymm1,%ymm0
DB 196,98,125,24,48 ; vbroadcastss (%rax),%ymm14
DB 196,193,124,89,198 ; vmulps %ymm14,%ymm0,%ymm0
DB 196,227,125,8,200,1 ; vroundps $0x1,%ymm0,%ymm1
DB 197,252,92,241 ; vsubps %ymm1,%ymm0,%ymm6
- DB 196,98,125,24,61,121,18,2,0 ; vbroadcastss 0x21279(%rip),%ymm15 # 2bc28 <_sk_overlay_sse2_8bit+0x51b>
+ DB 196,98,125,24,61,152,20,2,0 ; vbroadcastss 0x21498(%rip),%ymm15 # 2c168 <_sk_overlay_sse2_8bit+0x51b>
DB 196,193,124,88,199 ; vaddps %ymm15,%ymm0,%ymm0
- DB 196,226,125,24,29,111,18,2,0 ; vbroadcastss 0x2126f(%rip),%ymm3 # 2bc2c <_sk_overlay_sse2_8bit+0x51f>
+ DB 196,226,125,24,29,142,20,2,0 ; vbroadcastss 0x2148e(%rip),%ymm3 # 2c16c <_sk_overlay_sse2_8bit+0x51f>
DB 197,204,89,203 ; vmulps %ymm3,%ymm6,%ymm1
DB 197,252,92,201 ; vsubps %ymm1,%ymm0,%ymm1
- DB 196,226,125,24,21,98,18,2,0 ; vbroadcastss 0x21262(%rip),%ymm2 # 2bc30 <_sk_overlay_sse2_8bit+0x523>
+ DB 196,226,125,24,21,129,20,2,0 ; vbroadcastss 0x21481(%rip),%ymm2 # 2c170 <_sk_overlay_sse2_8bit+0x523>
DB 197,236,92,198 ; vsubps %ymm6,%ymm2,%ymm0
- DB 196,226,125,24,53,89,18,2,0 ; vbroadcastss 0x21259(%rip),%ymm6 # 2bc34 <_sk_overlay_sse2_8bit+0x527>
+ DB 196,226,125,24,53,120,20,2,0 ; vbroadcastss 0x21478(%rip),%ymm6 # 2c174 <_sk_overlay_sse2_8bit+0x527>
DB 197,204,94,192 ; vdivps %ymm0,%ymm6,%ymm0
DB 197,244,88,192 ; vaddps %ymm0,%ymm1,%ymm0
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
@@ -10070,7 +10243,7 @@ _sk_gamma_avx LABEL PROC
DB 197,236,92,212 ; vsubps %ymm4,%ymm2,%ymm2
DB 197,204,94,210 ; vdivps %ymm2,%ymm6,%ymm2
DB 197,244,88,202 ; vaddps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,157,17,2,0 ; vbroadcastss 0x2119d(%rip),%ymm2 # 2bc38 <_sk_overlay_sse2_8bit+0x52b>
+ DB 196,226,125,24,21,188,19,2,0 ; vbroadcastss 0x213bc(%rip),%ymm2 # 2c178 <_sk_overlay_sse2_8bit+0x52b>
DB 197,236,89,28,36 ; vmulps (%rsp),%ymm2,%ymm3
DB 197,252,89,226 ; vmulps %ymm2,%ymm0,%ymm4
DB 197,244,89,210 ; vmulps %ymm2,%ymm1,%ymm2
@@ -10088,31 +10261,31 @@ _sk_gamma_avx LABEL PROC
PUBLIC _sk_lab_to_xyz_avx
_sk_lab_to_xyz_avx LABEL PROC
- DB 196,98,125,24,5,80,17,2,0 ; vbroadcastss 0x21150(%rip),%ymm8 # 2bc3c <_sk_overlay_sse2_8bit+0x52f>
+ DB 196,98,125,24,5,111,19,2,0 ; vbroadcastss 0x2136f(%rip),%ymm8 # 2c17c <_sk_overlay_sse2_8bit+0x52f>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,174,16,2,0 ; vbroadcastss 0x210ae(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,205,18,2,0 ; vbroadcastss 0x212cd(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
- DB 196,98,125,24,13,56,17,2,0 ; vbroadcastss 0x21138(%rip),%ymm9 # 2bc40 <_sk_overlay_sse2_8bit+0x533>
+ DB 196,98,125,24,13,87,19,2,0 ; vbroadcastss 0x21357(%rip),%ymm9 # 2c180 <_sk_overlay_sse2_8bit+0x533>
DB 196,193,116,88,201 ; vaddps %ymm9,%ymm1,%ymm1
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 196,193,108,88,209 ; vaddps %ymm9,%ymm2,%ymm2
- DB 196,98,125,24,5,36,17,2,0 ; vbroadcastss 0x21124(%rip),%ymm8 # 2bc44 <_sk_overlay_sse2_8bit+0x537>
+ DB 196,98,125,24,5,67,19,2,0 ; vbroadcastss 0x21343(%rip),%ymm8 # 2c184 <_sk_overlay_sse2_8bit+0x537>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,26,17,2,0 ; vbroadcastss 0x2111a(%rip),%ymm8 # 2bc48 <_sk_overlay_sse2_8bit+0x53b>
+ DB 196,98,125,24,5,57,19,2,0 ; vbroadcastss 0x21339(%rip),%ymm8 # 2c188 <_sk_overlay_sse2_8bit+0x53b>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,5,16,17,2,0 ; vbroadcastss 0x21110(%rip),%ymm8 # 2bc4c <_sk_overlay_sse2_8bit+0x53f>
+ DB 196,98,125,24,5,47,19,2,0 ; vbroadcastss 0x2132f(%rip),%ymm8 # 2c18c <_sk_overlay_sse2_8bit+0x53f>
DB 196,193,116,89,200 ; vmulps %ymm8,%ymm1,%ymm1
DB 197,252,88,201 ; vaddps %ymm1,%ymm0,%ymm1
- DB 196,98,125,24,5,2,17,2,0 ; vbroadcastss 0x21102(%rip),%ymm8 # 2bc50 <_sk_overlay_sse2_8bit+0x543>
+ DB 196,98,125,24,5,33,19,2,0 ; vbroadcastss 0x21321(%rip),%ymm8 # 2c190 <_sk_overlay_sse2_8bit+0x543>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 197,252,92,210 ; vsubps %ymm2,%ymm0,%ymm2
DB 197,116,89,193 ; vmulps %ymm1,%ymm1,%ymm8
DB 196,65,116,89,192 ; vmulps %ymm8,%ymm1,%ymm8
- DB 196,98,125,24,13,235,16,2,0 ; vbroadcastss 0x210eb(%rip),%ymm9 # 2bc54 <_sk_overlay_sse2_8bit+0x547>
+ DB 196,98,125,24,13,10,19,2,0 ; vbroadcastss 0x2130a(%rip),%ymm9 # 2c194 <_sk_overlay_sse2_8bit+0x547>
DB 196,65,52,194,208,1 ; vcmpltps %ymm8,%ymm9,%ymm10
- DB 196,98,125,24,29,224,16,2,0 ; vbroadcastss 0x210e0(%rip),%ymm11 # 2bc58 <_sk_overlay_sse2_8bit+0x54b>
+ DB 196,98,125,24,29,255,18,2,0 ; vbroadcastss 0x212ff(%rip),%ymm11 # 2c198 <_sk_overlay_sse2_8bit+0x54b>
DB 196,193,116,88,203 ; vaddps %ymm11,%ymm1,%ymm1
- DB 196,98,125,24,37,214,16,2,0 ; vbroadcastss 0x210d6(%rip),%ymm12 # 2bc5c <_sk_overlay_sse2_8bit+0x54f>
+ DB 196,98,125,24,37,245,18,2,0 ; vbroadcastss 0x212f5(%rip),%ymm12 # 2c19c <_sk_overlay_sse2_8bit+0x54f>
DB 196,193,116,89,204 ; vmulps %ymm12,%ymm1,%ymm1
DB 196,67,117,74,192,160 ; vblendvps %ymm10,%ymm8,%ymm1,%ymm8
DB 197,252,89,200 ; vmulps %ymm0,%ymm0,%ymm1
@@ -10127,9 +10300,9 @@ _sk_lab_to_xyz_avx LABEL PROC
DB 196,193,108,88,211 ; vaddps %ymm11,%ymm2,%ymm2
DB 196,193,108,89,212 ; vmulps %ymm12,%ymm2,%ymm2
DB 196,227,109,74,208,144 ; vblendvps %ymm9,%ymm0,%ymm2,%ymm2
- DB 196,226,125,24,5,140,16,2,0 ; vbroadcastss 0x2108c(%rip),%ymm0 # 2bc60 <_sk_overlay_sse2_8bit+0x553>
+ DB 196,226,125,24,5,171,18,2,0 ; vbroadcastss 0x212ab(%rip),%ymm0 # 2c1a0 <_sk_overlay_sse2_8bit+0x553>
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,131,16,2,0 ; vbroadcastss 0x21083(%rip),%ymm8 # 2bc64 <_sk_overlay_sse2_8bit+0x557>
+ DB 196,98,125,24,5,162,18,2,0 ; vbroadcastss 0x212a2(%rip),%ymm8 # 2c1a4 <_sk_overlay_sse2_8bit+0x557>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -10144,15 +10317,15 @@ _sk_load_a8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne ac46 <_sk_load_a8_avx+0x5c>
+ DB 117,67 ; jne af67 <_sk_load_a8_avx+0x5c>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,255,24,2,0 ; vpand 0x218ff(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,249,219,5,30,27,2,0 ; vpand 0x21b1e(%rip),%xmm0,%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,191,15,2,0 ; vbroadcastss 0x20fbf(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,222,17,2,0 ; vbroadcastss 0x211de(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10165,15 +10338,15 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja ac09 <_sk_load_a8_avx+0x1f>
+ DB 119,175 ; ja af2a <_sk_load_a8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,119,0,0,0 ; lea 0x77(%rip),%r11 # acdc <_sk_load_a8_avx+0xf2>
+ DB 76,141,29,122,0,0,0 ; lea 0x7a(%rip),%r11 # b000 <_sk_load_a8_avx+0xf5>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,144 ; jmp ac09 <_sk_load_a8_avx+0x1f>
+ DB 235,144 ; jmp af2a <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -10181,7 +10354,7 @@ _sk_load_a8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,104,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq af2a <_sk_load_a8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10192,23 +10365,24 @@ _sk_load_a8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,45,255,255,255 ; jmpq ac09 <_sk_load_a8_avx+0x1f>
- DB 146 ; xchg %eax,%edx
+ DB 233,45,255,255,255 ; jmpq af2a <_sk_load_a8_avx+0x1f>
+ DB 15,31,0 ; nopl (%rax)
+ DB 143 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,172,255,255,255,157,255 ; ljmp *-0x620001(%rdi,%rdi,8)
+ DB 255,169,255,255,255,154 ; ljmp *-0x65000001(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 234 ; (bad)
+ DB 255,231 ; jmpq *%rdi
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 223,255 ; (bad)
+ DB 220,255 ; fdivr %st,%st(7)
DB 255 ; (bad)
- DB 255,212 ; callq *%rsp
+ DB 255,209 ; callq *%rcx
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,197 ; inc %ebp
+ DB 255,194 ; inc %edx
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -10223,15 +10397,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,67 ; jne ad54 <_sk_load_a8_dst_avx+0x5c>
+ DB 117,67 ; jne b078 <_sk_load_a8_dst_avx+0x5c>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,241,23,2,0 ; vpand 0x217f1(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,217,219,37,13,26,2,0 ; vpand 0x21a0d(%rip),%xmm4,%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,177,14,2,0 ; vbroadcastss 0x20eb1(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,205,16,2,0 ; vbroadcastss 0x210cd(%rip),%ymm5 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,253 ; vmulps %ymm5,%ymm4,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,220,87,228 ; vxorps %ymm4,%ymm4,%ymm4
@@ -10244,15 +10418,15 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,175 ; ja ad17 <_sk_load_a8_dst_avx+0x1f>
+ DB 119,175 ; ja b03b <_sk_load_a8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # adec <_sk_load_a8_dst_avx+0xf4>
+ DB 76,141,29,121,0,0,0 ; lea 0x79(%rip),%r11 # b110 <_sk_load_a8_dst_avx+0xf4>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,144 ; jmp ad17 <_sk_load_a8_dst_avx+0x1f>
+ DB 235,144 ; jmp b03b <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10260,7 +10434,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,104,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,104,255,255,255 ; jmpq b03b <_sk_load_a8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10271,7 +10445,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,45,255,255,255 ; jmpq ad17 <_sk_load_a8_dst_avx+0x1f>
+ DB 233,45,255,255,255 ; jmpq b03b <_sk_load_a8_dst_avx+0x1f>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -10280,7 +10454,7 @@ _sk_load_a8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde00adfc <_sk_overlay_sse2_8bit+0xffffffffddfdf6ef>
+ DB 232,255,255,255,221 ; callq ffffffffde00b120 <_sk_overlay_sse2_8bit+0xffffffffddfdf4d3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -10333,7 +10507,7 @@ _sk_gather_a8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,28,13,2,0 ; vbroadcastss 0x20d1c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,56,15,2,0 ; vbroadcastss 0x20f38(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,217 ; vmulps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,87,192 ; vxorps %ymm0,%ymm0,%ymm0
@@ -10350,14 +10524,14 @@ _sk_store_a8_avx LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,163,12,2,0 ; vbroadcastss 0x20ca3(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,191,14,2,0 ; vbroadcastss 0x20ebf(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,100,89,192 ; vmulps %ymm8,%ymm3,%ymm8
DB 196,65,125,91,192 ; vcvtps2dq %ymm8,%ymm8
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 196,65,57,103,192 ; vpackuswb %xmm8,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne af2f <_sk_store_a8_avx+0x47>
+ DB 117,11 ; jne b253 <_sk_store_a8_avx+0x47>
DB 196,65,123,17,4,25 ; vmovsd %xmm8,(%r9,%rbx,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10366,25 +10540,25 @@ _sk_store_a8_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja af2a <_sk_store_a8_avx+0x42>
+ DB 119,235 ; ja b24e <_sk_store_a8_avx+0x42>
DB 196,66,121,48,192 ; vpmovzxbw %xmm8,%xmm8
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # afa4 <_sk_store_a8_avx+0xbc>
+ DB 76,141,29,85,0,0,0 ; lea 0x55(%rip),%r11 # b2c8 <_sk_store_a8_avx+0xbc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,20,4,25,0 ; vpextrb $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,201 ; jmp af2a <_sk_store_a8_avx+0x42>
+ DB 235,201 ; jmp b24e <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,2,4 ; vpextrb $0x4,%xmm8,0x2(%r9,%rbx,1)
- DB 196,98,57,0,5,174,21,2,0 ; vpshufb 0x215ae(%rip),%xmm8,%xmm8 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
+ DB 196,98,57,0,5,202,23,2,0 ; vpshufb 0x217ca(%rip),%xmm8,%xmm8 # 2ca60 <_sk_overlay_sse2_8bit+0xe13>
DB 196,67,121,21,4,25,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,1)
- DB 235,175 ; jmp af2a <_sk_store_a8_avx+0x42>
+ DB 235,175 ; jmp b24e <_sk_store_a8_avx+0x42>
DB 196,67,121,20,68,25,6,12 ; vpextrb $0xc,%xmm8,0x6(%r9,%rbx,1)
DB 196,67,121,20,68,25,5,10 ; vpextrb $0xa,%xmm8,0x5(%r9,%rbx,1)
DB 196,67,121,20,68,25,4,8 ; vpextrb $0x8,%xmm8,0x4(%r9,%rbx,1)
- DB 196,98,57,0,5,148,21,2,0 ; vpshufb 0x21594(%rip),%xmm8,%xmm8 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
+ DB 196,98,57,0,5,176,23,2,0 ; vpshufb 0x217b0(%rip),%xmm8,%xmm8 # 2ca70 <_sk_overlay_sse2_8bit+0xe23>
DB 196,65,121,126,4,25 ; vmovd %xmm8,(%r9,%rbx,1)
- DB 235,134 ; jmp af2a <_sk_store_a8_avx+0x42>
+ DB 235,134 ; jmp b24e <_sk_store_a8_avx+0x42>
DB 180,255 ; mov $0xff,%ah
DB 255 ; (bad)
DB 255,197 ; inc %ebp
@@ -10415,18 +10589,18 @@ _sk_load_g8_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne b021 <_sk_load_g8_avx+0x61>
+ DB 117,72 ; jne b345 <_sk_load_g8_avx+0x61>
DB 196,194,121,48,4,25 ; vpmovzxbw (%r9,%rbx,1),%xmm0
- DB 197,249,219,5,41,21,2,0 ; vpand 0x21529(%rip),%xmm0,%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,249,219,5,69,23,2,0 ; vpand 0x21745(%rip),%xmm0,%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,233,11,2,0 ; vbroadcastss 0x20be9(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,5,14,2,0 ; vbroadcastss 0x20e05(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,102,11,2,0 ; vbroadcastss 0x20b66(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,130,13,2,0 ; vbroadcastss 0x20d82(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 91 ; pop %rbx
@@ -10436,15 +10610,15 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja afdf <_sk_load_g8_avx+0x1f>
+ DB 119,170 ; ja b303 <_sk_load_g8_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b0b8 <_sk_load_g8_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b3dc <_sk_load_g8_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,139 ; jmp afdf <_sk_load_g8_avx+0x1f>
+ DB 235,139 ; jmp b303 <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,2 ; vpinsrw $0x2,%eax,%xmm0,%xmm0
@@ -10452,7 +10626,7 @@ _sk_load_g8_avx LABEL PROC
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,99,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq b303 <_sk_load_g8_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 197,249,196,192,6 ; vpinsrw $0x6,%eax,%xmm0,%xmm0
@@ -10463,7 +10637,7 @@ _sk_load_g8_avx LABEL PROC
DB 196,193,121,110,12,25 ; vmovd (%r9,%rbx,1),%xmm1
DB 196,226,121,48,201 ; vpmovzxbw %xmm1,%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,40,255,255,255 ; jmpq afdf <_sk_load_g8_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq b303 <_sk_load_g8_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10472,7 +10646,7 @@ _sk_load_g8_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00b0c8 <_sk_overlay_sse2_8bit+0xffffffffdefdf9bb>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b3ec <_sk_overlay_sse2_8bit+0xffffffffdefdf79f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10493,18 +10667,18 @@ _sk_load_g8_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne b135 <_sk_load_g8_dst_avx+0x61>
+ DB 117,72 ; jne b459 <_sk_load_g8_dst_avx+0x61>
DB 196,194,121,48,36,25 ; vpmovzxbw (%r9,%rbx,1),%xmm4
- DB 197,217,219,37,21,20,2,0 ; vpand 0x21415(%rip),%xmm4,%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 197,217,219,37,49,22,2,0 ; vpand 0x21631(%rip),%xmm4,%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,213,10,2,0 ; vbroadcastss 0x20ad5(%rip),%ymm5 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,45,241,12,2,0 ; vbroadcastss 0x20cf1(%rip),%ymm5 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,82,10,2,0 ; vbroadcastss 0x20a52(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,110,12,2,0 ; vbroadcastss 0x20c6e(%rip),%ymm7 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,236 ; vmovaps %ymm4,%ymm5
DB 197,252,40,244 ; vmovaps %ymm4,%ymm6
DB 91 ; pop %rbx
@@ -10514,15 +10688,15 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,170 ; ja b0f3 <_sk_load_g8_dst_avx+0x1f>
+ DB 119,170 ; ja b417 <_sk_load_g8_dst_avx+0x1f>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b1cc <_sk_load_g8_dst_avx+0xf8>
+ DB 76,141,29,120,0,0,0 ; lea 0x78(%rip),%r11 # b4f0 <_sk_load_g8_dst_avx+0xf8>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,182,4,25 ; movzbl (%r9,%rbx,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 235,139 ; jmp b0f3 <_sk_load_g8_dst_avx+0x1f>
+ DB 235,139 ; jmp b417 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,2 ; movzbl 0x2(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,2 ; vpinsrw $0x2,%eax,%xmm4,%xmm4
@@ -10530,7 +10704,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,99,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,99,255,255,255 ; jmpq b417 <_sk_load_g8_dst_avx+0x1f>
DB 65,15,182,68,25,6 ; movzbl 0x6(%r9,%rbx,1),%eax
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 197,217,196,224,6 ; vpinsrw $0x6,%eax,%xmm4,%xmm4
@@ -10541,7 +10715,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 196,193,121,110,44,25 ; vmovd (%r9,%rbx,1),%xmm5
DB 196,226,121,48,237 ; vpmovzxbw %xmm5,%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,40,255,255,255 ; jmpq b0f3 <_sk_load_g8_dst_avx+0x1f>
+ DB 233,40,255,255,255 ; jmpq b417 <_sk_load_g8_dst_avx+0x1f>
DB 144 ; nop
DB 145 ; xchg %eax,%ecx
DB 255 ; (bad)
@@ -10550,7 +10724,7 @@ _sk_load_g8_dst_avx LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf00b1dc <_sk_overlay_sse2_8bit+0xffffffffdefdfacf>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf00b500 <_sk_overlay_sse2_8bit+0xffffffffdefdf8b3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -10603,10 +10777,10 @@ _sk_gather_g8_avx LABEL PROC
DB 196,226,121,49,192 ; vpmovzxbd %xmm0,%xmm0
DB 196,227,117,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm1,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,60,9,2,0 ; vbroadcastss 0x2093c(%rip),%ymm1 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,226,125,24,13,88,11,2,0 ; vbroadcastss 0x20b58(%rip),%ymm1 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,213,10,2,0 ; vbroadcastss 0x20ad5(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 197,252,40,208 ; vmovaps %ymm0,%ymm2
DB 255,224 ; jmpq *%rax
@@ -10622,29 +10796,29 @@ _sk_load_565_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne b36e <_sk_load_565_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne b692 <_sk_load_565_avx+0xa1>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,229,8,2,0 ; vbroadcastss 0x208e5(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,5,1,11,2,0 ; vbroadcastss 0x20b01(%rip),%ymm0 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,216,8,2,0 ; vbroadcastss 0x208d8(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,244,10,2,0 ; vbroadcastss 0x20af4(%rip),%ymm1 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,207,8,2,0 ; vbroadcastss 0x208cf(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,13,235,10,2,0 ; vbroadcastss 0x20aeb(%rip),%ymm1 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,194,8,2,0 ; vbroadcastss 0x208c2(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,222,10,2,0 ; vbroadcastss 0x20ade(%rip),%ymm3 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,185,8,2,0 ; vbroadcastss 0x208b9(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,29,213,10,2,0 ; vbroadcastss 0x20ad5(%rip),%ymm3 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,172,8,2,0 ; vbroadcastss 0x208ac(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,200,10,2,0 ; vbroadcastss 0x20ac8(%rip),%ymm3 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,17,8,2,0 ; vbroadcastss 0x20811(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,45,10,2,0 ; vbroadcastss 0x20a2d(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10652,27 +10826,27 @@ _sk_load_565_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja b2f3 <_sk_load_565_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja b617 <_sk_load_565_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b3f4 <_sk_load_565_avx+0x127>
+ DB 76,141,29,99,0,0,0 ; lea 0x63(%rip),%r11 # b718 <_sk_load_565_avx+0x127>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,75,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq b617 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,46,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq b617 <_sk_load_565_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,1,255,255,255 ; jmpq b2f3 <_sk_load_565_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq b617 <_sk_load_565_avx+0x26>
DB 102,144 ; xchg %ax,%ax
DB 166 ; cmpsb %es:(%rdi),%ds:(%rsi)
DB 255 ; (bad)
@@ -10704,29 +10878,29 @@ _sk_load_565_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,129,0,0,0 ; jne b4b1 <_sk_load_565_dst_avx+0xa1>
+ DB 15,133,129,0,0,0 ; jne b7d5 <_sk_load_565_dst_avx+0xa1>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,245,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm6
- DB 196,226,125,24,37,162,7,2,0 ; vbroadcastss 0x207a2(%rip),%ymm4 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,37,190,9,2,0 ; vbroadcastss 0x209be(%rip),%ymm4 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,204,84,228 ; vandps %ymm4,%ymm6,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,149,7,2,0 ; vbroadcastss 0x20795(%rip),%ymm5 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,45,177,9,2,0 ; vbroadcastss 0x209b1(%rip),%ymm5 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,140,7,2,0 ; vbroadcastss 0x2078c(%rip),%ymm5 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,45,168,9,2,0 ; vbroadcastss 0x209a8(%rip),%ymm5 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 197,204,84,237 ; vandps %ymm5,%ymm6,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,61,127,7,2,0 ; vbroadcastss 0x2077f(%rip),%ymm7 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,61,155,9,2,0 ; vbroadcastss 0x2099b(%rip),%ymm7 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,212,89,239 ; vmulps %ymm7,%ymm5,%ymm5
- DB 196,226,125,24,61,118,7,2,0 ; vbroadcastss 0x20776(%rip),%ymm7 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,61,146,9,2,0 ; vbroadcastss 0x20992(%rip),%ymm7 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,204,84,247 ; vandps %ymm7,%ymm6,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,226,125,24,61,105,7,2,0 ; vbroadcastss 0x20769(%rip),%ymm7 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,61,133,9,2,0 ; vbroadcastss 0x20985(%rip),%ymm7 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,204,89,247 ; vmulps %ymm7,%ymm6,%ymm6
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,61,206,6,2,0 ; vbroadcastss 0x206ce(%rip),%ymm7 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,61,234,8,2,0 ; vbroadcastss 0x208ea(%rip),%ymm7 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
@@ -10734,27 +10908,27 @@ _sk_load_565_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,109,255,255,255 ; ja b436 <_sk_load_565_dst_avx+0x26>
+ DB 15,135,109,255,255,255 ; ja b75a <_sk_load_565_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b538 <_sk_load_565_dst_avx+0x128>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b85c <_sk_load_565_dst_avx+0x128>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,75,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
+ DB 233,75,255,255,255 ; jmpq b75a <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,46,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
+ DB 233,46,255,255,255 ; jmpq b75a <_sk_load_565_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,1,255,255,255 ; jmpq b436 <_sk_load_565_dst_avx+0x26>
+ DB 233,1,255,255,255 ; jmpq b75a <_sk_load_565_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -10824,23 +10998,23 @@ _sk_gather_565_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,209,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm2
- DB 196,226,125,24,5,206,5,2,0 ; vbroadcastss 0x205ce(%rip),%ymm0 # 2bbf4 <_sk_overlay_sse2_8bit+0x4e7>
+ DB 196,226,125,24,5,234,7,2,0 ; vbroadcastss 0x207ea(%rip),%ymm0 # 2c134 <_sk_overlay_sse2_8bit+0x4e7>
DB 197,236,84,192 ; vandps %ymm0,%ymm2,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,193,5,2,0 ; vbroadcastss 0x205c1(%rip),%ymm1 # 2bbf8 <_sk_overlay_sse2_8bit+0x4eb>
+ DB 196,226,125,24,13,221,7,2,0 ; vbroadcastss 0x207dd(%rip),%ymm1 # 2c138 <_sk_overlay_sse2_8bit+0x4eb>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,184,5,2,0 ; vbroadcastss 0x205b8(%rip),%ymm1 # 2bbfc <_sk_overlay_sse2_8bit+0x4ef>
+ DB 196,226,125,24,13,212,7,2,0 ; vbroadcastss 0x207d4(%rip),%ymm1 # 2c13c <_sk_overlay_sse2_8bit+0x4ef>
DB 197,236,84,201 ; vandps %ymm1,%ymm2,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,29,171,5,2,0 ; vbroadcastss 0x205ab(%rip),%ymm3 # 2bc00 <_sk_overlay_sse2_8bit+0x4f3>
+ DB 196,226,125,24,29,199,7,2,0 ; vbroadcastss 0x207c7(%rip),%ymm3 # 2c140 <_sk_overlay_sse2_8bit+0x4f3>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
- DB 196,226,125,24,29,162,5,2,0 ; vbroadcastss 0x205a2(%rip),%ymm3 # 2bc04 <_sk_overlay_sse2_8bit+0x4f7>
+ DB 196,226,125,24,29,190,7,2,0 ; vbroadcastss 0x207be(%rip),%ymm3 # 2c144 <_sk_overlay_sse2_8bit+0x4f7>
DB 197,236,84,211 ; vandps %ymm3,%ymm2,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,226,125,24,29,149,5,2,0 ; vbroadcastss 0x20595(%rip),%ymm3 # 2bc08 <_sk_overlay_sse2_8bit+0x4fb>
+ DB 196,226,125,24,29,177,7,2,0 ; vbroadcastss 0x207b1(%rip),%ymm3 # 2c148 <_sk_overlay_sse2_8bit+0x4fb>
DB 197,236,89,211 ; vmulps %ymm3,%ymm2,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,250,4,2,0 ; vbroadcastss 0x204fa(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,22,7,2,0 ; vbroadcastss 0x20716(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
PUBLIC _sk_store_565_avx
@@ -10853,14 +11027,14 @@ _sk_store_565_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,196,5,2,0 ; vbroadcastss 0x205c4(%rip),%ymm8 # 2bc68 <_sk_overlay_sse2_8bit+0x55b>
+ DB 196,98,125,24,5,224,7,2,0 ; vbroadcastss 0x207e0(%rip),%ymm8 # 2c1a8 <_sk_overlay_sse2_8bit+0x55b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,11 ; vpslld $0xb,%xmm9,%xmm10
DB 196,67,125,25,201,1 ; vextractf128 $0x1,%ymm9,%xmm9
DB 196,193,49,114,241,11 ; vpslld $0xb,%xmm9,%xmm9
DB 196,67,45,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm9
- DB 196,98,125,24,21,157,5,2,0 ; vbroadcastss 0x2059d(%rip),%ymm10 # 2bc6c <_sk_overlay_sse2_8bit+0x55f>
+ DB 196,98,125,24,21,185,7,2,0 ; vbroadcastss 0x207b9(%rip),%ymm10 # 2c1ac <_sk_overlay_sse2_8bit+0x55f>
DB 196,65,116,89,210 ; vmulps %ymm10,%ymm1,%ymm10
DB 196,65,125,91,210 ; vcvtps2dq %ymm10,%ymm10
DB 196,193,33,114,242,5 ; vpslld $0x5,%xmm10,%xmm11
@@ -10874,7 +11048,7 @@ _sk_store_565_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne b720 <_sk_store_565_avx+0x9c>
+ DB 117,11 ; jne ba44 <_sk_store_565_avx+0x9c>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10883,22 +11057,22 @@ _sk_store_565_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja b71b <_sk_store_565_avx+0x97>
+ DB 119,235 ; ja ba3f <_sk_store_565_avx+0x97>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # b780 <_sk_store_565_avx+0xfc>
+ DB 76,141,29,69,0,0,0 ; lea 0x45(%rip),%r11 # baa4 <_sk_store_565_avx+0xfc>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp b71b <_sk_store_565_avx+0x97>
+ DB 235,206 ; jmp ba3f <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp b71b <_sk_store_565_avx+0x97>
+ DB 235,190 ; jmp ba3f <_sk_store_565_avx+0x97>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp b71b <_sk_store_565_avx+0x97>
+ DB 235,158 ; jmp ba3f <_sk_store_565_avx+0x97>
DB 15,31,0 ; nopl (%rax)
DB 196 ; (bad)
DB 255 ; (bad)
@@ -10935,31 +11109,31 @@ _sk_load_4444_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne b855 <_sk_load_4444_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne bb79 <_sk_load_4444_avx+0xb9>
DB 196,193,122,111,4,89 ; vmovdqu (%r9,%rbx,2),%xmm0
DB 197,241,239,201 ; vpxor %xmm1,%xmm1,%xmm1
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,146,4,2,0 ; vbroadcastss 0x20492(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,5,174,6,2,0 ; vbroadcastss 0x206ae(%rip),%ymm0 # 2c1b0 <_sk_overlay_sse2_8bit+0x563>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,133,4,2,0 ; vbroadcastss 0x20485(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,161,6,2,0 ; vbroadcastss 0x206a1(%rip),%ymm1 # 2c1b4 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,124,4,2,0 ; vbroadcastss 0x2047c(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,13,152,6,2,0 ; vbroadcastss 0x20698(%rip),%ymm1 # 2c1b8 <_sk_overlay_sse2_8bit+0x56b>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,111,4,2,0 ; vbroadcastss 0x2046f(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,139,6,2,0 ; vbroadcastss 0x2068b(%rip),%ymm2 # 2c1bc <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,102,4,2,0 ; vbroadcastss 0x20466(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,21,130,6,2,0 ; vbroadcastss 0x20682(%rip),%ymm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x573>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,89,4,2,0 ; vbroadcastss 0x20459(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,117,6,2,0 ; vbroadcastss 0x20675(%rip),%ymm8 # 2c1c4 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,79,4,2,0 ; vbroadcastss 0x2044f(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,107,6,2,0 ; vbroadcastss 0x2066b(%rip),%ymm8 # 2c1c8 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,65,4,2,0 ; vbroadcastss 0x20441(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,93,6,2,0 ; vbroadcastss 0x2065d(%rip),%ymm8 # 2c1cc <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -10969,27 +11143,27 @@ _sk_load_4444_avx LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja b7c2 <_sk_load_4444_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja bae6 <_sk_load_4444_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # b8dc <_sk_load_4444_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # bc00 <_sk_load_4444_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 233,51,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq bae6 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,110,12,89 ; vmovd (%r9,%rbx,2),%xmm1
DB 196,227,121,14,193,3 ; vpblendw $0x3,%xmm1,%xmm0,%xmm0
- DB 233,22,255,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq bae6 <_sk_load_4444_avx+0x26>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,193,121,196,68,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,121,196,68,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm0,%xmm0
DB 196,193,122,126,12,89 ; vmovq (%r9,%rbx,2),%xmm1
DB 196,227,113,14,192,240 ; vpblendw $0xf0,%xmm0,%xmm1,%xmm0
- DB 233,233,254,255,255 ; jmpq b7c2 <_sk_load_4444_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq bae6 <_sk_load_4444_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -11024,31 +11198,31 @@ _sk_load_4444_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,153,0,0,0 ; jne b9b1 <_sk_load_4444_dst_avx+0xb9>
+ DB 15,133,153,0,0,0 ; jne bcd5 <_sk_load_4444_dst_avx+0xb9>
DB 196,193,122,111,36,89 ; vmovdqu (%r9,%rbx,2),%xmm4
DB 197,209,239,237 ; vpxor %xmm5,%xmm5,%xmm5
DB 197,217,105,237 ; vpunpckhwd %xmm5,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,253,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm7
- DB 196,226,125,24,37,54,3,2,0 ; vbroadcastss 0x20336(%rip),%ymm4 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,37,82,5,2,0 ; vbroadcastss 0x20552(%rip),%ymm4 # 2c1b0 <_sk_overlay_sse2_8bit+0x563>
DB 197,196,84,228 ; vandps %ymm4,%ymm7,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,226,125,24,45,41,3,2,0 ; vbroadcastss 0x20329(%rip),%ymm5 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,45,69,5,2,0 ; vbroadcastss 0x20545(%rip),%ymm5 # 2c1b4 <_sk_overlay_sse2_8bit+0x567>
DB 197,220,89,229 ; vmulps %ymm5,%ymm4,%ymm4
- DB 196,226,125,24,45,32,3,2,0 ; vbroadcastss 0x20320(%rip),%ymm5 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,45,60,5,2,0 ; vbroadcastss 0x2053c(%rip),%ymm5 # 2c1b8 <_sk_overlay_sse2_8bit+0x56b>
DB 197,196,84,237 ; vandps %ymm5,%ymm7,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,226,125,24,53,19,3,2,0 ; vbroadcastss 0x20313(%rip),%ymm6 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,53,47,5,2,0 ; vbroadcastss 0x2052f(%rip),%ymm6 # 2c1bc <_sk_overlay_sse2_8bit+0x56f>
DB 197,212,89,238 ; vmulps %ymm6,%ymm5,%ymm5
- DB 196,226,125,24,53,10,3,2,0 ; vbroadcastss 0x2030a(%rip),%ymm6 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,53,38,5,2,0 ; vbroadcastss 0x20526(%rip),%ymm6 # 2c1c0 <_sk_overlay_sse2_8bit+0x573>
DB 197,196,84,246 ; vandps %ymm6,%ymm7,%ymm6
DB 197,252,91,246 ; vcvtdq2ps %ymm6,%ymm6
- DB 196,98,125,24,5,253,2,2,0 ; vbroadcastss 0x202fd(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,25,5,2,0 ; vbroadcastss 0x20519(%rip),%ymm8 # 2c1c4 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,76,89,240 ; vmulps %ymm8,%ymm6,%ymm6
- DB 196,98,125,24,5,243,2,2,0 ; vbroadcastss 0x202f3(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,15,5,2,0 ; vbroadcastss 0x2050f(%rip),%ymm8 # 2c1c8 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,68,84,248 ; vandps %ymm8,%ymm7,%ymm7
DB 197,252,91,255 ; vcvtdq2ps %ymm7,%ymm7
- DB 196,98,125,24,5,229,2,2,0 ; vbroadcastss 0x202e5(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,1,5,2,0 ; vbroadcastss 0x20501(%rip),%ymm8 # 2c1cc <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,68,89,248 ; vmulps %ymm8,%ymm7,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11058,27 +11232,27 @@ _sk_load_4444_dst_avx LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,85,255,255,255 ; ja b91e <_sk_load_4444_dst_avx+0x26>
+ DB 15,135,85,255,255,255 ; ja bc42 <_sk_load_4444_dst_avx+0x26>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # ba38 <_sk_load_4444_dst_avx+0x140>
+ DB 76,141,29,100,0,0,0 ; lea 0x64(%rip),%r11 # bd5c <_sk_load_4444_dst_avx+0x140>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 65,15,183,4,89 ; movzwl (%r9,%rbx,2),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,51,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
+ DB 233,51,255,255,255 ; jmpq bc42 <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,4,2 ; vpinsrw $0x2,0x4(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,121,110,44,89 ; vmovd (%r9,%rbx,2),%xmm5
DB 196,227,89,14,229,3 ; vpblendw $0x3,%xmm5,%xmm4,%xmm4
- DB 233,22,255,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
+ DB 233,22,255,255,255 ; jmpq bc42 <_sk_load_4444_dst_avx+0x26>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,193,89,196,100,89,12,6 ; vpinsrw $0x6,0xc(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,10,5 ; vpinsrw $0x5,0xa(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,89,196,100,89,8,4 ; vpinsrw $0x4,0x8(%r9,%rbx,2),%xmm4,%xmm4
DB 196,193,122,126,44,89 ; vmovq (%r9,%rbx,2),%xmm5
DB 196,227,81,14,228,240 ; vpblendw $0xf0,%xmm4,%xmm5,%xmm4
- DB 233,233,254,255,255 ; jmpq b91e <_sk_load_4444_dst_avx+0x26>
+ DB 233,233,254,255,255 ; jmpq bc42 <_sk_load_4444_dst_avx+0x26>
DB 15,31,0 ; nopl (%rax)
DB 165 ; movsl %ds:(%rsi),%es:(%rdi)
DB 255 ; (bad)
@@ -11148,25 +11322,25 @@ _sk_gather_4444_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,217,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm3
- DB 196,226,125,24,5,74,1,2,0 ; vbroadcastss 0x2014a(%rip),%ymm0 # 2bc70 <_sk_overlay_sse2_8bit+0x563>
+ DB 196,226,125,24,5,102,3,2,0 ; vbroadcastss 0x20366(%rip),%ymm0 # 2c1b0 <_sk_overlay_sse2_8bit+0x563>
DB 197,228,84,192 ; vandps %ymm0,%ymm3,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,226,125,24,13,61,1,2,0 ; vbroadcastss 0x2013d(%rip),%ymm1 # 2bc74 <_sk_overlay_sse2_8bit+0x567>
+ DB 196,226,125,24,13,89,3,2,0 ; vbroadcastss 0x20359(%rip),%ymm1 # 2c1b4 <_sk_overlay_sse2_8bit+0x567>
DB 197,252,89,193 ; vmulps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,52,1,2,0 ; vbroadcastss 0x20134(%rip),%ymm1 # 2bc78 <_sk_overlay_sse2_8bit+0x56b>
+ DB 196,226,125,24,13,80,3,2,0 ; vbroadcastss 0x20350(%rip),%ymm1 # 2c1b8 <_sk_overlay_sse2_8bit+0x56b>
DB 197,228,84,201 ; vandps %ymm1,%ymm3,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,226,125,24,21,39,1,2,0 ; vbroadcastss 0x20127(%rip),%ymm2 # 2bc7c <_sk_overlay_sse2_8bit+0x56f>
+ DB 196,226,125,24,21,67,3,2,0 ; vbroadcastss 0x20343(%rip),%ymm2 # 2c1bc <_sk_overlay_sse2_8bit+0x56f>
DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
- DB 196,226,125,24,21,30,1,2,0 ; vbroadcastss 0x2011e(%rip),%ymm2 # 2bc80 <_sk_overlay_sse2_8bit+0x573>
+ DB 196,226,125,24,21,58,3,2,0 ; vbroadcastss 0x2033a(%rip),%ymm2 # 2c1c0 <_sk_overlay_sse2_8bit+0x573>
DB 197,228,84,210 ; vandps %ymm2,%ymm3,%ymm2
DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,98,125,24,5,17,1,2,0 ; vbroadcastss 0x20111(%rip),%ymm8 # 2bc84 <_sk_overlay_sse2_8bit+0x577>
+ DB 196,98,125,24,5,45,3,2,0 ; vbroadcastss 0x2032d(%rip),%ymm8 # 2c1c4 <_sk_overlay_sse2_8bit+0x577>
DB 196,193,108,89,208 ; vmulps %ymm8,%ymm2,%ymm2
- DB 196,98,125,24,5,7,1,2,0 ; vbroadcastss 0x20107(%rip),%ymm8 # 2bc88 <_sk_overlay_sse2_8bit+0x57b>
+ DB 196,98,125,24,5,35,3,2,0 ; vbroadcastss 0x20323(%rip),%ymm8 # 2c1c8 <_sk_overlay_sse2_8bit+0x57b>
DB 196,193,100,84,216 ; vandps %ymm8,%ymm3,%ymm3
DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
- DB 196,98,125,24,5,249,0,2,0 ; vbroadcastss 0x200f9(%rip),%ymm8 # 2bc8c <_sk_overlay_sse2_8bit+0x57f>
+ DB 196,98,125,24,5,21,3,2,0 ; vbroadcastss 0x20315(%rip),%ymm8 # 2c1cc <_sk_overlay_sse2_8bit+0x57f>
DB 196,193,100,89,216 ; vmulps %ymm8,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -11181,7 +11355,7 @@ _sk_store_4444_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,212,0,2,0 ; vbroadcastss 0x200d4(%rip),%ymm8 # 2bc90 <_sk_overlay_sse2_8bit+0x583>
+ DB 196,98,125,24,5,240,2,2,0 ; vbroadcastss 0x202f0(%rip),%ymm8 # 2c1d0 <_sk_overlay_sse2_8bit+0x583>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,193,41,114,241,12 ; vpslld $0xc,%xmm9,%xmm10
@@ -11208,7 +11382,7 @@ _sk_store_4444_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,66,57,43,193 ; vpackusdw %xmm9,%xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne bc56 <_sk_store_4444_avx+0xba>
+ DB 117,11 ; jne bf7a <_sk_store_4444_avx+0xba>
DB 196,65,122,127,4,89 ; vmovdqu %xmm8,(%r9,%rbx,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11217,22 +11391,22 @@ _sk_store_4444_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja bc51 <_sk_store_4444_avx+0xb5>
+ DB 119,235 ; ja bf75 <_sk_store_4444_avx+0xb5>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # bcb4 <_sk_store_4444_avx+0x118>
+ DB 76,141,29,67,0,0,0 ; lea 0x43(%rip),%r11 # bfd8 <_sk_store_4444_avx+0x118>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,67,121,21,4,89,0 ; vpextrw $0x0,%xmm8,(%r9,%rbx,2)
- DB 235,206 ; jmp bc51 <_sk_store_4444_avx+0xb5>
+ DB 235,206 ; jmp bf75 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,4,2 ; vpextrw $0x2,%xmm8,0x4(%r9,%rbx,2)
DB 196,65,121,126,4,89 ; vmovd %xmm8,(%r9,%rbx,2)
- DB 235,190 ; jmp bc51 <_sk_store_4444_avx+0xb5>
+ DB 235,190 ; jmp bf75 <_sk_store_4444_avx+0xb5>
DB 196,67,121,21,68,89,12,6 ; vpextrw $0x6,%xmm8,0xc(%r9,%rbx,2)
DB 196,67,121,21,68,89,10,5 ; vpextrw $0x5,%xmm8,0xa(%r9,%rbx,2)
DB 196,67,121,21,68,89,8,4 ; vpextrw $0x4,%xmm8,0x8(%r9,%rbx,2)
DB 196,65,121,214,4,89 ; vmovq %xmm8,(%r9,%rbx,2)
- DB 235,158 ; jmp bc51 <_sk_store_4444_avx+0xb5>
+ DB 235,158 ; jmp bf75 <_sk_store_4444_avx+0xb5>
DB 144 ; nop
DB 198 ; (bad)
DB 255 ; (bad)
@@ -11269,12 +11443,12 @@ _sk_load_8888_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne bd79 <_sk_load_8888_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c09d <_sk_load_8888_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,97,3,2,0 ; vmovapd 0x20361(%rip),%ymm10 # 2c060 <_sk_overlay_sse2_8bit+0x953>
+ DB 197,125,40,21,125,5,2,0 ; vmovapd 0x2057d(%rip),%ymm10 # 2c5a0 <_sk_overlay_sse2_8bit+0x953>
DB 196,193,53,84,194 ; vandpd %ymm10,%ymm9,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,5,223,254,1,0 ; vbroadcastss 0x1fedf(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,251,0,2,0 ; vbroadcastss 0x200fb(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,192 ; vmulps %ymm8,%ymm0,%ymm0
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11302,21 +11476,21 @@ _sk_load_8888_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja bcf7 <_sk_load_8888_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c01b <_sk_load_8888_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # be30 <_sk_load_8888_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c154 <_sk_load_8888_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c01b <_sk_load_8888_avx+0x27>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c01b <_sk_load_8888_avx+0x27>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11330,9 +11504,9 @@ _sk_load_8888_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,202,254,255,255 ; jmpq bcf7 <_sk_load_8888_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c01b <_sk_load_8888_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe be31 <_sk_load_8888_avx+0x161>
+ DB 118,255 ; jbe c155 <_sk_load_8888_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11363,12 +11537,12 @@ _sk_load_8888_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne bef5 <_sk_load_8888_dst_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c219 <_sk_load_8888_dst_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,5,2,2,0 ; vmovapd 0x20205(%rip),%ymm10 # 2c080 <_sk_overlay_sse2_8bit+0x973>
+ DB 197,125,40,21,33,4,2,0 ; vmovapd 0x20421(%rip),%ymm10 # 2c5c0 <_sk_overlay_sse2_8bit+0x973>
DB 196,193,53,84,226 ; vandpd %ymm10,%ymm9,%ymm4
DB 197,252,91,228 ; vcvtdq2ps %ymm4,%ymm4
- DB 196,98,125,24,5,99,253,1,0 ; vbroadcastss 0x1fd63(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,127,255,1,0 ; vbroadcastss 0x1ff7f(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,92,89,224 ; vmulps %ymm8,%ymm4,%ymm4
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11396,21 +11570,21 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja be73 <_sk_load_8888_dst_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c197 <_sk_load_8888_dst_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # bfac <_sk_load_8888_dst_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c2d0 <_sk_load_8888_dst_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c197 <_sk_load_8888_dst_avx+0x27>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c197 <_sk_load_8888_dst_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11424,9 +11598,9 @@ _sk_load_8888_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,202,254,255,255 ; jmpq be73 <_sk_load_8888_dst_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c197 <_sk_load_8888_dst_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe bfad <_sk_load_8888_dst_avx+0x161>
+ DB 118,255 ; jbe c2d1 <_sk_load_8888_dst_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11481,10 +11655,10 @@ _sk_gather_8888_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,21,45,0,2,0 ; vmovaps 0x2002d(%rip),%ymm10 # 2c0a0 <_sk_overlay_sse2_8bit+0x993>
+ DB 197,124,40,21,73,2,2,0 ; vmovaps 0x20249(%rip),%ymm10 # 2c5e0 <_sk_overlay_sse2_8bit+0x993>
DB 196,193,124,84,194 ; vandps %ymm10,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,13,107,251,1,0 ; vbroadcastss 0x1fb6b(%rip),%ymm9 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,13,135,253,1,0 ; vbroadcastss 0x1fd87(%rip),%ymm9 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,193 ; vmulps %ymm9,%ymm0,%ymm0
DB 196,193,113,114,208,8 ; vpsrld $0x8,%xmm8,%xmm1
DB 197,233,114,211,8 ; vpsrld $0x8,%xmm3,%xmm2
@@ -11516,7 +11690,7 @@ _sk_store_8888_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,161,250,1,0 ; vbroadcastss 0x1faa1(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,189,252,1,0 ; vbroadcastss 0x1fcbd(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11541,7 +11715,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne c196 <_sk_store_8888_avx+0xb0>
+ DB 117,11 ; jne c4ba <_sk_store_8888_avx+0xb0>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11550,17 +11724,17 @@ _sk_store_8888_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja c191 <_sk_store_8888_avx+0xab>
+ DB 119,235 ; ja c4b5 <_sk_store_8888_avx+0xab>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c204 <_sk_store_8888_avx+0x11e>
+ DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c528 <_sk_store_8888_avx+0x11e>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp c191 <_sk_store_8888_avx+0xab>
+ DB 235,207 ; jmp c4b5 <_sk_store_8888_avx+0xab>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp c191 <_sk_store_8888_avx+0xab>
+ DB 235,191 ; jmp c4b5 <_sk_store_8888_avx+0xab>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11568,7 +11742,7 @@ _sk_store_8888_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp c191 <_sk_store_8888_avx+0xab>
+ DB 235,142 ; jmp c4b5 <_sk_store_8888_avx+0xab>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11602,12 +11776,12 @@ _sk_load_bgra_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne c2c9 <_sk_load_bgra_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c5ed <_sk_load_bgra_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,113,254,1,0 ; vmovapd 0x1fe71(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x9b3>
+ DB 197,125,40,21,141,0,2,0 ; vmovapd 0x2008d(%rip),%ymm10 # 2c600 <_sk_overlay_sse2_8bit+0x9b3>
DB 196,193,53,84,202 ; vandpd %ymm10,%ymm9,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,98,125,24,5,143,249,1,0 ; vbroadcastss 0x1f98f(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,171,251,1,0 ; vbroadcastss 0x1fbab(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,116,89,208 ; vmulps %ymm8,%ymm1,%ymm2
DB 196,193,113,114,209,8 ; vpsrld $0x8,%xmm9,%xmm1
DB 196,99,125,25,203,1 ; vextractf128 $0x1,%ymm9,%xmm3
@@ -11635,21 +11809,21 @@ _sk_load_bgra_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja c247 <_sk_load_bgra_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c56b <_sk_load_bgra_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c380 <_sk_load_bgra_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c6a4 <_sk_load_bgra_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c56b <_sk_load_bgra_avx+0x27>
DB 196,193,121,110,68,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,99,117,12,200,4 ; vblendps $0x4,%ymm0,%ymm1,%ymm9
DB 196,193,123,16,4,153 ; vmovsd (%r9,%rbx,4),%xmm0
DB 196,99,53,13,200,1 ; vblendpd $0x1,%ymm0,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c56b <_sk_load_bgra_avx+0x27>
DB 196,193,121,110,68,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm0
DB 197,249,112,192,68 ; vpshufd $0x44,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
@@ -11663,9 +11837,9 @@ _sk_load_bgra_avx LABEL PROC
DB 196,99,53,24,200,1 ; vinsertf128 $0x1,%xmm0,%ymm9,%ymm9
DB 196,193,121,16,4,153 ; vmovupd (%r9,%rbx,4),%xmm0
DB 196,67,125,13,201,12 ; vblendpd $0xc,%ymm9,%ymm0,%ymm9
- DB 233,202,254,255,255 ; jmpq c247 <_sk_load_bgra_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c56b <_sk_load_bgra_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe c381 <_sk_load_bgra_avx+0x161>
+ DB 118,255 ; jbe c6a5 <_sk_load_bgra_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11696,12 +11870,12 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,136,0,0,0 ; jne c445 <_sk_load_bgra_dst_avx+0xa9>
+ DB 15,133,136,0,0,0 ; jne c769 <_sk_load_bgra_dst_avx+0xa9>
DB 196,65,125,16,12,153 ; vmovupd (%r9,%rbx,4),%ymm9
- DB 197,125,40,21,21,253,1,0 ; vmovapd 0x1fd15(%rip),%ymm10 # 2c0e0 <_sk_overlay_sse2_8bit+0x9d3>
+ DB 197,125,40,21,49,255,1,0 ; vmovapd 0x1ff31(%rip),%ymm10 # 2c620 <_sk_overlay_sse2_8bit+0x9d3>
DB 196,193,53,84,234 ; vandpd %ymm10,%ymm9,%ymm5
DB 197,252,91,237 ; vcvtdq2ps %ymm5,%ymm5
- DB 196,98,125,24,5,19,248,1,0 ; vbroadcastss 0x1f813(%rip),%ymm8 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,5,47,250,1,0 ; vbroadcastss 0x1fa2f(%rip),%ymm8 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,84,89,240 ; vmulps %ymm8,%ymm5,%ymm6
DB 196,193,81,114,209,8 ; vpsrld $0x8,%xmm9,%xmm5
DB 196,99,125,25,207,1 ; vextractf128 $0x1,%ymm9,%xmm7
@@ -11729,21 +11903,21 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 15,135,101,255,255,255 ; ja c3c3 <_sk_load_bgra_dst_avx+0x27>
+ DB 15,135,101,255,255,255 ; ja c6e7 <_sk_load_bgra_dst_avx+0x27>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c4fc <_sk_load_bgra_dst_avx+0x160>
+ DB 76,141,29,147,0,0,0 ; lea 0x93(%rip),%r11 # c820 <_sk_load_bgra_dst_avx+0x160>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,122,16,12,153 ; vmovss (%r9,%rbx,4),%xmm9
- DB 233,70,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,70,255,255,255 ; jmpq c6e7 <_sk_load_bgra_dst_avx+0x27>
DB 196,193,121,110,100,153,8 ; vmovd 0x8(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 197,212,87,237 ; vxorps %ymm5,%ymm5,%ymm5
DB 196,99,85,12,204,4 ; vblendps $0x4,%ymm4,%ymm5,%ymm9
DB 196,193,123,16,36,153 ; vmovsd (%r9,%rbx,4),%xmm4
DB 196,99,53,13,204,1 ; vblendpd $0x1,%ymm4,%ymm9,%ymm9
- DB 233,31,255,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,31,255,255,255 ; jmpq c6e7 <_sk_load_bgra_dst_avx+0x27>
DB 196,193,121,110,100,153,24 ; vmovd 0x18(%r9,%rbx,4),%xmm4
DB 197,249,112,228,68 ; vpshufd $0x44,%xmm4,%xmm4
DB 196,227,125,24,228,1 ; vinsertf128 $0x1,%xmm4,%ymm0,%ymm4
@@ -11757,9 +11931,9 @@ _sk_load_bgra_dst_avx LABEL PROC
DB 196,99,53,24,204,1 ; vinsertf128 $0x1,%xmm4,%ymm9,%ymm9
DB 196,193,121,16,36,153 ; vmovupd (%r9,%rbx,4),%xmm4
DB 196,67,93,13,201,12 ; vblendpd $0xc,%ymm9,%ymm4,%ymm9
- DB 233,202,254,255,255 ; jmpq c3c3 <_sk_load_bgra_dst_avx+0x27>
+ DB 233,202,254,255,255 ; jmpq c6e7 <_sk_load_bgra_dst_avx+0x27>
DB 15,31,0 ; nopl (%rax)
- DB 118,255 ; jbe c4fd <_sk_load_bgra_dst_avx+0x161>
+ DB 118,255 ; jbe c821 <_sk_load_bgra_dst_avx+0x161>
DB 255 ; (bad)
DB 255,151,255,255,255,129 ; callq *-0x7e000001(%rdi)
DB 255 ; (bad)
@@ -11814,10 +11988,10 @@ _sk_gather_bgra_avx LABEL PROC
DB 73,193,234,32 ; shr $0x20,%r10
DB 196,131,121,34,28,145,3 ; vpinsrd $0x3,(%r9,%r10,4),%xmm0,%xmm3
DB 196,227,61,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm8,%ymm0
- DB 197,124,40,13,61,251,1,0 ; vmovaps 0x1fb3d(%rip),%ymm9 # 2c100 <_sk_overlay_sse2_8bit+0x9f3>
+ DB 197,124,40,13,89,253,1,0 ; vmovaps 0x1fd59(%rip),%ymm9 # 2c640 <_sk_overlay_sse2_8bit+0x9f3>
DB 196,193,124,84,193 ; vandps %ymm9,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,21,27,246,1,0 ; vbroadcastss 0x1f61b(%rip),%ymm10 # 2bbf0 <_sk_overlay_sse2_8bit+0x4e3>
+ DB 196,98,125,24,21,55,248,1,0 ; vbroadcastss 0x1f837(%rip),%ymm10 # 2c130 <_sk_overlay_sse2_8bit+0x4e3>
DB 196,193,124,89,210 ; vmulps %ymm10,%ymm0,%ymm2
DB 196,193,121,114,208,8 ; vpsrld $0x8,%xmm8,%xmm0
DB 197,241,114,211,8 ; vpsrld $0x8,%xmm3,%xmm1
@@ -11849,7 +12023,7 @@ _sk_store_bgra_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,218 ; movslq %edx,%rbx
- DB 196,98,125,24,5,81,245,1,0 ; vbroadcastss 0x1f551(%rip),%ymm8 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 196,98,125,24,5,109,247,1,0 ; vbroadcastss 0x1f76d(%rip),%ymm8 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 196,65,108,89,200 ; vmulps %ymm8,%ymm2,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,65,116,89,208 ; vmulps %ymm8,%ymm1,%ymm10
@@ -11874,7 +12048,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,65,45,86,192 ; vorpd %ymm8,%ymm10,%ymm8
DB 196,65,53,86,192 ; vorpd %ymm8,%ymm9,%ymm8
DB 77,133,192 ; test %r8,%r8
- DB 117,11 ; jne c6e6 <_sk_store_bgra_avx+0xb0>
+ DB 117,11 ; jne ca0a <_sk_store_bgra_avx+0xb0>
DB 196,65,124,17,4,153 ; vmovups %ymm8,(%r9,%rbx,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
@@ -11883,17 +12057,17 @@ _sk_store_bgra_avx LABEL PROC
DB 65,128,226,7 ; and $0x7,%r10b
DB 65,254,202 ; dec %r10b
DB 65,128,250,6 ; cmp $0x6,%r10b
- DB 119,235 ; ja c6e1 <_sk_store_bgra_avx+0xab>
+ DB 119,235 ; ja ca05 <_sk_store_bgra_avx+0xab>
DB 69,15,182,210 ; movzbl %r10b,%r10d
- DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # c754 <_sk_store_bgra_avx+0x11e>
+ DB 76,141,29,83,0,0,0 ; lea 0x53(%rip),%r11 # ca78 <_sk_store_bgra_avx+0x11e>
DB 75,99,4,147 ; movslq (%r11,%r10,4),%rax
DB 76,1,216 ; add %r11,%rax
DB 255,224 ; jmpq *%rax
DB 196,65,121,126,4,153 ; vmovd %xmm8,(%r9,%rbx,4)
- DB 235,207 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
+ DB 235,207 ; jmp ca05 <_sk_store_bgra_avx+0xab>
DB 196,67,121,22,68,153,8,2 ; vpextrd $0x2,%xmm8,0x8(%r9,%rbx,4)
DB 196,65,121,214,4,153 ; vmovq %xmm8,(%r9,%rbx,4)
- DB 235,191 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
+ DB 235,191 ; jmp ca05 <_sk_store_bgra_avx+0xab>
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,67,121,22,76,153,24,2 ; vpextrd $0x2,%xmm9,0x18(%r9,%rbx,4)
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
@@ -11901,7 +12075,7 @@ _sk_store_bgra_avx LABEL PROC
DB 196,67,125,25,193,1 ; vextractf128 $0x1,%ymm8,%xmm9
DB 196,65,122,17,76,153,16 ; vmovss %xmm9,0x10(%r9,%rbx,4)
DB 196,65,121,17,4,153 ; vmovupd %xmm8,(%r9,%rbx,4)
- DB 235,142 ; jmp c6e1 <_sk_store_bgra_avx+0xab>
+ DB 235,142 ; jmp ca05 <_sk_store_bgra_avx+0xab>
DB 144 ; nop
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -11939,7 +12113,7 @@ _sk_load_f16_avx LABEL PROC
DB 197,252,17,116,36,64 ; vmovups %ymm6,0x40(%rsp)
DB 197,252,17,108,36,32 ; vmovups %ymm5,0x20(%rsp)
DB 197,254,127,36,36 ; vmovdqu %ymm4,(%rsp)
- DB 15,133,147,2,0,0 ; jne ca41 <_sk_load_f16_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne cd65 <_sk_load_f16_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,84,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm2
DB 196,193,121,16,76,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm1
@@ -11957,13 +12131,13 @@ _sk_load_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,237,244,1,0 ; vbroadcastss 0x1f4ed(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,9,247,1,0 ; vbroadcastss 0x1f709(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,177,244,1,0 ; vbroadcastss 0x1f4b1(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,205,246,1,0 ; vbroadcastss 0x1f6cd(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,203,244,1,0 ; vbroadcastss 0x1f4cb(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,231,246,1,0 ; vbroadcastss 0x1f6e7(%rip),%xmm13 # 2c23c <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -11977,7 +12151,7 @@ _sk_load_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,129,244,1,0 ; vbroadcastss 0x1f481(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,29,157,246,1,0 ; vbroadcastss 0x1f69d(%rip),%xmm3 # 2c240 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -12070,29 +12244,29 @@ _sk_load_f16_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je caa7 <_sk_load_f16_avx+0x337>
+ DB 116,85 ; je cdcb <_sk_load_f16_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb caa7 <_sk_load_f16_avx+0x337>
+ DB 114,72 ; jb cdcb <_sk_load_f16_avx+0x337>
DB 196,193,123,16,84,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je cab4 <_sk_load_f16_avx+0x344>
+ DB 116,72 ; je cdd8 <_sk_load_f16_avx+0x344>
DB 196,193,105,22,84,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb cab4 <_sk_load_f16_avx+0x344>
+ DB 114,59 ; jb cdd8 <_sk_load_f16_avx+0x344>
DB 196,193,123,16,76,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm1
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je c7c9 <_sk_load_f16_avx+0x59>
+ DB 15,132,63,253,255,255 ; je caed <_sk_load_f16_avx+0x59>
DB 196,193,113,22,76,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm1,%xmm1
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb c7c9 <_sk_load_f16_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb caed <_sk_load_f16_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq caed <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,21,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq caed <_sk_load_f16_avx+0x59>
DB 197,241,87,201 ; vxorpd %xmm1,%xmm1,%xmm1
- DB 233,12,253,255,255 ; jmpq c7c9 <_sk_load_f16_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq caed <_sk_load_f16_avx+0x59>
PUBLIC _sk_load_f16_dst_avx
_sk_load_f16_dst_avx LABEL PROC
@@ -12109,7 +12283,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,252,17,84,36,64 ; vmovups %ymm2,0x40(%rsp)
DB 197,252,17,76,36,32 ; vmovups %ymm1,0x20(%rsp)
DB 197,254,127,4,36 ; vmovdqu %ymm0,(%rsp)
- DB 15,133,147,2,0,0 ; jne cd8e <_sk_load_f16_dst_avx+0x2d1>
+ DB 15,133,147,2,0,0 ; jne d0b2 <_sk_load_f16_dst_avx+0x2d1>
DB 196,65,121,16,4,193 ; vmovupd (%r9,%rax,8),%xmm8
DB 196,193,121,16,116,193,16 ; vmovupd 0x10(%r9,%rax,8),%xmm6
DB 196,193,121,16,108,193,32 ; vmovupd 0x20(%r9,%rax,8),%xmm5
@@ -12127,13 +12301,13 @@ _sk_load_f16_dst_avx LABEL PROC
DB 197,217,105,232 ; vpunpckhwd %xmm0,%xmm4,%xmm5
DB 196,226,121,51,228 ; vpmovzxwd %xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
- DB 196,98,125,24,37,160,241,1,0 ; vbroadcastss 0x1f1a0(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,188,243,1,0 ; vbroadcastss 0x1f3bc(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,92,84,236 ; vandps %ymm12,%ymm4,%ymm5
DB 197,220,87,229 ; vxorps %ymm5,%ymm4,%ymm4
DB 196,195,125,25,230,1 ; vextractf128 $0x1,%ymm4,%xmm14
- DB 196,98,121,24,29,100,241,1,0 ; vbroadcastss 0x1f164(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,128,243,1,0 ; vbroadcastss 0x1f380(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,251 ; vxorps %xmm11,%xmm14,%xmm7
- DB 196,98,121,24,45,126,241,1,0 ; vbroadcastss 0x1f17e(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,154,243,1,0 ; vbroadcastss 0x1f39a(%rip),%xmm13 # 2c23c <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,255 ; vpcmpgtd %xmm7,%xmm13,%xmm7
DB 196,65,88,87,211 ; vxorps %xmm11,%xmm4,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12147,7 +12321,7 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,227,93,24,231,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm4
DB 197,220,86,229 ; vorps %ymm5,%ymm4,%ymm4
DB 196,227,125,25,229,1 ; vextractf128 $0x1,%ymm4,%xmm5
- DB 196,226,121,24,61,52,241,1,0 ; vbroadcastss 0x1f134(%rip),%xmm7 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,61,80,243,1,0 ; vbroadcastss 0x1f350(%rip),%xmm7 # 2c240 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,209,254,239 ; vpaddd %xmm7,%xmm5,%xmm5
DB 197,217,254,231 ; vpaddd %xmm7,%xmm4,%xmm4
DB 196,227,93,24,229,1 ; vinsertf128 $0x1,%xmm5,%ymm4,%ymm4
@@ -12240,29 +12414,29 @@ _sk_load_f16_dst_avx LABEL PROC
DB 196,65,123,16,4,193 ; vmovsd (%r9,%rax,8),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je cdf4 <_sk_load_f16_dst_avx+0x337>
+ DB 116,85 ; je d118 <_sk_load_f16_dst_avx+0x337>
DB 196,65,57,22,68,193,8 ; vmovhpd 0x8(%r9,%rax,8),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb cdf4 <_sk_load_f16_dst_avx+0x337>
+ DB 114,72 ; jb d118 <_sk_load_f16_dst_avx+0x337>
DB 196,193,123,16,116,193,16 ; vmovsd 0x10(%r9,%rax,8),%xmm6
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je ce01 <_sk_load_f16_dst_avx+0x344>
+ DB 116,72 ; je d125 <_sk_load_f16_dst_avx+0x344>
DB 196,193,73,22,116,193,24 ; vmovhpd 0x18(%r9,%rax,8),%xmm6,%xmm6
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb ce01 <_sk_load_f16_dst_avx+0x344>
+ DB 114,59 ; jb d125 <_sk_load_f16_dst_avx+0x344>
DB 196,193,123,16,108,193,32 ; vmovsd 0x20(%r9,%rax,8),%xmm5
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,63,253,255,255 ; je cb16 <_sk_load_f16_dst_avx+0x59>
+ DB 15,132,63,253,255,255 ; je ce3a <_sk_load_f16_dst_avx+0x59>
DB 196,193,81,22,108,193,40 ; vmovhpd 0x28(%r9,%rax,8),%xmm5,%xmm5
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,46,253,255,255 ; jb cb16 <_sk_load_f16_dst_avx+0x59>
+ DB 15,130,46,253,255,255 ; jb ce3a <_sk_load_f16_dst_avx+0x59>
DB 196,65,122,126,76,193,48 ; vmovq 0x30(%r9,%rax,8),%xmm9
- DB 233,34,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
+ DB 233,34,253,255,255 ; jmpq ce3a <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
DB 197,201,87,246 ; vxorpd %xmm6,%xmm6,%xmm6
- DB 233,21,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
+ DB 233,21,253,255,255 ; jmpq ce3a <_sk_load_f16_dst_avx+0x59>
DB 197,209,87,237 ; vxorpd %xmm5,%xmm5,%xmm5
- DB 233,12,253,255,255 ; jmpq cb16 <_sk_load_f16_dst_avx+0x59>
+ DB 233,12,253,255,255 ; jmpq ce3a <_sk_load_f16_dst_avx+0x59>
PUBLIC _sk_gather_f16_avx
_sk_gather_f16_avx LABEL PROC
@@ -12321,13 +12495,13 @@ _sk_gather_f16_avx LABEL PROC
DB 197,249,105,201 ; vpunpckhwd %xmm1,%xmm0,%xmm1
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
- DB 196,98,125,24,37,226,237,1,0 ; vbroadcastss 0x1ede2(%rip),%ymm12 # 2bcf8 <_sk_overlay_sse2_8bit+0x5eb>
+ DB 196,98,125,24,37,254,239,1,0 ; vbroadcastss 0x1effe(%rip),%ymm12 # 2c238 <_sk_overlay_sse2_8bit+0x5eb>
DB 196,193,124,84,204 ; vandps %ymm12,%ymm0,%ymm1
DB 197,252,87,193 ; vxorps %ymm1,%ymm0,%ymm0
DB 196,195,125,25,198,1 ; vextractf128 $0x1,%ymm0,%xmm14
- DB 196,98,121,24,29,166,237,1,0 ; vbroadcastss 0x1eda6(%rip),%xmm11 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,121,24,29,194,239,1,0 ; vbroadcastss 0x1efc2(%rip),%xmm11 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,8,87,219 ; vxorps %xmm11,%xmm14,%xmm3
- DB 196,98,121,24,45,192,237,1,0 ; vbroadcastss 0x1edc0(%rip),%xmm13 # 2bcfc <_sk_overlay_sse2_8bit+0x5ef>
+ DB 196,98,121,24,45,220,239,1,0 ; vbroadcastss 0x1efdc(%rip),%xmm13 # 2c23c <_sk_overlay_sse2_8bit+0x5ef>
DB 197,145,102,219 ; vpcmpgtd %xmm3,%xmm13,%xmm3
DB 196,65,120,87,211 ; vxorps %xmm11,%xmm0,%xmm10
DB 196,65,17,102,210 ; vpcmpgtd %xmm10,%xmm13,%xmm10
@@ -12341,7 +12515,7 @@ _sk_gather_f16_avx LABEL PROC
DB 196,227,125,24,195,1 ; vinsertf128 $0x1,%xmm3,%ymm0,%ymm0
DB 197,252,86,193 ; vorps %ymm1,%ymm0,%ymm0
DB 196,227,125,25,193,1 ; vextractf128 $0x1,%ymm0,%xmm1
- DB 196,226,121,24,29,118,237,1,0 ; vbroadcastss 0x1ed76(%rip),%xmm3 # 2bd00 <_sk_overlay_sse2_8bit+0x5f3>
+ DB 196,226,121,24,29,146,239,1,0 ; vbroadcastss 0x1ef92(%rip),%xmm3 # 2c240 <_sk_overlay_sse2_8bit+0x5f3>
DB 197,241,254,203 ; vpaddd %xmm3,%xmm1,%xmm1
DB 197,249,254,195 ; vpaddd %xmm3,%xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
@@ -12439,12 +12613,12 @@ _sk_store_f16_avx LABEL PROC
DB 197,252,17,180,36,128,0,0,0 ; vmovups %ymm6,0x80(%rsp)
DB 197,252,17,108,36,96 ; vmovups %ymm5,0x60(%rsp)
DB 197,252,17,100,36,64 ; vmovups %ymm4,0x40(%rsp)
- DB 196,98,125,24,13,90,235,1,0 ; vbroadcastss 0x1eb5a(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,118,237,1,0 ; vbroadcastss 0x1ed76(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,124,84,209 ; vandps %ymm9,%ymm0,%ymm10
DB 197,252,17,4,36 ; vmovups %ymm0,(%rsp)
DB 196,65,124,87,218 ; vxorps %ymm10,%ymm0,%ymm11
DB 196,67,125,25,220,1 ; vextractf128 $0x1,%ymm11,%xmm12
- DB 196,98,121,24,5,108,235,1,0 ; vbroadcastss 0x1eb6c(%rip),%xmm8 # 2bd04 <_sk_overlay_sse2_8bit+0x5f7>
+ DB 196,98,121,24,5,136,237,1,0 ; vbroadcastss 0x1ed88(%rip),%xmm8 # 2c244 <_sk_overlay_sse2_8bit+0x5f7>
DB 196,65,57,102,236 ; vpcmpgtd %xmm12,%xmm8,%xmm13
DB 196,65,57,102,243 ; vpcmpgtd %xmm11,%xmm8,%xmm14
DB 196,67,13,24,237,1 ; vinsertf128 $0x1,%xmm13,%ymm14,%ymm13
@@ -12454,7 +12628,7 @@ _sk_store_f16_avx LABEL PROC
DB 196,67,13,24,242,1 ; vinsertf128 $0x1,%xmm10,%ymm14,%ymm14
DB 196,193,33,114,211,13 ; vpsrld $0xd,%xmm11,%xmm11
DB 196,193,25,114,212,13 ; vpsrld $0xd,%xmm12,%xmm12
- DB 196,98,125,24,21,51,235,1,0 ; vbroadcastss 0x1eb33(%rip),%ymm10 # 2bd08 <_sk_overlay_sse2_8bit+0x5fb>
+ DB 196,98,125,24,21,79,237,1,0 ; vbroadcastss 0x1ed4f(%rip),%ymm10 # 2c248 <_sk_overlay_sse2_8bit+0x5fb>
DB 196,65,12,86,242 ; vorps %ymm10,%ymm14,%ymm14
DB 196,67,125,25,247,1 ; vextractf128 $0x1,%ymm14,%xmm15
DB 196,65,1,254,228 ; vpaddd %xmm12,%xmm15,%xmm12
@@ -12541,7 +12715,7 @@ _sk_store_f16_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,79 ; jne d3d2 <_sk_store_f16_avx+0x286>
+ DB 117,79 ; jne d6f6 <_sk_store_f16_avx+0x286>
DB 196,65,120,17,28,193 ; vmovups %xmm11,(%r9,%rax,8)
DB 196,65,120,17,84,193,16 ; vmovups %xmm10,0x10(%r9,%rax,8)
DB 196,65,120,17,76,193,32 ; vmovups %xmm9,0x20(%r9,%rax,8)
@@ -12557,22 +12731,22 @@ _sk_store_f16_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,193 ; vmovq %xmm11,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,192 ; je d39e <_sk_store_f16_avx+0x252>
+ DB 116,192 ; je d6c2 <_sk_store_f16_avx+0x252>
DB 196,65,121,23,92,193,8 ; vmovhpd %xmm11,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,179 ; jb d39e <_sk_store_f16_avx+0x252>
+ DB 114,179 ; jb d6c2 <_sk_store_f16_avx+0x252>
DB 196,65,121,214,84,193,16 ; vmovq %xmm10,0x10(%r9,%rax,8)
- DB 116,170 ; je d39e <_sk_store_f16_avx+0x252>
+ DB 116,170 ; je d6c2 <_sk_store_f16_avx+0x252>
DB 196,65,121,23,84,193,24 ; vmovhpd %xmm10,0x18(%r9,%rax,8)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,157 ; jb d39e <_sk_store_f16_avx+0x252>
+ DB 114,157 ; jb d6c2 <_sk_store_f16_avx+0x252>
DB 196,65,121,214,76,193,32 ; vmovq %xmm9,0x20(%r9,%rax,8)
- DB 116,148 ; je d39e <_sk_store_f16_avx+0x252>
+ DB 116,148 ; je d6c2 <_sk_store_f16_avx+0x252>
DB 196,65,121,23,76,193,40 ; vmovhpd %xmm9,0x28(%r9,%rax,8)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,135 ; jb d39e <_sk_store_f16_avx+0x252>
+ DB 114,135 ; jb d6c2 <_sk_store_f16_avx+0x252>
DB 196,65,121,214,68,193,48 ; vmovq %xmm8,0x30(%r9,%rax,8)
- DB 233,123,255,255,255 ; jmpq d39e <_sk_store_f16_avx+0x252>
+ DB 233,123,255,255,255 ; jmpq d6c2 <_sk_store_f16_avx+0x252>
PUBLIC _sk_load_u16_be_avx
_sk_load_u16_be_avx LABEL PROC
@@ -12585,7 +12759,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne d547 <_sk_load_u16_be_avx+0x124>
+ DB 15,133,253,0,0,0 ; jne d86b <_sk_load_u16_be_avx+0x124>
DB 196,65,121,16,4,65 ; vmovupd (%r9,%rax,2),%xmm8
DB 196,193,121,16,84,65,16 ; vmovupd 0x10(%r9,%rax,2),%xmm2
DB 196,193,121,16,92,65,32 ; vmovupd 0x20(%r9,%rax,2),%xmm3
@@ -12607,7 +12781,7 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,81,231,1,0 ; vbroadcastss 0x1e751(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
+ DB 196,98,125,24,29,109,233,1,0 ; vbroadcastss 0x1e96d(%rip),%ymm11 # 2c14c <_sk_overlay_sse2_8bit+0x4ff>
DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
DB 197,177,109,202 ; vpunpckhqdq %xmm2,%xmm9,%xmm1
DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
@@ -12641,29 +12815,29 @@ _sk_load_u16_be_avx LABEL PROC
DB 196,65,123,16,4,65 ; vmovsd (%r9,%rax,2),%xmm8
DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,85 ; je d5ad <_sk_load_u16_be_avx+0x18a>
+ DB 116,85 ; je d8d1 <_sk_load_u16_be_avx+0x18a>
DB 196,65,57,22,68,65,8 ; vmovhpd 0x8(%r9,%rax,2),%xmm8,%xmm8
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,72 ; jb d5ad <_sk_load_u16_be_avx+0x18a>
+ DB 114,72 ; jb d8d1 <_sk_load_u16_be_avx+0x18a>
DB 196,193,123,16,84,65,16 ; vmovsd 0x10(%r9,%rax,2),%xmm2
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 116,72 ; je d5ba <_sk_load_u16_be_avx+0x197>
+ DB 116,72 ; je d8de <_sk_load_u16_be_avx+0x197>
DB 196,193,105,22,84,65,24 ; vmovhpd 0x18(%r9,%rax,2),%xmm2,%xmm2
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,59 ; jb d5ba <_sk_load_u16_be_avx+0x197>
+ DB 114,59 ; jb d8de <_sk_load_u16_be_avx+0x197>
DB 196,193,123,16,92,65,32 ; vmovsd 0x20(%r9,%rax,2),%xmm3
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 15,132,213,254,255,255 ; je d465 <_sk_load_u16_be_avx+0x42>
+ DB 15,132,213,254,255,255 ; je d789 <_sk_load_u16_be_avx+0x42>
DB 196,193,97,22,92,65,40 ; vmovhpd 0x28(%r9,%rax,2),%xmm3,%xmm3
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,130,196,254,255,255 ; jb d465 <_sk_load_u16_be_avx+0x42>
+ DB 15,130,196,254,255,255 ; jb d789 <_sk_load_u16_be_avx+0x42>
DB 196,65,122,126,76,65,48 ; vmovq 0x30(%r9,%rax,2),%xmm9
- DB 233,184,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
+ DB 233,184,254,255,255 ; jmpq d789 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
DB 197,233,87,210 ; vxorpd %xmm2,%xmm2,%xmm2
- DB 233,171,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
+ DB 233,171,254,255,255 ; jmpq d789 <_sk_load_u16_be_avx+0x42>
DB 197,225,87,219 ; vxorpd %xmm3,%xmm3,%xmm3
- DB 233,162,254,255,255 ; jmpq d465 <_sk_load_u16_be_avx+0x42>
+ DB 233,162,254,255,255 ; jmpq d789 <_sk_load_u16_be_avx+0x42>
PUBLIC _sk_load_rgb_u16_be_avx
_sk_load_rgb_u16_be_avx LABEL PROC
@@ -12678,89 +12852,117 @@ _sk_load_rgb_u16_be_avx LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,243,0,0,0 ; jne d6e1 <_sk_load_rgb_u16_be_avx+0x11e>
- DB 196,193,122,111,4,65 ; vmovdqu (%r9,%rax,2),%xmm0
- DB 196,193,122,111,84,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm2
- DB 196,193,122,111,76,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm1
- DB 196,193,122,111,92,65,32 ; vmovdqu 0x20(%r9,%rax,2),%xmm3
- DB 197,225,115,219,4 ; vpsrldq $0x4,%xmm3,%xmm3
- DB 197,185,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm8
- DB 197,177,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm9
- DB 197,161,115,217,6 ; vpsrldq $0x6,%xmm1,%xmm11
+ DB 15,133,241,0,0,0 ; jne da03 <_sk_load_rgb_u16_be_avx+0x11c>
+ DB 196,65,122,111,28,65 ; vmovdqu (%r9,%rax,2),%xmm11
+ DB 196,193,122,111,92,65,12 ; vmovdqu 0xc(%r9,%rax,2),%xmm3
+ DB 196,193,122,111,84,65,24 ; vmovdqu 0x18(%r9,%rax,2),%xmm2
+ DB 196,193,122,111,68,65,32 ; vmovdqu 0x20(%r9,%rax,2),%xmm0
+ DB 197,249,115,216,4 ; vpsrldq $0x4,%xmm0,%xmm0
+ DB 196,193,57,115,219,6 ; vpsrldq $0x6,%xmm11,%xmm8
DB 197,169,115,219,6 ; vpsrldq $0x6,%xmm3,%xmm10
- DB 197,249,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm0
- DB 196,193,57,97,209 ; vpunpcklwd %xmm9,%xmm8,%xmm2
- DB 197,241,97,203 ; vpunpcklwd %xmm3,%xmm1,%xmm1
- DB 196,193,33,97,218 ; vpunpcklwd %xmm10,%xmm11,%xmm3
- DB 197,121,97,194 ; vpunpcklwd %xmm2,%xmm0,%xmm8
- DB 197,121,105,202 ; vpunpckhwd %xmm2,%xmm0,%xmm9
- DB 197,241,97,211 ; vpunpcklwd %xmm3,%xmm1,%xmm2
- DB 197,113,105,211 ; vpunpckhwd %xmm3,%xmm1,%xmm10
- DB 197,185,108,194 ; vpunpcklqdq %xmm2,%xmm8,%xmm0
- DB 197,241,113,240,8 ; vpsllw $0x8,%xmm0,%xmm1
+ DB 197,153,115,218,6 ; vpsrldq $0x6,%xmm2,%xmm12
+ DB 197,177,115,216,6 ; vpsrldq $0x6,%xmm0,%xmm9
+ DB 197,161,97,219 ; vpunpcklwd %xmm3,%xmm11,%xmm3
+ DB 196,193,57,97,202 ; vpunpcklwd %xmm10,%xmm8,%xmm1
+ DB 197,233,97,192 ; vpunpcklwd %xmm0,%xmm2,%xmm0
+ DB 196,193,25,97,209 ; vpunpcklwd %xmm9,%xmm12,%xmm2
+ DB 197,97,97,193 ; vpunpcklwd %xmm1,%xmm3,%xmm8
+ DB 197,97,105,201 ; vpunpckhwd %xmm1,%xmm3,%xmm9
+ DB 197,249,97,202 ; vpunpcklwd %xmm2,%xmm0,%xmm1
+ DB 197,121,105,210 ; vpunpckhwd %xmm2,%xmm0,%xmm10
+ DB 197,185,108,193 ; vpunpcklqdq %xmm1,%xmm8,%xmm0
+ DB 197,225,113,240,8 ; vpsllw $0x8,%xmm0,%xmm3
DB 197,249,113,208,8 ; vpsrlw $0x8,%xmm0,%xmm0
- DB 197,241,235,192 ; vpor %xmm0,%xmm1,%xmm0
- DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
- DB 196,193,121,105,204 ; vpunpckhwd %xmm12,%xmm0,%xmm1
+ DB 197,225,235,192 ; vpor %xmm0,%xmm3,%xmm0
+ DB 196,65,33,239,219 ; vpxor %xmm11,%xmm11,%xmm11
+ DB 196,193,121,105,211 ; vpunpckhwd %xmm11,%xmm0,%xmm2
DB 196,226,121,51,192 ; vpmovzxwd %xmm0,%xmm0
- DB 196,227,125,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm0,%ymm0
+ DB 196,227,125,24,194,1 ; vinsertf128 $0x1,%xmm2,%ymm0,%ymm0
DB 197,252,91,192 ; vcvtdq2ps %ymm0,%ymm0
- DB 196,98,125,24,29,148,229,1,0 ; vbroadcastss 0x1e594(%rip),%ymm11 # 2bc0c <_sk_overlay_sse2_8bit+0x4ff>
- DB 196,193,124,89,195 ; vmulps %ymm11,%ymm0,%ymm0
- DB 197,185,109,202 ; vpunpckhqdq %xmm2,%xmm8,%xmm1
- DB 197,233,113,241,8 ; vpsllw $0x8,%xmm1,%xmm2
+ DB 196,226,125,24,21,175,231,1,0 ; vbroadcastss 0x1e7af(%rip),%ymm2 # 2c14c <_sk_overlay_sse2_8bit+0x4ff>
+ DB 197,252,89,194 ; vmulps %ymm2,%ymm0,%ymm0
+ DB 197,185,109,201 ; vpunpckhqdq %xmm1,%xmm8,%xmm1
+ DB 197,225,113,241,8 ; vpsllw $0x8,%xmm1,%xmm3
DB 197,241,113,209,8 ; vpsrlw $0x8,%xmm1,%xmm1
- DB 197,233,235,201 ; vpor %xmm1,%xmm2,%xmm1
- DB 196,193,113,105,212 ; vpunpckhwd %xmm12,%xmm1,%xmm2
+ DB 197,225,235,201 ; vpor %xmm1,%xmm3,%xmm1
+ DB 196,193,113,105,219 ; vpunpckhwd %xmm11,%xmm1,%xmm3
DB 196,226,121,51,201 ; vpmovzxwd %xmm1,%xmm1
- DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
+ DB 196,227,117,24,203,1 ; vinsertf128 $0x1,%xmm3,%ymm1,%ymm1
DB 197,252,91,201 ; vcvtdq2ps %ymm1,%ymm1
- DB 196,193,116,89,203 ; vmulps %ymm11,%ymm1,%ymm1
- DB 196,193,49,108,210 ; vpunpcklqdq %xmm10,%xmm9,%xmm2
- DB 197,225,113,242,8 ; vpsllw $0x8,%xmm2,%xmm3
- DB 197,233,113,210,8 ; vpsrlw $0x8,%xmm2,%xmm2
- DB 197,225,235,210 ; vpor %xmm2,%xmm3,%xmm2
- DB 196,193,105,105,220 ; vpunpckhwd %xmm12,%xmm2,%xmm3
- DB 196,226,121,51,210 ; vpmovzxwd %xmm2,%xmm2
- DB 196,227,109,24,211,1 ; vinsertf128 $0x1,%xmm3,%ymm2,%ymm2
- DB 197,252,91,210 ; vcvtdq2ps %ymm2,%ymm2
- DB 196,193,108,89,211 ; vmulps %ymm11,%ymm2,%ymm2
+ DB 197,244,89,202 ; vmulps %ymm2,%ymm1,%ymm1
+ DB 196,193,49,108,218 ; vpunpcklqdq %xmm10,%xmm9,%xmm3
+ DB 197,185,113,243,8 ; vpsllw $0x8,%xmm3,%xmm8
+ DB 197,225,113,211,8 ; vpsrlw $0x8,%xmm3,%xmm3
+ DB 197,185,235,219 ; vpor %xmm3,%xmm8,%xmm3
+ DB 196,65,97,105,195 ; vpunpckhwd %xmm11,%xmm3,%xmm8
+ DB 196,226,121,51,219 ; vpmovzxwd %xmm3,%xmm3
+ DB 196,195,101,24,216,1 ; vinsertf128 $0x1,%xmm8,%ymm3,%ymm3
+ DB 197,252,91,219 ; vcvtdq2ps %ymm3,%ymm3
+ DB 197,228,89,210 ; vmulps %ymm2,%ymm3,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,157,228,1,0 ; vbroadcastss 0x1e49d(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,187,230,1,0 ; vbroadcastss 0x1e6bb(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 255,224 ; jmpq *%rax
DB 196,193,121,110,4,65 ; vmovd (%r9,%rax,2),%xmm0
- DB 196,193,121,196,68,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm0
+ DB 196,65,121,196,92,65,4,2 ; vpinsrw $0x2,0x4(%r9,%rax,2),%xmm0,%xmm11
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,5 ; jne d6fa <_sk_load_rgb_u16_be_avx+0x137>
- DB 233,40,255,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 196,193,121,110,76,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm1
- DB 196,65,113,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm1,%xmm8
+ DB 117,32 ; jne da3c <_sk_load_rgb_u16_be_avx+0x155>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 196,65,57,239,192 ; vpxor %xmm8,%xmm8,%xmm8
+ DB 233,11,255,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
+ DB 196,193,121,110,68,65,6 ; vmovd 0x6(%r9,%rax,2),%xmm0
+ DB 196,65,121,196,68,65,10,2 ; vpinsrw $0x2,0xa(%r9,%rax,2),%xmm0,%xmm8
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,26 ; jb d729 <_sk_load_rgb_u16_be_avx+0x166>
- DB 196,193,121,110,76,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm1
- DB 196,193,113,196,84,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm1,%xmm2
+ DB 114,49 ; jb da87 <_sk_load_rgb_u16_be_avx+0x1a0>
+ DB 196,193,121,110,68,65,12 ; vmovd 0xc(%r9,%rax,2),%xmm0
+ DB 196,193,121,196,92,65,16,2 ; vpinsrw $0x2,0x10(%r9,%rax,2),%xmm0,%xmm3
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 117,10 ; jne d72e <_sk_load_rgb_u16_be_avx+0x16b>
- DB 233,249,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,244,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 196,193,121,110,76,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm1
- DB 196,65,113,196,76,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm1,%xmm9
+ DB 117,50 ; jne daa2 <_sk_load_rgb_u16_be_avx+0x1bb>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 233,192,254,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 196,65,41,239,210 ; vpxor %xmm10,%xmm10,%xmm10
+ DB 197,225,239,219 ; vpxor %xmm3,%xmm3,%xmm3
+ DB 233,165,254,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
+ DB 196,193,121,110,68,65,18 ; vmovd 0x12(%r9,%rax,2),%xmm0
+ DB 196,65,121,196,84,65,22,2 ; vpinsrw $0x2,0x16(%r9,%rax,2),%xmm0,%xmm10
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,26 ; jb d75d <_sk_load_rgb_u16_be_avx+0x19a>
- DB 196,193,121,110,76,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm1
- DB 196,193,113,196,76,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm1,%xmm1
+ DB 114,40 ; jb dae4 <_sk_load_rgb_u16_be_avx+0x1fd>
+ DB 196,193,121,110,68,65,24 ; vmovd 0x18(%r9,%rax,2),%xmm0
+ DB 196,193,121,196,84,65,28,2 ; vpinsrw $0x2,0x1c(%r9,%rax,2),%xmm0,%xmm2
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 117,10 ; jne d762 <_sk_load_rgb_u16_be_avx+0x19f>
- DB 233,197,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,192,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 196,193,121,110,92,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm3
- DB 196,65,97,196,92,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm3,%xmm11
+ DB 117,32 ; jne daf6 <_sk_load_rgb_u16_be_avx+0x20f>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 233,99,254,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 196,65,25,239,228 ; vpxor %xmm12,%xmm12,%xmm12
+ DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
+ DB 233,81,254,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
+ DB 196,193,121,110,68,65,30 ; vmovd 0x1e(%r9,%rax,2),%xmm0
+ DB 196,65,121,196,100,65,34,2 ; vpinsrw $0x2,0x22(%r9,%rax,2),%xmm0,%xmm12
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,20 ; jb d78b <_sk_load_rgb_u16_be_avx+0x1c8>
- DB 196,193,121,110,92,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm3
- DB 196,193,97,196,92,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm3,%xmm3
- DB 233,151,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
- DB 233,146,254,255,255 ; jmpq d622 <_sk_load_rgb_u16_be_avx+0x5f>
+ DB 114,25 ; jb db29 <_sk_load_rgb_u16_be_avx+0x242>
+ DB 196,193,121,110,68,65,36 ; vmovd 0x24(%r9,%rax,2),%xmm0
+ DB 196,193,121,196,68,65,40,2 ; vpinsrw $0x2,0x28(%r9,%rax,2),%xmm0,%xmm0
+ DB 196,65,49,239,201 ; vpxor %xmm9,%xmm9,%xmm9
+ DB 233,30,254,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
+ DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
+ DB 233,21,254,255,255 ; jmpq d947 <_sk_load_rgb_u16_be_avx+0x60>
PUBLIC _sk_store_u16_be_avx
_sk_store_u16_be_avx LABEL PROC
@@ -12772,7 +12974,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 196,98,125,24,5,221,228,1,0 ; vbroadcastss 0x1e4dd(%rip),%ymm8 # 2bc94 <_sk_overlay_sse2_8bit+0x587>
+ DB 196,98,125,24,5,123,230,1,0 ; vbroadcastss 0x1e67b(%rip),%ymm8 # 2c1d4 <_sk_overlay_sse2_8bit+0x587>
DB 196,65,124,89,200 ; vmulps %ymm8,%ymm0,%ymm9
DB 196,65,125,91,201 ; vcvtps2dq %ymm9,%ymm9
DB 196,67,125,25,202,1 ; vextractf128 $0x1,%ymm9,%xmm10
@@ -12810,7 +13012,7 @@ _sk_store_u16_be_avx LABEL PROC
DB 196,65,17,98,200 ; vpunpckldq %xmm8,%xmm13,%xmm9
DB 196,65,17,106,192 ; vpunpckhdq %xmm8,%xmm13,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,31 ; jne d89b <_sk_store_u16_be_avx+0x10b>
+ DB 117,31 ; jne dc3d <_sk_store_u16_be_avx+0x10b>
DB 196,65,120,17,28,65 ; vmovups %xmm11,(%r9,%rax,2)
DB 196,65,120,17,84,65,16 ; vmovups %xmm10,0x10(%r9,%rax,2)
DB 196,65,120,17,76,65,32 ; vmovups %xmm9,0x20(%r9,%rax,2)
@@ -12819,28 +13021,34 @@ _sk_store_u16_be_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,214,28,65 ; vmovq %xmm11,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je d897 <_sk_store_u16_be_avx+0x107>
+ DB 116,240 ; je dc39 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,92,65,8 ; vmovhpd %xmm11,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb d897 <_sk_store_u16_be_avx+0x107>
+ DB 114,227 ; jb dc39 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,84,65,16 ; vmovq %xmm10,0x10(%r9,%rax,2)
- DB 116,218 ; je d897 <_sk_store_u16_be_avx+0x107>
+ DB 116,218 ; je dc39 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,84,65,24 ; vmovhpd %xmm10,0x18(%r9,%rax,2)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb d897 <_sk_store_u16_be_avx+0x107>
+ DB 114,205 ; jb dc39 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,76,65,32 ; vmovq %xmm9,0x20(%r9,%rax,2)
- DB 116,196 ; je d897 <_sk_store_u16_be_avx+0x107>
+ DB 116,196 ; je dc39 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,23,76,65,40 ; vmovhpd %xmm9,0x28(%r9,%rax,2)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,183 ; jb d897 <_sk_store_u16_be_avx+0x107>
+ DB 114,183 ; jb dc39 <_sk_store_u16_be_avx+0x107>
DB 196,65,121,214,68,65,48 ; vmovq %xmm8,0x30(%r9,%rax,2)
- DB 235,174 ; jmp d897 <_sk_store_u16_be_avx+0x107>
+ DB 235,174 ; jmp dc39 <_sk_store_u16_be_avx+0x107>
PUBLIC _sk_load_f32_avx
_sk_load_f32_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja d975 <_sk_load_f32_avx+0x8c>
+ DB 15,135,101,1,0,0 ; ja de00 <_sk_load_f32_avx+0x175>
+ DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
+ DB 197,253,17,36,36 ; vmovupd %ymm4,(%rsp)
+ DB 197,253,17,108,36,32 ; vmovupd %ymm5,0x20(%rsp)
+ DB 197,253,17,116,36,64 ; vmovupd %ymm6,0x40(%rsp)
+ DB 197,253,17,124,36,96 ; vmovupd %ymm7,0x60(%rsp)
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12848,47 +13056,85 @@ _sk_load_f32_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,135,0,0,0 ; lea 0x87(%rip),%r11 # d9a0 <_sk_load_f32_avx+0xb7>
+ DB 76,141,29,51,1,0,0 ; lea 0x133(%rip),%r11 # de10 <_sk_load_f32_avx+0x185>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
- DB 255,224 ; jmpq *%rax
- DB 196,3,125,24,68,145,112,1 ; vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- DB 196,131,125,24,92,145,96,1 ; vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm3
- DB 196,131,125,24,76,145,80,1 ; vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm1
- DB 196,131,125,24,84,145,64,1 ; vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm2
- DB 196,129,121,16,68,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm0
- DB 196,195,125,13,192,12 ; vblendpd $0xc,%ymm8,%ymm0,%ymm0
- DB 196,1,121,16,68,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm8
- DB 196,99,61,13,203,12 ; vblendpd $0xc,%ymm3,%ymm8,%ymm9
- DB 196,129,121,16,92,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm3
- DB 196,99,101,13,209,12 ; vblendpd $0xc,%ymm1,%ymm3,%ymm10
+ DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
+ DB 196,65,53,87,201 ; vxorpd %ymm9,%ymm9,%ymm9
+ DB 197,237,87,210 ; vxorpd %ymm2,%ymm2,%ymm2
+ DB 196,65,37,87,219 ; vxorpd %ymm11,%ymm11,%ymm11
+ DB 196,65,29,87,228 ; vxorpd %ymm12,%ymm12,%ymm12
+ DB 196,65,61,87,192 ; vxorpd %ymm8,%ymm8,%ymm8
+ DB 196,65,13,87,246 ; vxorpd %ymm14,%ymm14,%ymm14
+ DB 197,205,87,246 ; vxorpd %ymm6,%ymm6,%ymm6
+ DB 196,65,5,87,255 ; vxorpd %ymm15,%ymm15,%ymm15
+ DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
+ DB 196,65,21,87,237 ; vxorpd %ymm13,%ymm13,%ymm13
+ DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
+ DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
+ DB 255,224 ; jmpq *%rax
+ DB 196,129,121,16,68,145,112 ; vmovupd 0x70(%r9,%r10,4),%xmm0
+ DB 196,227,125,6,192,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ DB 196,129,121,16,76,145,96 ; vmovupd 0x60(%r9,%r10,4),%xmm1
+ DB 196,227,125,6,225,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm4
+ DB 196,129,121,16,76,145,80 ; vmovupd 0x50(%r9,%r10,4),%xmm1
+ DB 196,227,125,6,209,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm2
+ DB 197,125,40,204 ; vmovapd %ymm4,%ymm9
+ DB 196,129,121,16,76,145,64 ; vmovupd 0x40(%r9,%r10,4),%xmm1
+ DB 196,99,125,6,193,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm8
+ DB 196,65,125,40,217 ; vmovapd %ymm9,%ymm11
+ DB 197,125,40,226 ; vmovapd %ymm2,%ymm12
+ DB 196,129,121,16,76,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm1
+ DB 196,227,117,13,192,12 ; vblendpd $0xc,%ymm0,%ymm1,%ymm0
+ DB 196,65,125,40,243 ; vmovapd %ymm11,%ymm14
+ DB 197,125,41,230 ; vmovapd %ymm12,%ymm6
+ DB 196,65,125,40,248 ; vmovapd %ymm8,%ymm15
+ DB 196,129,121,16,76,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm1
+ DB 196,195,117,13,206,12 ; vblendpd $0xc,%ymm14,%ymm1,%ymm1
+ DB 197,125,40,238 ; vmovapd %ymm6,%ymm13
+ DB 197,125,41,253 ; vmovapd %ymm15,%ymm5
+ DB 196,129,121,16,84,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm2
+ DB 196,67,109,13,213,12 ; vblendpd $0xc,%ymm13,%ymm2,%ymm10
+ DB 197,253,40,217 ; vmovapd %ymm1,%ymm3
+ DB 197,253,40,253 ; vmovapd %ymm5,%ymm7
DB 196,129,121,16,12,145 ; vmovupd (%r9,%r10,4),%xmm1
- DB 196,227,117,13,202,12 ; vblendpd $0xc,%ymm2,%ymm1,%ymm1
+ DB 196,227,117,13,207,12 ; vblendpd $0xc,%ymm7,%ymm1,%ymm1
+ DB 197,252,16,124,36,96 ; vmovups 0x60(%rsp),%ymm7
+ DB 197,252,16,116,36,64 ; vmovups 0x40(%rsp),%ymm6
+ DB 197,252,16,108,36,32 ; vmovups 0x20(%rsp),%ymm5
+ DB 197,252,16,36,36 ; vmovups (%rsp),%ymm4
+ DB 72,129,196,152,0,0,0 ; add $0x98,%rsp
DB 196,193,116,20,210 ; vunpcklps %ymm10,%ymm1,%ymm2
- DB 196,193,116,21,218 ; vunpckhps %ymm10,%ymm1,%ymm3
- DB 197,180,20,200 ; vunpcklps %ymm0,%ymm9,%ymm1
- DB 197,52,21,192 ; vunpckhps %ymm0,%ymm9,%ymm8
+ DB 196,65,116,21,194 ; vunpckhps %ymm10,%ymm1,%ymm8
+ DB 197,228,20,200 ; vunpcklps %ymm0,%ymm3,%ymm1
+ DB 197,228,21,216 ; vunpckhps %ymm0,%ymm3,%ymm3
DB 197,237,20,193 ; vunpcklpd %ymm1,%ymm2,%ymm0
DB 197,237,21,201 ; vunpckhpd %ymm1,%ymm2,%ymm1
- DB 196,193,101,20,208 ; vunpcklpd %ymm8,%ymm3,%ymm2
- DB 196,193,101,21,216 ; vunpckhpd %ymm8,%ymm3,%ymm3
+ DB 197,189,20,211 ; vunpcklpd %ymm3,%ymm8,%ymm2
+ DB 197,189,21,219 ; vunpckhpd %ymm3,%ymm8,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
- DB 15,31,0 ; nopl (%rax)
- DB 130 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255,201 ; dec %ecx
+ DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
+ DB 235,203 ; jmp ddda <_sk_load_f32_avx+0x14f>
+ DB 144 ; nop
+ DB 26,255 ; sbb %bh,%bh
DB 255 ; (bad)
+ DB 255,160,255,255,255,139 ; jmpq *-0x74000001(%rax)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 188,255,255,255,175 ; mov $0xafffffff,%esp
+ DB 255,118,255 ; pushq -0x1(%rsi)
DB 255 ; (bad)
+ DB 255,91,255 ; lcall *-0x1(%rbx)
DB 255 ; (bad)
- DB 255,162,255,255,255,154 ; jmpq *-0x65000001(%rdx)
+ DB 255,69,255 ; incl -0x1(%rbp)
DB 255 ; (bad)
+ DB 255,52,255 ; pushq (%rdi,%rdi,8)
DB 255 ; (bad)
- DB 255,146,255,255,255,138 ; callq *-0x75000001(%rdx)
+ DB 255,39 ; jmpq *(%rdi)
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -12896,8 +13142,14 @@ _sk_load_f32_avx LABEL PROC
PUBLIC _sk_load_f32_dst_avx
_sk_load_f32_dst_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
+ DB 197,221,87,228 ; vxorpd %ymm4,%ymm4,%ymm4
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 15,135,128,0,0,0 ; ja da4c <_sk_load_f32_dst_avx+0x8c>
+ DB 15,135,101,1,0,0 ; ja dfa5 <_sk_load_f32_dst_avx+0x175>
+ DB 72,129,236,152,0,0,0 ; sub $0x98,%rsp
+ DB 197,253,17,4,36 ; vmovupd %ymm0,(%rsp)
+ DB 197,253,17,76,36,32 ; vmovupd %ymm1,0x20(%rsp)
+ DB 197,253,17,84,36,64 ; vmovupd %ymm2,0x40(%rsp)
+ DB 197,253,17,92,36,96 ; vmovupd %ymm3,0x60(%rsp)
DB 68,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10d
DB 76,99,88,8 ; movslq 0x8(%rax),%r11
DB 76,99,201 ; movslq %ecx,%r9
@@ -12905,45 +13157,81 @@ _sk_load_f32_dst_avx LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 77,99,210 ; movslq %r10d,%r10
- DB 76,141,29,132,0,0,0 ; lea 0x84(%rip),%r11 # da74 <_sk_load_f32_dst_avx+0xb4>
+ DB 76,141,29,50,1,0,0 ; lea 0x132(%rip),%r11 # dfb4 <_sk_load_f32_dst_avx+0x184>
DB 75,99,4,131 ; movslq (%r11,%r8,4),%rax
DB 76,1,216 ; add %r11,%rax
- DB 255,224 ; jmpq *%rax
- DB 196,3,125,24,68,145,112,1 ; vinsertf128 $0x1,0x70(%r9,%r10,4),%ymm0,%ymm8
- DB 196,131,125,24,124,145,96,1 ; vinsertf128 $0x1,0x60(%r9,%r10,4),%ymm0,%ymm7
- DB 196,131,125,24,108,145,80,1 ; vinsertf128 $0x1,0x50(%r9,%r10,4),%ymm0,%ymm5
- DB 196,131,125,24,116,145,64,1 ; vinsertf128 $0x1,0x40(%r9,%r10,4),%ymm0,%ymm6
- DB 196,129,121,16,100,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm4
- DB 196,195,93,13,224,12 ; vblendpd $0xc,%ymm8,%ymm4,%ymm4
- DB 196,1,121,16,68,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm8
- DB 196,99,61,13,207,12 ; vblendpd $0xc,%ymm7,%ymm8,%ymm9
- DB 196,129,121,16,124,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm7
- DB 196,99,69,13,213,12 ; vblendpd $0xc,%ymm5,%ymm7,%ymm10
- DB 196,129,121,16,44,145 ; vmovupd (%r9,%r10,4),%xmm5
- DB 196,227,85,13,238,12 ; vblendpd $0xc,%ymm6,%ymm5,%ymm5
+ DB 197,253,87,192 ; vxorpd %ymm0,%ymm0,%ymm0
+ DB 196,65,53,87,201 ; vxorpd %ymm9,%ymm9,%ymm9
+ DB 197,205,87,246 ; vxorpd %ymm6,%ymm6,%ymm6
+ DB 196,65,37,87,219 ; vxorpd %ymm11,%ymm11,%ymm11
+ DB 196,65,29,87,228 ; vxorpd %ymm12,%ymm12,%ymm12
+ DB 196,65,61,87,192 ; vxorpd %ymm8,%ymm8,%ymm8
+ DB 196,65,13,87,246 ; vxorpd %ymm14,%ymm14,%ymm14
+ DB 197,237,87,210 ; vxorpd %ymm2,%ymm2,%ymm2
+ DB 196,65,5,87,255 ; vxorpd %ymm15,%ymm15,%ymm15
+ DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
+ DB 196,65,21,87,237 ; vxorpd %ymm13,%ymm13,%ymm13
+ DB 197,245,87,201 ; vxorpd %ymm1,%ymm1,%ymm1
+ DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,229,87,219 ; vxorpd %ymm3,%ymm3,%ymm3
+ DB 255,224 ; jmpq *%rax
+ DB 196,129,121,16,68,145,112 ; vmovupd 0x70(%r9,%r10,4),%xmm0
+ DB 196,227,125,6,224,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm4
+ DB 196,129,121,16,68,145,96 ; vmovupd 0x60(%r9,%r10,4),%xmm0
+ DB 196,227,125,6,192,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm0
+ DB 196,129,121,16,76,145,80 ; vmovupd 0x50(%r9,%r10,4),%xmm1
+ DB 196,227,125,6,241,40 ; vperm2f128 $0x28,%ymm1,%ymm0,%ymm6
+ DB 197,125,40,200 ; vmovapd %ymm0,%ymm9
+ DB 196,129,121,16,68,145,64 ; vmovupd 0x40(%r9,%r10,4),%xmm0
+ DB 196,99,125,6,192,40 ; vperm2f128 $0x28,%ymm0,%ymm0,%ymm8
+ DB 196,65,125,40,217 ; vmovapd %ymm9,%ymm11
+ DB 197,125,40,230 ; vmovapd %ymm6,%ymm12
+ DB 196,129,121,16,68,145,48 ; vmovupd 0x30(%r9,%r10,4),%xmm0
+ DB 196,227,125,13,228,12 ; vblendpd $0xc,%ymm4,%ymm0,%ymm4
+ DB 196,65,125,40,243 ; vmovapd %ymm11,%ymm14
+ DB 197,125,41,226 ; vmovapd %ymm12,%ymm2
+ DB 196,65,125,40,248 ; vmovapd %ymm8,%ymm15
+ DB 196,129,121,16,68,145,32 ; vmovupd 0x20(%r9,%r10,4),%xmm0
+ DB 196,195,125,13,238,12 ; vblendpd $0xc,%ymm14,%ymm0,%ymm5
+ DB 197,125,40,234 ; vmovapd %ymm2,%ymm13
+ DB 197,125,41,249 ; vmovapd %ymm15,%ymm1
+ DB 196,129,121,16,68,145,16 ; vmovupd 0x10(%r9,%r10,4),%xmm0
+ DB 196,67,125,13,213,12 ; vblendpd $0xc,%ymm13,%ymm0,%ymm10
+ DB 197,253,40,253 ; vmovapd %ymm5,%ymm7
+ DB 197,253,40,217 ; vmovapd %ymm1,%ymm3
+ DB 196,129,121,16,4,145 ; vmovupd (%r9,%r10,4),%xmm0
+ DB 196,227,125,13,235,12 ; vblendpd $0xc,%ymm3,%ymm0,%ymm5
+ DB 197,252,16,92,36,96 ; vmovups 0x60(%rsp),%ymm3
+ DB 197,252,16,84,36,64 ; vmovups 0x40(%rsp),%ymm2
+ DB 197,252,16,76,36,32 ; vmovups 0x20(%rsp),%ymm1
+ DB 197,252,16,4,36 ; vmovups (%rsp),%ymm0
+ DB 72,129,196,152,0,0,0 ; add $0x98,%rsp
DB 196,193,84,20,242 ; vunpcklps %ymm10,%ymm5,%ymm6
- DB 196,193,84,21,250 ; vunpckhps %ymm10,%ymm5,%ymm7
- DB 197,180,20,236 ; vunpcklps %ymm4,%ymm9,%ymm5
- DB 197,52,21,196 ; vunpckhps %ymm4,%ymm9,%ymm8
+ DB 196,65,84,21,194 ; vunpckhps %ymm10,%ymm5,%ymm8
+ DB 197,196,20,236 ; vunpcklps %ymm4,%ymm7,%ymm5
+ DB 197,196,21,252 ; vunpckhps %ymm4,%ymm7,%ymm7
DB 197,205,20,229 ; vunpcklpd %ymm5,%ymm6,%ymm4
DB 197,205,21,237 ; vunpckhpd %ymm5,%ymm6,%ymm5
- DB 196,193,69,20,240 ; vunpcklpd %ymm8,%ymm7,%ymm6
- DB 196,193,69,21,248 ; vunpckhpd %ymm8,%ymm7,%ymm7
+ DB 197,189,20,247 ; vunpcklpd %ymm7,%ymm8,%ymm6
+ DB 197,189,21,255 ; vunpckhpd %ymm7,%ymm8,%ymm7
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
- DB 133,255 ; test %edi,%edi
+ DB 197,197,87,255 ; vxorpd %ymm7,%ymm7,%ymm7
+ DB 196,65,45,87,210 ; vxorpd %ymm10,%ymm10,%ymm10
+ DB 197,213,87,237 ; vxorpd %ymm5,%ymm5,%ymm5
+ DB 235,203 ; jmp df7f <_sk_load_f32_dst_avx+0x14f>
+ DB 27,255 ; sbb %edi,%edi
DB 255 ; (bad)
- DB 255,204 ; dec %esp
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 255 ; (bad)
- DB 191,255,255,255,178 ; mov $0xb2ffffff,%edi
+ DB 255,161,255,255,255,140 ; jmpq *-0x73000001(%rcx)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,165,255,255,255,157 ; jmpq *-0x62000001(%rbp)
+ DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
+ DB 255,92,255,255 ; lcall *-0x1(%rdi,%rdi,8)
+ DB 255,70,255 ; incl -0x1(%rsi)
DB 255 ; (bad)
- DB 255,149,255,255,255,141 ; callq *-0x72000001(%rbp)
+ DB 255,53,255,255,255,40 ; pushq 0x28ffffff(%rip) # 2900dfd0 <_sk_overlay_sse2_8bit+0x28fe2383>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -12967,7 +13255,7 @@ _sk_store_f32_avx LABEL PROC
DB 196,65,37,20,196 ; vunpcklpd %ymm12,%ymm11,%ymm8
DB 196,65,37,21,220 ; vunpckhpd %ymm12,%ymm11,%ymm11
DB 77,133,192 ; test %r8,%r8
- DB 117,55 ; jne db13 <_sk_store_f32_avx+0x7f>
+ DB 117,55 ; jne e053 <_sk_store_f32_avx+0x7f>
DB 196,67,45,24,225,1 ; vinsertf128 $0x1,%xmm9,%ymm10,%ymm12
DB 196,67,61,24,235,1 ; vinsertf128 $0x1,%xmm11,%ymm8,%ymm13
DB 196,67,45,6,201,49 ; vperm2f128 $0x31,%ymm9,%ymm10,%ymm9
@@ -12980,22 +13268,22 @@ _sk_store_f32_avx LABEL PROC
DB 255,224 ; jmpq *%rax
DB 196,65,121,17,20,129 ; vmovupd %xmm10,(%r9,%rax,4)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je db0f <_sk_store_f32_avx+0x7b>
+ DB 116,240 ; je e04f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,76,129,16 ; vmovupd %xmm9,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb db0f <_sk_store_f32_avx+0x7b>
+ DB 114,227 ; jb e04f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,68,129,32 ; vmovupd %xmm8,0x20(%r9,%rax,4)
- DB 116,218 ; je db0f <_sk_store_f32_avx+0x7b>
+ DB 116,218 ; je e04f <_sk_store_f32_avx+0x7b>
DB 196,65,121,17,92,129,48 ; vmovupd %xmm11,0x30(%r9,%rax,4)
DB 73,131,248,5 ; cmp $0x5,%r8
- DB 114,205 ; jb db0f <_sk_store_f32_avx+0x7b>
+ DB 114,205 ; jb e04f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,84,129,64,1 ; vextractf128 $0x1,%ymm10,0x40(%r9,%rax,4)
- DB 116,195 ; je db0f <_sk_store_f32_avx+0x7b>
+ DB 116,195 ; je e04f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,76,129,80,1 ; vextractf128 $0x1,%ymm9,0x50(%r9,%rax,4)
DB 73,131,248,7 ; cmp $0x7,%r8
- DB 114,181 ; jb db0f <_sk_store_f32_avx+0x7b>
+ DB 114,181 ; jb e04f <_sk_store_f32_avx+0x7b>
DB 196,67,125,25,68,129,96,1 ; vextractf128 $0x1,%ymm8,0x60(%r9,%rax,4)
- DB 235,171 ; jmp db0f <_sk_store_f32_avx+0x7b>
+ DB 235,171 ; jmp e04f <_sk_store_f32_avx+0x7b>
PUBLIC _sk_clamp_x_avx
_sk_clamp_x_avx LABEL PROC
@@ -13078,7 +13366,7 @@ _sk_mirror_x_avx LABEL PROC
DB 196,193,58,88,192 ; vaddss %xmm8,%xmm8,%xmm0
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,99,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm8
- DB 197,178,89,5,223,222,1,0 ; vmulss 0x1dedf(%rip),%xmm9,%xmm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,5,223,222,1,0 ; vmulss 0x1dedf(%rip),%xmm9,%xmm0 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,89,192 ; vmulps %ymm0,%ymm11,%ymm0
@@ -13110,7 +13398,7 @@ _sk_mirror_y_avx LABEL PROC
DB 196,193,58,88,200 ; vaddss %xmm8,%xmm8,%xmm1
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,99,117,24,193,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm8
- DB 197,178,89,13,82,222,1,0 ; vmulss 0x1de52(%rip),%xmm9,%xmm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 197,178,89,13,82,222,1,0 ; vmulss 0x1de52(%rip),%xmm9,%xmm1 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,227,121,4,201,0 ; vpermilps $0x0,%xmm1,%xmm1
DB 196,227,117,24,201,1 ; vinsertf128 $0x1,%xmm1,%ymm1,%ymm1
DB 197,164,89,201 ; vmulps %ymm1,%ymm11,%ymm1
@@ -13135,7 +13423,7 @@ PUBLIC _sk_clamp_x_1_avx
_sk_clamp_x_1_avx LABEL PROC
DB 196,65,60,87,192 ; vxorps %ymm8,%ymm8,%ymm8
DB 197,188,95,192 ; vmaxps %ymm0,%ymm8,%ymm0
- DB 196,98,125,24,5,236,221,1,0 ; vbroadcastss 0x1ddec(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,236,221,1,0 ; vbroadcastss 0x1ddec(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 196,193,124,93,192 ; vminps %ymm8,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -13149,9 +13437,9 @@ _sk_repeat_x_1_avx LABEL PROC
PUBLIC _sk_mirror_x_1_avx
_sk_mirror_x_1_avx LABEL PROC
- DB 196,98,125,24,5,227,221,1,0 ; vbroadcastss 0x1dde3(%rip),%ymm8 # 2bb94 <_sk_overlay_sse2_8bit+0x487>
+ DB 196,98,125,24,5,227,221,1,0 ; vbroadcastss 0x1dde3(%rip),%ymm8 # 2c0d4 <_sk_overlay_sse2_8bit+0x487>
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,13,185,221,1,0 ; vbroadcastss 0x1ddb9(%rip),%ymm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,13,185,221,1,0 ; vbroadcastss 0x1ddb9(%rip),%ymm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,89,201 ; vmulps %ymm9,%ymm0,%ymm9
DB 196,67,125,8,201,1 ; vroundps $0x1,%ymm9,%ymm9
DB 196,65,52,88,201 ; vaddps %ymm9,%ymm9,%ymm9
@@ -13165,12 +13453,12 @@ _sk_mirror_x_1_avx LABEL PROC
PUBLIC _sk_luminance_to_alpha_avx
_sk_luminance_to_alpha_avx LABEL PROC
- DB 196,226,125,24,29,165,222,1,0 ; vbroadcastss 0x1dea5(%rip),%ymm3 # 2bc98 <_sk_overlay_sse2_8bit+0x58b>
+ DB 196,226,125,24,29,165,222,1,0 ; vbroadcastss 0x1dea5(%rip),%ymm3 # 2c1d8 <_sk_overlay_sse2_8bit+0x58b>
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,29,156,222,1,0 ; vbroadcastss 0x1de9c(%rip),%ymm3 # 2bc9c <_sk_overlay_sse2_8bit+0x58f>
+ DB 196,226,125,24,29,156,222,1,0 ; vbroadcastss 0x1de9c(%rip),%ymm3 # 2c1dc <_sk_overlay_sse2_8bit+0x58f>
DB 197,244,89,203 ; vmulps %ymm3,%ymm1,%ymm1
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
- DB 196,226,125,24,13,143,222,1,0 ; vbroadcastss 0x1de8f(%rip),%ymm1 # 2bca0 <_sk_overlay_sse2_8bit+0x593>
+ DB 196,226,125,24,13,143,222,1,0 ; vbroadcastss 0x1de8f(%rip),%ymm1 # 2c1e0 <_sk_overlay_sse2_8bit+0x593>
DB 197,236,89,201 ; vmulps %ymm1,%ymm2,%ymm1
DB 197,252,88,217 ; vaddps %ymm1,%ymm0,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13403,9 +13691,9 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 72,139,104,8 ; mov 0x8(%rax),%rbp
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js e1b8 <_sk_evenly_spaced_gradient_avx+0x28>
+ DB 120,7 ; js e6f8 <_sk_evenly_spaced_gradient_avx+0x28>
DB 196,225,242,42,203 ; vcvtsi2ss %rbx,%xmm1,%xmm1
- DB 235,21 ; jmp e1cd <_sk_evenly_spaced_gradient_avx+0x3d>
+ DB 235,21 ; jmp e70d <_sk_evenly_spaced_gradient_avx+0x3d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -13562,18 +13850,18 @@ _sk_evenly_spaced_gradient_avx LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_avx
_sk_gauss_a_to_rgba_avx LABEL PROC
- DB 196,226,125,24,5,116,215,1,0 ; vbroadcastss 0x1d774(%rip),%ymm0 # 2bca8 <_sk_overlay_sse2_8bit+0x59b>
+ DB 196,226,125,24,5,116,215,1,0 ; vbroadcastss 0x1d774(%rip),%ymm0 # 2c1e8 <_sk_overlay_sse2_8bit+0x59b>
DB 197,228,89,192 ; vmulps %ymm0,%ymm3,%ymm0
- DB 196,226,125,24,13,99,215,1,0 ; vbroadcastss 0x1d763(%rip),%ymm1 # 2bca4 <_sk_overlay_sse2_8bit+0x597>
+ DB 196,226,125,24,13,99,215,1,0 ; vbroadcastss 0x1d763(%rip),%ymm1 # 2c1e4 <_sk_overlay_sse2_8bit+0x597>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,90,215,1,0 ; vbroadcastss 0x1d75a(%rip),%ymm1 # 2bcac <_sk_overlay_sse2_8bit+0x59f>
+ DB 196,226,125,24,13,90,215,1,0 ; vbroadcastss 0x1d75a(%rip),%ymm1 # 2c1ec <_sk_overlay_sse2_8bit+0x59f>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,77,215,1,0 ; vbroadcastss 0x1d74d(%rip),%ymm1 # 2bcb0 <_sk_overlay_sse2_8bit+0x5a3>
+ DB 196,226,125,24,13,77,215,1,0 ; vbroadcastss 0x1d74d(%rip),%ymm1 # 2c1f0 <_sk_overlay_sse2_8bit+0x5a3>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 197,252,89,195 ; vmulps %ymm3,%ymm0,%ymm0
- DB 196,226,125,24,13,64,215,1,0 ; vbroadcastss 0x1d740(%rip),%ymm1 # 2bcb4 <_sk_overlay_sse2_8bit+0x5a7>
+ DB 196,226,125,24,13,64,215,1,0 ; vbroadcastss 0x1d740(%rip),%ymm1 # 2c1f4 <_sk_overlay_sse2_8bit+0x5a7>
DB 197,252,88,193 ; vaddps %ymm1,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
@@ -13595,12 +13883,12 @@ _sk_gradient_avx LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,80 ; jb e5fa <_sk_gradient_avx+0x72>
+ DB 114,80 ; jb eb3a <_sk_gradient_avx+0x72>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 196,65,52,87,201 ; vxorps %ymm9,%ymm9,%ymm9
- DB 196,98,125,24,21,189,213,1,0 ; vbroadcastss 0x1d5bd(%rip),%ymm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,125,24,21,189,213,1,0 ; vbroadcastss 0x1d5bd(%rip),%ymm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 197,244,87,201 ; vxorps %ymm1,%ymm1,%ymm1
DB 196,98,125,24,3 ; vbroadcastss (%rbx),%ymm8
DB 197,60,194,192,2 ; vcmpleps %ymm0,%ymm8,%ymm8
@@ -13612,7 +13900,7 @@ _sk_gradient_avx LABEL PROC
DB 196,227,117,24,202,1 ; vinsertf128 $0x1,%xmm2,%ymm1,%ymm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,205 ; jne e5c7 <_sk_gradient_avx+0x3f>
+ DB 117,205 ; jne eb07 <_sk_gradient_avx+0x3f>
DB 196,195,249,22,201,1 ; vpextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -13792,27 +14080,27 @@ _sk_xy_to_unit_angle_avx LABEL PROC
DB 196,65,52,95,226 ; vmaxps %ymm10,%ymm9,%ymm12
DB 196,65,36,94,220 ; vdivps %ymm12,%ymm11,%ymm11
DB 196,65,36,89,227 ; vmulps %ymm11,%ymm11,%ymm12
- DB 196,98,125,24,45,228,210,1,0 ; vbroadcastss 0x1d2e4(%rip),%ymm13 # 2bcb8 <_sk_overlay_sse2_8bit+0x5ab>
+ DB 196,98,125,24,45,228,210,1,0 ; vbroadcastss 0x1d2e4(%rip),%ymm13 # 2c1f8 <_sk_overlay_sse2_8bit+0x5ab>
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,218,210,1,0 ; vbroadcastss 0x1d2da(%rip),%ymm14 # 2bcbc <_sk_overlay_sse2_8bit+0x5af>
+ DB 196,98,125,24,53,218,210,1,0 ; vbroadcastss 0x1d2da(%rip),%ymm14 # 2c1fc <_sk_overlay_sse2_8bit+0x5af>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,237 ; vmulps %ymm13,%ymm12,%ymm13
- DB 196,98,125,24,53,203,210,1,0 ; vbroadcastss 0x1d2cb(%rip),%ymm14 # 2bcc0 <_sk_overlay_sse2_8bit+0x5b3>
+ DB 196,98,125,24,53,203,210,1,0 ; vbroadcastss 0x1d2cb(%rip),%ymm14 # 2c200 <_sk_overlay_sse2_8bit+0x5b3>
DB 196,65,20,88,238 ; vaddps %ymm14,%ymm13,%ymm13
DB 196,65,28,89,229 ; vmulps %ymm13,%ymm12,%ymm12
- DB 196,98,125,24,45,188,210,1,0 ; vbroadcastss 0x1d2bc(%rip),%ymm13 # 2bcc4 <_sk_overlay_sse2_8bit+0x5b7>
+ DB 196,98,125,24,45,188,210,1,0 ; vbroadcastss 0x1d2bc(%rip),%ymm13 # 2c204 <_sk_overlay_sse2_8bit+0x5b7>
DB 196,65,28,88,229 ; vaddps %ymm13,%ymm12,%ymm12
DB 196,65,36,89,220 ; vmulps %ymm12,%ymm11,%ymm11
DB 196,65,52,194,202,1 ; vcmpltps %ymm10,%ymm9,%ymm9
- DB 196,98,125,24,21,167,210,1,0 ; vbroadcastss 0x1d2a7(%rip),%ymm10 # 2bcc8 <_sk_overlay_sse2_8bit+0x5bb>
+ DB 196,98,125,24,21,167,210,1,0 ; vbroadcastss 0x1d2a7(%rip),%ymm10 # 2c208 <_sk_overlay_sse2_8bit+0x5bb>
DB 196,65,44,92,211 ; vsubps %ymm11,%ymm10,%ymm10
DB 196,67,37,74,202,144 ; vblendvps %ymm9,%ymm10,%ymm11,%ymm9
DB 196,193,124,194,192,1 ; vcmpltps %ymm8,%ymm0,%ymm0
- DB 196,98,125,24,21,61,209,1,0 ; vbroadcastss 0x1d13d(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,61,209,1,0 ; vbroadcastss 0x1d13d(%rip),%ymm10 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,44,92,209 ; vsubps %ymm9,%ymm10,%ymm10
DB 196,195,53,74,194,0 ; vblendvps %ymm0,%ymm10,%ymm9,%ymm0
DB 196,65,116,194,200,1 ; vcmpltps %ymm8,%ymm1,%ymm9
- DB 196,98,125,24,21,39,209,1,0 ; vbroadcastss 0x1d127(%rip),%ymm10 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,21,39,209,1,0 ; vbroadcastss 0x1d127(%rip),%ymm10 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,44,92,208 ; vsubps %ymm0,%ymm10,%ymm10
DB 196,195,125,74,194,144 ; vblendvps %ymm9,%ymm10,%ymm0,%ymm0
DB 196,65,124,194,200,3 ; vcmpunordps %ymm8,%ymm0,%ymm9
@@ -13838,7 +14126,7 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,29,210,1,0 ; vbroadcastss 0x1d21d(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,29,210,1,0 ; vbroadcastss 0x1d21d(%rip),%ymm11 # 2c20c <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13847,17 +14135,17 @@ _sk_xy_to_2pt_conical_quadratic_max_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,241,209,1,0 ; vbroadcastss 0x1d1f1(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,241,209,1,0 ; vbroadcastss 0x1d1f1(%rip),%ymm9 # 2c210 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,207,209,1,0 ; vbroadcastss 0x1d1cf(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,207,209,1,0 ; vbroadcastss 0x1d1cf(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,96,208,1,0 ; vbroadcastss 0x1d060(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,96,208,1,0 ; vbroadcastss 0x1d060(%rip),%ymm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13875,7 +14163,7 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,67,121,4,210,0 ; vpermilps $0x0,%xmm10,%xmm10
DB 196,67,45,24,210,1 ; vinsertf128 $0x1,%xmm10,%ymm10,%ymm10
DB 197,44,88,208 ; vaddps %ymm0,%ymm10,%ymm10
- DB 196,98,125,24,29,111,209,1,0 ; vbroadcastss 0x1d16f(%rip),%ymm11 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,29,111,209,1,0 ; vbroadcastss 0x1d16f(%rip),%ymm11 # 2c20c <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,44,89,211 ; vmulps %ymm11,%ymm10,%ymm10
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,217 ; vmulps %ymm1,%ymm1,%ymm11
@@ -13884,17 +14172,17 @@ _sk_xy_to_2pt_conical_quadratic_min_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,164,92,192 ; vsubps %ymm0,%ymm11,%ymm0
- DB 196,98,125,24,13,67,209,1,0 ; vbroadcastss 0x1d143(%rip),%ymm9 # 2bcd0 <_sk_overlay_sse2_8bit+0x5c3>
+ DB 196,98,125,24,13,67,209,1,0 ; vbroadcastss 0x1d143(%rip),%ymm9 # 2c210 <_sk_overlay_sse2_8bit+0x5c3>
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
DB 197,188,89,192 ; vmulps %ymm0,%ymm8,%ymm0
DB 196,65,44,89,194 ; vmulps %ymm10,%ymm10,%ymm8
DB 196,193,124,88,192 ; vaddps %ymm8,%ymm0,%ymm0
DB 197,252,81,192 ; vsqrtps %ymm0,%ymm0
DB 196,98,125,24,64,36 ; vbroadcastss 0x24(%rax),%ymm8
- DB 196,98,125,24,13,33,209,1,0 ; vbroadcastss 0x1d121(%rip),%ymm9 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,13,33,209,1,0 ; vbroadcastss 0x1d121(%rip),%ymm9 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,65,44,87,201 ; vxorps %ymm9,%ymm10,%ymm9
DB 196,65,124,92,210 ; vsubps %ymm10,%ymm0,%ymm10
- DB 196,98,125,24,29,178,207,1,0 ; vbroadcastss 0x1cfb2(%rip),%ymm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,29,178,207,1,0 ; vbroadcastss 0x1cfb2(%rip),%ymm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,60,89,195 ; vmulps %ymm11,%ymm8,%ymm8
DB 196,65,60,89,210 ; vmulps %ymm10,%ymm8,%ymm10
DB 197,180,92,192 ; vsubps %ymm0,%ymm9,%ymm0
@@ -13911,7 +14199,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,67,121,4,201,0 ; vpermilps $0x0,%xmm9,%xmm9
DB 196,67,53,24,201,1 ; vinsertf128 $0x1,%xmm9,%ymm9,%ymm9
DB 197,52,88,200 ; vaddps %ymm0,%ymm9,%ymm9
- DB 196,98,125,24,21,199,208,1,0 ; vbroadcastss 0x1d0c7(%rip),%ymm10 # 2bccc <_sk_overlay_sse2_8bit+0x5bf>
+ DB 196,98,125,24,21,199,208,1,0 ; vbroadcastss 0x1d0c7(%rip),%ymm10 # 2c20c <_sk_overlay_sse2_8bit+0x5bf>
DB 196,65,52,89,202 ; vmulps %ymm10,%ymm9,%ymm9
DB 197,252,89,192 ; vmulps %ymm0,%ymm0,%ymm0
DB 197,116,89,209 ; vmulps %ymm1,%ymm1,%ymm10
@@ -13920,7 +14208,7 @@ _sk_xy_to_2pt_conical_linear_avx LABEL PROC
DB 196,227,121,4,192,0 ; vpermilps $0x0,%xmm0,%xmm0
DB 196,227,125,24,192,1 ; vinsertf128 $0x1,%xmm0,%ymm0,%ymm0
DB 197,172,92,192 ; vsubps %ymm0,%ymm10,%ymm0
- DB 196,98,125,24,5,159,208,1,0 ; vbroadcastss 0x1d09f(%rip),%ymm8 # 2bcd4 <_sk_overlay_sse2_8bit+0x5c7>
+ DB 196,98,125,24,5,159,208,1,0 ; vbroadcastss 0x1d09f(%rip),%ymm8 # 2c214 <_sk_overlay_sse2_8bit+0x5c7>
DB 196,193,124,87,192 ; vxorps %ymm8,%ymm0,%ymm0
DB 196,193,124,94,193 ; vdivps %ymm9,%ymm0,%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13955,7 +14243,7 @@ _sk_apply_vector_mask_avx LABEL PROC
PUBLIC _sk_save_xy_avx
_sk_save_xy_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,219,206,1,0 ; vbroadcastss 0x1cedb(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,219,206,1,0 ; vbroadcastss 0x1cedb(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,124,88,200 ; vaddps %ymm8,%ymm0,%ymm9
DB 196,67,125,8,209,1 ; vroundps $0x1,%ymm9,%ymm10
DB 196,65,52,92,202 ; vsubps %ymm10,%ymm9,%ymm9
@@ -13988,9 +14276,9 @@ _sk_accumulate_avx LABEL PROC
PUBLIC _sk_bilinear_nx_avx
_sk_bilinear_nx_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,195,207,1,0 ; vbroadcastss 0x1cfc3(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,195,207,1,0 ; vbroadcastss 0x1cfc3(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,90,206,1,0 ; vbroadcastss 0x1ce5a(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,90,206,1,0 ; vbroadcastss 0x1ce5a(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -13999,7 +14287,7 @@ _sk_bilinear_nx_avx LABEL PROC
PUBLIC _sk_bilinear_px_avx
_sk_bilinear_px_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,58,206,1,0 ; vbroadcastss 0x1ce3a(%rip),%ymm0 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,5,58,206,1,0 ; vbroadcastss 0x1ce3a(%rip),%ymm0 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14009,9 +14297,9 @@ _sk_bilinear_px_avx LABEL PROC
PUBLIC _sk_bilinear_ny_avx
_sk_bilinear_ny_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,122,207,1,0 ; vbroadcastss 0x1cf7a(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,122,207,1,0 ; vbroadcastss 0x1cf7a(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,16,206,1,0 ; vbroadcastss 0x1ce10(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,16,206,1,0 ; vbroadcastss 0x1ce10(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14020,7 +14308,7 @@ _sk_bilinear_ny_avx LABEL PROC
PUBLIC _sk_bilinear_py_avx
_sk_bilinear_py_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,240,205,1,0 ; vbroadcastss 0x1cdf0(%rip),%ymm1 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,226,125,24,13,240,205,1,0 ; vbroadcastss 0x1cdf0(%rip),%ymm1 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14030,14 +14318,14 @@ _sk_bilinear_py_avx LABEL PROC
PUBLIC _sk_bicubic_n3x_avx
_sk_bicubic_n3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,51,207,1,0 ; vbroadcastss 0x1cf33(%rip),%ymm0 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,5,51,207,1,0 ; vbroadcastss 0x1cf33(%rip),%ymm0 # 2c21c <_sk_overlay_sse2_8bit+0x5cf>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,198,205,1,0 ; vbroadcastss 0x1cdc6(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,198,205,1,0 ; vbroadcastss 0x1cdc6(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,23,207,1,0 ; vbroadcastss 0x1cf17(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,23,207,1,0 ; vbroadcastss 0x1cf17(%rip),%ymm10 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,21,206,1,0 ; vbroadcastss 0x1ce15(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,21,206,1,0 ; vbroadcastss 0x1ce15(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14047,19 +14335,19 @@ _sk_bicubic_n3x_avx LABEL PROC
PUBLIC _sk_bicubic_n1x_avx
_sk_bicubic_n1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,224,206,1,0 ; vbroadcastss 0x1cee0(%rip),%ymm0 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,5,224,206,1,0 ; vbroadcastss 0x1cee0(%rip),%ymm0 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
- DB 196,98,125,24,5,119,205,1,0 ; vbroadcastss 0x1cd77(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,119,205,1,0 ; vbroadcastss 0x1cd77(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,64 ; vsubps 0x40(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,213,206,1,0 ; vbroadcastss 0x1ced5(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,213,206,1,0 ; vbroadcastss 0x1ced5(%rip),%ymm9 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,195,206,1,0 ; vbroadcastss 0x1cec3(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,195,206,1,0 ; vbroadcastss 0x1cec3(%rip),%ymm10 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,68,205,1,0 ; vbroadcastss 0x1cd44(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,68,205,1,0 ; vbroadcastss 0x1cd44(%rip),%ymm10 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,165,206,1,0 ; vbroadcastss 0x1cea5(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,165,206,1,0 ; vbroadcastss 0x1cea5(%rip),%ymm9 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14068,17 +14356,17 @@ _sk_bicubic_n1x_avx LABEL PROC
PUBLIC _sk_bicubic_p1x_avx
_sk_bicubic_p1x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,21,205,1,0 ; vbroadcastss 0x1cd15(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,21,205,1,0 ; vbroadcastss 0x1cd15(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,0 ; vaddps (%rax),%ymm8,%ymm0
DB 197,124,16,72,64 ; vmovups 0x40(%rax),%ymm9
- DB 196,98,125,24,21,115,206,1,0 ; vbroadcastss 0x1ce73(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,115,206,1,0 ; vbroadcastss 0x1ce73(%rip),%ymm10 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,97,206,1,0 ; vbroadcastss 0x1ce61(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,97,206,1,0 ; vbroadcastss 0x1ce61(%rip),%ymm11 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,76,206,1,0 ; vbroadcastss 0x1ce4c(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,76,206,1,0 ; vbroadcastss 0x1ce4c(%rip),%ymm9 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14087,13 +14375,13 @@ _sk_bicubic_p1x_avx LABEL PROC
PUBLIC _sk_bicubic_p3x_avx
_sk_bicubic_p3x_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,40,206,1,0 ; vbroadcastss 0x1ce28(%rip),%ymm0 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,5,40,206,1,0 ; vbroadcastss 0x1ce28(%rip),%ymm0 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,252,88,0 ; vaddps (%rax),%ymm0,%ymm0
DB 197,124,16,64,64 ; vmovups 0x40(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,13,206,1,0 ; vbroadcastss 0x1ce0d(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,13,206,1,0 ; vbroadcastss 0x1ce0d(%rip),%ymm10 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,11,205,1,0 ; vbroadcastss 0x1cd0b(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,11,205,1,0 ; vbroadcastss 0x1cd0b(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,128,0,0,0 ; vmovups %ymm8,0x80(%rax)
@@ -14103,14 +14391,14 @@ _sk_bicubic_p3x_avx LABEL PROC
PUBLIC _sk_bicubic_n3y_avx
_sk_bicubic_n3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,218,205,1,0 ; vbroadcastss 0x1cdda(%rip),%ymm1 # 2bcdc <_sk_overlay_sse2_8bit+0x5cf>
+ DB 196,226,125,24,13,218,205,1,0 ; vbroadcastss 0x1cdda(%rip),%ymm1 # 2c21c <_sk_overlay_sse2_8bit+0x5cf>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,108,204,1,0 ; vbroadcastss 0x1cc6c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,108,204,1,0 ; vbroadcastss 0x1cc6c(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,189,205,1,0 ; vbroadcastss 0x1cdbd(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,189,205,1,0 ; vbroadcastss 0x1cdbd(%rip),%ymm10 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,187,204,1,0 ; vbroadcastss 0x1ccbb(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,187,204,1,0 ; vbroadcastss 0x1ccbb(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14120,19 +14408,19 @@ _sk_bicubic_n3y_avx LABEL PROC
PUBLIC _sk_bicubic_n1y_avx
_sk_bicubic_n1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,134,205,1,0 ; vbroadcastss 0x1cd86(%rip),%ymm1 # 2bcd8 <_sk_overlay_sse2_8bit+0x5cb>
+ DB 196,226,125,24,13,134,205,1,0 ; vbroadcastss 0x1cd86(%rip),%ymm1 # 2c218 <_sk_overlay_sse2_8bit+0x5cb>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
- DB 196,98,125,24,5,28,204,1,0 ; vbroadcastss 0x1cc1c(%rip),%ymm8 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,98,125,24,5,28,204,1,0 ; vbroadcastss 0x1cc1c(%rip),%ymm8 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,60,92,64,96 ; vsubps 0x60(%rax),%ymm8,%ymm8
- DB 196,98,125,24,13,122,205,1,0 ; vbroadcastss 0x1cd7a(%rip),%ymm9 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,13,122,205,1,0 ; vbroadcastss 0x1cd7a(%rip),%ymm9 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,104,205,1,0 ; vbroadcastss 0x1cd68(%rip),%ymm10 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,21,104,205,1,0 ; vbroadcastss 0x1cd68(%rip),%ymm10 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,201 ; vmulps %ymm9,%ymm8,%ymm9
- DB 196,98,125,24,21,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm10 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,21,233,203,1,0 ; vbroadcastss 0x1cbe9(%rip),%ymm10 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 196,65,52,88,202 ; vaddps %ymm10,%ymm9,%ymm9
DB 196,65,60,89,193 ; vmulps %ymm9,%ymm8,%ymm8
- DB 196,98,125,24,13,74,205,1,0 ; vbroadcastss 0x1cd4a(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,74,205,1,0 ; vbroadcastss 0x1cd4a(%rip),%ymm9 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14141,17 +14429,17 @@ _sk_bicubic_n1y_avx LABEL PROC
PUBLIC _sk_bicubic_p1y_avx
_sk_bicubic_p1y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,98,125,24,5,186,203,1,0 ; vbroadcastss 0x1cbba(%rip),%ymm8 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 196,98,125,24,5,186,203,1,0 ; vbroadcastss 0x1cbba(%rip),%ymm8 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 197,188,88,72,32 ; vaddps 0x20(%rax),%ymm8,%ymm1
DB 197,124,16,72,96 ; vmovups 0x60(%rax),%ymm9
- DB 196,98,125,24,21,23,205,1,0 ; vbroadcastss 0x1cd17(%rip),%ymm10 # 2bce8 <_sk_overlay_sse2_8bit+0x5db>
+ DB 196,98,125,24,21,23,205,1,0 ; vbroadcastss 0x1cd17(%rip),%ymm10 # 2c228 <_sk_overlay_sse2_8bit+0x5db>
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
- DB 196,98,125,24,29,5,205,1,0 ; vbroadcastss 0x1cd05(%rip),%ymm11 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,98,125,24,29,5,205,1,0 ; vbroadcastss 0x1cd05(%rip),%ymm11 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 196,65,44,88,211 ; vaddps %ymm11,%ymm10,%ymm10
DB 196,65,52,89,210 ; vmulps %ymm10,%ymm9,%ymm10
DB 196,65,44,88,192 ; vaddps %ymm8,%ymm10,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
- DB 196,98,125,24,13,240,204,1,0 ; vbroadcastss 0x1ccf0(%rip),%ymm9 # 2bcec <_sk_overlay_sse2_8bit+0x5df>
+ DB 196,98,125,24,13,240,204,1,0 ; vbroadcastss 0x1ccf0(%rip),%ymm9 # 2c22c <_sk_overlay_sse2_8bit+0x5df>
DB 196,65,60,88,193 ; vaddps %ymm9,%ymm8,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -14160,13 +14448,13 @@ _sk_bicubic_p1y_avx LABEL PROC
PUBLIC _sk_bicubic_p3y_avx
_sk_bicubic_p3y_avx LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,13,204,204,1,0 ; vbroadcastss 0x1cccc(%rip),%ymm1 # 2bce4 <_sk_overlay_sse2_8bit+0x5d7>
+ DB 196,226,125,24,13,204,204,1,0 ; vbroadcastss 0x1cccc(%rip),%ymm1 # 2c224 <_sk_overlay_sse2_8bit+0x5d7>
DB 197,244,88,72,32 ; vaddps 0x20(%rax),%ymm1,%ymm1
DB 197,124,16,64,96 ; vmovups 0x60(%rax),%ymm8
DB 196,65,60,89,200 ; vmulps %ymm8,%ymm8,%ymm9
- DB 196,98,125,24,21,176,204,1,0 ; vbroadcastss 0x1ccb0(%rip),%ymm10 # 2bce0 <_sk_overlay_sse2_8bit+0x5d3>
+ DB 196,98,125,24,21,176,204,1,0 ; vbroadcastss 0x1ccb0(%rip),%ymm10 # 2c220 <_sk_overlay_sse2_8bit+0x5d3>
DB 196,65,60,89,194 ; vmulps %ymm10,%ymm8,%ymm8
- DB 196,98,125,24,21,174,203,1,0 ; vbroadcastss 0x1cbae(%rip),%ymm10 # 2bbec <_sk_overlay_sse2_8bit+0x4df>
+ DB 196,98,125,24,21,174,203,1,0 ; vbroadcastss 0x1cbae(%rip),%ymm10 # 2c12c <_sk_overlay_sse2_8bit+0x4df>
DB 196,65,60,88,194 ; vaddps %ymm10,%ymm8,%ymm8
DB 196,65,52,89,192 ; vmulps %ymm8,%ymm9,%ymm8
DB 197,124,17,128,160,0,0,0 ; vmovups %ymm8,0xa0(%rax)
@@ -14302,7 +14590,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,249,127,68,36,96 ; vmovdqa %xmm0,0x60(%rsp)
DB 72,139,0 ; mov (%rax),%rax
DB 196,193,121,254,194 ; vpaddd %xmm10,%xmm0,%xmm0
- DB 196,98,121,24,29,87,202,1,0 ; vbroadcastss 0x1ca57(%rip),%xmm11 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,121,24,29,87,202,1,0 ; vbroadcastss 0x1ca57(%rip),%xmm11 # 2c234 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,121,64,203 ; vpmulld %xmm11,%xmm0,%xmm1
DB 196,193,249,126,201 ; vmovq %xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
@@ -14336,7 +14624,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,227,93,24,223,1 ; vinsertf128 $0x1,%xmm7,%ymm4,%ymm3
DB 197,252,17,156,36,192,0,0,0 ; vmovups %ymm3,0xc0(%rsp)
- DB 196,98,121,24,13,32,200,1,0 ; vbroadcastss 0x1c820(%rip),%xmm9 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,121,24,13,32,200,1,0 ; vbroadcastss 0x1c820(%rip),%xmm9 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,193,105,254,249 ; vpaddd %xmm9,%xmm2,%xmm7
DB 196,195,249,22,249,1 ; vpextrq $0x1,%xmm7,%r9
DB 196,193,249,126,250 ; vmovq %xmm7,%r10
@@ -14364,7 +14652,7 @@ _sk_clut_3D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,254,1 ; vinsertf128 $0x1,%xmm6,%ymm5,%ymm15
- DB 196,98,121,24,37,147,199,1,0 ; vbroadcastss 0x1c793(%rip),%xmm12 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,121,24,37,147,199,1,0 ; vbroadcastss 0x1c793(%rip),%xmm12 # 2c0c8 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,105,254,212 ; vpaddd %xmm12,%xmm2,%xmm2
DB 196,195,249,22,209,1 ; vpextrq $0x1,%xmm2,%r9
DB 196,193,249,126,210 ; vmovq %xmm2,%r10
@@ -14392,7 +14680,7 @@ _sk_clut_3D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,105,33,213,48 ; vinsertps $0x30,%xmm5,%xmm2,%xmm2
DB 196,227,109,24,225,1 ; vinsertf128 $0x1,%xmm1,%ymm2,%ymm4
- DB 196,226,125,24,13,103,200,1,0 ; vbroadcastss 0x1c867(%rip),%ymm1 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,226,125,24,13,103,200,1,0 ; vbroadcastss 0x1c867(%rip),%ymm1 # 2c230 <_sk_overlay_sse2_8bit+0x5e3>
DB 197,188,88,209 ; vaddps %ymm1,%ymm8,%ymm2
DB 197,252,17,140,36,160,0,0,0 ; vmovups %ymm1,0xa0(%rsp)
DB 197,254,91,210 ; vcvttps2dq %ymm2,%ymm2
@@ -15145,7 +15433,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,226,25,64,200 ; vpmulld %xmm0,%xmm12,%xmm1
DB 197,249,127,12,36 ; vmovdqa %xmm1,(%rsp)
DB 197,241,254,202 ; vpaddd %xmm2,%xmm1,%xmm1
- DB 196,98,121,24,61,234,184,1,0 ; vbroadcastss 0x1b8ea(%rip),%xmm15 # 2bcf4 <_sk_overlay_sse2_8bit+0x5e7>
+ DB 196,98,121,24,61,234,184,1,0 ; vbroadcastss 0x1b8ea(%rip),%xmm15 # 2c234 <_sk_overlay_sse2_8bit+0x5e7>
DB 196,194,113,64,247 ; vpmulld %xmm15,%xmm1,%xmm6
DB 196,193,249,126,241 ; vmovq %xmm6,%r9
DB 69,137,202 ; mov %r9d,%r10d
@@ -15183,7 +15471,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,163,65,33,60,144,32 ; vinsertps $0x20,(%rax,%r10,4),%xmm7,%xmm7
DB 196,163,65,33,60,152,48 ; vinsertps $0x30,(%rax,%r11,4),%xmm7,%xmm7
DB 196,99,53,24,247,1 ; vinsertf128 $0x1,%xmm7,%ymm9,%ymm14
- DB 196,98,121,24,21,154,182,1,0 ; vbroadcastss 0x1b69a(%rip),%xmm10 # 2bb80 <_sk_overlay_sse2_8bit+0x473>
+ DB 196,98,121,24,21,154,182,1,0 ; vbroadcastss 0x1b69a(%rip),%xmm10 # 2c0c0 <_sk_overlay_sse2_8bit+0x473>
DB 196,65,97,254,202 ; vpaddd %xmm10,%xmm3,%xmm9
DB 196,67,249,22,201,1 ; vpextrq $0x1,%xmm9,%r9
DB 196,65,249,126,202 ; vmovq %xmm9,%r10
@@ -15211,7 +15499,7 @@ _sk_clut_4D_avx LABEL PROC
DB 196,161,122,16,60,152 ; vmovss (%rax,%r11,4),%xmm7
DB 196,227,81,33,239,48 ; vinsertps $0x30,%xmm7,%xmm5,%xmm5
DB 196,99,85,24,220,1 ; vinsertf128 $0x1,%xmm4,%ymm5,%ymm11
- DB 196,98,121,24,13,13,182,1,0 ; vbroadcastss 0x1b60d(%rip),%xmm9 # 2bb88 <_sk_overlay_sse2_8bit+0x47b>
+ DB 196,98,121,24,13,13,182,1,0 ; vbroadcastss 0x1b60d(%rip),%xmm9 # 2c0c8 <_sk_overlay_sse2_8bit+0x47b>
DB 196,193,97,254,217 ; vpaddd %xmm9,%xmm3,%xmm3
DB 196,195,249,22,217,1 ; vpextrq $0x1,%xmm3,%r9
DB 196,193,249,126,218 ; vmovq %xmm3,%r10
@@ -15239,7 +15527,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,250,16,44,152 ; vmovss (%rax,%rbx,4),%xmm5
DB 196,227,89,33,229,48 ; vinsertps $0x30,%xmm5,%xmm4,%xmm4
DB 196,227,93,24,243,1 ; vinsertf128 $0x1,%xmm3,%ymm4,%ymm6
- DB 196,226,125,24,37,225,182,1,0 ; vbroadcastss 0x1b6e1(%rip),%ymm4 # 2bcf0 <_sk_overlay_sse2_8bit+0x5e3>
+ DB 196,226,125,24,37,225,182,1,0 ; vbroadcastss 0x1b6e1(%rip),%ymm4 # 2c230 <_sk_overlay_sse2_8bit+0x5e3>
DB 197,148,88,220 ; vaddps %ymm4,%ymm13,%ymm3
DB 197,252,40,252 ; vmovaps %ymm4,%ymm7
DB 197,252,17,188,36,160,0,0,0 ; vmovups %ymm7,0xa0(%rsp)
@@ -16669,7 +16957,7 @@ _sk_clut_4D_avx LABEL PROC
DB 197,220,89,210 ; vmulps %ymm2,%ymm4,%ymm2
DB 197,212,88,210 ; vaddps %ymm2,%ymm5,%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,29,168,151,1,0 ; vbroadcastss 0x197a8(%rip),%ymm3 # 2bb7c <_sk_overlay_sse2_8bit+0x46f>
+ DB 196,226,125,24,29,168,151,1,0 ; vbroadcastss 0x197a8(%rip),%ymm3 # 2c0bc <_sk_overlay_sse2_8bit+0x46f>
DB 197,252,16,164,36,160,2,0,0 ; vmovups 0x2a0(%rsp),%ymm4
DB 197,252,16,172,36,192,2,0,0 ; vmovups 0x2c0(%rsp),%ymm5
DB 197,252,16,180,36,224,2,0,0 ; vmovups 0x2e0(%rsp),%ymm6
@@ -16711,13 +16999,13 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 124f1 <_sk_start_pipeline_sse41+0xeb>
+ DB 115,110 ; jae 12a31 <_sk_start_pipeline_sse41+0xeb>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,43 ; ja 124d0 <_sk_start_pipeline_sse41+0xca>
+ DB 119,43 ; ja 12a10 <_sk_start_pipeline_sse41+0xca>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -16729,17 +17017,17 @@ _sk_start_pipeline_sse41 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 124ac <_sk_start_pipeline_sse41+0xa6>
+ DB 118,220 ; jbe 129ec <_sk_start_pipeline_sse41+0xa6>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 124e5 <_sk_start_pipeline_sse41+0xdf>
+ DB 116,13 ; je 12a25 <_sk_start_pipeline_sse41+0xdf>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 12495 <_sk_start_pipeline_sse41+0x8f>
+ DB 117,164 ; jne 129d5 <_sk_start_pipeline_sse41+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -16770,7 +17058,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,229,159,1,0 ; movaps 0x19fe5(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,40,21,229,159,1,0 ; movaps 0x19fe5(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -16779,7 +17067,7 @@ _sk_seed_shader_sse41 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,212,159,1,0 ; movaps 0x19fd4(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,212,159,1,0 ; movaps 0x19fd4(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -16797,14 +17085,14 @@ _sk_dither_sse41 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,162,159,1,0 ; movdqa 0x19fa2(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,21,162,159,1,0 ; movdqa 0x19fa2(%rip),%xmm10 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,142,159,1,0 ; movdqa 0x19f8e(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63>
- DB 102,68,15,111,45,149,159,1,0 ; movdqa 0x19f95(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,37,142,159,1,0 ; movdqa 0x19f8e(%rip),%xmm12 # 2cab0 <_sk_overlay_sse2_8bit+0xe63>
+ DB 102,68,15,111,45,149,159,1,0 ; movdqa 0x19f95(%rip),%xmm13 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -16820,8 +17108,8 @@ _sk_dither_sse41 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,80,159,1,0 ; mulps 0x19f50(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83>
- DB 68,15,88,5,88,159,1,0 ; addps 0x19f58(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93>
+ DB 68,15,89,5,80,159,1,0 ; mulps 0x19f50(%rip),%xmm8 # 2cad0 <_sk_overlay_sse2_8bit+0xe83>
+ DB 68,15,88,5,88,159,1,0 ; addps 0x19f58(%rip),%xmm8 # 2cae0 <_sk_overlay_sse2_8bit+0xe93>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -16859,7 +17147,7 @@ _sk_uniform_color_sse41 LABEL PROC
PUBLIC _sk_black_color_sse41
_sk_black_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,142,158,1,0 ; movaps 0x19e8e(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,142,158,1,0 ; movaps 0x19e8e(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -16868,7 +17156,7 @@ _sk_black_color_sse41 LABEL PROC
PUBLIC _sk_white_color_sse41
_sk_white_color_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,122,158,1,0 ; movaps 0x19e7a(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,5,122,158,1,0 ; movaps 0x19e7a(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -16906,7 +17194,7 @@ _sk_clear_sse41 LABEL PROC
PUBLIC _sk_srcatop_sse41
_sk_srcatop_sse41 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,42,158,1,0 ; movaps 0x19e2a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,42,158,1,0 ; movaps 0x19e2a(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -16929,7 +17217,7 @@ PUBLIC _sk_dstatop_sse41
_sk_dstatop_sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,221,157,1,0 ; movaps 0x19ddd(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,221,157,1,0 ; movaps 0x19ddd(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -16970,7 +17258,7 @@ _sk_dstin_sse41 LABEL PROC
PUBLIC _sk_srcout_sse41
_sk_srcout_sse41 LABEL PROC
- DB 68,15,40,5,113,157,1,0 ; movaps 0x19d71(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,113,157,1,0 ; movaps 0x19d71(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -16981,7 +17269,7 @@ _sk_srcout_sse41 LABEL PROC
PUBLIC _sk_dstout_sse41
_sk_dstout_sse41 LABEL PROC
- DB 68,15,40,5,81,157,1,0 ; movaps 0x19d51(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,81,157,1,0 ; movaps 0x19d51(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -16996,7 +17284,7 @@ _sk_dstout_sse41 LABEL PROC
PUBLIC _sk_srcover_sse41
_sk_srcover_sse41 LABEL PROC
- DB 68,15,40,5,36,157,1,0 ; movaps 0x19d24(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,36,157,1,0 ; movaps 0x19d24(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -17014,7 +17302,7 @@ _sk_srcover_sse41 LABEL PROC
PUBLIC _sk_dstover_sse41
_sk_dstover_sse41 LABEL PROC
- DB 68,15,40,5,232,156,1,0 ; movaps 0x19ce8(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,232,156,1,0 ; movaps 0x19ce8(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -17038,7 +17326,7 @@ _sk_modulate_sse41 LABEL PROC
PUBLIC _sk_multiply_sse41
_sk_multiply_sse41 LABEL PROC
- DB 68,15,40,5,172,156,1,0 ; movaps 0x19cac(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,172,156,1,0 ; movaps 0x19cac(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -17074,7 +17362,7 @@ _sk_multiply_sse41 LABEL PROC
PUBLIC _sk_plus__sse41
_sk_plus__sse41 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 68,15,40,5,45,156,1,0 ; movaps 0x19c2d(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,45,156,1,0 ; movaps 0x19c2d(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
DB 65,15,93,200 ; minps %xmm8,%xmm1
@@ -17112,7 +17400,7 @@ _sk_screen_sse41 LABEL PROC
PUBLIC _sk_xor__sse41
_sk_xor__sse41 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,185,155,1,0 ; movaps 0x19bb9(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,185,155,1,0 ; movaps 0x19bb9(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -17158,7 +17446,7 @@ _sk_darken_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,20,155,1,0 ; movaps 0x19b14(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,20,155,1,0 ; movaps 0x19b14(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17190,7 +17478,7 @@ _sk_lighten_sse41 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,169,154,1,0 ; movaps 0x19aa9(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,169,154,1,0 ; movaps 0x19aa9(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17225,7 +17513,7 @@ _sk_difference_sse41 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,51,154,1,0 ; movaps 0x19a33(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,51,154,1,0 ; movaps 0x19a33(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17251,7 +17539,7 @@ _sk_exclusion_sse41 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,227,153,1,0 ; movaps 0x199e3(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,227,153,1,0 ; movaps 0x199e3(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -17261,7 +17549,7 @@ _sk_exclusion_sse41 LABEL PROC
PUBLIC _sk_colorburn_sse41
_sk_colorburn_sse41 LABEL PROC
- DB 68,15,40,29,202,153,1,0 ; movaps 0x199ca(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,29,202,153,1,0 ; movaps 0x199ca(%rip),%xmm11 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 68,15,92,231 ; subps %xmm7,%xmm12
DB 69,15,40,204 ; movaps %xmm12,%xmm9
@@ -17343,7 +17631,7 @@ _sk_colorburn_sse41 LABEL PROC
PUBLIC _sk_colordodge_sse41
_sk_colordodge_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,21,148,152,1,0 ; movaps 0x19894(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,148,152,1,0 ; movaps 0x19894(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -17424,7 +17712,7 @@ _sk_hardlight_sse41 LABEL PROC
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 15,40,227 ; movaps %xmm3,%xmm4
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,92,151,1,0 ; movaps 0x1975c(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,92,151,1,0 ; movaps 0x1975c(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,234 ; movaps %xmm10,%xmm5
DB 15,92,239 ; subps %xmm7,%xmm5
DB 15,40,197 ; movaps %xmm5,%xmm0
@@ -17506,7 +17794,7 @@ PUBLIC _sk_overlay_sse41
_sk_overlay_sse41 LABEL PROC
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,40,240 ; movaps %xmm0,%xmm14
- DB 68,15,40,21,46,150,1,0 ; movaps 0x1962e(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,46,150,1,0 ; movaps 0x1962e(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -17590,7 +17878,7 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,198 ; movaps %xmm6,%xmm0
DB 15,94,199 ; divps %xmm7,%xmm0
DB 65,15,84,193 ; andps %xmm9,%xmm0
- DB 15,40,13,241,148,1,0 ; movaps 0x194f1(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,13,241,148,1,0 ; movaps 0x194f1(%rip),%xmm1 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 68,15,40,240 ; movaps %xmm0,%xmm14
@@ -17603,10 +17891,10 @@ _sk_softlight_sse41 LABEL PROC
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,89,210 ; mulps %xmm2,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,40,45,31,149,1,0 ; movaps 0x1951f(%rip),%xmm13 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
+ DB 68,15,40,45,31,149,1,0 ; movaps 0x1951f(%rip),%xmm13 # 2caf0 <_sk_overlay_sse2_8bit+0xea3>
DB 69,15,88,245 ; addps %xmm13,%xmm14
DB 68,15,89,242 ; mulps %xmm2,%xmm14
- DB 68,15,40,37,31,149,1,0 ; movaps 0x1951f(%rip),%xmm12 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3>
+ DB 68,15,40,37,31,149,1,0 ; movaps 0x1951f(%rip),%xmm12 # 2cb00 <_sk_overlay_sse2_8bit+0xeb3>
DB 69,15,89,252 ; mulps %xmm12,%xmm15
DB 69,15,88,254 ; addps %xmm14,%xmm15
DB 15,40,198 ; movaps %xmm6,%xmm0
@@ -17792,12 +18080,12 @@ _sk_hue_sse41 LABEL PROC
DB 68,15,84,208 ; andps %xmm0,%xmm10
DB 15,84,200 ; andps %xmm0,%xmm1
DB 68,15,84,232 ; andps %xmm0,%xmm13
- DB 15,40,5,133,146,1,0 ; movaps 0x19285(%rip),%xmm0 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 15,40,5,133,146,1,0 ; movaps 0x19285(%rip),%xmm0 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,89,224 ; mulps %xmm0,%xmm12
- DB 15,40,21,138,146,1,0 ; movaps 0x1928a(%rip),%xmm2 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 15,40,21,138,146,1,0 ; movaps 0x1928a(%rip),%xmm2 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 15,89,250 ; mulps %xmm2,%xmm7
DB 65,15,88,252 ; addps %xmm12,%xmm7
- DB 68,15,40,53,139,146,1,0 ; movaps 0x1928b(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,53,139,146,1,0 ; movaps 0x1928b(%rip),%xmm14 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,252 ; movaps %xmm4,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,255 ; addps %xmm7,%xmm15
@@ -17880,7 +18168,7 @@ _sk_hue_sse41 LABEL PROC
DB 65,15,88,214 ; addps %xmm14,%xmm2
DB 15,40,196 ; movaps %xmm4,%xmm0
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,40,13,160,144,1,0 ; movaps 0x190a0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,160,144,1,0 ; movaps 0x190a0(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,225 ; movaps %xmm9,%xmm4
DB 15,92,229 ; subps %xmm5,%xmm4
DB 15,40,68,36,48 ; movaps 0x30(%rsp),%xmm0
@@ -17974,14 +18262,14 @@ _sk_saturation_sse41 LABEL PROC
DB 68,15,84,215 ; andps %xmm7,%xmm10
DB 68,15,84,223 ; andps %xmm7,%xmm11
DB 68,15,84,199 ; andps %xmm7,%xmm8
- DB 15,40,21,195,143,1,0 ; movaps 0x18fc3(%rip),%xmm2 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 15,40,21,195,143,1,0 ; movaps 0x18fc3(%rip),%xmm2 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,218 ; mulps %xmm2,%xmm3
- DB 15,40,13,198,143,1,0 ; movaps 0x18fc6(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 15,40,13,198,143,1,0 ; movaps 0x18fc6(%rip),%xmm1 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,254 ; movaps %xmm6,%xmm7
DB 15,89,249 ; mulps %xmm1,%xmm7
DB 15,88,251 ; addps %xmm3,%xmm7
- DB 68,15,40,45,197,143,1,0 ; movaps 0x18fc5(%rip),%xmm13 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,45,197,143,1,0 ; movaps 0x18fc5(%rip),%xmm13 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 68,15,88,247 ; addps %xmm7,%xmm14
DB 65,15,40,218 ; movaps %xmm10,%xmm3
@@ -18062,7 +18350,7 @@ _sk_saturation_sse41 LABEL PROC
DB 65,15,88,253 ; addps %xmm13,%xmm7
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 102,68,15,56,20,223 ; blendvps %xmm0,%xmm7,%xmm11
- DB 68,15,40,13,219,141,1,0 ; movaps 0x18ddb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,219,141,1,0 ; movaps 0x18ddb(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 68,15,92,204 ; subps %xmm4,%xmm9
DB 15,40,60,36 ; movaps (%rsp),%xmm7
@@ -18117,14 +18405,14 @@ _sk_color_sse41 LABEL PROC
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 68,15,89,244 ; mulps %xmm4,%xmm14
DB 15,89,204 ; mulps %xmm4,%xmm1
- DB 68,15,40,13,144,141,1,0 ; movaps 0x18d90(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,13,144,141,1,0 ; movaps 0x18d90(%rip),%xmm9 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,40,250 ; movaps %xmm10,%xmm7
DB 65,15,89,249 ; mulps %xmm9,%xmm7
- DB 68,15,40,21,144,141,1,0 ; movaps 0x18d90(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 68,15,40,21,144,141,1,0 ; movaps 0x18d90(%rip),%xmm10 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 65,15,40,219 ; movaps %xmm11,%xmm3
DB 65,15,89,218 ; mulps %xmm10,%xmm3
DB 15,88,223 ; addps %xmm7,%xmm3
- DB 68,15,40,29,141,141,1,0 ; movaps 0x18d8d(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,29,141,141,1,0 ; movaps 0x18d8d(%rip),%xmm11 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
@@ -18209,7 +18497,7 @@ _sk_color_sse41 LABEL PROC
DB 65,15,88,251 ; addps %xmm11,%xmm7
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,15,56,20,207 ; blendvps %xmm0,%xmm7,%xmm1
- DB 68,15,40,13,153,139,1,0 ; movaps 0x18b99(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,153,139,1,0 ; movaps 0x18b99(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,92,196 ; subps %xmm4,%xmm0
DB 68,15,89,192 ; mulps %xmm0,%xmm8
@@ -18261,13 +18549,13 @@ _sk_luminosity_sse41 LABEL PROC
DB 69,15,89,216 ; mulps %xmm8,%xmm11
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,89,205 ; mulps %xmm5,%xmm9
- DB 68,15,40,5,91,139,1,0 ; movaps 0x18b5b(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,5,91,139,1,0 ; movaps 0x18b5b(%rip),%xmm8 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
- DB 68,15,40,21,95,139,1,0 ; movaps 0x18b5f(%rip),%xmm10 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 68,15,40,21,95,139,1,0 ; movaps 0x18b5f(%rip),%xmm10 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,233 ; movaps %xmm1,%xmm5
DB 65,15,89,234 ; mulps %xmm10,%xmm5
DB 15,88,232 ; addps %xmm0,%xmm5
- DB 68,15,40,37,93,139,1,0 ; movaps 0x18b5d(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,37,93,139,1,0 ; movaps 0x18b5d(%rip),%xmm12 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,242 ; movaps %xmm2,%xmm14
DB 69,15,89,244 ; mulps %xmm12,%xmm14
DB 68,15,88,245 ; addps %xmm5,%xmm14
@@ -18352,7 +18640,7 @@ _sk_luminosity_sse41 LABEL PROC
DB 65,15,88,244 ; addps %xmm12,%xmm6
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 102,68,15,56,20,206 ; blendvps %xmm0,%xmm6,%xmm9
- DB 15,40,5,99,137,1,0 ; movaps 0x18963(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,5,99,137,1,0 ; movaps 0x18963(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,92,215 ; subps %xmm7,%xmm2
DB 15,89,226 ; mulps %xmm2,%xmm4
@@ -18396,23 +18684,23 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,219,0,0,0 ; jne 13d58 <_sk_srcover_rgba_8888_sse41+0xfb>
+ DB 15,133,219,0,0,0 ; jne 14298 <_sk_srcover_rgba_8888_sse41+0xfb>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,114,137,1,0 ; movdqa 0x18972(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,37,114,137,1,0 ; movdqa 0x18972(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,45,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm5 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,53,110,137,1,0 ; pshufb 0x1896e(%rip),%xmm6 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 68,15,40,5,139,136,1,0 ; movaps 0x1888b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,139,136,1,0 ; movaps 0x1888b(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,95,137,1,0 ; movaps 0x1895f(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,37,95,137,1,0 ; movaps 0x1895f(%rip),%xmm12 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -18438,7 +18726,7 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,88 ; jne 13d96 <_sk_srcover_rgba_8888_sse41+0x139>
+ DB 117,88 ; jne 142d6 <_sk_srcover_rgba_8888_sse41+0x139>
DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -18449,32 +18737,32 @@ _sk_srcover_rgba_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,91 ; je 13dc0 <_sk_srcover_rgba_8888_sse41+0x163>
+ DB 116,91 ; je 14300 <_sk_srcover_rgba_8888_sse41+0x163>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 13d85 <_sk_srcover_rgba_8888_sse41+0x128>
+ DB 116,22 ; je 142c5 <_sk_srcover_rgba_8888_sse41+0x128>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,10,255,255,255 ; jne 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 15,133,10,255,255,255 ; jne 141c3 <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,237,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,237,254,255,255 ; jmpq 141c3 <_sk_srcover_rgba_8888_sse41+0x26>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,40 ; je 13dcb <_sk_srcover_rgba_8888_sse41+0x16e>
+ DB 116,40 ; je 1430b <_sk_srcover_rgba_8888_sse41+0x16e>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 13db8 <_sk_srcover_rgba_8888_sse41+0x15b>
+ DB 116,15 ; je 142f8 <_sk_srcover_rgba_8888_sse41+0x15b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,149 ; jne 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 117,149 ; jne 14284 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm0,0x8(%r9,%rax,4)
DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4)
- DB 235,132 ; jmp 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 235,132 ; jmp 14284 <_sk_srcover_rgba_8888_sse41+0xe7>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,184,254,255,255 ; jmpq 13c83 <_sk_srcover_rgba_8888_sse41+0x26>
+ DB 233,184,254,255,255 ; jmpq 141c3 <_sk_srcover_rgba_8888_sse41+0x26>
DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4)
- DB 233,110,255,255,255 ; jmpq 13d44 <_sk_srcover_rgba_8888_sse41+0xe7>
+ DB 233,110,255,255,255 ; jmpq 14284 <_sk_srcover_rgba_8888_sse41+0xe7>
PUBLIC _sk_clamp_0_sse41
_sk_clamp_0_sse41 LABEL PROC
@@ -18488,7 +18776,7 @@ _sk_clamp_0_sse41 LABEL PROC
PUBLIC _sk_clamp_1_sse41
_sk_clamp_1_sse41 LABEL PROC
- DB 68,15,40,5,90,135,1,0 ; movaps 0x1875a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,90,135,1,0 ; movaps 0x1875a(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -18498,7 +18786,7 @@ _sk_clamp_1_sse41 LABEL PROC
PUBLIC _sk_clamp_a_sse41
_sk_clamp_a_sse41 LABEL PROC
- DB 15,93,29,63,135,1,0 ; minps 0x1873f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,29,63,135,1,0 ; minps 0x1873f(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -18507,7 +18795,7 @@ _sk_clamp_a_sse41 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse41
_sk_clamp_a_dst_sse41 LABEL PROC
- DB 15,93,61,43,135,1,0 ; minps 0x1872b(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,61,43,135,1,0 ; minps 0x1872b(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -18536,7 +18824,7 @@ _sk_swap_rb_sse41 LABEL PROC
PUBLIC _sk_invert_sse41
_sk_invert_sse41 LABEL PROC
- DB 68,15,40,5,231,134,1,0 ; movaps 0x186e7(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,231,134,1,0 ; movaps 0x186e7(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -18588,7 +18876,7 @@ _sk_premul_dst_sse41 LABEL PROC
PUBLIC _sk_unpremul_sse41
_sk_unpremul_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,113,134,1,0 ; movaps 0x18671(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,113,134,1,0 ; movaps 0x18671(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -18600,20 +18888,20 @@ _sk_unpremul_sse41 LABEL PROC
PUBLIC _sk_from_srgb_sse41
_sk_from_srgb_sse41 LABEL PROC
- DB 68,15,40,29,60,135,1,0 ; movaps 0x1873c(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
+ DB 68,15,40,29,60,135,1,0 ; movaps 0x1873c(%rip),%xmm11 # 2cb80 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
DB 68,15,40,208 ; movaps %xmm0,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
- DB 68,15,40,37,180,134,1,0 ; movaps 0x186b4(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,37,180,134,1,0 ; movaps 0x186b4(%rip),%xmm12 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,36,135,1,0 ; movaps 0x18724(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
+ DB 68,15,40,45,36,135,1,0 ; movaps 0x18724(%rip),%xmm13 # 2cb90 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,197 ; addps %xmm13,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
- DB 68,15,40,53,36,135,1,0 ; movaps 0x18724(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
+ DB 68,15,40,53,36,135,1,0 ; movaps 0x18724(%rip),%xmm14 # 2cba0 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,198 ; addps %xmm14,%xmm8
- DB 68,15,40,61,40,135,1,0 ; movaps 0x18728(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
+ DB 68,15,40,61,40,135,1,0 ; movaps 0x18728(%rip),%xmm15 # 2cbb0 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,40,209 ; movaps %xmm1,%xmm10
@@ -18648,19 +18936,19 @@ PUBLIC _sk_from_srgb_dst_sse41
_sk_from_srgb_dst_sse41 LABEL PROC
DB 68,15,40,204 ; movaps %xmm4,%xmm9
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,29,115,134,1,0 ; movaps 0x18673(%rip),%xmm11 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
+ DB 68,15,40,29,115,134,1,0 ; movaps 0x18673(%rip),%xmm11 # 2cb80 <_sk_overlay_sse2_8bit+0xf33>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
- DB 68,15,40,37,236,133,1,0 ; movaps 0x185ec(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,37,236,133,1,0 ; movaps 0x185ec(%rip),%xmm12 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,228 ; mulps %xmm12,%xmm4
- DB 68,15,40,45,96,134,1,0 ; movaps 0x18660(%rip),%xmm13 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
+ DB 68,15,40,45,96,134,1,0 ; movaps 0x18660(%rip),%xmm13 # 2cb90 <_sk_overlay_sse2_8bit+0xf43>
DB 65,15,88,229 ; addps %xmm13,%xmm4
DB 15,89,224 ; mulps %xmm0,%xmm4
- DB 68,15,40,53,97,134,1,0 ; movaps 0x18661(%rip),%xmm14 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
+ DB 68,15,40,53,97,134,1,0 ; movaps 0x18661(%rip),%xmm14 # 2cba0 <_sk_overlay_sse2_8bit+0xf53>
DB 65,15,88,230 ; addps %xmm14,%xmm4
- DB 68,15,40,61,101,134,1,0 ; movaps 0x18665(%rip),%xmm15 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
+ DB 68,15,40,61,101,134,1,0 ; movaps 0x18665(%rip),%xmm15 # 2cbb0 <_sk_overlay_sse2_8bit+0xf63>
DB 69,15,194,207,1 ; cmpltps %xmm15,%xmm9
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,226 ; blendvps %xmm0,%xmm10,%xmm4
@@ -18703,22 +18991,22 @@ _sk_to_srgb_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,209 ; movaps %xmm1,%xmm2
DB 68,15,82,192 ; rsqrtps %xmm0,%xmm8
- DB 68,15,40,29,214,133,1,0 ; movaps 0x185d6(%rip),%xmm11 # 2c680 <_sk_overlay_sse2_8bit+0xf73>
+ DB 68,15,40,29,214,133,1,0 ; movaps 0x185d6(%rip),%xmm11 # 2cbc0 <_sk_overlay_sse2_8bit+0xf73>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
- DB 68,15,40,37,214,133,1,0 ; movaps 0x185d6(%rip),%xmm12 # 2c690 <_sk_overlay_sse2_8bit+0xf83>
+ DB 68,15,40,37,214,133,1,0 ; movaps 0x185d6(%rip),%xmm12 # 2cbd0 <_sk_overlay_sse2_8bit+0xf83>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 69,15,89,252 ; mulps %xmm12,%xmm15
- DB 68,15,40,21,214,133,1,0 ; movaps 0x185d6(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93>
+ DB 68,15,40,21,214,133,1,0 ; movaps 0x185d6(%rip),%xmm10 # 2cbe0 <_sk_overlay_sse2_8bit+0xf93>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,248 ; mulps %xmm8,%xmm15
- DB 68,15,40,45,214,133,1,0 ; movaps 0x185d6(%rip),%xmm13 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3>
+ DB 68,15,40,45,214,133,1,0 ; movaps 0x185d6(%rip),%xmm13 # 2cbf0 <_sk_overlay_sse2_8bit+0xfa3>
DB 69,15,88,253 ; addps %xmm13,%xmm15
- DB 68,15,40,53,218,133,1,0 ; movaps 0x185da(%rip),%xmm14 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3>
+ DB 68,15,40,53,218,133,1,0 ; movaps 0x185da(%rip),%xmm14 # 2cc00 <_sk_overlay_sse2_8bit+0xfb3>
DB 69,15,88,198 ; addps %xmm14,%xmm8
DB 69,15,83,192 ; rcpps %xmm8,%xmm8
DB 69,15,89,199 ; mulps %xmm15,%xmm8
- DB 68,15,40,61,214,133,1,0 ; movaps 0x185d6(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3>
+ DB 68,15,40,61,214,133,1,0 ; movaps 0x185d6(%rip),%xmm15 # 2cc10 <_sk_overlay_sse2_8bit+0xfc3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 68,15,82,202 ; rsqrtps %xmm2,%xmm9
@@ -18772,7 +19060,7 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 68,15,93,224 ; minps %xmm0,%xmm12
DB 65,15,40,203 ; movaps %xmm11,%xmm1
DB 65,15,92,204 ; subps %xmm12,%xmm1
- DB 68,15,40,53,138,131,1,0 ; movaps 0x1838a(%rip),%xmm14 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,53,138,131,1,0 ; movaps 0x1838a(%rip),%xmm14 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,241 ; divps %xmm1,%xmm14
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 69,15,194,208,0 ; cmpeqps %xmm8,%xmm10
@@ -18781,27 +19069,27 @@ _sk_rgb_to_hsl_sse41 LABEL PROC
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 68,15,194,250,1 ; cmpltps %xmm2,%xmm15
- DB 68,15,84,61,241,132,1,0 ; andps 0x184f1(%rip),%xmm15 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
+ DB 68,15,84,61,241,132,1,0 ; andps 0x184f1(%rip),%xmm15 # 2cc20 <_sk_overlay_sse2_8bit+0xfd3>
DB 68,15,88,248 ; addps %xmm0,%xmm15
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,193,0 ; cmpeqps %xmm9,%xmm0
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,214 ; mulps %xmm14,%xmm2
- DB 68,15,40,45,228,132,1,0 ; movaps 0x184e4(%rip),%xmm13 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3>
+ DB 68,15,40,45,228,132,1,0 ; movaps 0x184e4(%rip),%xmm13 # 2cc30 <_sk_overlay_sse2_8bit+0xfe3>
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,198 ; mulps %xmm14,%xmm8
- DB 68,15,88,5,224,132,1,0 ; addps 0x184e0(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
+ DB 68,15,88,5,224,132,1,0 ; addps 0x184e0(%rip),%xmm8 # 2cc40 <_sk_overlay_sse2_8bit+0xff3>
DB 102,68,15,56,20,194 ; blendvps %xmm0,%xmm2,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 102,69,15,56,20,199 ; blendvps %xmm0,%xmm15,%xmm8
- DB 68,15,89,5,216,132,1,0 ; mulps 0x184d8(%rip),%xmm8 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
+ DB 68,15,89,5,216,132,1,0 ; mulps 0x184d8(%rip),%xmm8 # 2cc50 <_sk_overlay_sse2_8bit+0x1003>
DB 69,15,40,203 ; movaps %xmm11,%xmm9
DB 69,15,194,204,4 ; cmpneqps %xmm12,%xmm9
DB 69,15,84,193 ; andps %xmm9,%xmm8
DB 69,15,92,235 ; subps %xmm11,%xmm13
DB 69,15,88,220 ; addps %xmm12,%xmm11
- DB 15,40,5,236,130,1,0 ; movaps 0x182ec(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,40,5,236,130,1,0 ; movaps 0x182ec(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,211 ; movaps %xmm11,%xmm2
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,194,194,1 ; cmpltps %xmm2,%xmm0
@@ -18822,7 +19110,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,100,36,32 ; movaps %xmm4,0x20(%rsp)
DB 15,41,92,36,16 ; movaps %xmm3,0x10(%rsp)
DB 68,15,40,208 ; movaps %xmm0,%xmm10
- DB 68,15,40,13,158,130,1,0 ; movaps 0x1829e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,13,158,130,1,0 ; movaps 0x1829e(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,194,194,2 ; cmpleps %xmm2,%xmm0
DB 15,40,217 ; movaps %xmm1,%xmm3
@@ -18835,19 +19123,19 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 15,41,20,36 ; movaps %xmm2,(%rsp)
DB 69,15,88,192 ; addps %xmm8,%xmm8
DB 68,15,92,197 ; subps %xmm5,%xmm8
- DB 68,15,40,53,74,132,1,0 ; movaps 0x1844a(%rip),%xmm14 # 2c720 <_sk_overlay_sse2_8bit+0x1013>
+ DB 68,15,40,53,74,132,1,0 ; movaps 0x1844a(%rip),%xmm14 # 2cc60 <_sk_overlay_sse2_8bit+0x1013>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 102,65,15,58,8,198,1 ; roundps $0x1,%xmm14,%xmm0
DB 68,15,92,240 ; subps %xmm0,%xmm14
- DB 68,15,40,29,67,132,1,0 ; movaps 0x18443(%rip),%xmm11 # 2c730 <_sk_overlay_sse2_8bit+0x1023>
+ DB 68,15,40,29,67,132,1,0 ; movaps 0x18443(%rip),%xmm11 # 2cc70 <_sk_overlay_sse2_8bit+0x1023>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 65,15,92,240 ; subps %xmm8,%xmm6
- DB 15,40,61,220,131,1,0 ; movaps 0x183dc(%rip),%xmm7 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
+ DB 15,40,61,220,131,1,0 ; movaps 0x183dc(%rip),%xmm7 # 2cc20 <_sk_overlay_sse2_8bit+0xfd3>
DB 69,15,40,238 ; movaps %xmm14,%xmm13
DB 68,15,89,239 ; mulps %xmm7,%xmm13
- DB 15,40,29,237,131,1,0 ; movaps 0x183ed(%rip),%xmm3 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
+ DB 15,40,29,237,131,1,0 ; movaps 0x183ed(%rip),%xmm3 # 2cc40 <_sk_overlay_sse2_8bit+0xff3>
DB 68,15,40,227 ; movaps %xmm3,%xmm12
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 68,15,89,230 ; mulps %xmm6,%xmm12
@@ -18857,7 +19145,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,40,253 ; movaps %xmm5,%xmm15
DB 102,69,15,56,20,252 ; blendvps %xmm0,%xmm12,%xmm15
- DB 68,15,40,37,204,131,1,0 ; movaps 0x183cc(%rip),%xmm12 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
+ DB 68,15,40,37,204,131,1,0 ; movaps 0x183cc(%rip),%xmm12 # 2cc50 <_sk_overlay_sse2_8bit+0x1003>
DB 65,15,40,196 ; movaps %xmm12,%xmm0
DB 65,15,194,198,2 ; cmpleps %xmm14,%xmm0
DB 68,15,89,238 ; mulps %xmm6,%xmm13
@@ -18891,7 +19179,7 @@ _sk_hsl_to_rgb_sse41 LABEL PROC
DB 65,15,40,198 ; movaps %xmm14,%xmm0
DB 15,40,20,36 ; movaps (%rsp),%xmm2
DB 102,15,56,20,202 ; blendvps %xmm0,%xmm2,%xmm1
- DB 68,15,88,21,101,131,1,0 ; addps 0x18365(%rip),%xmm10 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,88,21,101,131,1,0 ; addps 0x18365(%rip),%xmm10 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 102,65,15,58,8,194,1 ; roundps $0x1,%xmm10,%xmm0
DB 68,15,92,208 ; subps %xmm0,%xmm10
DB 69,15,194,218,2 ; cmpleps %xmm10,%xmm11
@@ -18943,11 +19231,11 @@ _sk_scale_u8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,52 ; jne 144c6 <_sk_scale_u8_sse41+0x4c>
+ DB 117,52 ; jne 14a06 <_sk_scale_u8_sse41+0x4c>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,94,129,1,0 ; pand 0x1815e(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,68,15,219,5,94,129,1,0 ; pand 0x1815e(%rip),%xmm8 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,162,130,1,0 ; mulps 0x182a2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,89,5,162,130,1,0 ; mulps 0x182a2(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -18958,12 +19246,12 @@ _sk_scale_u8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1450e <_sk_scale_u8_sse41+0x94>
+ DB 116,59 ; je 14a4e <_sk_scale_u8_sse41+0x94>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 144f5 <_sk_scale_u8_sse41+0x7b>
+ DB 116,23 ; je 14a35 <_sk_scale_u8_sse41+0x7b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,181 ; jne 14499 <_sk_scale_u8_sse41+0x1f>
+ DB 117,181 ; jne 149d9 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -18971,10 +19259,10 @@ _sk_scale_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 235,139 ; jmp 14499 <_sk_scale_u8_sse41+0x1f>
+ DB 235,139 ; jmp 149d9 <_sk_scale_u8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,124,255,255,255 ; jmpq 14499 <_sk_scale_u8_sse41+0x1f>
+ DB 233,124,255,255,255 ; jmpq 149d9 <_sk_scale_u8_sse41+0x1f>
PUBLIC _sk_scale_565_sse41
_sk_scale_565_sse41 LABEL PROC
@@ -18987,19 +19275,19 @@ _sk_scale_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,159,0,0,0 ; jne 145e0 <_sk_scale_565_sse41+0xc3>
+ DB 15,133,159,0,0,0 ; jne 14b20 <_sk_scale_565_sse41+0xc3>
DB 102,71,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm11
- DB 102,15,111,5,16,130,1,0 ; movdqa 0x18210(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,5,16,130,1,0 ; movdqa 0x18210(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,65,15,219,195 ; pand %xmm11,%xmm0
DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
- DB 68,15,89,13,15,130,1,0 ; mulps 0x1820f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,5,23,130,1,0 ; movdqa 0x18217(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 68,15,89,13,15,130,1,0 ; mulps 0x1820f(%rip),%xmm9 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,5,23,130,1,0 ; movdqa 0x18217(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,65,15,219,195 ; pand %xmm11,%xmm0
DB 68,15,91,208 ; cvtdq2ps %xmm0,%xmm10
- DB 68,15,89,21,22,130,1,0 ; mulps 0x18216(%rip),%xmm10 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,68,15,219,29,29,130,1,0 ; pand 0x1821d(%rip),%xmm11 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 68,15,89,21,22,130,1,0 ; mulps 0x18216(%rip),%xmm10 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,29,29,130,1,0 ; pand 0x1821d(%rip),%xmm11 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 69,15,91,219 ; cvtdq2ps %xmm11,%xmm11
- DB 68,15,89,29,33,130,1,0 ; mulps 0x18221(%rip),%xmm11 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,89,29,33,130,1,0 ; mulps 0x18221(%rip),%xmm11 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
DB 69,15,40,226 ; movaps %xmm10,%xmm12
@@ -19024,22 +19312,22 @@ _sk_scale_565_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,60 ; je 14629 <_sk_scale_565_sse41+0x10c>
+ DB 116,60 ; je 14b69 <_sk_scale_565_sse41+0x10c>
DB 102,69,15,239,219 ; pxor %xmm11,%xmm11
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,26 ; je 14612 <_sk_scale_565_sse41+0xf5>
+ DB 116,26 ; je 14b52 <_sk_scale_565_sse41+0xf5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,70,255,255,255 ; jne 14548 <_sk_scale_565_sse41+0x2b>
+ DB 15,133,70,255,255,255 ; jne 14a88 <_sk_scale_565_sse41+0x2b>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,68,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm11
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,68,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm11
- DB 233,31,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b>
+ DB 233,31,255,255,255 ; jmpq 14a88 <_sk_scale_565_sse41+0x2b>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,68,15,110,216 ; movd %eax,%xmm11
- DB 233,16,255,255,255 ; jmpq 14548 <_sk_scale_565_sse41+0x2b>
+ DB 233,16,255,255,255 ; jmpq 14a88 <_sk_scale_565_sse41+0x2b>
PUBLIC _sk_lerp_1_float_sse41
_sk_lerp_1_float_sse41 LABEL PROC
@@ -19070,11 +19358,11 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 146d0 <_sk_lerp_u8_sse41+0x60>
+ DB 117,72 ; jne 14c10 <_sk_lerp_u8_sse41+0x60>
DB 102,71,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm8
- DB 102,68,15,219,5,104,127,1,0 ; pand 0x17f68(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,68,15,219,5,104,127,1,0 ; pand 0x17f68(%rip),%xmm8 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,172,128,1,0 ; mulps 0x180ac(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,89,5,172,128,1,0 ; mulps 0x180ac(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -19092,12 +19380,12 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,62 ; je 1471b <_sk_lerp_u8_sse41+0xab>
+ DB 116,62 ; je 14c5b <_sk_lerp_u8_sse41+0xab>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 146ff <_sk_lerp_u8_sse41+0x8f>
+ DB 116,23 ; je 14c3f <_sk_lerp_u8_sse41+0x8f>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,161 ; jne 1468f <_sk_lerp_u8_sse41+0x1f>
+ DB 117,161 ; jne 14bcf <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -19105,10 +19393,10 @@ _sk_lerp_u8_sse41 LABEL PROC
DB 102,68,15,110,200 ; movd %eax,%xmm9
DB 102,69,15,56,49,201 ; pmovzxbd %xmm9,%xmm9
DB 102,69,15,58,14,193,15 ; pblendw $0xf,%xmm9,%xmm8
- DB 233,116,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f>
+ DB 233,116,255,255,255 ; jmpq 14bcf <_sk_lerp_u8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,101,255,255,255 ; jmpq 1468f <_sk_lerp_u8_sse41+0x1f>
+ DB 233,101,255,255,255 ; jmpq 14bcf <_sk_lerp_u8_sse41+0x1f>
PUBLIC _sk_lerp_565_sse41
_sk_lerp_565_sse41 LABEL PROC
@@ -19121,19 +19409,19 @@ _sk_lerp_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,165,0,0,0 ; jne 147f3 <_sk_lerp_565_sse41+0xc9>
+ DB 15,133,165,0,0,0 ; jne 14d33 <_sk_lerp_565_sse41+0xc9>
DB 102,71,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm10
- DB 102,15,111,5,3,128,1,0 ; movdqa 0x18003(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,5,3,128,1,0 ; movdqa 0x18003(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 68,15,91,200 ; cvtdq2ps %xmm0,%xmm9
- DB 68,15,89,13,2,128,1,0 ; mulps 0x18002(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,5,10,128,1,0 ; movdqa 0x1800a(%rip),%xmm0 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 68,15,89,13,2,128,1,0 ; mulps 0x18002(%rip),%xmm9 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,5,10,128,1,0 ; movdqa 0x1800a(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 68,15,91,216 ; cvtdq2ps %xmm0,%xmm11
- DB 68,15,89,29,9,128,1,0 ; mulps 0x18009(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,68,15,219,21,16,128,1,0 ; pand 0x18010(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 68,15,89,29,9,128,1,0 ; mulps 0x18009(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,21,16,128,1,0 ; pand 0x18010(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,20,128,1,0 ; mulps 0x18014(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,89,21,20,128,1,0 ; mulps 0x18014(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 15,40,195 ; movaps %xmm3,%xmm0
DB 15,194,199,1 ; cmpltps %xmm7,%xmm0
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -19161,34 +19449,34 @@ _sk_lerp_565_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,60 ; je 1483c <_sk_lerp_565_sse41+0x112>
+ DB 116,60 ; je 14d7c <_sk_lerp_565_sse41+0x112>
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,26 ; je 14825 <_sk_lerp_565_sse41+0xfb>
+ DB 116,26 ; je 14d65 <_sk_lerp_565_sse41+0xfb>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,64,255,255,255 ; jne 14755 <_sk_lerp_565_sse41+0x2b>
+ DB 15,133,64,255,255,255 ; jne 14c95 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,68,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm10
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,68,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm10
- DB 233,25,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b>
+ DB 233,25,255,255,255 ; jmpq 14c95 <_sk_lerp_565_sse41+0x2b>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,68,15,110,208 ; movd %eax,%xmm10
- DB 233,10,255,255,255 ; jmpq 14755 <_sk_lerp_565_sse41+0x2b>
+ DB 233,10,255,255,255 ; jmpq 14c95 <_sk_lerp_565_sse41+0x2b>
PUBLIC _sk_load_tables_sse41
_sk_load_tables_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,24,1,0,0 ; jne 14971 <_sk_load_tables_sse41+0x126>
+ DB 15,133,24,1,0,0 ; jne 14eb1 <_sk_load_tables_sse41+0x126>
DB 243,69,15,111,4,145 ; movdqu (%r9,%rdx,4),%xmm8
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,15,111,5,148,125,1,0 ; movdqa 0x17d94(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,148,125,1,0 ; movdqa 0x17d94(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -19203,7 +19491,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,66,15,58,33,4,179,32 ; insertps $0x20,(%rbx,%r14,4),%xmm0
DB 102,66,15,58,33,4,11,48 ; insertps $0x30,(%rbx,%r9,1),%xmm0
DB 102,65,15,111,200 ; movdqa %xmm8,%xmm1
- DB 102,15,56,0,13,79,125,1,0 ; pshufb 0x17d4f(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,13,79,125,1,0 ; pshufb 0x17d4f(%rip),%xmm1 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
DB 68,15,182,211 ; movzbl %bl,%r10d
@@ -19218,7 +19506,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,202,48 ; insertps $0x30,%xmm2,%xmm1
DB 76,139,72,24 ; mov 0x18(%rax),%r9
DB 102,65,15,111,208 ; movdqa %xmm8,%xmm2
- DB 102,15,56,0,21,11,125,1,0 ; pshufb 0x17d0b(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,21,11,125,1,0 ; pshufb 0x17d0b(%rip),%xmm2 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 102,72,15,58,22,211,1 ; pextrq $0x1,%xmm2,%rbx
DB 102,72,15,126,208 ; movq %xmm2,%rax
DB 68,15,182,208 ; movzbl %al,%r10d
@@ -19233,7 +19521,7 @@ _sk_load_tables_sse41 LABEL PROC
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,216 ; cvtdq2ps %xmm8,%xmm3
- DB 15,89,29,232,125,1,0 ; mulps 0x17de8(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,29,232,125,1,0 ; mulps 0x17de8(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19242,19 +19530,19 @@ _sk_load_tables_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,52 ; je 149b2 <_sk_load_tables_sse41+0x167>
+ DB 116,52 ; je 14ef2 <_sk_load_tables_sse41+0x167>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 149a0 <_sk_load_tables_sse41+0x155>
+ DB 116,23 ; je 14ee0 <_sk_load_tables_sse41+0x155>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,204,254,255,255 ; jne 1485f <_sk_load_tables_sse41+0x14>
+ DB 15,133,204,254,255,255 ; jne 14d9f <_sk_load_tables_sse41+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm8
DB 243,65,15,126,4,145 ; movq (%r9,%rdx,4),%xmm0
DB 102,68,15,58,14,192,15 ; pblendw $0xf,%xmm0,%xmm8
- DB 233,173,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14>
+ DB 233,173,254,255,255 ; jmpq 14d9f <_sk_load_tables_sse41+0x14>
DB 102,69,15,110,4,145 ; movd (%r9,%rdx,4),%xmm8
- DB 233,162,254,255,255 ; jmpq 1485f <_sk_load_tables_sse41+0x14>
+ DB 233,162,254,255,255 ; jmpq 14d9f <_sk_load_tables_sse41+0x14>
PUBLIC _sk_load_tables_u16_be_sse41
_sk_load_tables_u16_be_sse41 LABEL PROC
@@ -19262,7 +19550,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,99,1,0,0 ; jne 14b36 <_sk_load_tables_u16_be_sse41+0x179>
+ DB 15,133,99,1,0,0 ; jne 15076 <_sk_load_tables_u16_be_sse41+0x179>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 243,67,15,111,76,81,16 ; movdqu 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -19274,7 +19562,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,5,182,125,1,0 ; movdqa 0x17db6(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
+ DB 102,68,15,111,5,182,125,1,0 ; movdqa 0x17db6(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19292,7 +19580,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,15,58,33,194,32 ; insertps $0x20,%xmm2,%xmm0
DB 243,66,15,16,20,11 ; movss (%rbx,%r9,1),%xmm2
DB 102,15,58,33,194,48 ; insertps $0x30,%xmm2,%xmm0
- DB 102,15,56,0,13,101,125,1,0 ; pshufb 0x17d65(%rip),%xmm1 # 2c7d0 <_sk_overlay_sse2_8bit+0x10c3>
+ DB 102,15,56,0,13,101,125,1,0 ; pshufb 0x17d65(%rip),%xmm1 # 2cd10 <_sk_overlay_sse2_8bit+0x10c3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19328,7 +19616,7 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 102,65,15,235,216 ; por %xmm8,%xmm3
DB 102,15,56,51,219 ; pmovzxwd %xmm3,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,179,124,1,0 ; mulps 0x17cb3(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
+ DB 15,89,29,179,124,1,0 ; mulps 0x17cb3(%rip),%xmm3 # 2cd20 <_sk_overlay_sse2_8bit+0x10d3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -19336,16 +19624,16 @@ _sk_load_tables_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 14b4f <_sk_load_tables_u16_be_sse41+0x192>
+ DB 117,13 ; jne 1508f <_sk_load_tables_u16_be_sse41+0x192>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,145,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,145,254,255,255 ; jmpq 14f20 <_sk_load_tables_u16_be_sse41+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,124,254,255,255 ; jb 149e0 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 15,130,124,254,255,255 ; jb 14f20 <_sk_load_tables_u16_be_sse41+0x23>
DB 243,67,15,126,76,81,16 ; movq 0x10(%r9,%r10,2),%xmm1
- DB 233,112,254,255,255 ; jmpq 149e0 <_sk_load_tables_u16_be_sse41+0x23>
+ DB 233,112,254,255,255 ; jmpq 14f20 <_sk_load_tables_u16_be_sse41+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse41
_sk_load_tables_rgb_u16_be_sse41 LABEL PROC
@@ -19353,7 +19641,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,83,1,0,0 ; jne 14cd5 <_sk_load_tables_rgb_u16_be_sse41+0x165>
+ DB 15,133,83,1,0,0 ; jne 15215 <_sk_load_tables_rgb_u16_be_sse41+0x165>
DB 243,67,15,111,20,81 ; movdqu (%r9,%r10,2),%xmm2
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -19368,7 +19656,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
- DB 102,68,15,111,5,248,123,1,0 ; movdqa 0x17bf8(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
+ DB 102,68,15,111,5,248,123,1,0 ; movdqa 0x17bf8(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
@@ -19386,7 +19674,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,15,58,33,195,32 ; insertps $0x20,%xmm3,%xmm0
DB 243,66,15,16,28,11 ; movss (%rbx,%r9,1),%xmm3
DB 102,15,58,33,195,48 ; insertps $0x30,%xmm3,%xmm0
- DB 102,15,56,0,13,199,123,1,0 ; pshufb 0x17bc7(%rip),%xmm1 # 2c7f0 <_sk_overlay_sse2_8bit+0x10e3>
+ DB 102,15,56,0,13,199,123,1,0 ; pshufb 0x17bc7(%rip),%xmm1 # 2cd30 <_sk_overlay_sse2_8bit+0x10e3>
DB 102,15,56,51,201 ; pmovzxwd %xmm1,%xmm1
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 102,72,15,126,203 ; movq %xmm1,%rbx
@@ -19417,7 +19705,7 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 243,65,15,16,28,25 ; movss (%r9,%rbx,1),%xmm3
DB 102,15,58,33,211,48 ; insertps $0x30,%xmm3,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,130,120,1,0 ; movaps 0x17882(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,130,120,1,0 ; movaps 0x17882(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -19426,21 +19714,21 @@ _sk_load_tables_rgb_u16_be_sse41 LABEL PROC
DB 102,67,15,196,84,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 14cfb <_sk_load_tables_rgb_u16_be_sse41+0x18b>
+ DB 117,14 ; jne 1523b <_sk_load_tables_rgb_u16_be_sse41+0x18b>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
- DB 233,173,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,173,254,255,255 ; jmpq 150e8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,71,15,110,76,81,6 ; movd 0x6(%r9,%r10,2),%xmm9
DB 102,71,15,196,76,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm9
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 14d2c <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
+ DB 114,24 ; jb 1526c <_sk_load_tables_rgb_u16_be_sse41+0x1bc>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,124,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,124,254,255,255 ; jmpq 150e8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,115,254,255,255 ; jmpq 14ba8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
+ DB 233,115,254,255,255 ; jmpq 150e8 <_sk_load_tables_rgb_u16_be_sse41+0x38>
PUBLIC _sk_byte_tables_sse41
_sk_byte_tables_sse41 LABEL PROC
@@ -19449,7 +19737,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 65,84 ; push %r12
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,234,120,1,0 ; movaps 0x178ea(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,234,120,1,0 ; movaps 0x178ea(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,58,22,193,1 ; pextrq $0x1,%xmm0,%r9
@@ -19468,7 +19756,7 @@ _sk_byte_tables_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,171,121,1,0 ; movaps 0x179ab(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,13,171,121,1,0 ; movaps 0x179ab(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19562,7 +19850,7 @@ _sk_byte_tables_rgb_sse41 LABEL PROC
DB 102,15,58,32,195,3 ; pinsrb $0x3,%ebx,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,13,19,120,1,0 ; movaps 0x17813(%rip),%xmm9 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,13,19,120,1,0 ; movaps 0x17813(%rip),%xmm9 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -19739,31 +20027,31 @@ _sk_parametric_r_sse41 LABEL PROC
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,194 ; cvtdq2ps %xmm10,%xmm8
- DB 68,15,89,5,251,117,1,0 ; mulps 0x175fb(%rip),%xmm8 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,21,3,118,1,0 ; andps 0x17603(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,21,43,115,1,0 ; orps 0x1732b(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,5,3,118,1,0 ; addps 0x17603(%rip),%xmm8 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 68,15,40,37,11,118,1,0 ; movaps 0x1760b(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,5,251,117,1,0 ; mulps 0x175fb(%rip),%xmm8 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,3,118,1,0 ; andps 0x17603(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,43,115,1,0 ; orps 0x1732b(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,3,118,1,0 ; addps 0x17603(%rip),%xmm8 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,11,118,1,0 ; movaps 0x1760b(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
- DB 68,15,88,21,11,118,1,0 ; addps 0x1760b(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 68,15,40,37,19,118,1,0 ; movaps 0x17613(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,21,11,118,1,0 ; addps 0x1760b(%rip),%xmm10 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,19,118,1,0 ; movaps 0x17613(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,196 ; subps %xmm12,%xmm8
DB 69,15,89,195 ; mulps %xmm11,%xmm8
DB 102,69,15,58,8,208,1 ; roundps $0x1,%xmm8,%xmm10
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,5,0,118,1,0 ; addps 0x17600(%rip),%xmm8 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,5,0,118,1,0 ; addps 0x17600(%rip),%xmm8 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,211 ; mulps %xmm11,%xmm10
DB 69,15,92,194 ; subps %xmm10,%xmm8
- DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,21,8,118,1,0 ; movaps 0x17608(%rip),%xmm10 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 68,15,40,29,12,118,1,0 ; movaps 0x1760c(%rip),%xmm11 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,29,12,118,1,0 ; movaps 0x1760c(%rip),%xmm11 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,218 ; divps %xmm10,%xmm11
DB 69,15,88,216 ; addps %xmm8,%xmm11
- DB 68,15,89,29,12,118,1,0 ; mulps 0x1760c(%rip),%xmm11 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 68,15,89,29,12,118,1,0 ; mulps 0x1760c(%rip),%xmm11 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,211 ; cvtps2dq %xmm11,%xmm10
DB 243,68,15,16,64,20 ; movss 0x14(%rax),%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
@@ -19771,7 +20059,7 @@ _sk_parametric_r_sse41 LABEL PROC
DB 102,69,15,56,20,193 ; blendvps %xmm0,%xmm9,%xmm8
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,147,114,1,0 ; minps 0x17293(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,93,5,147,114,1,0 ; minps 0x17293(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19799,31 +20087,31 @@ _sk_parametric_g_sse41 LABEL PROC
DB 68,15,88,217 ; addps %xmm1,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,212,116,1,0 ; mulps 0x174d4(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,29,220,116,1,0 ; andps 0x174dc(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,29,4,114,1,0 ; orps 0x17204(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,37,220,116,1,0 ; addps 0x174dc(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 15,40,13,229,116,1,0 ; movaps 0x174e5(%rip),%xmm1 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,37,212,116,1,0 ; mulps 0x174d4(%rip),%xmm12 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,220,116,1,0 ; andps 0x174dc(%rip),%xmm11 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,4,114,1,0 ; orps 0x17204(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,220,116,1,0 ; addps 0x174dc(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,13,229,116,1,0 ; movaps 0x174e5(%rip),%xmm1 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,88,29,229,116,1,0 ; addps 0x174e5(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 15,40,13,238,116,1,0 ; movaps 0x174ee(%rip),%xmm1 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,29,229,116,1,0 ; addps 0x174e5(%rip),%xmm11 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,13,238,116,1,0 ; movaps 0x174ee(%rip),%xmm1 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,203 ; divps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,219,116,1,0 ; addps 0x174db(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 15,40,13,228,116,1,0 ; movaps 0x174e4(%rip),%xmm1 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,37,219,116,1,0 ; addps 0x174db(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,13,228,116,1,0 ; movaps 0x174e4(%rip),%xmm1 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 68,15,92,225 ; subps %xmm1,%xmm12
- DB 68,15,40,21,228,116,1,0 ; movaps 0x174e4(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,21,228,116,1,0 ; movaps 0x174e4(%rip),%xmm10 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,13,233,116,1,0 ; movaps 0x174e9(%rip),%xmm1 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 15,40,13,233,116,1,0 ; movaps 0x174e9(%rip),%xmm1 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,202 ; divps %xmm10,%xmm1
DB 65,15,88,204 ; addps %xmm12,%xmm1
- DB 15,89,13,234,116,1,0 ; mulps 0x174ea(%rip),%xmm1 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 15,89,13,234,116,1,0 ; mulps 0x174ea(%rip),%xmm1 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,209 ; cvtps2dq %xmm1,%xmm10
DB 243,15,16,72,20 ; movss 0x14(%rax),%xmm1
DB 15,198,201,0 ; shufps $0x0,%xmm1,%xmm1
@@ -19831,7 +20119,7 @@ _sk_parametric_g_sse41 LABEL PROC
DB 102,65,15,56,20,201 ; blendvps %xmm0,%xmm9,%xmm1
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,200 ; maxps %xmm0,%xmm1
- DB 15,93,13,117,113,1,0 ; minps 0x17175(%rip),%xmm1 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,13,117,113,1,0 ; minps 0x17175(%rip),%xmm1 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19859,31 +20147,31 @@ _sk_parametric_b_sse41 LABEL PROC
DB 68,15,88,218 ; addps %xmm2,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,182,115,1,0 ; mulps 0x173b6(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,29,190,115,1,0 ; andps 0x173be(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,29,230,112,1,0 ; orps 0x170e6(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,37,190,115,1,0 ; addps 0x173be(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 15,40,21,199,115,1,0 ; movaps 0x173c7(%rip),%xmm2 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,37,182,115,1,0 ; mulps 0x173b6(%rip),%xmm12 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,190,115,1,0 ; andps 0x173be(%rip),%xmm11 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,230,112,1,0 ; orps 0x170e6(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,190,115,1,0 ; addps 0x173be(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,21,199,115,1,0 ; movaps 0x173c7(%rip),%xmm2 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,88,29,199,115,1,0 ; addps 0x173c7(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 15,40,21,208,115,1,0 ; movaps 0x173d0(%rip),%xmm2 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,29,199,115,1,0 ; addps 0x173c7(%rip),%xmm11 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,21,208,115,1,0 ; movaps 0x173d0(%rip),%xmm2 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,211 ; divps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,189,115,1,0 ; addps 0x173bd(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm2 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,37,189,115,1,0 ; addps 0x173bd(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm2 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,211 ; mulps %xmm11,%xmm2
DB 68,15,92,226 ; subps %xmm2,%xmm12
- DB 68,15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,21,198,115,1,0 ; movaps 0x173c6(%rip),%xmm10 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,21,203,115,1,0 ; movaps 0x173cb(%rip),%xmm2 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 15,40,21,203,115,1,0 ; movaps 0x173cb(%rip),%xmm2 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,210 ; divps %xmm10,%xmm2
DB 65,15,88,212 ; addps %xmm12,%xmm2
- DB 15,89,21,204,115,1,0 ; mulps 0x173cc(%rip),%xmm2 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 15,89,21,204,115,1,0 ; mulps 0x173cc(%rip),%xmm2 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,210 ; cvtps2dq %xmm2,%xmm10
DB 243,15,16,80,20 ; movss 0x14(%rax),%xmm2
DB 15,198,210,0 ; shufps $0x0,%xmm2,%xmm2
@@ -19891,7 +20179,7 @@ _sk_parametric_b_sse41 LABEL PROC
DB 102,65,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm2
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,208 ; maxps %xmm0,%xmm2
- DB 15,93,21,87,112,1,0 ; minps 0x17057(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,21,87,112,1,0 ; minps 0x17057(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19919,31 +20207,31 @@ _sk_parametric_a_sse41 LABEL PROC
DB 68,15,88,219 ; addps %xmm3,%xmm11
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,91,227 ; cvtdq2ps %xmm11,%xmm12
- DB 68,15,89,37,152,114,1,0 ; mulps 0x17298(%rip),%xmm12 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,29,160,114,1,0 ; andps 0x172a0(%rip),%xmm11 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,29,200,111,1,0 ; orps 0x16fc8(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,37,160,114,1,0 ; addps 0x172a0(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 15,40,29,169,114,1,0 ; movaps 0x172a9(%rip),%xmm3 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,37,152,114,1,0 ; mulps 0x17298(%rip),%xmm12 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,29,160,114,1,0 ; andps 0x172a0(%rip),%xmm11 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,29,200,111,1,0 ; orps 0x16fc8(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,37,160,114,1,0 ; addps 0x172a0(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 15,40,29,169,114,1,0 ; movaps 0x172a9(%rip),%xmm3 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,88,29,169,114,1,0 ; addps 0x172a9(%rip),%xmm11 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 15,40,29,178,114,1,0 ; movaps 0x172b2(%rip),%xmm3 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,29,169,114,1,0 ; addps 0x172a9(%rip),%xmm11 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 15,40,29,178,114,1,0 ; movaps 0x172b2(%rip),%xmm3 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,94,219 ; divps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 102,69,15,58,8,212,1 ; roundps $0x1,%xmm12,%xmm10
DB 69,15,40,220 ; movaps %xmm12,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 68,15,88,37,159,114,1,0 ; addps 0x1729f(%rip),%xmm12 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 15,40,29,168,114,1,0 ; movaps 0x172a8(%rip),%xmm3 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,37,159,114,1,0 ; addps 0x1729f(%rip),%xmm12 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,29,168,114,1,0 ; movaps 0x172a8(%rip),%xmm3 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 65,15,89,219 ; mulps %xmm11,%xmm3
DB 68,15,92,227 ; subps %xmm3,%xmm12
- DB 68,15,40,21,168,114,1,0 ; movaps 0x172a8(%rip),%xmm10 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,21,168,114,1,0 ; movaps 0x172a8(%rip),%xmm10 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,211 ; subps %xmm11,%xmm10
- DB 15,40,29,173,114,1,0 ; movaps 0x172ad(%rip),%xmm3 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 15,40,29,173,114,1,0 ; movaps 0x172ad(%rip),%xmm3 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,94,218 ; divps %xmm10,%xmm3
DB 65,15,88,220 ; addps %xmm12,%xmm3
- DB 15,89,29,174,114,1,0 ; mulps 0x172ae(%rip),%xmm3 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 15,89,29,174,114,1,0 ; mulps 0x172ae(%rip),%xmm3 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,68,15,91,211 ; cvtps2dq %xmm3,%xmm10
DB 243,15,16,88,20 ; movss 0x14(%rax),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
@@ -19951,7 +20239,7 @@ _sk_parametric_a_sse41 LABEL PROC
DB 102,65,15,56,20,217 ; blendvps %xmm0,%xmm9,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,95,216 ; maxps %xmm0,%xmm3
- DB 15,93,29,57,111,1,0 ; minps 0x16f39(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,29,57,111,1,0 ; minps 0x16f39(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -19967,20 +20255,20 @@ _sk_gamma_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,181,113,1,0 ; mulps 0x171b5(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,40,53,189,113,1,0 ; movaps 0x171bd(%rip),%xmm14 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 15,89,5,181,113,1,0 ; mulps 0x171b5(%rip),%xmm0 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,40,53,189,113,1,0 ; movaps 0x171bd(%rip),%xmm14 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,37,225,110,1,0 ; movaps 0x16ee1(%rip),%xmm12 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,37,225,110,1,0 ; movaps 0x16ee1(%rip),%xmm12 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,86,212 ; orps %xmm12,%xmm2
- DB 68,15,40,21,181,113,1,0 ; movaps 0x171b5(%rip),%xmm10 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,21,181,113,1,0 ; movaps 0x171b5(%rip),%xmm10 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,29,185,113,1,0 ; movaps 0x171b9(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,40,29,185,113,1,0 ; movaps 0x171b9(%rip),%xmm11 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,13,183,113,1,0 ; movaps 0x171b7(%rip),%xmm9 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,13,183,113,1,0 ; movaps 0x171b7(%rip),%xmm9 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 68,15,40,45,187,113,1,0 ; movaps 0x171bb(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,40,45,187,113,1,0 ; movaps 0x171bb(%rip),%xmm13 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -19991,21 +20279,21 @@ _sk_gamma_sse41 LABEL PROC
DB 102,15,58,8,208,1 ; roundps $0x1,%xmm0,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,158,113,1,0 ; movaps 0x1719e(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,53,158,113,1,0 ; movaps 0x1719e(%rip),%xmm6 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,180,113,1,0 ; movaps 0x171b4(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 15,40,61,180,113,1,0 ; movaps 0x171b4(%rip),%xmm7 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,148,113,1,0 ; movaps 0x17194(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 15,40,37,148,113,1,0 ; movaps 0x17194(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,166,113,1,0 ; movaps 0x171a6(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,61,166,113,1,0 ; movaps 0x171a6(%rip),%xmm15 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,2,113,1,0 ; mulps 0x17102(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,89,5,2,113,1,0 ; mulps 0x17102(%rip),%xmm0 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
DB 65,15,84,206 ; andps %xmm14,%xmm1
DB 65,15,86,204 ; orps %xmm12,%xmm1
DB 65,15,88,194 ; addps %xmm10,%xmm0
@@ -20031,8 +20319,8 @@ _sk_gamma_sse41 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,163,112,1,0 ; mulps 0x170a3(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 15,84,29,172,112,1,0 ; andps 0x170ac(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 15,89,5,163,112,1,0 ; mulps 0x170a3(%rip),%xmm0 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,29,172,112,1,0 ; andps 0x170ac(%rip),%xmm3 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,86,220 ; orps %xmm12,%xmm3
DB 65,15,88,194 ; addps %xmm10,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
@@ -20050,7 +20338,7 @@ _sk_gamma_sse41 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,244,112,1,0 ; movaps 0x170f4(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 15,40,5,244,112,1,0 ; movaps 0x170f4(%rip),%xmm0 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -20069,29 +20357,29 @@ _sk_gamma_sse41 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse41
_sk_lab_to_xyz_sse41 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,89,5,193,112,1,0 ; mulps 0x170c1(%rip),%xmm8 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3>
- DB 68,15,40,13,57,110,1,0 ; movaps 0x16e39(%rip),%xmm9 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,89,5,193,112,1,0 ; mulps 0x170c1(%rip),%xmm8 # 2cdf0 <_sk_overlay_sse2_8bit+0x11a3>
+ DB 68,15,40,13,57,110,1,0 ; movaps 0x16e39(%rip),%xmm9 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,201 ; mulps %xmm9,%xmm1
- DB 15,40,5,190,112,1,0 ; movaps 0x170be(%rip),%xmm0 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3>
+ DB 15,40,5,190,112,1,0 ; movaps 0x170be(%rip),%xmm0 # 2ce00 <_sk_overlay_sse2_8bit+0x11b3>
DB 15,88,200 ; addps %xmm0,%xmm1
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
- DB 68,15,88,5,188,112,1,0 ; addps 0x170bc(%rip),%xmm8 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3>
- DB 68,15,89,5,196,112,1,0 ; mulps 0x170c4(%rip),%xmm8 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3>
- DB 15,89,13,205,112,1,0 ; mulps 0x170cd(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3>
+ DB 68,15,88,5,188,112,1,0 ; addps 0x170bc(%rip),%xmm8 # 2ce10 <_sk_overlay_sse2_8bit+0x11c3>
+ DB 68,15,89,5,196,112,1,0 ; mulps 0x170c4(%rip),%xmm8 # 2ce20 <_sk_overlay_sse2_8bit+0x11d3>
+ DB 15,89,13,205,112,1,0 ; mulps 0x170cd(%rip),%xmm1 # 2ce30 <_sk_overlay_sse2_8bit+0x11e3>
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 15,89,21,210,112,1,0 ; mulps 0x170d2(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3>
+ DB 15,89,21,210,112,1,0 ; mulps 0x170d2(%rip),%xmm2 # 2ce40 <_sk_overlay_sse2_8bit+0x11f3>
DB 69,15,40,208 ; movaps %xmm8,%xmm10
DB 68,15,92,210 ; subps %xmm2,%xmm10
DB 68,15,40,217 ; movaps %xmm1,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
- DB 68,15,40,13,198,112,1,0 ; movaps 0x170c6(%rip),%xmm9 # 2c910 <_sk_overlay_sse2_8bit+0x1203>
+ DB 68,15,40,13,198,112,1,0 ; movaps 0x170c6(%rip),%xmm9 # 2ce50 <_sk_overlay_sse2_8bit+0x1203>
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 15,40,21,198,112,1,0 ; movaps 0x170c6(%rip),%xmm2 # 2c920 <_sk_overlay_sse2_8bit+0x1213>
+ DB 15,40,21,198,112,1,0 ; movaps 0x170c6(%rip),%xmm2 # 2ce60 <_sk_overlay_sse2_8bit+0x1213>
DB 15,88,202 ; addps %xmm2,%xmm1
- DB 68,15,40,37,203,112,1,0 ; movaps 0x170cb(%rip),%xmm12 # 2c930 <_sk_overlay_sse2_8bit+0x1223>
+ DB 68,15,40,37,203,112,1,0 ; movaps 0x170cb(%rip),%xmm12 # 2ce70 <_sk_overlay_sse2_8bit+0x1223>
DB 65,15,89,204 ; mulps %xmm12,%xmm1
DB 102,65,15,56,20,203 ; blendvps %xmm0,%xmm11,%xmm1
DB 69,15,40,216 ; movaps %xmm8,%xmm11
@@ -20110,8 +20398,8 @@ _sk_lab_to_xyz_sse41 LABEL PROC
DB 65,15,89,212 ; mulps %xmm12,%xmm2
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,65,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm2
- DB 15,89,13,132,112,1,0 ; mulps 0x17084(%rip),%xmm1 # 2c940 <_sk_overlay_sse2_8bit+0x1233>
- DB 15,89,21,141,112,1,0 ; mulps 0x1708d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243>
+ DB 15,89,13,132,112,1,0 ; mulps 0x17084(%rip),%xmm1 # 2ce80 <_sk_overlay_sse2_8bit+0x1233>
+ DB 15,89,21,141,112,1,0 ; mulps 0x1708d(%rip),%xmm2 # 2ce90 <_sk_overlay_sse2_8bit+0x1243>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,40,200 ; movaps %xmm8,%xmm1
@@ -20126,11 +20414,11 @@ _sk_load_a8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 1590d <_sk_load_a8_sse41+0x3f>
+ DB 117,39 ; jne 15e4d <_sk_load_a8_sse41+0x3f>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,11,109,1,0 ; pand 0x16d0b(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,5,11,109,1,0 ; pand 0x16d0b(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,81,110,1,0 ; mulps 0x16e51(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,29,81,110,1,0 ; mulps 0x16e51(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -20139,12 +20427,12 @@ _sk_load_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 1594f <_sk_load_a8_sse41+0x81>
+ DB 116,53 ; je 15e8f <_sk_load_a8_sse41+0x81>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15939 <_sk_load_a8_sse41+0x6b>
+ DB 116,21 ; je 15e79 <_sk_load_a8_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 158ed <_sk_load_a8_sse41+0x1f>
+ DB 117,195 ; jne 15e2d <_sk_load_a8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -20152,10 +20440,10 @@ _sk_load_a8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,158 ; jmp 158ed <_sk_load_a8_sse41+0x1f>
+ DB 235,158 ; jmp 15e2d <_sk_load_a8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,147 ; jmp 158ed <_sk_load_a8_sse41+0x1f>
+ DB 235,147 ; jmp 15e2d <_sk_load_a8_sse41+0x1f>
PUBLIC _sk_load_a8_dst_sse41
_sk_load_a8_dst_sse41 LABEL PROC
@@ -20166,11 +20454,11 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,39 ; jne 15999 <_sk_load_a8_dst_sse41+0x3f>
+ DB 117,39 ; jne 15ed9 <_sk_load_a8_dst_sse41+0x3f>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,127,108,1,0 ; pand 0x16c7f(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,37,127,108,1,0 ; pand 0x16c7f(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,197,109,1,0 ; mulps 0x16dc5(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,61,197,109,1,0 ; mulps 0x16dc5(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
@@ -20179,12 +20467,12 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 159db <_sk_load_a8_dst_sse41+0x81>
+ DB 116,53 ; je 15f1b <_sk_load_a8_dst_sse41+0x81>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 159c5 <_sk_load_a8_dst_sse41+0x6b>
+ DB 116,21 ; je 15f05 <_sk_load_a8_dst_sse41+0x6b>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 15979 <_sk_load_a8_dst_sse41+0x1f>
+ DB 117,195 ; jne 15eb9 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -20192,10 +20480,10 @@ _sk_load_a8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,158 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,158 ; jmp 15eb9 <_sk_load_a8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,147 ; jmp 15979 <_sk_load_a8_dst_sse41+0x1f>
+ DB 235,147 ; jmp 15eb9 <_sk_load_a8_dst_sse41+0x1f>
PUBLIC _sk_gather_a8_sse41
_sk_gather_a8_sse41 LABEL PROC
@@ -20222,7 +20510,7 @@ _sk_gather_a8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,250,108,1,0 ; mulps 0x16cfa(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,29,250,108,1,0 ; mulps 0x16cfa(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -20239,13 +20527,13 @@ _sk_store_a8_sse41 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,171,107,1,0 ; movaps 0x16bab(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,171,107,1,0 ; movaps 0x16bab(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 15aaf <_sk_store_a8_sse41+0x49>
+ DB 117,17 ; jne 15fef <_sk_store_a8_sse41+0x49>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -20255,17 +20543,17 @@ _sk_store_a8_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 15aeb <_sk_store_a8_sse41+0x85>
+ DB 116,41 ; je 1602b <_sk_store_a8_sse41+0x85>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 15ad7 <_sk_store_a8_sse41+0x71>
+ DB 116,15 ; je 16017 <_sk_store_a8_sse41+0x71>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,217 ; jne 15aa7 <_sk_store_a8_sse41+0x41>
+ DB 117,217 ; jne 15fe7 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,68,25,2,8 ; pextrb $0x8,%xmm8,0x2(%r9,%r11,1)
- DB 102,68,15,56,0,5,127,110,1,0 ; pshufb 0x16e7f(%rip),%xmm8 # 2c960 <_sk_overlay_sse2_8bit+0x1253>
+ DB 102,68,15,56,0,5,127,110,1,0 ; pshufb 0x16e7f(%rip),%xmm8 # 2cea0 <_sk_overlay_sse2_8bit+0x1253>
DB 102,71,15,58,21,4,25,0 ; pextrw $0x0,%xmm8,(%r9,%r11,1)
- DB 235,188 ; jmp 15aa7 <_sk_store_a8_sse41+0x41>
+ DB 235,188 ; jmp 15fe7 <_sk_store_a8_sse41+0x41>
DB 102,71,15,58,20,4,25,0 ; pextrb $0x0,%xmm8,(%r9,%r11,1)
- DB 235,178 ; jmp 15aa7 <_sk_store_a8_sse41+0x41>
+ DB 235,178 ; jmp 15fe7 <_sk_store_a8_sse41+0x41>
PUBLIC _sk_load_g8_sse41
_sk_load_g8_sse41 LABEL PROC
@@ -20276,25 +20564,25 @@ _sk_load_g8_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 15b37 <_sk_load_g8_sse41+0x42>
+ DB 117,42 ; jne 16077 <_sk_load_g8_sse41+0x42>
DB 102,67,15,56,49,4,25 ; pmovzxbd (%r9,%r11,1),%xmm0
- DB 102,15,219,5,228,106,1,0 ; pand 0x16ae4(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,5,228,106,1,0 ; pand 0x16ae4(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,42,108,1,0 ; mulps 0x16c2a(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,5,42,108,1,0 ; mulps 0x16c2a(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,33,106,1,0 ; movaps 0x16a21(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,33,106,1,0 ; movaps 0x16a21(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15b79 <_sk_load_g8_sse41+0x84>
+ DB 116,53 ; je 160b9 <_sk_load_g8_sse41+0x84>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15b63 <_sk_load_g8_sse41+0x6e>
+ DB 116,21 ; je 160a3 <_sk_load_g8_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 15b14 <_sk_load_g8_sse41+0x1f>
+ DB 117,192 ; jne 16054 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -20302,10 +20590,10 @@ _sk_load_g8_sse41 LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,56,49,201 ; pmovzxbd %xmm1,%xmm1
DB 102,15,58,14,193,15 ; pblendw $0xf,%xmm1,%xmm0
- DB 235,155 ; jmp 15b14 <_sk_load_g8_sse41+0x1f>
+ DB 235,155 ; jmp 16054 <_sk_load_g8_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,144 ; jmp 15b14 <_sk_load_g8_sse41+0x1f>
+ DB 235,144 ; jmp 16054 <_sk_load_g8_sse41+0x1f>
PUBLIC _sk_load_g8_dst_sse41
_sk_load_g8_dst_sse41 LABEL PROC
@@ -20316,25 +20604,25 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,42 ; jne 15bc6 <_sk_load_g8_dst_sse41+0x42>
+ DB 117,42 ; jne 16106 <_sk_load_g8_dst_sse41+0x42>
DB 102,67,15,56,49,36,25 ; pmovzxbd (%r9,%r11,1),%xmm4
- DB 102,15,219,37,85,106,1,0 ; pand 0x16a55(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,37,85,106,1,0 ; pand 0x16a55(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,155,107,1,0 ; mulps 0x16b9b(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,37,155,107,1,0 ; mulps 0x16b9b(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,146,105,1,0 ; movaps 0x16992(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,61,146,105,1,0 ; movaps 0x16992(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15c08 <_sk_load_g8_dst_sse41+0x84>
+ DB 116,53 ; je 16148 <_sk_load_g8_dst_sse41+0x84>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15bf2 <_sk_load_g8_dst_sse41+0x6e>
+ DB 116,21 ; je 16132 <_sk_load_g8_dst_sse41+0x6e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 15ba3 <_sk_load_g8_dst_sse41+0x1f>
+ DB 117,192 ; jne 160e3 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -20342,10 +20630,10 @@ _sk_load_g8_dst_sse41 LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,49,237 ; pmovzxbd %xmm5,%xmm5
DB 102,15,58,14,229,15 ; pblendw $0xf,%xmm5,%xmm4
- DB 235,155 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,155 ; jmp 160e3 <_sk_load_g8_dst_sse41+0x1f>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,144 ; jmp 15ba3 <_sk_load_g8_dst_sse41+0x1f>
+ DB 235,144 ; jmp 160e3 <_sk_load_g8_dst_sse41+0x1f>
PUBLIC _sk_gather_g8_sse41
_sk_gather_g8_sse41 LABEL PROC
@@ -20372,9 +20660,9 @@ _sk_gather_g8_sse41 LABEL PROC
DB 102,15,58,32,192,3 ; pinsrb $0x3,%eax,%xmm0
DB 102,15,56,49,192 ; pmovzxbd %xmm0,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,205,106,1,0 ; mulps 0x16acd(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,5,205,106,1,0 ; mulps 0x16acd(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,196,104,1,0 ; movaps 0x168c4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,196,104,1,0 ; movaps 0x168c4(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -20390,41 +20678,41 @@ _sk_load_565_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 15d00 <_sk_load_565_sse41+0x6b>
+ DB 117,80 ; jne 16240 <_sk_load_565_sse41+0x6b>
DB 102,67,15,56,51,20,89 ; pmovzxwd (%r9,%r11,2),%xmm2
- DB 102,15,111,5,161,106,1,0 ; movdqa 0x16aa1(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,5,161,106,1,0 ; movdqa 0x16aa1(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,163,106,1,0 ; mulps 0x16aa3(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,13,171,106,1,0 ; movdqa 0x16aab(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 15,89,5,163,106,1,0 ; mulps 0x16aa3(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,171,106,1,0 ; movdqa 0x16aab(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,173,106,1,0 ; mulps 0x16aad(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,15,219,21,181,106,1,0 ; pand 0x16ab5(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 15,89,13,173,106,1,0 ; mulps 0x16aad(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,181,106,1,0 ; pand 0x16ab5(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,187,106,1,0 ; mulps 0x16abb(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,89,21,187,106,1,0 ; mulps 0x16abb(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,82,104,1,0 ; movaps 0x16852(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,82,104,1,0 ; movaps 0x16852(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15d42 <_sk_load_565_sse41+0xad>
+ DB 116,53 ; je 16282 <_sk_load_565_sse41+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15d2c <_sk_load_565_sse41+0x97>
+ DB 116,21 ; je 1626c <_sk_load_565_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 15cb7 <_sk_load_565_sse41+0x22>
+ DB 117,154 ; jne 161f7 <_sk_load_565_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,208,15 ; pblendw $0xf,%xmm0,%xmm2
- DB 233,117,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 161f7 <_sk_load_565_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,103,255,255,255 ; jmpq 15cb7 <_sk_load_565_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 161f7 <_sk_load_565_sse41+0x22>
PUBLIC _sk_load_565_dst_sse41
_sk_load_565_dst_sse41 LABEL PROC
@@ -20436,41 +20724,41 @@ _sk_load_565_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,80 ; jne 15dbb <_sk_load_565_dst_sse41+0x6b>
+ DB 117,80 ; jne 162fb <_sk_load_565_dst_sse41+0x6b>
DB 102,67,15,56,51,52,89 ; pmovzxwd (%r9,%r11,2),%xmm6
- DB 102,15,111,37,230,105,1,0 ; movdqa 0x169e6(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,37,230,105,1,0 ; movdqa 0x169e6(%rip),%xmm4 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,232,105,1,0 ; mulps 0x169e8(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,45,240,105,1,0 ; movdqa 0x169f0(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 15,89,37,232,105,1,0 ; mulps 0x169e8(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,45,240,105,1,0 ; movdqa 0x169f0(%rip),%xmm5 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,242,105,1,0 ; mulps 0x169f2(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,15,219,53,250,105,1,0 ; pand 0x169fa(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 15,89,45,242,105,1,0 ; mulps 0x169f2(%rip),%xmm5 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,53,250,105,1,0 ; pand 0x169fa(%rip),%xmm6 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,0,106,1,0 ; mulps 0x16a00(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,89,53,0,106,1,0 ; mulps 0x16a00(%rip),%xmm6 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,151,103,1,0 ; movaps 0x16797(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,61,151,103,1,0 ; movaps 0x16797(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 15dfd <_sk_load_565_dst_sse41+0xad>
+ DB 116,53 ; je 1633d <_sk_load_565_dst_sse41+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 15de7 <_sk_load_565_dst_sse41+0x97>
+ DB 116,21 ; je 16327 <_sk_load_565_dst_sse41+0x97>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 15d72 <_sk_load_565_dst_sse41+0x22>
+ DB 117,154 ; jne 162b2 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,117,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22>
+ DB 233,117,255,255,255 ; jmpq 162b2 <_sk_load_565_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,103,255,255,255 ; jmpq 15d72 <_sk_load_565_dst_sse41+0x22>
+ DB 233,103,255,255,255 ; jmpq 162b2 <_sk_load_565_dst_sse41+0x22>
PUBLIC _sk_gather_565_sse41
_sk_gather_565_sse41 LABEL PROC
@@ -20496,19 +20784,19 @@ _sk_gather_565_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,208 ; pmovzxwd %xmm0,%xmm2
- DB 102,15,111,5,235,104,1,0 ; movdqa 0x168eb(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,5,235,104,1,0 ; movdqa 0x168eb(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,237,104,1,0 ; mulps 0x168ed(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,13,245,104,1,0 ; movdqa 0x168f5(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 15,89,5,237,104,1,0 ; mulps 0x168ed(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,245,104,1,0 ; movdqa 0x168f5(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,247,104,1,0 ; mulps 0x168f7(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,15,219,21,255,104,1,0 ; pand 0x168ff(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 15,89,13,247,104,1,0 ; mulps 0x168f7(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,255,104,1,0 ; pand 0x168ff(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,5,105,1,0 ; mulps 0x16905(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,89,21,5,105,1,0 ; mulps 0x16905(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,156,102,1,0 ; movaps 0x1669c(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,156,102,1,0 ; movaps 0x1669c(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -20521,12 +20809,12 @@ _sk_store_565_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,155,106,1,0 ; movaps 0x16a9b(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263>
+ DB 68,15,40,5,155,106,1,0 ; movaps 0x16a9b(%rip),%xmm8 # 2ceb0 <_sk_overlay_sse2_8bit+0x1263>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,144,106,1,0 ; movaps 0x16a90(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273>
+ DB 68,15,40,21,144,106,1,0 ; movaps 0x16a90(%rip),%xmm10 # 2cec0 <_sk_overlay_sse2_8bit+0x1273>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -20536,7 +20824,7 @@ _sk_store_565_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 15f27 <_sk_store_565_sse41+0x70>
+ DB 117,10 ; jne 16467 <_sk_store_565_sse41+0x70>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20544,17 +20832,17 @@ _sk_store_565_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 15f5d <_sk_store_565_sse41+0xa6>
+ DB 116,35 ; je 1649d <_sk_store_565_sse41+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 15f4f <_sk_store_565_sse41+0x98>
+ DB 116,15 ; je 1648f <_sk_store_565_sse41+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 15f23 <_sk_store_565_sse41+0x6c>
+ DB 117,221 ; jne 16463 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 15f23 <_sk_store_565_sse41+0x6c>
+ DB 235,198 ; jmp 16463 <_sk_store_565_sse41+0x6c>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 15f23 <_sk_store_565_sse41+0x6c>
+ DB 235,188 ; jmp 16463 <_sk_store_565_sse41+0x6c>
PUBLIC _sk_load_4444_sse41
_sk_load_4444_sse41 LABEL PROC
@@ -20566,44 +20854,44 @@ _sk_load_4444_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 15fe1 <_sk_load_4444_sse41+0x7a>
+ DB 117,95 ; jne 16521 <_sk_load_4444_sse41+0x7a>
DB 102,67,15,56,51,28,89 ; pmovzxwd (%r9,%r11,2),%xmm3
- DB 102,15,111,5,255,105,1,0 ; movdqa 0x169ff(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
+ DB 102,15,111,5,255,105,1,0 ; movdqa 0x169ff(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,1,106,1,0 ; mulps 0x16a01(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
- DB 102,15,111,13,9,106,1,0 ; movdqa 0x16a09(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
+ DB 15,89,5,1,106,1,0 ; mulps 0x16a01(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,9,106,1,0 ; movdqa 0x16a09(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,11,106,1,0 ; mulps 0x16a0b(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
- DB 102,15,111,21,19,106,1,0 ; movdqa 0x16a13(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
+ DB 15,89,13,11,106,1,0 ; mulps 0x16a0b(%rip),%xmm1 # 2cf00 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,19,106,1,0 ; movdqa 0x16a13(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,21,106,1,0 ; mulps 0x16a15(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
- DB 102,15,219,29,29,106,1,0 ; pand 0x16a1d(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
+ DB 15,89,21,21,106,1,0 ; mulps 0x16a15(%rip),%xmm2 # 2cf20 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,29,106,1,0 ; pand 0x16a1d(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,35,106,1,0 ; mulps 0x16a23(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
+ DB 15,89,29,35,106,1,0 ; mulps 0x16a23(%rip),%xmm3 # 2cf40 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 16023 <_sk_load_4444_sse41+0xbc>
+ DB 116,53 ; je 16563 <_sk_load_4444_sse41+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1600d <_sk_load_4444_sse41+0xa6>
+ DB 116,21 ; je 1654d <_sk_load_4444_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 15f89 <_sk_load_4444_sse41+0x22>
+ DB 117,139 ; jne 164c9 <_sk_load_4444_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,56,51,192 ; pmovzxwd %xmm0,%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,102,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 164c9 <_sk_load_4444_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,88,255,255,255 ; jmpq 15f89 <_sk_load_4444_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 164c9 <_sk_load_4444_sse41+0x22>
PUBLIC _sk_load_4444_dst_sse41
_sk_load_4444_dst_sse41 LABEL PROC
@@ -20615,44 +20903,44 @@ _sk_load_4444_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,95 ; jne 160ab <_sk_load_4444_dst_sse41+0x7a>
+ DB 117,95 ; jne 165eb <_sk_load_4444_dst_sse41+0x7a>
DB 102,67,15,56,51,60,89 ; pmovzxwd (%r9,%r11,2),%xmm7
- DB 102,15,111,37,53,105,1,0 ; movdqa 0x16935(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
+ DB 102,15,111,37,53,105,1,0 ; movdqa 0x16935(%rip),%xmm4 # 2ced0 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,55,105,1,0 ; mulps 0x16937(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
- DB 102,15,111,45,63,105,1,0 ; movdqa 0x1693f(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
+ DB 15,89,37,55,105,1,0 ; mulps 0x16937(%rip),%xmm4 # 2cee0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,45,63,105,1,0 ; movdqa 0x1693f(%rip),%xmm5 # 2cef0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,65,105,1,0 ; mulps 0x16941(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
- DB 102,15,111,53,73,105,1,0 ; movdqa 0x16949(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
+ DB 15,89,45,65,105,1,0 ; mulps 0x16941(%rip),%xmm5 # 2cf00 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,53,73,105,1,0 ; movdqa 0x16949(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,75,105,1,0 ; mulps 0x1694b(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
- DB 102,15,219,61,83,105,1,0 ; pand 0x16953(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
+ DB 15,89,53,75,105,1,0 ; mulps 0x1694b(%rip),%xmm6 # 2cf20 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,61,83,105,1,0 ; pand 0x16953(%rip),%xmm7 # 2cf30 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,89,105,1,0 ; mulps 0x16959(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
+ DB 15,89,61,89,105,1,0 ; mulps 0x16959(%rip),%xmm7 # 2cf40 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,53 ; je 160ed <_sk_load_4444_dst_sse41+0xbc>
+ DB 116,53 ; je 1662d <_sk_load_4444_dst_sse41+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 160d7 <_sk_load_4444_dst_sse41+0xa6>
+ DB 116,21 ; je 16617 <_sk_load_4444_dst_sse41+0xa6>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 16053 <_sk_load_4444_dst_sse41+0x22>
+ DB 117,139 ; jne 16593 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,56,51,228 ; pmovzxwd %xmm4,%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,102,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22>
+ DB 233,102,255,255,255 ; jmpq 16593 <_sk_load_4444_dst_sse41+0x22>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,88,255,255,255 ; jmpq 16053 <_sk_load_4444_dst_sse41+0x22>
+ DB 233,88,255,255,255 ; jmpq 16593 <_sk_load_4444_dst_sse41+0x22>
PUBLIC _sk_gather_4444_sse41
_sk_gather_4444_sse41 LABEL PROC
@@ -20678,21 +20966,21 @@ _sk_gather_4444_sse41 LABEL PROC
DB 65,15,183,4,65 ; movzwl (%r9,%rax,2),%eax
DB 102,15,196,192,3 ; pinsrw $0x3,%eax,%xmm0
DB 102,15,56,51,216 ; pmovzxwd %xmm0,%xmm3
- DB 102,15,111,5,43,104,1,0 ; movdqa 0x1682b(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
+ DB 102,15,111,5,43,104,1,0 ; movdqa 0x1682b(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,45,104,1,0 ; mulps 0x1682d(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
- DB 102,15,111,13,53,104,1,0 ; movdqa 0x16835(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
+ DB 15,89,5,45,104,1,0 ; mulps 0x1682d(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,53,104,1,0 ; movdqa 0x16835(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,55,104,1,0 ; mulps 0x16837(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
- DB 102,15,111,21,63,104,1,0 ; movdqa 0x1683f(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
+ DB 15,89,13,55,104,1,0 ; mulps 0x16837(%rip),%xmm1 # 2cf00 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,63,104,1,0 ; movdqa 0x1683f(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,65,104,1,0 ; mulps 0x16841(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
- DB 102,15,219,29,73,104,1,0 ; pand 0x16849(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
+ DB 15,89,21,65,104,1,0 ; mulps 0x16841(%rip),%xmm2 # 2cf20 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,73,104,1,0 ; pand 0x16849(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,79,104,1,0 ; mulps 0x1684f(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
+ DB 15,89,29,79,104,1,0 ; mulps 0x1684f(%rip),%xmm3 # 2cf40 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -20706,7 +20994,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,60,104,1,0 ; movaps 0x1683c(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303>
+ DB 68,15,40,5,60,104,1,0 ; movaps 0x1683c(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x1303>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20726,7 +21014,7 @@ _sk_store_4444_sse41 LABEL PROC
DB 102,69,15,86,194 ; orpd %xmm10,%xmm8
DB 102,69,15,56,43,192 ; packusdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1623a <_sk_store_4444_sse41+0x84>
+ DB 117,10 ; jne 1677a <_sk_store_4444_sse41+0x84>
DB 242,69,15,17,4,65 ; movsd %xmm8,(%r9,%rax,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -20734,17 +21022,17 @@ _sk_store_4444_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,35 ; je 16270 <_sk_store_4444_sse41+0xba>
+ DB 116,35 ; je 167b0 <_sk_store_4444_sse41+0xba>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 16262 <_sk_store_4444_sse41+0xac>
+ DB 116,15 ; je 167a2 <_sk_store_4444_sse41+0xac>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,221 ; jne 16236 <_sk_store_4444_sse41+0x80>
+ DB 117,221 ; jne 16776 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,68,65,4,4 ; pextrw $0x4,%xmm8,0x4(%r9,%rax,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,69,15,126,4,65 ; movd %xmm8,(%r9,%rax,2)
- DB 235,198 ; jmp 16236 <_sk_store_4444_sse41+0x80>
+ DB 235,198 ; jmp 16776 <_sk_store_4444_sse41+0x80>
DB 102,69,15,58,21,4,65,0 ; pextrw $0x0,%xmm8,(%r9,%rax,2)
- DB 235,188 ; jmp 16236 <_sk_store_4444_sse41+0x80>
+ DB 235,188 ; jmp 16776 <_sk_store_4444_sse41+0x80>
PUBLIC _sk_load_8888_sse41
_sk_load_8888_sse41 LABEL PROC
@@ -20756,19 +21044,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 162ef <_sk_load_8888_sse41+0x75>
+ DB 117,89 ; jne 1682f <_sk_load_8888_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,92,99,1,0 ; movdqa 0x1635c(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,92,99,1,0 ; movdqa 0x1635c(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,157,100,1,0 ; movaps 0x1649d(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,157,100,1,0 ; movaps 0x1649d(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,76,99,1,0 ; pshufb 0x1634c(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,13,76,99,1,0 ; pshufb 0x1634c(%rip),%xmm1 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,72,99,1,0 ; pshufb 0x16348(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,21,72,99,1,0 ; pshufb 0x16348(%rip),%xmm2 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20779,19 +21067,19 @@ _sk_load_8888_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 16329 <_sk_load_8888_sse41+0xaf>
+ DB 116,45 ; je 16869 <_sk_load_8888_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 16318 <_sk_load_8888_sse41+0x9e>
+ DB 116,18 ; je 16858 <_sk_load_8888_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 1629c <_sk_load_8888_sse41+0x22>
+ DB 117,144 ; jne 167dc <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 167dc <_sk_load_8888_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 1629c <_sk_load_8888_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 167dc <_sk_load_8888_sse41+0x22>
PUBLIC _sk_load_8888_dst_sse41
_sk_load_8888_dst_sse41 LABEL PROC
@@ -20803,19 +21091,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 163a9 <_sk_load_8888_dst_sse41+0x75>
+ DB 117,89 ; jne 168e9 <_sk_load_8888_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,162,98,1,0 ; movdqa 0x162a2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,37,162,98,1,0 ; movdqa 0x162a2(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,227,99,1,0 ; movaps 0x163e3(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,227,99,1,0 ; movaps 0x163e3(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,111,239 ; movdqa %xmm7,%xmm5
- DB 102,15,56,0,45,146,98,1,0 ; pshufb 0x16292(%rip),%xmm5 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,45,146,98,1,0 ; pshufb 0x16292(%rip),%xmm5 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,142,98,1,0 ; pshufb 0x1628e(%rip),%xmm6 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,53,142,98,1,0 ; pshufb 0x1628e(%rip),%xmm6 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -20826,19 +21114,19 @@ _sk_load_8888_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 163e3 <_sk_load_8888_dst_sse41+0xaf>
+ DB 116,45 ; je 16923 <_sk_load_8888_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 163d2 <_sk_load_8888_dst_sse41+0x9e>
+ DB 116,18 ; je 16912 <_sk_load_8888_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 16356 <_sk_load_8888_dst_sse41+0x22>
+ DB 117,144 ; jne 16896 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16896 <_sk_load_8888_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 16356 <_sk_load_8888_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16896 <_sk_load_8888_dst_sse41+0x22>
PUBLIC _sk_gather_8888_sse41
_sk_gather_8888_sse41 LABEL PROC
@@ -20861,17 +21149,17 @@ _sk_gather_8888_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,177,97,1,0 ; movdqa 0x161b1(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,177,97,1,0 ; movdqa 0x161b1(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,242,98,1,0 ; movaps 0x162f2(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,242,98,1,0 ; movaps 0x162f2(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
- DB 102,15,56,0,13,161,97,1,0 ; pshufb 0x161a1(%rip),%xmm1 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,13,161,97,1,0 ; pshufb 0x161a1(%rip),%xmm1 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,56,0,21,157,97,1,0 ; pshufb 0x1619d(%rip),%xmm2 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,21,157,97,1,0 ; pshufb 0x1619d(%rip),%xmm2 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20890,7 +21178,7 @@ _sk_store_8888_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,118,97,1,0 ; movaps 0x16176(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,118,97,1,0 ; movaps 0x16176(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -20909,23 +21197,23 @@ _sk_store_8888_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1651a <_sk_store_8888_sse41+0x7f>
+ DB 117,10 ; jne 16a5a <_sk_store_8888_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 16544 <_sk_store_8888_sse41+0xa9>
+ DB 116,29 ; je 16a84 <_sk_store_8888_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 1653c <_sk_store_8888_sse41+0xa1>
+ DB 116,15 ; je 16a7c <_sk_store_8888_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 16516 <_sk_store_8888_sse41+0x7b>
+ DB 117,227 ; jne 16a56 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 16516 <_sk_store_8888_sse41+0x7b>
+ DB 235,210 ; jmp 16a56 <_sk_store_8888_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 16516 <_sk_store_8888_sse41+0x7b>
+ DB 235,202 ; jmp 16a56 <_sk_store_8888_sse41+0x7b>
PUBLIC _sk_load_bgra_sse41
_sk_load_bgra_sse41 LABEL PROC
@@ -20937,19 +21225,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 165c1 <_sk_load_bgra_sse41+0x75>
+ DB 117,89 ; jne 16b01 <_sk_load_bgra_sse41+0x75>
DB 243,65,15,111,28,129 ; movdqu (%r9,%rax,4),%xmm3
- DB 102,15,111,5,138,96,1,0 ; movdqa 0x1608a(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,138,96,1,0 ; movdqa 0x1608a(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,203,97,1,0 ; movaps 0x161cb(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,203,97,1,0 ; movaps 0x161cb(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,122,96,1,0 ; pshufb 0x1607a(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,5,122,96,1,0 ; pshufb 0x1607a(%rip),%xmm0 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,118,96,1,0 ; pshufb 0x16076(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,5,118,96,1,0 ; pshufb 0x16076(%rip),%xmm0 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -20960,19 +21248,19 @@ _sk_load_bgra_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 165fb <_sk_load_bgra_sse41+0xaf>
+ DB 116,45 ; je 16b3b <_sk_load_bgra_sse41+0xaf>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 165ea <_sk_load_bgra_sse41+0x9e>
+ DB 116,18 ; je 16b2a <_sk_load_bgra_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 1656e <_sk_load_bgra_sse41+0x22>
+ DB 117,144 ; jne 16aae <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 243,65,15,126,4,129 ; movq (%r9,%rax,4),%xmm0
DB 102,15,58,14,216,15 ; pblendw $0xf,%xmm0,%xmm3
- DB 233,115,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16aae <_sk_load_bgra_sse41+0x22>
DB 102,65,15,110,28,129 ; movd (%r9,%rax,4),%xmm3
- DB 233,104,255,255,255 ; jmpq 1656e <_sk_load_bgra_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16aae <_sk_load_bgra_sse41+0x22>
PUBLIC _sk_load_bgra_dst_sse41
_sk_load_bgra_dst_sse41 LABEL PROC
@@ -20984,19 +21272,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,89 ; jne 1667b <_sk_load_bgra_dst_sse41+0x75>
+ DB 117,89 ; jne 16bbb <_sk_load_bgra_dst_sse41+0x75>
DB 243,65,15,111,60,129 ; movdqu (%r9,%rax,4),%xmm7
- DB 102,15,111,37,208,95,1,0 ; movdqa 0x15fd0(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,37,208,95,1,0 ; movdqa 0x15fd0(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,244 ; cvtdq2ps %xmm4,%xmm6
- DB 68,15,40,5,17,97,1,0 ; movaps 0x16111(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,17,97,1,0 ; movaps 0x16111(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,192,95,1,0 ; pshufb 0x15fc0(%rip),%xmm4 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,37,192,95,1,0 ; pshufb 0x15fc0(%rip),%xmm4 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,236 ; cvtdq2ps %xmm4,%xmm5
DB 65,15,89,232 ; mulps %xmm8,%xmm5
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
- DB 102,15,56,0,37,188,95,1,0 ; pshufb 0x15fbc(%rip),%xmm4 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,37,188,95,1,0 ; pshufb 0x15fbc(%rip),%xmm4 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,15,114,215,24 ; psrld $0x18,%xmm7
@@ -21007,19 +21295,19 @@ _sk_load_bgra_dst_sse41 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 166b5 <_sk_load_bgra_dst_sse41+0xaf>
+ DB 116,45 ; je 16bf5 <_sk_load_bgra_dst_sse41+0xaf>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 166a4 <_sk_load_bgra_dst_sse41+0x9e>
+ DB 116,18 ; je 16be4 <_sk_load_bgra_dst_sse41+0x9e>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,144 ; jne 16628 <_sk_load_bgra_dst_sse41+0x22>
+ DB 117,144 ; jne 16b68 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 243,65,15,126,36,129 ; movq (%r9,%rax,4),%xmm4
DB 102,15,58,14,252,15 ; pblendw $0xf,%xmm4,%xmm7
- DB 233,115,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,115,255,255,255 ; jmpq 16b68 <_sk_load_bgra_dst_sse41+0x22>
DB 102,65,15,110,60,129 ; movd (%r9,%rax,4),%xmm7
- DB 233,104,255,255,255 ; jmpq 16628 <_sk_load_bgra_dst_sse41+0x22>
+ DB 233,104,255,255,255 ; jmpq 16b68 <_sk_load_bgra_dst_sse41+0x22>
PUBLIC _sk_gather_bgra_sse41
_sk_gather_bgra_sse41 LABEL PROC
@@ -21042,17 +21330,17 @@ _sk_gather_bgra_sse41 LABEL PROC
DB 102,65,15,58,34,28,129,1 ; pinsrd $0x1,(%r9,%rax,4),%xmm3
DB 102,65,15,58,34,28,153,2 ; pinsrd $0x2,(%r9,%rbx,4),%xmm3
DB 102,67,15,58,34,28,153,3 ; pinsrd $0x3,(%r9,%r11,4),%xmm3
- DB 102,15,111,5,223,94,1,0 ; movdqa 0x15edf(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,223,94,1,0 ; movdqa 0x15edf(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,208 ; cvtdq2ps %xmm0,%xmm2
- DB 68,15,40,5,32,96,1,0 ; movaps 0x16020(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,32,96,1,0 ; movaps 0x16020(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,207,94,1,0 ; pshufb 0x15ecf(%rip),%xmm0 # 2c610 <_sk_overlay_sse2_8bit+0xf03>
+ DB 102,15,56,0,5,207,94,1,0 ; pshufb 0x15ecf(%rip),%xmm0 # 2cb50 <_sk_overlay_sse2_8bit+0xf03>
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
- DB 102,15,56,0,5,203,94,1,0 ; pshufb 0x15ecb(%rip),%xmm0 # 2c620 <_sk_overlay_sse2_8bit+0xf13>
+ DB 102,15,56,0,5,203,94,1,0 ; pshufb 0x15ecb(%rip),%xmm0 # 2cb60 <_sk_overlay_sse2_8bit+0xf13>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,114,211,24 ; psrld $0x18,%xmm3
@@ -21071,7 +21359,7 @@ _sk_store_bgra_sse41 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,164,94,1,0 ; movaps 0x15ea4(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,164,94,1,0 ; movaps 0x15ea4(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -21090,23 +21378,23 @@ _sk_store_bgra_sse41 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 167ec <_sk_store_bgra_sse41+0x7f>
+ DB 117,10 ; jne 16d2c <_sk_store_bgra_sse41+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,29 ; je 16816 <_sk_store_bgra_sse41+0xa9>
+ DB 116,29 ; je 16d56 <_sk_store_bgra_sse41+0xa9>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,15 ; je 1680e <_sk_store_bgra_sse41+0xa1>
+ DB 116,15 ; je 16d4e <_sk_store_bgra_sse41+0xa1>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 167e8 <_sk_store_bgra_sse41+0x7b>
+ DB 117,227 ; jne 16d28 <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,58,22,68,129,8,2 ; pextrd $0x2,%xmm8,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,210 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b>
+ DB 235,210 ; jmp 16d28 <_sk_store_bgra_sse41+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,202 ; jmp 167e8 <_sk_store_bgra_sse41+0x7b>
+ DB 235,202 ; jmp 16d28 <_sk_store_bgra_sse41+0x7b>
PUBLIC _sk_load_f16_sse41
_sk_load_f16_sse41 LABEL PROC
@@ -21118,7 +21406,7 @@ _sk_load_f16_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 1697c <_sk_load_f16_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 16ebc <_sk_load_f16_sse41+0x15e>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 243,65,15,111,76,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,200 ; movapd %xmm0,%xmm9
@@ -21128,18 +21416,18 @@ _sk_load_f16_sse41 LABEL PROC
DB 102,68,15,97,216 ; punpcklwd %xmm0,%xmm11
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,169,97,1,0 ; movdqa 0x161a9(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
+ DB 102,68,15,111,5,169,97,1,0 ; movdqa 0x161a9(%rip),%xmm8 # 2cf60 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,164,97,1,0 ; movdqa 0x161a4(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
+ DB 102,15,111,29,164,97,1,0 ; movdqa 0x161a4(%rip),%xmm3 # 2cf70 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,144,97,1,0 ; movdqa 0x16190(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
+ DB 102,68,15,111,21,144,97,1,0 ; movdqa 0x16190(%rip),%xmm10 # 2cf80 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21182,16 +21470,16 @@ _sk_load_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16995 <_sk_load_f16_sse41+0x177>
+ DB 117,13 ; jne 16ed5 <_sk_load_f16_sse41+0x177>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,182,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 16d8b <_sk_load_f16_sse41+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 1684b <_sk_load_f16_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 16d8b <_sk_load_f16_sse41+0x2d>
DB 243,65,15,126,76,193,16 ; movq 0x10(%r9,%rax,8),%xmm1
- DB 233,149,254,255,255 ; jmpq 1684b <_sk_load_f16_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 16d8b <_sk_load_f16_sse41+0x2d>
PUBLIC _sk_load_f16_dst_sse41
_sk_load_f16_dst_sse41 LABEL PROC
@@ -21203,7 +21491,7 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,62,1,0,0 ; jne 16b14 <_sk_load_f16_dst_sse41+0x15e>
+ DB 15,133,62,1,0,0 ; jne 17054 <_sk_load_f16_dst_sse41+0x15e>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 243,65,15,111,108,193,16 ; movdqu 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,204 ; movapd %xmm4,%xmm9
@@ -21213,18 +21501,18 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 102,68,15,97,220 ; punpcklwd %xmm4,%xmm11
DB 102,68,15,105,204 ; punpckhwd %xmm4,%xmm9
DB 102,65,15,56,51,235 ; pmovzxwd %xmm11,%xmm5
- DB 102,68,15,111,5,17,96,1,0 ; movdqa 0x16011(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
+ DB 102,68,15,111,5,17,96,1,0 ; movdqa 0x16011(%rip),%xmm8 # 2cf60 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,245 ; movdqa %xmm5,%xmm6
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,239,238 ; pxor %xmm6,%xmm5
- DB 102,15,111,61,12,96,1,0 ; movdqa 0x1600c(%rip),%xmm7 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
+ DB 102,15,111,61,12,96,1,0 ; movdqa 0x1600c(%rip),%xmm7 # 2cf70 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,246,16 ; pslld $0x10,%xmm6
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,15,56,63,231 ; pmaxud %xmm7,%xmm4
DB 102,15,118,229 ; pcmpeqd %xmm5,%xmm4
DB 102,15,114,245,13 ; pslld $0xd,%xmm5
DB 102,15,235,238 ; por %xmm6,%xmm5
- DB 102,68,15,111,21,248,95,1,0 ; movdqa 0x15ff8(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
+ DB 102,68,15,111,21,248,95,1,0 ; movdqa 0x15ff8(%rip),%xmm10 # 2cf80 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,234 ; paddd %xmm10,%xmm5
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21267,16 +21555,16 @@ _sk_load_f16_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16b2d <_sk_load_f16_dst_sse41+0x177>
+ DB 117,13 ; jne 1706d <_sk_load_f16_dst_sse41+0x177>
DB 243,15,126,228 ; movq %xmm4,%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
- DB 233,182,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,182,254,255,255 ; jmpq 16f23 <_sk_load_f16_dst_sse41+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,161,254,255,255 ; jb 169e3 <_sk_load_f16_dst_sse41+0x2d>
+ DB 15,130,161,254,255,255 ; jb 16f23 <_sk_load_f16_dst_sse41+0x2d>
DB 243,65,15,126,108,193,16 ; movq 0x10(%r9,%rax,8),%xmm5
- DB 233,149,254,255,255 ; jmpq 169e3 <_sk_load_f16_dst_sse41+0x2d>
+ DB 233,149,254,255,255 ; jmpq 16f23 <_sk_load_f16_dst_sse41+0x2d>
PUBLIC _sk_gather_f16_sse41
_sk_gather_f16_sse41 LABEL PROC
@@ -21308,18 +21596,18 @@ _sk_gather_f16_sse41 LABEL PROC
DB 102,68,15,97,218 ; punpcklwd %xmm2,%xmm11
DB 102,68,15,105,202 ; punpckhwd %xmm2,%xmm9
DB 102,65,15,56,51,203 ; pmovzxwd %xmm11,%xmm1
- DB 102,68,15,111,5,75,94,1,0 ; movdqa 0x15e4b(%rip),%xmm8 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
+ DB 102,68,15,111,5,75,94,1,0 ; movdqa 0x15e4b(%rip),%xmm8 # 2cf60 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,65,15,219,208 ; pand %xmm8,%xmm2
DB 102,15,239,202 ; pxor %xmm2,%xmm1
- DB 102,15,111,29,70,94,1,0 ; movdqa 0x15e46(%rip),%xmm3 # 2ca30 <_sk_overlay_sse2_8bit+0x1323>
+ DB 102,15,111,29,70,94,1,0 ; movdqa 0x15e46(%rip),%xmm3 # 2cf70 <_sk_overlay_sse2_8bit+0x1323>
DB 102,15,114,242,16 ; pslld $0x10,%xmm2
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,15,56,63,195 ; pmaxud %xmm3,%xmm0
DB 102,15,118,193 ; pcmpeqd %xmm1,%xmm0
DB 102,15,114,241,13 ; pslld $0xd,%xmm1
DB 102,15,235,202 ; por %xmm2,%xmm1
- DB 102,68,15,111,21,50,94,1,0 ; movdqa 0x15e32(%rip),%xmm10 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
+ DB 102,68,15,111,21,50,94,1,0 ; movdqa 0x15e32(%rip),%xmm10 # 2cf80 <_sk_overlay_sse2_8bit+0x1333>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,219,193 ; pand %xmm1,%xmm0
DB 102,65,15,115,219,8 ; psrldq $0x8,%xmm11
@@ -21371,17 +21659,17 @@ _sk_store_f16_sse41 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,85,93,1,0 ; movdqa 0x15d55(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 102,68,15,111,21,85,93,1,0 ; movdqa 0x15d55(%rip),%xmm10 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 102,68,15,111,216 ; movdqa %xmm0,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,235 ; pxor %xmm11,%xmm13
- DB 102,68,15,111,13,72,93,1,0 ; movdqa 0x15d48(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353>
+ DB 102,68,15,111,13,72,93,1,0 ; movdqa 0x15d48(%rip),%xmm9 # 2cfa0 <_sk_overlay_sse2_8bit+0x1353>
DB 102,65,15,114,211,16 ; psrld $0x10,%xmm11
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,37,57,93,1,0 ; movdqa 0x15d39(%rip),%xmm12 # 2ca70 <_sk_overlay_sse2_8bit+0x1363>
+ DB 102,68,15,111,37,57,93,1,0 ; movdqa 0x15d39(%rip),%xmm12 # 2cfb0 <_sk_overlay_sse2_8bit+0x1363>
DB 102,69,15,235,220 ; por %xmm12,%xmm11
DB 102,69,15,254,221 ; paddd %xmm13,%xmm11
DB 102,69,15,223,195 ; pandn %xmm11,%xmm8
@@ -21425,7 +21713,7 @@ _sk_store_f16_sse41 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,203 ; punpckldq %xmm11,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 16e2d <_sk_store_f16_sse41+0x152>
+ DB 117,21 ; jne 1736d <_sk_store_f16_sse41+0x152>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -21433,13 +21721,13 @@ _sk_store_f16_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 16e29 <_sk_store_f16_sse41+0x14e>
+ DB 116,240 ; je 17369 <_sk_store_f16_sse41+0x14e>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 16e29 <_sk_store_f16_sse41+0x14e>
+ DB 114,227 ; jb 17369 <_sk_store_f16_sse41+0x14e>
DB 102,69,15,106,195 ; punpckhdq %xmm11,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 16e29 <_sk_store_f16_sse41+0x14e>
+ DB 235,213 ; jmp 17369 <_sk_store_f16_sse41+0x14e>
PUBLIC _sk_load_u16_be_sse41
_sk_load_u16_be_sse41 LABEL PROC
@@ -21452,7 +21740,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,185,0,0,0 ; jne 16f34 <_sk_load_u16_be_sse41+0xe0>
+ DB 15,133,185,0,0,0 ; jne 17474 <_sk_load_u16_be_sse41+0xe0>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 243,65,15,111,76,65,16 ; movdqu 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -21468,7 +21756,7 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,25,89,1,0 ; movaps 0x15919(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
+ DB 68,15,40,5,25,89,1,0 ; movaps 0x15919(%rip),%xmm8 # 2cd20 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21496,16 +21784,16 @@ _sk_load_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 16f4d <_sk_load_u16_be_sse41+0xf9>
+ DB 117,13 ; jne 1748d <_sk_load_u16_be_sse41+0xf9>
DB 243,15,126,192 ; movq %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,59,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34>
+ DB 233,59,255,255,255 ; jmpq 173c8 <_sk_load_u16_be_sse41+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,38,255,255,255 ; jb 16e88 <_sk_load_u16_be_sse41+0x34>
+ DB 15,130,38,255,255,255 ; jb 173c8 <_sk_load_u16_be_sse41+0x34>
DB 243,65,15,126,76,65,16 ; movq 0x10(%r9,%rax,2),%xmm1
- DB 233,26,255,255,255 ; jmpq 16e88 <_sk_load_u16_be_sse41+0x34>
+ DB 233,26,255,255,255 ; jmpq 173c8 <_sk_load_u16_be_sse41+0x34>
PUBLIC _sk_load_rgb_u16_be_sse41
_sk_load_rgb_u16_be_sse41 LABEL PROC
@@ -21520,7 +21808,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,170,0,0,0 ; jne 17043 <_sk_load_rgb_u16_be_sse41+0xd5>
+ DB 15,133,170,0,0,0 ; jne 17583 <_sk_load_rgb_u16_be_sse41+0xd5>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -21540,7 +21828,7 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 102,15,235,200 ; por %xmm0,%xmm1
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,232,87,1,0 ; movaps 0x157e8(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
+ DB 68,15,40,5,232,87,1,0 ; movaps 0x157e8(%rip),%xmm8 # 2cd20 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -21557,27 +21845,27 @@ _sk_load_rgb_u16_be_sse41 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,15,85,1,0 ; movaps 0x1550f(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,15,85,1,0 ; movaps 0x1550f(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 17068 <_sk_load_rgb_u16_be_sse41+0xfa>
+ DB 117,13 ; jne 175a8 <_sk_load_rgb_u16_be_sse41+0xfa>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,85,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,85,255,255,255 ; jmpq 174fd <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 17099 <_sk_load_rgb_u16_be_sse41+0x12b>
+ DB 114,24 ; jb 175d9 <_sk_load_rgb_u16_be_sse41+0x12b>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,36,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,36,255,255,255 ; jmpq 174fd <_sk_load_rgb_u16_be_sse41+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,27,255,255,255 ; jmpq 16fbd <_sk_load_rgb_u16_be_sse41+0x4f>
+ DB 233,27,255,255,255 ; jmpq 174fd <_sk_load_rgb_u16_be_sse41+0x4f>
PUBLIC _sk_store_u16_be_sse41
_sk_store_u16_be_sse41 LABEL PROC
@@ -21589,7 +21877,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,184,89,1,0 ; movaps 0x159b8(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373>
+ DB 68,15,40,21,184,89,1,0 ; movaps 0x159b8(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x1373>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -21626,7 +21914,7 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 17196 <_sk_store_u16_be_sse41+0xf4>
+ DB 117,21 ; jne 176d6 <_sk_store_u16_be_sse41+0xf4>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -21634,13 +21922,13 @@ _sk_store_u16_be_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 17192 <_sk_store_u16_be_sse41+0xf0>
+ DB 116,240 ; je 176d2 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 17192 <_sk_store_u16_be_sse41+0xf0>
+ DB 114,227 ; jb 176d2 <_sk_store_u16_be_sse41+0xf0>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 17192 <_sk_store_u16_be_sse41+0xf0>
+ DB 235,213 ; jmp 176d2 <_sk_store_u16_be_sse41+0xf0>
PUBLIC _sk_load_f32_sse41
_sk_load_f32_sse41 LABEL PROC
@@ -21654,7 +21942,7 @@ _sk_load_f32_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 17228 <_sk_load_f32_sse41+0x6b>
+ DB 117,66 ; jne 17768 <_sk_load_f32_sse41+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -21674,17 +21962,17 @@ _sk_load_f32_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1723a <_sk_load_f32_sse41+0x7d>
+ DB 117,8 ; jne 1777a <_sk_load_f32_sse41+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
+ DB 235,190 ; jmp 17738 <_sk_load_f32_sse41+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1724e <_sk_load_f32_sse41+0x91>
+ DB 114,8 ; jb 1778e <_sk_load_f32_sse41+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
+ DB 235,170 ; jmp 17738 <_sk_load_f32_sse41+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 171f8 <_sk_load_f32_sse41+0x3b>
+ DB 235,165 ; jmp 17738 <_sk_load_f32_sse41+0x3b>
PUBLIC _sk_load_f32_dst_sse41
_sk_load_f32_dst_sse41 LABEL PROC
@@ -21698,7 +21986,7 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 172be <_sk_load_f32_dst_sse41+0x6b>
+ DB 117,66 ; jne 177fe <_sk_load_f32_dst_sse41+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -21718,17 +22006,17 @@ _sk_load_f32_dst_sse41 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 172d0 <_sk_load_f32_dst_sse41+0x7d>
+ DB 117,8 ; jne 17810 <_sk_load_f32_dst_sse41+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,190 ; jmp 177ce <_sk_load_f32_dst_sse41+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 172e4 <_sk_load_f32_dst_sse41+0x91>
+ DB 114,8 ; jb 17824 <_sk_load_f32_dst_sse41+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,170 ; jmp 177ce <_sk_load_f32_dst_sse41+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 1728e <_sk_load_f32_dst_sse41+0x3b>
+ DB 235,165 ; jmp 177ce <_sk_load_f32_dst_sse41+0x3b>
PUBLIC _sk_store_f32_sse41
_sk_store_f32_sse41 LABEL PROC
@@ -21755,7 +22043,7 @@ _sk_store_f32_sse41 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 17366 <_sk_store_f32_sse41+0x7d>
+ DB 117,29 ; jne 178a6 <_sk_store_f32_sse41+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -21763,12 +22051,12 @@ _sk_store_f32_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 17362 <_sk_store_f32_sse41+0x79>
+ DB 116,246 ; je 178a2 <_sk_store_f32_sse41+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 17362 <_sk_store_f32_sse41+0x79>
+ DB 114,234 ; jb 178a2 <_sk_store_f32_sse41+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 17362 <_sk_store_f32_sse41+0x79>
+ DB 235,225 ; jmp 178a2 <_sk_store_f32_sse41+0x79>
PUBLIC _sk_clamp_x_sse41
_sk_clamp_x_sse41 LABEL PROC
@@ -21848,7 +22136,7 @@ _sk_mirror_x_sse41 LABEL PROC
DB 65,15,92,194 ; subps %xmm10,%xmm0
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,234,70,1,0 ; mulss 0x146ea(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,13,234,70,1,0 ; mulss 0x146ea(%rip),%xmm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -21877,7 +22165,7 @@ _sk_mirror_y_sse41 LABEL PROC
DB 65,15,92,202 ; subps %xmm10,%xmm1
DB 243,69,15,88,192 ; addss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
- DB 243,68,15,89,13,120,70,1,0 ; mulss 0x14678(%rip),%xmm9 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,13,120,70,1,0 ; mulss 0x14678(%rip),%xmm9 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,89,201 ; mulps %xmm1,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
@@ -21900,7 +22188,7 @@ PUBLIC _sk_clamp_x_1_sse41
_sk_clamp_x_1_sse41 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,251,79,1,0 ; minps 0x14ffb(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,93,5,251,79,1,0 ; minps 0x14ffb(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -21914,9 +22202,9 @@ _sk_repeat_x_1_sse41 LABEL PROC
PUBLIC _sk_mirror_x_1_sse41
_sk_mirror_x_1_sse41 LABEL PROC
- DB 68,15,40,5,60,80,1,0 ; movaps 0x1503c(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
+ DB 68,15,40,5,60,80,1,0 ; movaps 0x1503c(%rip),%xmm8 # 2caf0 <_sk_overlay_sse2_8bit+0xea3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,192,79,1,0 ; movaps 0x14fc0(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,13,192,79,1,0 ; movaps 0x14fc0(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 102,69,15,58,8,201,1 ; roundps $0x1,%xmm9,%xmm9
DB 69,15,88,201 ; addps %xmm9,%xmm9
@@ -21931,10 +22219,10 @@ _sk_mirror_x_1_sse41 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse41
_sk_luminance_to_alpha_sse41 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,223,84,1,0 ; mulps 0x154df(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383>
- DB 15,89,13,232,84,1,0 ; mulps 0x154e8(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393>
+ DB 15,89,5,223,84,1,0 ; mulps 0x154df(%rip),%xmm0 # 2cfd0 <_sk_overlay_sse2_8bit+0x1383>
+ DB 15,89,13,232,84,1,0 ; mulps 0x154e8(%rip),%xmm1 # 2cfe0 <_sk_overlay_sse2_8bit+0x1393>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,238,84,1,0 ; mulps 0x154ee(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3>
+ DB 15,89,29,238,84,1,0 ; mulps 0x154ee(%rip),%xmm3 # 2cff0 <_sk_overlay_sse2_8bit+0x13a3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -22231,9 +22519,9 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 17a64 <_sk_evenly_spaced_gradient_sse41+0x1a>
+ DB 120,7 ; js 17fa4 <_sk_evenly_spaced_gradient_sse41+0x1a>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 17a79 <_sk_evenly_spaced_gradient_sse41+0x2f>
+ DB 235,21 ; jmp 17fb9 <_sk_evenly_spaced_gradient_sse41+0x2f>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -22321,15 +22609,15 @@ _sk_evenly_spaced_gradient_sse41 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse41
_sk_gauss_a_to_rgba_sse41 LABEL PROC
- DB 15,40,5,153,78,1,0 ; movaps 0x14e99(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3>
+ DB 15,40,5,153,78,1,0 ; movaps 0x14e99(%rip),%xmm0 # 2d000 <_sk_overlay_sse2_8bit+0x13b3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,159,78,1,0 ; addps 0x14e9f(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3>
+ DB 15,88,5,159,78,1,0 ; addps 0x14e9f(%rip),%xmm0 # 2d010 <_sk_overlay_sse2_8bit+0x13c3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,165,78,1,0 ; addps 0x14ea5(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3>
+ DB 15,88,5,165,78,1,0 ; addps 0x14ea5(%rip),%xmm0 # 2d020 <_sk_overlay_sse2_8bit+0x13d3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,171,78,1,0 ; addps 0x14eab(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3>
+ DB 15,88,5,171,78,1,0 ; addps 0x14eab(%rip),%xmm0 # 2d030 <_sk_overlay_sse2_8bit+0x13e3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,177,78,1,0 ; addps 0x14eb1(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3>
+ DB 15,88,5,177,78,1,0 ; addps 0x14eb1(%rip),%xmm0 # 2d040 <_sk_overlay_sse2_8bit+0x13f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -22345,12 +22633,12 @@ _sk_gradient_sse41 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 17ca2 <_sk_gradient_sse41+0x46>
+ DB 114,50 ; jb 181e2 <_sk_gradient_sse41+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,218,72,1,0 ; movaps 0x148da(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 15,40,21,218,72,1,0 ; movaps 0x148da(%rip),%xmm2 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -22358,7 +22646,7 @@ _sk_gradient_sse41 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 17c86 <_sk_gradient_sse41+0x2a>
+ DB 117,228 ; jne 181c6 <_sk_gradient_sse41+0x2a>
DB 102,73,15,58,22,201,1 ; pextrq $0x1,%xmm1,%r9
DB 69,137,202 ; mov %r9d,%r10d
DB 73,193,233,32 ; shr $0x20,%r9
@@ -22484,26 +22772,26 @@ _sk_xy_to_unit_angle_sse41 LABEL PROC
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,40,236 ; movaps %xmm12,%xmm13
DB 69,15,89,237 ; mulps %xmm13,%xmm13
- DB 68,15,40,21,27,76,1,0 ; movaps 0x14c1b(%rip),%xmm10 # 2cb10 <_sk_overlay_sse2_8bit+0x1403>
+ DB 68,15,40,21,27,76,1,0 ; movaps 0x14c1b(%rip),%xmm10 # 2d050 <_sk_overlay_sse2_8bit+0x1403>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,31,76,1,0 ; addps 0x14c1f(%rip),%xmm10 # 2cb20 <_sk_overlay_sse2_8bit+0x1413>
+ DB 68,15,88,21,31,76,1,0 ; addps 0x14c1f(%rip),%xmm10 # 2d060 <_sk_overlay_sse2_8bit+0x1413>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,35,76,1,0 ; addps 0x14c23(%rip),%xmm10 # 2cb30 <_sk_overlay_sse2_8bit+0x1423>
+ DB 68,15,88,21,35,76,1,0 ; addps 0x14c23(%rip),%xmm10 # 2d070 <_sk_overlay_sse2_8bit+0x1423>
DB 69,15,89,213 ; mulps %xmm13,%xmm10
- DB 68,15,88,21,39,76,1,0 ; addps 0x14c27(%rip),%xmm10 # 2cb40 <_sk_overlay_sse2_8bit+0x1433>
+ DB 68,15,88,21,39,76,1,0 ; addps 0x14c27(%rip),%xmm10 # 2d080 <_sk_overlay_sse2_8bit+0x1433>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,194,195,1 ; cmpltps %xmm11,%xmm0
- DB 68,15,40,29,38,76,1,0 ; movaps 0x14c26(%rip),%xmm11 # 2cb50 <_sk_overlay_sse2_8bit+0x1443>
+ DB 68,15,40,29,38,76,1,0 ; movaps 0x14c26(%rip),%xmm11 # 2d090 <_sk_overlay_sse2_8bit+0x1443>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,40,29,255,69,1,0 ; movaps 0x145ff(%rip),%xmm11 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,29,255,69,1,0 ; movaps 0x145ff(%rip),%xmm11 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 102,69,15,56,20,211 ; blendvps %xmm0,%xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
DB 65,15,194,192,1 ; cmpltps %xmm8,%xmm0
- DB 68,15,40,13,241,69,1,0 ; movaps 0x145f1(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,241,69,1,0 ; movaps 0x145f1(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 102,69,15,56,20,209 ; blendvps %xmm0,%xmm9,%xmm10
DB 69,15,194,194,7 ; cmpordps %xmm10,%xmm8
@@ -22533,7 +22821,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,154,75,1,0 ; mulps 0x14b9a(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
+ DB 68,15,89,13,154,75,1,0 ; mulps 0x14b9a(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22541,7 +22829,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,133,75,1,0 ; mulps 0x14b85(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
+ DB 68,15,89,21,133,75,1,0 ; mulps 0x14b85(%rip),%xmm10 # 2d0b0 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22550,8 +22838,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,61,74,1,0 ; xorps 0x14a3d(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
- DB 68,15,89,5,37,69,1,0 ; mulps 0x14525(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,87,13,61,74,1,0 ; xorps 0x14a3d(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,37,69,1,0 ; mulps 0x14525(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22570,7 +22858,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,252,74,1,0 ; mulps 0x14afc(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
+ DB 68,15,89,13,252,74,1,0 ; mulps 0x14afc(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -22578,7 +22866,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,231,74,1,0 ; mulps 0x14ae7(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
+ DB 68,15,89,21,231,74,1,0 ; mulps 0x14ae7(%rip),%xmm10 # 2d0b0 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -22587,8 +22875,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse41 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,159,73,1,0 ; xorps 0x1499f(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
- DB 68,15,89,5,135,68,1,0 ; mulps 0x14487(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,87,13,159,73,1,0 ; xorps 0x1499f(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,135,68,1,0 ; mulps 0x14487(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -22604,7 +22892,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,111,74,1,0 ; mulps 0x14a6f(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
+ DB 68,15,89,13,111,74,1,0 ; mulps 0x14a6f(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -22612,7 +22900,7 @@ _sk_xy_to_2pt_conical_linear_sse41 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,59,73,1,0 ; xorps 0x1493b(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 15,87,5,59,73,1,0 ; xorps 0x1493b(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22649,7 +22937,7 @@ _sk_apply_vector_mask_sse41 LABEL PROC
PUBLIC _sk_save_xy_sse41
_sk_save_xy_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,193,67,1,0 ; movaps 0x143c1(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,5,193,67,1,0 ; movaps 0x143c1(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -22689,8 +22977,8 @@ _sk_bilinear_nx_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,115,73,1,0 ; addps 0x14973(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,59,67,1,0 ; movaps 0x1433b(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,5,115,73,1,0 ; addps 0x14973(%rip),%xmm0 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,59,67,1,0 ; movaps 0x1433b(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22701,7 +22989,7 @@ _sk_bilinear_px_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,10,67,1,0 ; addps 0x1430a(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,88,5,10,67,1,0 ; addps 0x1430a(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22711,8 +22999,8 @@ _sk_bilinear_ny_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,44,73,1,0 ; addps 0x1492c(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,244,66,1,0 ; movaps 0x142f4(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,13,44,73,1,0 ; addps 0x1492c(%rip),%xmm1 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,244,66,1,0 ; movaps 0x142f4(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22723,7 +23011,7 @@ _sk_bilinear_py_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,194,66,1,0 ; addps 0x142c2(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,88,13,194,66,1,0 ; addps 0x142c2(%rip),%xmm1 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22733,13 +23021,13 @@ _sk_bicubic_n3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,245,72,1,0 ; addps 0x148f5(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
- DB 68,15,40,13,173,66,1,0 ; movaps 0x142ad(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,5,245,72,1,0 ; addps 0x148f5(%rip),%xmm0 # 2d0d0 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,173,66,1,0 ; movaps 0x142ad(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,233,72,1,0 ; mulps 0x148e9(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,13,129,68,1,0 ; addps 0x14481(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,13,233,72,1,0 ; mulps 0x148e9(%rip),%xmm9 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,129,68,1,0 ; addps 0x14481(%rip),%xmm9 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22750,16 +23038,16 @@ _sk_bicubic_n1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,160,72,1,0 ; addps 0x148a0(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,104,66,1,0 ; movaps 0x14268(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,5,160,72,1,0 ; addps 0x148a0(%rip),%xmm0 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,104,66,1,0 ; movaps 0x14268(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,188,72,1,0 ; movaps 0x148bc(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,5,188,72,1,0 ; movaps 0x148bc(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,192,72,1,0 ; addps 0x148c0(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,5,192,72,1,0 ; addps 0x148c0(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,52,66,1,0 ; addps 0x14234(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,52,66,1,0 ; addps 0x14234(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,184,72,1,0 ; addps 0x148b8(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,5,184,72,1,0 ; addps 0x148b8(%rip),%xmm8 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22767,17 +23055,17 @@ _sk_bicubic_n1x_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse41
_sk_bicubic_p1x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,18,66,1,0 ; movaps 0x14212(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,5,18,66,1,0 ; movaps 0x14212(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,110,72,1,0 ; movaps 0x1486e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,21,110,72,1,0 ; movaps 0x1486e(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,114,72,1,0 ; addps 0x14872(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,21,114,72,1,0 ; addps 0x14872(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,110,72,1,0 ; addps 0x1486e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,21,110,72,1,0 ; addps 0x1486e(%rip),%xmm10 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22787,11 +23075,11 @@ _sk_bicubic_p3x_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,65,72,1,0 ; addps 0x14841(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 15,88,5,65,72,1,0 ; addps 0x14841(%rip),%xmm0 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,17,72,1,0 ; mulps 0x14811(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,5,169,67,1,0 ; addps 0x143a9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,5,17,72,1,0 ; mulps 0x14811(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,169,67,1,0 ; addps 0x143a9(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22802,13 +23090,13 @@ _sk_bicubic_n3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,215,71,1,0 ; addps 0x147d7(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
- DB 68,15,40,13,143,65,1,0 ; movaps 0x1418f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,13,215,71,1,0 ; addps 0x147d7(%rip),%xmm1 # 2d0d0 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,143,65,1,0 ; movaps 0x1418f(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,203,71,1,0 ; mulps 0x147cb(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,13,99,67,1,0 ; addps 0x14363(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,13,203,71,1,0 ; mulps 0x147cb(%rip),%xmm9 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,99,67,1,0 ; addps 0x14363(%rip),%xmm9 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22819,16 +23107,16 @@ _sk_bicubic_n1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,129,71,1,0 ; addps 0x14781(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,73,65,1,0 ; movaps 0x14149(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,13,129,71,1,0 ; addps 0x14781(%rip),%xmm1 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,73,65,1,0 ; movaps 0x14149(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,157,71,1,0 ; movaps 0x1479d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,5,157,71,1,0 ; movaps 0x1479d(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,161,71,1,0 ; addps 0x147a1(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,5,161,71,1,0 ; addps 0x147a1(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,21,65,1,0 ; addps 0x14115(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,21,65,1,0 ; addps 0x14115(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,153,71,1,0 ; addps 0x14799(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,5,153,71,1,0 ; addps 0x14799(%rip),%xmm8 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22836,17 +23124,17 @@ _sk_bicubic_n1y_sse41 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse41
_sk_bicubic_p1y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,243,64,1,0 ; movaps 0x140f3(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,5,243,64,1,0 ; movaps 0x140f3(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,78,71,1,0 ; movaps 0x1474e(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,21,78,71,1,0 ; movaps 0x1474e(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,82,71,1,0 ; addps 0x14752(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,21,82,71,1,0 ; addps 0x14752(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,78,71,1,0 ; addps 0x1474e(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,21,78,71,1,0 ; addps 0x1474e(%rip),%xmm10 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -22856,11 +23144,11 @@ _sk_bicubic_p3y_sse41 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,32,71,1,0 ; addps 0x14720(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 15,88,13,32,71,1,0 ; addps 0x14720(%rip),%xmm1 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,240,70,1,0 ; mulps 0x146f0(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,5,136,66,1,0 ; addps 0x14288(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,5,240,70,1,0 ; mulps 0x146f0(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,136,66,1,0 ; addps 0x14288(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -22993,10 +23281,10 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,56,64,227 ; pmulld %xmm3,%xmm12
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,15,254,209 ; paddd %xmm1,%xmm2
- DB 102,15,111,37,88,69,1,0 ; movdqa 0x14558(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,37,88,69,1,0 ; movdqa 0x14558(%rip),%xmm4 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
- DB 102,68,15,111,61,181,62,1,0 ; movdqa 0x13eb5(%rip),%xmm15 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,61,181,62,1,0 ; movdqa 0x13eb5(%rip),%xmm15 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,111,226 ; movdqa %xmm2,%xmm4
DB 102,65,15,254,231 ; paddd %xmm15,%xmm4
DB 102,73,15,58,22,225,1 ; pextrq $0x1,%xmm4,%r9
@@ -23016,7 +23304,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,65,15,58,22,210,1 ; pextrd $0x1,%xmm2,%r10d
DB 102,65,15,58,22,211,2 ; pextrd $0x2,%xmm2,%r11d
DB 102,65,15,58,22,214,3 ; pextrd $0x3,%xmm2,%r14d
- DB 102,68,15,111,13,103,62,1,0 ; movdqa 0x13e67(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,13,103,62,1,0 ; movdqa 0x13e67(%rip),%xmm9 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,209 ; paddd %xmm9,%xmm2
DB 102,73,15,58,22,215,1 ; pextrq $0x1,%xmm2,%r15
DB 102,72,15,126,211 ; movq %xmm2,%rbx
@@ -23030,7 +23318,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 73,193,239,32 ; shr $0x20,%r15
DB 243,66,15,16,20,184 ; movss (%rax,%r15,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
- DB 15,40,45,124,68,1,0 ; movaps 0x1447c(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
+ DB 15,40,45,124,68,1,0 ; movaps 0x1447c(%rip),%xmm5 # 2d120 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,197 ; addps %xmm5,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 15,40,215 ; movaps %xmm7,%xmm2
@@ -23199,7 +23487,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,68,15,254,232 ; paddd %xmm0,%xmm13
DB 102,65,15,111,212 ; movdqa %xmm12,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
- DB 102,15,111,45,61,65,1,0 ; movdqa 0x1413d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,45,61,65,1,0 ; movdqa 0x1413d(%rip),%xmm5 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,213 ; pmulld %xmm5,%xmm2
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
DB 102,65,15,254,207 ; paddd %xmm15,%xmm1
@@ -23305,7 +23593,7 @@ _sk_clut_3D_sse41 LABEL PROC
DB 102,69,15,58,22,225,1 ; pextrd $0x1,%xmm12,%r9d
DB 102,69,15,58,22,226,2 ; pextrd $0x2,%xmm12,%r10d
DB 102,69,15,58,22,227,3 ; pextrd $0x3,%xmm12,%r11d
- DB 102,15,111,21,161,56,1,0 ; movdqa 0x138a1(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,111,21,161,56,1,0 ; movdqa 0x138a1(%rip),%xmm2 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,68,15,254,226 ; paddd %xmm2,%xmm12
DB 102,76,15,58,22,225,1 ; pextrq $0x1,%xmm12,%rcx
DB 102,76,15,126,226 ; movq %xmm12,%rdx
@@ -23482,8 +23770,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,111,197 ; movdqa %xmm13,%xmm0
DB 102,68,15,127,108,36,48 ; movdqa %xmm13,0x30(%rsp)
DB 102,15,254,193 ; paddd %xmm1,%xmm0
- DB 102,15,56,64,5,233,59,1,0 ; pmulld 0x13be9(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
- DB 102,68,15,111,29,80,53,1,0 ; movdqa 0x13550(%rip),%xmm11 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,56,64,5,233,59,1,0 ; pmulld 0x13be9(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,68,15,111,29,80,53,1,0 ; movdqa 0x13550(%rip),%xmm11 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
DB 102,65,15,254,211 ; paddd %xmm11,%xmm2
DB 102,73,15,58,22,209,1 ; pextrq $0x1,%xmm2,%r9
@@ -23503,7 +23791,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
DB 102,65,15,58,22,195,2 ; pextrd $0x2,%xmm0,%r11d
DB 102,65,15,58,22,198,3 ; pextrd $0x3,%xmm0,%r14d
- DB 102,68,15,111,5,2,53,1,0 ; movdqa 0x13502(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,5,2,53,1,0 ; movdqa 0x13502(%rip),%xmm8 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,73,15,58,22,199,1 ; pextrq $0x1,%xmm0,%r15
DB 102,72,15,126,195 ; movq %xmm0,%rbx
@@ -23517,7 +23805,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 73,193,239,32 ; shr $0x20,%r15
DB 243,66,15,16,4,184 ; movss (%rax,%r15,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
- DB 15,40,53,23,59,1,0 ; movaps 0x13b17(%rip),%xmm6 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
+ DB 15,40,53,23,59,1,0 ; movaps 0x13b17(%rip),%xmm6 # 2d120 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,214 ; addps %xmm6,%xmm10
DB 68,15,41,148,36,176,0,0,0 ; movaps %xmm10,0xb0(%rsp)
DB 15,88,254 ; addps %xmm6,%xmm7
@@ -23530,7 +23818,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,68,15,111,214 ; movdqa %xmm6,%xmm10
DB 102,68,15,127,84,36,32 ; movdqa %xmm10,0x20(%rsp)
- DB 102,15,56,64,13,226,58,1,0 ; pmulld 0x13ae2(%rip),%xmm1 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,56,64,13,226,58,1,0 ; pmulld 0x13ae2(%rip),%xmm1 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,73,15,58,22,231,1 ; pextrq $0x1,%xmm4,%r15
@@ -23588,11 +23876,11 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,5,182,57,1,0 ; movdqa 0x139b6(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,182,57,1,0 ; movdqa 0x139b6(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,200 ; pmulld %xmm0,%xmm1
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,5,15,51,1,0 ; movdqa 0x1330f(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,5,15,51,1,0 ; movdqa 0x1330f(%rip),%xmm8 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,192 ; paddd %xmm8,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23694,7 +23982,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,68,15,111,108,36,48 ; movdqa 0x30(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
- DB 102,15,111,45,131,55,1,0 ; movdqa 0x13783(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,45,131,55,1,0 ; movdqa 0x13783(%rip),%xmm5 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,205 ; pmulld %xmm5,%xmm1
DB 102,15,126,201 ; movd %xmm1,%ecx
DB 102,15,58,22,202,1 ; pextrd $0x1,%xmm1,%edx
@@ -23706,7 +23994,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,20,152 ; movss (%rax,%rbx,4),%xmm2
DB 102,15,58,33,242,48 ; insertps $0x30,%xmm2,%xmm6
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,174,48,1,0 ; movdqa 0x130ae(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,29,174,48,1,0 ; movdqa 0x130ae(%rip),%xmm3 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,72,15,58,22,209,1 ; pextrq $0x1,%xmm2,%rcx
DB 102,72,15,126,210 ; movq %xmm2,%rdx
@@ -23754,7 +24042,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,194,1 ; pextrd $0x1,%xmm0,%r10d
DB 102,65,15,58,22,198,2 ; pextrd $0x2,%xmm0,%r14d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,254,5,220,47,1,0 ; paddd 0x12fdc(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,5,220,47,1,0 ; paddd 0x12fdc(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
DB 137,211 ; mov %edx,%ebx
@@ -23783,10 +24071,10 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,100,36,16 ; paddd 0x10(%rsp),%xmm4
DB 102,15,111,196 ; movdqa %xmm4,%xmm0
DB 102,65,15,254,197 ; paddd %xmm13,%xmm0
- DB 102,68,15,111,45,190,53,1,0 ; movdqa 0x135be(%rip),%xmm13 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,68,15,111,45,190,53,1,0 ; movdqa 0x135be(%rip),%xmm13 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,65,15,56,64,197 ; pmulld %xmm13,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,111,53,28,47,1,0 ; movdqa 0x12f1c(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,53,28,47,1,0 ; movdqa 0x12f1c(%rip),%xmm6 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,206 ; paddd %xmm6,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,202 ; movq %xmm1,%rdx
@@ -23804,7 +24092,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,61,220,46,1,0 ; movdqa 0x12edc(%rip),%xmm7 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,111,61,220,46,1,0 ; movdqa 0x12edc(%rip),%xmm7 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,199 ; paddd %xmm7,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -23821,7 +24109,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,254,227 ; paddd %xmm11,%xmm4
DB 102,65,15,56,64,229 ; pmulld %xmm13,%xmm4
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
- DB 102,68,15,111,45,102,46,1,0 ; movdqa 0x12e66(%rip),%xmm13 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,45,102,46,1,0 ; movdqa 0x12e66(%rip),%xmm13 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,245 ; paddd %xmm13,%xmm6
DB 102,72,15,58,22,241,1 ; pextrq $0x1,%xmm6,%rcx
DB 102,72,15,126,242 ; movq %xmm6,%rdx
@@ -23900,7 +24188,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,111,76,36,48 ; movdqa 0x30(%rsp),%xmm9
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,254,194 ; paddd %xmm2,%xmm0
- DB 102,15,111,29,116,51,1,0 ; movdqa 0x13374(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,29,116,51,1,0 ; movdqa 0x13374(%rip),%xmm3 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,56,64,195 ; pmulld %xmm3,%xmm0
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
DB 102,69,15,111,213 ; movdqa %xmm13,%xmm10
@@ -23921,7 +24209,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,193,1 ; pextrd $0x1,%xmm0,%r9d
DB 102,65,15,58,22,194,2 ; pextrd $0x2,%xmm0,%r10d
DB 102,65,15,58,22,195,3 ; pextrd $0x3,%xmm0,%r11d
- DB 102,15,111,45,149,44,1,0 ; movdqa 0x12c95(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,111,45,149,44,1,0 ; movdqa 0x12c95(%rip),%xmm5 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -24009,7 +24297,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,225,1 ; pextrd $0x1,%xmm4,%r9d
DB 102,65,15,58,22,226,2 ; pextrd $0x2,%xmm4,%r10d
DB 102,65,15,58,22,227,3 ; pextrd $0x3,%xmm4,%r11d
- DB 102,68,15,111,13,209,42,1,0 ; movdqa 0x12ad1(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,13,209,42,1,0 ; movdqa 0x12ad1(%rip),%xmm9 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,225 ; paddd %xmm9,%xmm4
DB 102,72,15,58,22,225,1 ; pextrq $0x1,%xmm4,%rcx
DB 102,72,15,126,226 ; movq %xmm4,%rdx
@@ -24091,7 +24379,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,15,254,76,36,48 ; paddd 0x30(%rsp),%xmm1
DB 102,65,15,56,64,205 ; pmulld %xmm13,%xmm1
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
- DB 102,68,15,111,37,11,41,1,0 ; movdqa 0x1290b(%rip),%xmm12 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,37,11,41,1,0 ; movdqa 0x1290b(%rip),%xmm12 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,196 ; paddd %xmm12,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -24109,7 +24397,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,65,15,58,22,201,1 ; pextrd $0x1,%xmm1,%r9d
DB 102,65,15,58,22,202,2 ; pextrd $0x2,%xmm1,%r10d
DB 102,65,15,58,22,203,3 ; pextrd $0x3,%xmm1,%r11d
- DB 102,15,111,29,202,40,1,0 ; movdqa 0x128ca(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,111,29,202,40,1,0 ; movdqa 0x128ca(%rip),%xmm3 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 102,72,15,58,22,201,1 ; pextrq $0x1,%xmm1,%rcx
DB 102,72,15,126,202 ; movq %xmm1,%rdx
@@ -24178,9 +24466,9 @@ _sk_clut_4D_sse41 LABEL PROC
DB 102,68,15,254,116,36,16 ; paddd 0x10(%rsp),%xmm14
DB 102,15,111,68,36,48 ; movdqa 0x30(%rsp),%xmm0
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
- DB 102,15,56,64,5,203,45,1,0 ; pmulld 0x12dcb(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,56,64,5,203,45,1,0 ; pmulld 0x12dcb(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,5,47,39,1,0 ; paddd 0x1272f(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,5,47,39,1,0 ; paddd 0x1272f(%rip),%xmm0 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
DB 137,213 ; mov %edx,%ebp
@@ -24213,8 +24501,8 @@ _sk_clut_4D_sse41 LABEL PROC
DB 243,15,16,4,136 ; movss (%rax,%rcx,4),%xmm0
DB 102,15,58,33,232,48 ; insertps $0x30,%xmm0,%xmm5
DB 102,68,15,254,116,36,32 ; paddd 0x20(%rsp),%xmm14
- DB 102,68,15,56,64,53,20,45,1,0 ; pmulld 0x12d14(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
- DB 102,15,111,5,124,38,1,0 ; movdqa 0x1267c(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,56,64,53,20,45,1,0 ; pmulld 0x12d14(%rip),%xmm14 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,124,38,1,0 ; movdqa 0x1267c(%rip),%xmm0 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,198 ; paddd %xmm14,%xmm0
DB 102,72,15,58,22,193,1 ; pextrq $0x1,%xmm0,%rcx
DB 102,72,15,126,194 ; movq %xmm0,%rdx
@@ -24295,7 +24583,7 @@ _sk_clut_4D_sse41 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,88,215 ; addps %xmm7,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,247,36,1,0 ; movaps 0x124f7(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,247,36,1,0 ; movaps 0x124f7(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 76,137,194 ; mov %r8,%rdx
DB 72,139,76,36,112 ; mov 0x70(%rsp),%rcx
DB 76,139,68,36,120 ; mov 0x78(%rsp),%r8
@@ -24343,13 +24631,13 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,8,255,255,255 ; mov %r9,-0xf8(%rbp)
DB 76,57,203 ; cmp %r9,%rbx
- DB 115,110 ; jae 1a184 <_sk_start_pipeline_sse2+0xeb>
+ DB 115,110 ; jae 1a6c4 <_sk_start_pipeline_sse2+0xeb>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,4 ; lea 0x4(%rax),%rax
DB 72,137,133,16,255,255,255 ; mov %rax,-0xf0(%rbp)
DB 76,57,189,16,255,255,255 ; cmp %r15,-0xf0(%rbp)
DB 72,139,149,24,255,255,255 ; mov -0xe8(%rbp),%rdx
- DB 119,43 ; ja 1a163 <_sk_start_pipeline_sse2+0xca>
+ DB 119,43 ; ja 1a6a3 <_sk_start_pipeline_sse2+0xca>
DB 76,139,165,24,255,255,255 ; mov -0xe8(%rbp),%r12
DB 69,49,192 ; xor %r8d,%r8d
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
@@ -24361,17 +24649,17 @@ _sk_start_pipeline_sse2 LABEL PROC
DB 73,131,196,8 ; add $0x8,%r12
DB 77,57,252 ; cmp %r15,%r12
DB 73,137,212 ; mov %rdx,%r12
- DB 118,220 ; jbe 1a13f <_sk_start_pipeline_sse2+0xa6>
+ DB 118,220 ; jbe 1a67f <_sk_start_pipeline_sse2+0xa6>
DB 77,137,248 ; mov %r15,%r8
DB 73,41,208 ; sub %rdx,%r8
- DB 116,13 ; je 1a178 <_sk_start_pipeline_sse2+0xdf>
+ DB 116,13 ; je 1a6b8 <_sk_start_pipeline_sse2+0xdf>
DB 72,139,125,56 ; mov 0x38(%rbp),%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 72,137,217 ; mov %rbx,%rcx
DB 65,255,213 ; callq *%r13
DB 72,255,195 ; inc %rbx
DB 72,59,157,8,255,255,255 ; cmp -0xf8(%rbp),%rbx
- DB 117,164 ; jne 1a128 <_sk_start_pipeline_sse2+0x8f>
+ DB 117,164 ; jne 1a668 <_sk_start_pipeline_sse2+0x8f>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -24402,7 +24690,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 102,15,110,194 ; movd %edx,%xmm0
DB 102,15,112,192,0 ; pshufd $0x0,%xmm0,%xmm0
DB 15,91,200 ; cvtdq2ps %xmm0,%xmm1
- DB 15,40,21,82,35,1,0 ; movaps 0x12352(%rip),%xmm2 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,40,21,82,35,1,0 ; movaps 0x12352(%rip),%xmm2 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,88,202 ; addps %xmm2,%xmm1
DB 15,16,7 ; movups (%rdi),%xmm0
DB 15,88,193 ; addps %xmm1,%xmm0
@@ -24411,7 +24699,7 @@ _sk_seed_shader_sse2 LABEL PROC
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,88,202 ; addps %xmm2,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,21,65,35,1,0 ; movaps 0x12341(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,65,35,1,0 ; movaps 0x12341(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 15,87,237 ; xorps %xmm5,%xmm5
@@ -24429,14 +24717,14 @@ _sk_dither_sse2 LABEL PROC
DB 102,68,15,110,193 ; movd %ecx,%xmm8
DB 102,69,15,112,192,0 ; pshufd $0x0,%xmm8,%xmm8
DB 102,69,15,239,193 ; pxor %xmm9,%xmm8
- DB 102,68,15,111,21,15,35,1,0 ; movdqa 0x1230f(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,21,15,35,1,0 ; movdqa 0x1230f(%rip),%xmm10 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,69,15,111,216 ; movdqa %xmm8,%xmm11
DB 102,69,15,219,218 ; pand %xmm10,%xmm11
DB 102,65,15,114,243,5 ; pslld $0x5,%xmm11
DB 102,69,15,219,209 ; pand %xmm9,%xmm10
DB 102,65,15,114,242,4 ; pslld $0x4,%xmm10
- DB 102,68,15,111,37,251,34,1,0 ; movdqa 0x122fb(%rip),%xmm12 # 2c570 <_sk_overlay_sse2_8bit+0xe63>
- DB 102,68,15,111,45,2,35,1,0 ; movdqa 0x12302(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,37,251,34,1,0 ; movdqa 0x122fb(%rip),%xmm12 # 2cab0 <_sk_overlay_sse2_8bit+0xe63>
+ DB 102,68,15,111,45,2,35,1,0 ; movdqa 0x12302(%rip),%xmm13 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,69,15,111,240 ; movdqa %xmm8,%xmm14
DB 102,69,15,219,245 ; pand %xmm13,%xmm14
DB 102,65,15,114,246,2 ; pslld $0x2,%xmm14
@@ -24452,8 +24740,8 @@ _sk_dither_sse2 LABEL PROC
DB 102,69,15,235,245 ; por %xmm13,%xmm14
DB 102,69,15,235,240 ; por %xmm8,%xmm14
DB 69,15,91,198 ; cvtdq2ps %xmm14,%xmm8
- DB 68,15,89,5,189,34,1,0 ; mulps 0x122bd(%rip),%xmm8 # 2c590 <_sk_overlay_sse2_8bit+0xe83>
- DB 68,15,88,5,197,34,1,0 ; addps 0x122c5(%rip),%xmm8 # 2c5a0 <_sk_overlay_sse2_8bit+0xe93>
+ DB 68,15,89,5,189,34,1,0 ; mulps 0x122bd(%rip),%xmm8 # 2cad0 <_sk_overlay_sse2_8bit+0xe83>
+ DB 68,15,88,5,197,34,1,0 ; addps 0x122c5(%rip),%xmm8 # 2cae0 <_sk_overlay_sse2_8bit+0xe93>
DB 243,68,15,16,16 ; movss (%rax),%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
@@ -24491,7 +24779,7 @@ _sk_uniform_color_sse2 LABEL PROC
PUBLIC _sk_black_color_sse2
_sk_black_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,251,33,1,0 ; movaps 0x121fb(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,251,33,1,0 ; movaps 0x121fb(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 15,87,201 ; xorps %xmm1,%xmm1
DB 15,87,210 ; xorps %xmm2,%xmm2
@@ -24500,7 +24788,7 @@ _sk_black_color_sse2 LABEL PROC
PUBLIC _sk_white_color_sse2
_sk_white_color_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,231,33,1,0 ; movaps 0x121e7(%rip),%xmm0 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,5,231,33,1,0 ; movaps 0x121e7(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,40,216 ; movaps %xmm0,%xmm3
@@ -24538,7 +24826,7 @@ _sk_clear_sse2 LABEL PROC
PUBLIC _sk_srcatop_sse2
_sk_srcatop_sse2 LABEL PROC
DB 15,89,199 ; mulps %xmm7,%xmm0
- DB 68,15,40,5,151,33,1,0 ; movaps 0x12197(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,151,33,1,0 ; movaps 0x12197(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24561,7 +24849,7 @@ PUBLIC _sk_dstatop_sse2
_sk_dstatop_sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
DB 68,15,89,196 ; mulps %xmm4,%xmm8
- DB 68,15,40,13,74,33,1,0 ; movaps 0x1214a(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,74,33,1,0 ; movaps 0x1214a(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
@@ -24602,7 +24890,7 @@ _sk_dstin_sse2 LABEL PROC
PUBLIC _sk_srcout_sse2
_sk_srcout_sse2 LABEL PROC
- DB 68,15,40,5,222,32,1,0 ; movaps 0x120de(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,222,32,1,0 ; movaps 0x120de(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
@@ -24613,7 +24901,7 @@ _sk_srcout_sse2 LABEL PROC
PUBLIC _sk_dstout_sse2
_sk_dstout_sse2 LABEL PROC
- DB 68,15,40,5,190,32,1,0 ; movaps 0x120be(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,190,32,1,0 ; movaps 0x120be(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 15,89,196 ; mulps %xmm4,%xmm0
@@ -24628,7 +24916,7 @@ _sk_dstout_sse2 LABEL PROC
PUBLIC _sk_srcover_sse2
_sk_srcover_sse2 LABEL PROC
- DB 68,15,40,5,145,32,1,0 ; movaps 0x12091(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,145,32,1,0 ; movaps 0x12091(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -24646,7 +24934,7 @@ _sk_srcover_sse2 LABEL PROC
PUBLIC _sk_dstover_sse2
_sk_dstover_sse2 LABEL PROC
- DB 68,15,40,5,85,32,1,0 ; movaps 0x12055(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,85,32,1,0 ; movaps 0x12055(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -24670,7 +24958,7 @@ _sk_modulate_sse2 LABEL PROC
PUBLIC _sk_multiply_sse2
_sk_multiply_sse2 LABEL PROC
- DB 68,15,40,5,25,32,1,0 ; movaps 0x12019(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,25,32,1,0 ; movaps 0x12019(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 69,15,40,209 ; movaps %xmm9,%xmm10
@@ -24706,7 +24994,7 @@ _sk_multiply_sse2 LABEL PROC
PUBLIC _sk_plus__sse2
_sk_plus__sse2 LABEL PROC
DB 15,88,196 ; addps %xmm4,%xmm0
- DB 68,15,40,5,154,31,1,0 ; movaps 0x11f9a(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,154,31,1,0 ; movaps 0x11f9a(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 15,88,205 ; addps %xmm5,%xmm1
DB 65,15,93,200 ; minps %xmm8,%xmm1
@@ -24744,7 +25032,7 @@ _sk_screen_sse2 LABEL PROC
PUBLIC _sk_xor__sse2
_sk_xor__sse2 LABEL PROC
DB 68,15,40,195 ; movaps %xmm3,%xmm8
- DB 15,40,29,38,31,1,0 ; movaps 0x11f26(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,38,31,1,0 ; movaps 0x11f26(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,40,203 ; movaps %xmm3,%xmm9
DB 68,15,92,207 ; subps %xmm7,%xmm9
DB 65,15,89,193 ; mulps %xmm9,%xmm0
@@ -24790,7 +25078,7 @@ _sk_darken_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,95,209 ; maxps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,129,30,1,0 ; movaps 0x11e81(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,129,30,1,0 ; movaps 0x11e81(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24822,7 +25110,7 @@ _sk_lighten_sse2 LABEL PROC
DB 68,15,89,206 ; mulps %xmm6,%xmm9
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,22,30,1,0 ; movaps 0x11e16(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,22,30,1,0 ; movaps 0x11e16(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24857,7 +25145,7 @@ _sk_difference_sse2 LABEL PROC
DB 65,15,93,209 ; minps %xmm9,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,160,29,1,0 ; movaps 0x11da0(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,160,29,1,0 ; movaps 0x11da0(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24883,7 +25171,7 @@ _sk_exclusion_sse2 LABEL PROC
DB 15,89,214 ; mulps %xmm6,%xmm2
DB 15,88,210 ; addps %xmm2,%xmm2
DB 68,15,92,194 ; subps %xmm2,%xmm8
- DB 15,40,21,80,29,1,0 ; movaps 0x11d50(%rip),%xmm2 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,21,80,29,1,0 ; movaps 0x11d50(%rip),%xmm2 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,211 ; subps %xmm3,%xmm2
DB 15,89,215 ; mulps %xmm7,%xmm2
DB 15,88,218 ; addps %xmm2,%xmm3
@@ -24894,7 +25182,7 @@ _sk_exclusion_sse2 LABEL PROC
PUBLIC _sk_colorburn_sse2
_sk_colorburn_sse2 LABEL PROC
DB 68,15,40,192 ; movaps %xmm0,%xmm8
- DB 68,15,40,13,51,29,1,0 ; movaps 0x11d33(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,51,29,1,0 ; movaps 0x11d33(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -24987,7 +25275,7 @@ _sk_colorburn_sse2 LABEL PROC
PUBLIC _sk_colordodge_sse2
_sk_colordodge_sse2 LABEL PROC
DB 68,15,40,200 ; movaps %xmm0,%xmm9
- DB 68,15,40,21,219,27,1,0 ; movaps 0x11bdb(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,219,27,1,0 ; movaps 0x11bdb(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,218 ; movaps %xmm10,%xmm11
DB 68,15,92,223 ; subps %xmm7,%xmm11
DB 65,15,40,195 ; movaps %xmm11,%xmm0
@@ -25078,7 +25366,7 @@ _sk_hardlight_sse2 LABEL PROC
DB 15,41,52,36 ; movaps %xmm6,(%rsp)
DB 15,40,245 ; movaps %xmm5,%xmm6
DB 15,40,236 ; movaps %xmm4,%xmm5
- DB 68,15,40,29,129,26,1,0 ; movaps 0x11a81(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,29,129,26,1,0 ; movaps 0x11a81(%rip),%xmm11 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,211 ; movaps %xmm11,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,194 ; movaps %xmm10,%xmm8
@@ -25165,7 +25453,7 @@ PUBLIC _sk_overlay_sse2
_sk_overlay_sse2 LABEL PROC
DB 68,15,40,193 ; movaps %xmm1,%xmm8
DB 68,15,40,232 ; movaps %xmm0,%xmm13
- DB 68,15,40,13,60,25,1,0 ; movaps 0x1193c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,60,25,1,0 ; movaps 0x1193c(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 68,15,92,215 ; subps %xmm7,%xmm10
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25255,7 +25543,7 @@ _sk_softlight_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 68,15,94,215 ; divps %xmm7,%xmm10
DB 69,15,84,212 ; andps %xmm12,%xmm10
- DB 68,15,40,13,230,23,1,0 ; movaps 0x117e6(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,230,23,1,0 ; movaps 0x117e6(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,249 ; movaps %xmm9,%xmm15
DB 69,15,92,250 ; subps %xmm10,%xmm15
DB 69,15,40,218 ; movaps %xmm10,%xmm11
@@ -25268,10 +25556,10 @@ _sk_softlight_sse2 LABEL PROC
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 65,15,88,194 ; addps %xmm10,%xmm0
- DB 68,15,40,53,16,24,1,0 ; movaps 0x11810(%rip),%xmm14 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
+ DB 68,15,40,53,16,24,1,0 ; movaps 0x11810(%rip),%xmm14 # 2caf0 <_sk_overlay_sse2_8bit+0xea3>
DB 69,15,88,222 ; addps %xmm14,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
- DB 68,15,40,21,16,24,1,0 ; movaps 0x11810(%rip),%xmm10 # 2c5c0 <_sk_overlay_sse2_8bit+0xeb3>
+ DB 68,15,40,21,16,24,1,0 ; movaps 0x11810(%rip),%xmm10 # 2cb00 <_sk_overlay_sse2_8bit+0xeb3>
DB 69,15,89,234 ; mulps %xmm10,%xmm13
DB 69,15,88,235 ; addps %xmm11,%xmm13
DB 15,88,228 ; addps %xmm4,%xmm4
@@ -25416,7 +25704,7 @@ _sk_hue_sse2 LABEL PROC
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 68,15,89,211 ; mulps %xmm3,%xmm10
- DB 68,15,40,5,156,21,1,0 ; movaps 0x1159c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,156,21,1,0 ; movaps 0x1159c(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,216 ; movaps %xmm8,%xmm11
DB 15,40,207 ; movaps %xmm7,%xmm1
DB 68,15,92,217 ; subps %xmm1,%xmm11
@@ -25464,12 +25752,12 @@ _sk_hue_sse2 LABEL PROC
DB 69,15,84,206 ; andps %xmm14,%xmm9
DB 69,15,84,214 ; andps %xmm14,%xmm10
DB 65,15,84,214 ; andps %xmm14,%xmm2
- DB 68,15,40,61,89,21,1,0 ; movaps 0x11559(%rip),%xmm15 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,61,89,21,1,0 ; movaps 0x11559(%rip),%xmm15 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 65,15,89,231 ; mulps %xmm15,%xmm4
- DB 15,40,5,94,21,1,0 ; movaps 0x1155e(%rip),%xmm0 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 15,40,5,94,21,1,0 ; movaps 0x1155e(%rip),%xmm0 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 15,89,240 ; mulps %xmm0,%xmm6
DB 15,88,244 ; addps %xmm4,%xmm6
- DB 68,15,40,53,96,21,1,0 ; movaps 0x11560(%rip),%xmm14 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,53,96,21,1,0 ; movaps 0x11560(%rip),%xmm14 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 68,15,40,239 ; movaps %xmm7,%xmm13
DB 69,15,89,238 ; mulps %xmm14,%xmm13
DB 68,15,88,238 ; addps %xmm6,%xmm13
@@ -25647,14 +25935,14 @@ _sk_saturation_sse2 LABEL PROC
DB 68,15,84,211 ; andps %xmm3,%xmm10
DB 68,15,84,203 ; andps %xmm3,%xmm9
DB 15,84,195 ; andps %xmm3,%xmm0
- DB 68,15,40,5,173,18,1,0 ; movaps 0x112ad(%rip),%xmm8 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,5,173,18,1,0 ; movaps 0x112ad(%rip),%xmm8 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 15,40,214 ; movaps %xmm6,%xmm2
DB 65,15,89,208 ; mulps %xmm8,%xmm2
- DB 15,40,13,175,18,1,0 ; movaps 0x112af(%rip),%xmm1 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 15,40,13,175,18,1,0 ; movaps 0x112af(%rip),%xmm1 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 15,40,221 ; movaps %xmm5,%xmm3
DB 15,89,217 ; mulps %xmm1,%xmm3
DB 15,88,218 ; addps %xmm2,%xmm3
- DB 68,15,40,37,174,18,1,0 ; movaps 0x112ae(%rip),%xmm12 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,37,174,18,1,0 ; movaps 0x112ae(%rip),%xmm12 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
DB 68,15,88,235 ; addps %xmm3,%xmm13
DB 65,15,40,210 ; movaps %xmm10,%xmm2
@@ -25699,7 +25987,7 @@ _sk_saturation_sse2 LABEL PROC
DB 15,40,223 ; movaps %xmm7,%xmm3
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,89,221 ; mulps %xmm5,%xmm3
- DB 68,15,40,5,99,17,1,0 ; movaps 0x11163(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,99,17,1,0 ; movaps 0x11163(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 68,15,92,199 ; subps %xmm7,%xmm8
DB 15,88,253 ; addps %xmm5,%xmm7
@@ -25800,14 +26088,14 @@ _sk_color_sse2 LABEL PROC
DB 68,15,40,213 ; movaps %xmm5,%xmm10
DB 69,15,89,208 ; mulps %xmm8,%xmm10
DB 65,15,40,208 ; movaps %xmm8,%xmm2
- DB 68,15,40,45,107,16,1,0 ; movaps 0x1106b(%rip),%xmm13 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,45,107,16,1,0 ; movaps 0x1106b(%rip),%xmm13 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,198 ; movaps %xmm6,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,40,53,107,16,1,0 ; movaps 0x1106b(%rip),%xmm14 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 68,15,40,53,107,16,1,0 ; movaps 0x1106b(%rip),%xmm14 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 65,15,40,195 ; movaps %xmm11,%xmm0
DB 65,15,89,198 ; mulps %xmm14,%xmm0
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,29,103,16,1,0 ; movaps 0x11067(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,29,103,16,1,0 ; movaps 0x11067(%rip),%xmm11 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
DB 69,15,89,227 ; mulps %xmm11,%xmm12
DB 68,15,88,224 ; addps %xmm0,%xmm12
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -25815,7 +26103,7 @@ _sk_color_sse2 LABEL PROC
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,89,254 ; mulps %xmm14,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 68,15,40,5,163,15,1,0 ; movaps 0x10fa3(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,163,15,1,0 ; movaps 0x10fa3(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,40,224 ; movaps %xmm8,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
DB 15,89,252 ; mulps %xmm4,%xmm7
@@ -25951,15 +26239,15 @@ _sk_luminosity_sse2 LABEL PROC
DB 68,15,40,205 ; movaps %xmm5,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
DB 15,89,222 ; mulps %xmm6,%xmm3
- DB 68,15,40,37,37,14,1,0 ; movaps 0x10e25(%rip),%xmm12 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,37,37,14,1,0 ; movaps 0x10e25(%rip),%xmm12 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,199 ; movaps %xmm7,%xmm8
DB 69,15,89,196 ; mulps %xmm12,%xmm8
- DB 68,15,40,45,37,14,1,0 ; movaps 0x10e25(%rip),%xmm13 # 2c5e0 <_sk_overlay_sse2_8bit+0xed3>
+ DB 68,15,40,45,37,14,1,0 ; movaps 0x10e25(%rip),%xmm13 # 2cb20 <_sk_overlay_sse2_8bit+0xed3>
DB 68,15,40,241 ; movaps %xmm1,%xmm14
DB 69,15,89,245 ; mulps %xmm13,%xmm14
DB 69,15,88,240 ; addps %xmm8,%xmm14
- DB 68,15,40,29,33,14,1,0 ; movaps 0x10e21(%rip),%xmm11 # 2c5f0 <_sk_overlay_sse2_8bit+0xee3>
- DB 68,15,40,5,121,13,1,0 ; movaps 0x10d79(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,29,33,14,1,0 ; movaps 0x10e21(%rip),%xmm11 # 2cb30 <_sk_overlay_sse2_8bit+0xee3>
+ DB 68,15,40,5,121,13,1,0 ; movaps 0x10d79(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,248 ; movaps %xmm8,%xmm15
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 68,15,92,248 ; subps %xmm0,%xmm15
@@ -26099,10 +26387,10 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,228,0,0,0 ; jne 1bac4 <_sk_srcover_rgba_8888_sse2+0x104>
+ DB 15,133,228,0,0,0 ; jne 1c004 <_sk_srcover_rgba_8888_sse2+0x104>
DB 243,69,15,111,4,129 ; movdqu (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,53,15,12,1,0 ; movdqa 0x10c0f(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,53,15,12,1,0 ; movdqa 0x10c0f(%rip),%xmm6 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,224 ; movdqa %xmm8,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
@@ -26116,9 +26404,9 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 15,91,247 ; cvtdq2ps %xmm7,%xmm6
DB 102,65,15,114,208,24 ; psrld $0x18,%xmm8
DB 65,15,91,248 ; cvtdq2ps %xmm8,%xmm7
- DB 68,15,40,5,31,11,1,0 ; movaps 0x10b1f(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,31,11,1,0 ; movaps 0x10b1f(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,92,195 ; subps %xmm3,%xmm8
- DB 68,15,40,37,243,11,1,0 ; movaps 0x10bf3(%rip),%xmm12 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,37,243,11,1,0 ; movaps 0x10bf3(%rip),%xmm12 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,196 ; mulps %xmm12,%xmm0
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,89,204 ; mulps %xmm4,%xmm9
@@ -26144,7 +26432,7 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 102,15,114,240,24 ; pslld $0x18,%xmm0
DB 102,15,235,194 ; por %xmm2,%xmm0
DB 102,15,235,193 ; por %xmm1,%xmm0
- DB 117,84 ; jne 1bafe <_sk_srcover_rgba_8888_sse2+0x13e>
+ DB 117,84 ; jne 1c03e <_sk_srcover_rgba_8888_sse2+0x13e>
DB 243,65,15,127,4,129 ; movdqu %xmm0,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,193 ; movaps %xmm9,%xmm0
@@ -26155,32 +26443,32 @@ _sk_srcover_rgba_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,90 ; je 1bb2b <_sk_srcover_rgba_8888_sse2+0x16b>
+ DB 116,90 ; je 1c06b <_sk_srcover_rgba_8888_sse2+0x16b>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1baf3 <_sk_srcover_rgba_8888_sse2+0x133>
+ DB 116,23 ; je 1c033 <_sk_srcover_rgba_8888_sse2+0x133>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,0,255,255,255 ; jne 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 15,133,0,255,255,255 ; jne 1bf26 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,69,15,18,4,129 ; movlpd (%r9,%rax,4),%xmm8
- DB 233,232,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,232,254,255,255 ; jmpq 1bf26 <_sk_srcover_rgba_8888_sse2+0x26>
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,43 ; je 1bb36 <_sk_srcover_rgba_8888_sse2+0x176>
+ DB 116,43 ; je 1c076 <_sk_srcover_rgba_8888_sse2+0x176>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1bb23 <_sk_srcover_rgba_8888_sse2+0x163>
+ DB 116,18 ; je 1c063 <_sk_srcover_rgba_8888_sse2+0x163>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,153 ; jne 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 117,153 ; jne 1bff0 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,126,76,129,8 ; movd %xmm1,0x8(%r9,%rax,4)
DB 102,65,15,214,4,129 ; movq %xmm0,(%r9,%rax,4)
- DB 235,133 ; jmp 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 235,133 ; jmp 1bff0 <_sk_srcover_rgba_8888_sse2+0xf0>
DB 102,69,15,110,4,129 ; movd (%r9,%rax,4),%xmm8
- DB 233,176,254,255,255 ; jmpq 1b9e6 <_sk_srcover_rgba_8888_sse2+0x26>
+ DB 233,176,254,255,255 ; jmpq 1bf26 <_sk_srcover_rgba_8888_sse2+0x26>
DB 102,65,15,126,4,129 ; movd %xmm0,(%r9,%rax,4)
- DB 233,111,255,255,255 ; jmpq 1bab0 <_sk_srcover_rgba_8888_sse2+0xf0>
+ DB 233,111,255,255,255 ; jmpq 1bff0 <_sk_srcover_rgba_8888_sse2+0xf0>
PUBLIC _sk_clamp_0_sse2
_sk_clamp_0_sse2 LABEL PROC
@@ -26194,7 +26482,7 @@ _sk_clamp_0_sse2 LABEL PROC
PUBLIC _sk_clamp_1_sse2
_sk_clamp_1_sse2 LABEL PROC
- DB 68,15,40,5,239,9,1,0 ; movaps 0x109ef(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,239,9,1,0 ; movaps 0x109ef(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,93,192 ; minps %xmm8,%xmm0
DB 65,15,93,200 ; minps %xmm8,%xmm1
DB 65,15,93,208 ; minps %xmm8,%xmm2
@@ -26204,7 +26492,7 @@ _sk_clamp_1_sse2 LABEL PROC
PUBLIC _sk_clamp_a_sse2
_sk_clamp_a_sse2 LABEL PROC
- DB 15,93,29,212,9,1,0 ; minps 0x109d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,29,212,9,1,0 ; minps 0x109d4(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,195 ; minps %xmm3,%xmm0
DB 15,93,203 ; minps %xmm3,%xmm1
DB 15,93,211 ; minps %xmm3,%xmm2
@@ -26213,7 +26501,7 @@ _sk_clamp_a_sse2 LABEL PROC
PUBLIC _sk_clamp_a_dst_sse2
_sk_clamp_a_dst_sse2 LABEL PROC
- DB 15,93,61,192,9,1,0 ; minps 0x109c0(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,93,61,192,9,1,0 ; minps 0x109c0(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,93,231 ; minps %xmm7,%xmm4
DB 15,93,239 ; minps %xmm7,%xmm5
DB 15,93,247 ; minps %xmm7,%xmm6
@@ -26242,7 +26530,7 @@ _sk_swap_rb_sse2 LABEL PROC
PUBLIC _sk_invert_sse2
_sk_invert_sse2 LABEL PROC
- DB 68,15,40,5,124,9,1,0 ; movaps 0x1097c(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,5,124,9,1,0 ; movaps 0x1097c(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 68,15,92,200 ; subps %xmm0,%xmm9
DB 69,15,40,208 ; movaps %xmm8,%xmm10
@@ -26294,7 +26582,7 @@ _sk_premul_dst_sse2 LABEL PROC
PUBLIC _sk_unpremul_sse2
_sk_unpremul_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
- DB 68,15,40,13,6,9,1,0 ; movaps 0x10906(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,6,9,1,0 ; movaps 0x10906(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,203 ; divps %xmm3,%xmm9
DB 68,15,194,195,4 ; cmpneqps %xmm3,%xmm8
DB 69,15,84,193 ; andps %xmm9,%xmm8
@@ -26306,20 +26594,20 @@ _sk_unpremul_sse2 LABEL PROC
PUBLIC _sk_from_srgb_sse2
_sk_from_srgb_sse2 LABEL PROC
- DB 68,15,40,5,209,9,1,0 ; movaps 0x109d1(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
+ DB 68,15,40,5,209,9,1,0 ; movaps 0x109d1(%rip),%xmm8 # 2cb80 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,232 ; movaps %xmm0,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,216 ; movaps %xmm0,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,73,9,1,0 ; movaps 0x10949(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,13,73,9,1,0 ; movaps 0x10949(%rip),%xmm9 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,185,9,1,0 ; movaps 0x109b9(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
+ DB 68,15,40,21,185,9,1,0 ; movaps 0x109b9(%rip),%xmm10 # 2cb90 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,185,9,1,0 ; movaps 0x109b9(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
+ DB 68,15,40,29,185,9,1,0 ; movaps 0x109b9(%rip),%xmm11 # 2cba0 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,189,9,1,0 ; movaps 0x109bd(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
+ DB 68,15,40,37,189,9,1,0 ; movaps 0x109bd(%rip),%xmm12 # 2cbb0 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,196,1 ; cmpltps %xmm12,%xmm0
DB 68,15,84,232 ; andps %xmm0,%xmm13
DB 65,15,85,198 ; andnps %xmm14,%xmm0
@@ -26353,20 +26641,20 @@ _sk_from_srgb_sse2 LABEL PROC
PUBLIC _sk_from_srgb_dst_sse2
_sk_from_srgb_dst_sse2 LABEL PROC
- DB 68,15,40,5,14,9,1,0 ; movaps 0x1090e(%rip),%xmm8 # 2c640 <_sk_overlay_sse2_8bit+0xf33>
+ DB 68,15,40,5,14,9,1,0 ; movaps 0x1090e(%rip),%xmm8 # 2cb80 <_sk_overlay_sse2_8bit+0xf33>
DB 68,15,40,236 ; movaps %xmm4,%xmm13
DB 69,15,89,232 ; mulps %xmm8,%xmm13
DB 68,15,40,220 ; movaps %xmm4,%xmm11
DB 69,15,89,219 ; mulps %xmm11,%xmm11
- DB 68,15,40,13,134,8,1,0 ; movaps 0x10886(%rip),%xmm9 # 2c5d0 <_sk_overlay_sse2_8bit+0xec3>
+ DB 68,15,40,13,134,8,1,0 ; movaps 0x10886(%rip),%xmm9 # 2cb10 <_sk_overlay_sse2_8bit+0xec3>
DB 68,15,40,244 ; movaps %xmm4,%xmm14
DB 69,15,89,241 ; mulps %xmm9,%xmm14
- DB 68,15,40,21,246,8,1,0 ; movaps 0x108f6(%rip),%xmm10 # 2c650 <_sk_overlay_sse2_8bit+0xf43>
+ DB 68,15,40,21,246,8,1,0 ; movaps 0x108f6(%rip),%xmm10 # 2cb90 <_sk_overlay_sse2_8bit+0xf43>
DB 69,15,88,242 ; addps %xmm10,%xmm14
DB 69,15,89,243 ; mulps %xmm11,%xmm14
- DB 68,15,40,29,246,8,1,0 ; movaps 0x108f6(%rip),%xmm11 # 2c660 <_sk_overlay_sse2_8bit+0xf53>
+ DB 68,15,40,29,246,8,1,0 ; movaps 0x108f6(%rip),%xmm11 # 2cba0 <_sk_overlay_sse2_8bit+0xf53>
DB 69,15,88,243 ; addps %xmm11,%xmm14
- DB 68,15,40,37,250,8,1,0 ; movaps 0x108fa(%rip),%xmm12 # 2c670 <_sk_overlay_sse2_8bit+0xf63>
+ DB 68,15,40,37,250,8,1,0 ; movaps 0x108fa(%rip),%xmm12 # 2cbb0 <_sk_overlay_sse2_8bit+0xf63>
DB 65,15,194,228,1 ; cmpltps %xmm12,%xmm4
DB 68,15,84,236 ; andps %xmm4,%xmm13
DB 65,15,85,230 ; andnps %xmm14,%xmm4
@@ -26401,22 +26689,22 @@ _sk_from_srgb_dst_sse2 LABEL PROC
PUBLIC _sk_to_srgb_sse2
_sk_to_srgb_sse2 LABEL PROC
DB 68,15,82,232 ; rsqrtps %xmm0,%xmm13
- DB 68,15,40,5,135,8,1,0 ; movaps 0x10887(%rip),%xmm8 # 2c680 <_sk_overlay_sse2_8bit+0xf73>
+ DB 68,15,40,5,135,8,1,0 ; movaps 0x10887(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0xf73>
DB 68,15,40,240 ; movaps %xmm0,%xmm14
DB 69,15,89,240 ; mulps %xmm8,%xmm14
- DB 68,15,40,13,135,8,1,0 ; movaps 0x10887(%rip),%xmm9 # 2c690 <_sk_overlay_sse2_8bit+0xf83>
+ DB 68,15,40,13,135,8,1,0 ; movaps 0x10887(%rip),%xmm9 # 2cbd0 <_sk_overlay_sse2_8bit+0xf83>
DB 69,15,40,253 ; movaps %xmm13,%xmm15
DB 69,15,89,249 ; mulps %xmm9,%xmm15
- DB 68,15,40,21,135,8,1,0 ; movaps 0x10887(%rip),%xmm10 # 2c6a0 <_sk_overlay_sse2_8bit+0xf93>
+ DB 68,15,40,21,135,8,1,0 ; movaps 0x10887(%rip),%xmm10 # 2cbe0 <_sk_overlay_sse2_8bit+0xf93>
DB 69,15,88,250 ; addps %xmm10,%xmm15
DB 69,15,89,253 ; mulps %xmm13,%xmm15
- DB 68,15,40,29,135,8,1,0 ; movaps 0x10887(%rip),%xmm11 # 2c6b0 <_sk_overlay_sse2_8bit+0xfa3>
+ DB 68,15,40,29,135,8,1,0 ; movaps 0x10887(%rip),%xmm11 # 2cbf0 <_sk_overlay_sse2_8bit+0xfa3>
DB 69,15,88,251 ; addps %xmm11,%xmm15
- DB 68,15,40,37,139,8,1,0 ; movaps 0x1088b(%rip),%xmm12 # 2c6c0 <_sk_overlay_sse2_8bit+0xfb3>
+ DB 68,15,40,37,139,8,1,0 ; movaps 0x1088b(%rip),%xmm12 # 2cc00 <_sk_overlay_sse2_8bit+0xfb3>
DB 69,15,88,236 ; addps %xmm12,%xmm13
DB 69,15,83,237 ; rcpps %xmm13,%xmm13
DB 69,15,89,239 ; mulps %xmm15,%xmm13
- DB 68,15,40,61,135,8,1,0 ; movaps 0x10887(%rip),%xmm15 # 2c6d0 <_sk_overlay_sse2_8bit+0xfc3>
+ DB 68,15,40,61,135,8,1,0 ; movaps 0x10887(%rip),%xmm15 # 2cc10 <_sk_overlay_sse2_8bit+0xfc3>
DB 65,15,194,199,1 ; cmpltps %xmm15,%xmm0
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,197 ; andnps %xmm13,%xmm0
@@ -26466,7 +26754,7 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 68,15,93,216 ; minps %xmm0,%xmm11
DB 65,15,40,202 ; movaps %xmm10,%xmm1
DB 65,15,92,203 ; subps %xmm11,%xmm1
- DB 68,15,40,45,74,6,1,0 ; movaps 0x1064a(%rip),%xmm13 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,45,74,6,1,0 ; movaps 0x1064a(%rip),%xmm13 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 68,15,94,233 ; divps %xmm1,%xmm13
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,194,192,0 ; cmpeqps %xmm8,%xmm0
@@ -26475,30 +26763,30 @@ _sk_rgb_to_hsl_sse2 LABEL PROC
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,40,241 ; movaps %xmm9,%xmm14
DB 68,15,194,242,1 ; cmpltps %xmm2,%xmm14
- DB 68,15,84,53,176,7,1,0 ; andps 0x107b0(%rip),%xmm14 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
+ DB 68,15,84,53,176,7,1,0 ; andps 0x107b0(%rip),%xmm14 # 2cc20 <_sk_overlay_sse2_8bit+0xfd3>
DB 69,15,88,244 ; addps %xmm12,%xmm14
DB 69,15,40,250 ; movaps %xmm10,%xmm15
DB 69,15,194,249,0 ; cmpeqps %xmm9,%xmm15
DB 65,15,92,208 ; subps %xmm8,%xmm2
DB 65,15,89,213 ; mulps %xmm13,%xmm2
- DB 68,15,40,37,163,7,1,0 ; movaps 0x107a3(%rip),%xmm12 # 2c6f0 <_sk_overlay_sse2_8bit+0xfe3>
+ DB 68,15,40,37,163,7,1,0 ; movaps 0x107a3(%rip),%xmm12 # 2cc30 <_sk_overlay_sse2_8bit+0xfe3>
DB 65,15,88,212 ; addps %xmm12,%xmm2
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 69,15,89,197 ; mulps %xmm13,%xmm8
- DB 68,15,88,5,159,7,1,0 ; addps 0x1079f(%rip),%xmm8 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
+ DB 68,15,88,5,159,7,1,0 ; addps 0x1079f(%rip),%xmm8 # 2cc40 <_sk_overlay_sse2_8bit+0xff3>
DB 65,15,84,215 ; andps %xmm15,%xmm2
DB 69,15,85,248 ; andnps %xmm8,%xmm15
DB 68,15,86,250 ; orps %xmm2,%xmm15
DB 68,15,84,240 ; andps %xmm0,%xmm14
DB 65,15,85,199 ; andnps %xmm15,%xmm0
DB 65,15,86,198 ; orps %xmm14,%xmm0
- DB 15,89,5,144,7,1,0 ; mulps 0x10790(%rip),%xmm0 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
+ DB 15,89,5,144,7,1,0 ; mulps 0x10790(%rip),%xmm0 # 2cc50 <_sk_overlay_sse2_8bit+0x1003>
DB 69,15,40,194 ; movaps %xmm10,%xmm8
DB 69,15,194,195,4 ; cmpneqps %xmm11,%xmm8
DB 65,15,84,192 ; andps %xmm8,%xmm0
DB 69,15,92,226 ; subps %xmm10,%xmm12
DB 69,15,88,211 ; addps %xmm11,%xmm10
- DB 68,15,40,13,163,5,1,0 ; movaps 0x105a3(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,13,163,5,1,0 ; movaps 0x105a3(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,40,210 ; movaps %xmm10,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 68,15,194,202,1 ; cmpltps %xmm2,%xmm9
@@ -26521,7 +26809,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,41,92,36,32 ; movaps %xmm3,0x20(%rsp)
DB 68,15,40,218 ; movaps %xmm2,%xmm11
DB 15,40,240 ; movaps %xmm0,%xmm6
- DB 68,15,40,13,78,5,1,0 ; movaps 0x1054e(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,13,78,5,1,0 ; movaps 0x1054e(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,40,209 ; movaps %xmm9,%xmm10
DB 69,15,194,211,2 ; cmpleps %xmm11,%xmm10
DB 15,40,193 ; movaps %xmm1,%xmm0
@@ -26538,28 +26826,28 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 69,15,88,211 ; addps %xmm11,%xmm10
DB 69,15,88,219 ; addps %xmm11,%xmm11
DB 69,15,92,218 ; subps %xmm10,%xmm11
- DB 15,40,5,232,6,1,0 ; movaps 0x106e8(%rip),%xmm0 # 2c720 <_sk_overlay_sse2_8bit+0x1013>
+ DB 15,40,5,232,6,1,0 ; movaps 0x106e8(%rip),%xmm0 # 2cc60 <_sk_overlay_sse2_8bit+0x1013>
DB 15,88,198 ; addps %xmm6,%xmm0
DB 243,15,91,200 ; cvttps2dq %xmm0,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
DB 15,40,216 ; movaps %xmm0,%xmm3
DB 15,194,217,1 ; cmpltps %xmm1,%xmm3
- DB 15,84,29,0,5,1,0 ; andps 0x10500(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,84,29,0,5,1,0 ; andps 0x10500(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,203 ; subps %xmm3,%xmm1
DB 15,92,193 ; subps %xmm1,%xmm0
- DB 68,15,40,45,210,6,1,0 ; movaps 0x106d2(%rip),%xmm13 # 2c730 <_sk_overlay_sse2_8bit+0x1023>
+ DB 68,15,40,45,210,6,1,0 ; movaps 0x106d2(%rip),%xmm13 # 2cc70 <_sk_overlay_sse2_8bit+0x1023>
DB 69,15,40,197 ; movaps %xmm13,%xmm8
DB 68,15,194,192,2 ; cmpleps %xmm0,%xmm8
DB 69,15,40,242 ; movaps %xmm10,%xmm14
DB 69,15,92,243 ; subps %xmm11,%xmm14
DB 65,15,40,217 ; movaps %xmm9,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
- DB 15,40,21,146,6,1,0 ; movaps 0x10692(%rip),%xmm2 # 2c710 <_sk_overlay_sse2_8bit+0x1003>
+ DB 15,40,21,146,6,1,0 ; movaps 0x10692(%rip),%xmm2 # 2cc50 <_sk_overlay_sse2_8bit+0x1003>
DB 68,15,40,250 ; movaps %xmm2,%xmm15
DB 68,15,194,248,2 ; cmpleps %xmm0,%xmm15
- DB 15,40,13,82,6,1,0 ; movaps 0x10652(%rip),%xmm1 # 2c6e0 <_sk_overlay_sse2_8bit+0xfd3>
+ DB 15,40,13,82,6,1,0 ; movaps 0x10652(%rip),%xmm1 # 2cc20 <_sk_overlay_sse2_8bit+0xfd3>
DB 15,89,193 ; mulps %xmm1,%xmm0
- DB 15,40,45,104,6,1,0 ; movaps 0x10668(%rip),%xmm5 # 2c700 <_sk_overlay_sse2_8bit+0xff3>
+ DB 15,40,45,104,6,1,0 ; movaps 0x10668(%rip),%xmm5 # 2cc40 <_sk_overlay_sse2_8bit+0xff3>
DB 15,40,229 ; movaps %xmm5,%xmm4
DB 15,92,224 ; subps %xmm0,%xmm4
DB 65,15,89,230 ; mulps %xmm14,%xmm4
@@ -26582,7 +26870,7 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,93,4,1,0 ; andps 0x1045d(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,84,29,93,4,1,0 ; andps 0x1045d(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 68,15,40,230 ; movaps %xmm6,%xmm12
DB 68,15,92,224 ; subps %xmm0,%xmm12
@@ -26612,12 +26900,12 @@ _sk_hsl_to_rgb_sse2 LABEL PROC
DB 15,40,60,36 ; movaps (%rsp),%xmm7
DB 15,40,231 ; movaps %xmm7,%xmm4
DB 15,85,227 ; andnps %xmm3,%xmm4
- DB 15,88,53,214,5,1,0 ; addps 0x105d6(%rip),%xmm6 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 15,88,53,214,5,1,0 ; addps 0x105d6(%rip),%xmm6 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 243,15,91,198 ; cvttps2dq %xmm6,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
DB 15,40,222 ; movaps %xmm6,%xmm3
DB 15,194,216,1 ; cmpltps %xmm0,%xmm3
- DB 15,84,29,209,3,1,0 ; andps 0x103d1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,84,29,209,3,1,0 ; andps 0x103d1(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,92,195 ; subps %xmm3,%xmm0
DB 15,92,240 ; subps %xmm0,%xmm6
DB 15,89,206 ; mulps %xmm6,%xmm1
@@ -26678,13 +26966,13 @@ _sk_scale_u8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,61 ; jne 1c284 <_sk_scale_u8_sse2+0x55>
+ DB 117,61 ; jne 1c7c4 <_sk_scale_u8_sse2+0x55>
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,160,3,1,0 ; pand 0x103a0(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,68,15,219,5,160,3,1,0 ; pand 0x103a0(%rip),%xmm8 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,228,4,1,0 ; mulps 0x104e4(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,89,5,228,4,1,0 ; mulps 0x104e4(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
@@ -26695,12 +26983,12 @@ _sk_scale_u8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,61 ; je 1c2ce <_sk_scale_u8_sse2+0x9f>
+ DB 116,61 ; je 1c80e <_sk_scale_u8_sse2+0x9f>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1c2b3 <_sk_scale_u8_sse2+0x84>
+ DB 116,23 ; je 1c7f3 <_sk_scale_u8_sse2+0x84>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,181 ; jne 1c257 <_sk_scale_u8_sse2+0x28>
+ DB 117,181 ; jne 1c797 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26709,10 +26997,10 @@ _sk_scale_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 235,137 ; jmp 1c257 <_sk_scale_u8_sse2+0x28>
+ DB 235,137 ; jmp 1c797 <_sk_scale_u8_sse2+0x28>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,122,255,255,255 ; jmpq 1c257 <_sk_scale_u8_sse2+0x28>
+ DB 233,122,255,255,255 ; jmpq 1c797 <_sk_scale_u8_sse2+0x28>
PUBLIC _sk_scale_565_sse2
_sk_scale_565_sse2 LABEL PROC
@@ -26724,20 +27012,20 @@ _sk_scale_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,173,0,0,0 ; jne 1c3a9 <_sk_scale_565_sse2+0xcc>
+ DB 15,133,173,0,0,0 ; jne 1c8e9 <_sk_scale_565_sse2+0xcc>
DB 243,71,15,126,20,89 ; movq (%r9,%r11,2),%xmm10
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
- DB 102,68,15,111,5,80,4,1,0 ; movdqa 0x10450(%rip),%xmm8 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,68,15,111,5,80,4,1,0 ; movdqa 0x10450(%rip),%xmm8 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,69,15,219,194 ; pand %xmm10,%xmm8
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,79,4,1,0 ; mulps 0x1044f(%rip),%xmm8 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,68,15,111,13,86,4,1,0 ; movdqa 0x10456(%rip),%xmm9 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 68,15,89,5,79,4,1,0 ; mulps 0x1044f(%rip),%xmm8 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,68,15,111,13,86,4,1,0 ; movdqa 0x10456(%rip),%xmm9 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,69,15,219,202 ; pand %xmm10,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,85,4,1,0 ; mulps 0x10455(%rip),%xmm9 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,68,15,219,21,92,4,1,0 ; pand 0x1045c(%rip),%xmm10 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 68,15,89,13,85,4,1,0 ; mulps 0x10455(%rip),%xmm9 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,21,92,4,1,0 ; pand 0x1045c(%rip),%xmm10 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
- DB 68,15,89,21,96,4,1,0 ; mulps 0x10460(%rip),%xmm10 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,89,21,96,4,1,0 ; mulps 0x10460(%rip),%xmm10 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 68,15,40,219 ; movaps %xmm3,%xmm11
DB 68,15,194,223,1 ; cmpltps %xmm7,%xmm11
DB 69,15,40,225 ; movaps %xmm9,%xmm12
@@ -26764,22 +27052,22 @@ _sk_scale_565_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1c3f1 <_sk_scale_565_sse2+0x114>
+ DB 116,59 ; je 1c931 <_sk_scale_565_sse2+0x114>
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,27 ; je 1c3dc <_sk_scale_565_sse2+0xff>
+ DB 116,27 ; je 1c91c <_sk_scale_565_sse2+0xff>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,60,255,255,255 ; jne 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 15,133,60,255,255,255 ; jne 1c847 <_sk_scale_565_sse2+0x2a>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,208,69 ; pshufd $0x45,%xmm8,%xmm10
DB 102,71,15,110,4,89 ; movd (%r9,%r11,2),%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
DB 242,69,15,16,208 ; movsd %xmm8,%xmm10
- DB 233,22,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 233,22,255,255,255 ; jmpq 1c847 <_sk_scale_565_sse2+0x2a>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,68,15,110,208 ; movd %eax,%xmm10
- DB 233,7,255,255,255 ; jmpq 1c307 <_sk_scale_565_sse2+0x2a>
+ DB 233,7,255,255,255 ; jmpq 1c847 <_sk_scale_565_sse2+0x2a>
PUBLIC _sk_lerp_1_float_sse2
_sk_lerp_1_float_sse2 LABEL PROC
@@ -26810,13 +27098,13 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,81 ; jne 1c4a1 <_sk_lerp_u8_sse2+0x69>
+ DB 117,81 ; jne 1c9e1 <_sk_lerp_u8_sse2+0x69>
DB 102,71,15,110,4,25 ; movd (%r9,%r11,1),%xmm8
DB 102,68,15,96,192 ; punpcklbw %xmm0,%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,219,5,151,1,1,0 ; pand 0x10197(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,68,15,219,5,151,1,1,0 ; pand 0x10197(%rip),%xmm8 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,219,2,1,0 ; mulps 0x102db(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,89,5,219,2,1,0 ; mulps 0x102db(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 15,92,196 ; subps %xmm4,%xmm0
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 15,88,196 ; addps %xmm4,%xmm0
@@ -26834,12 +27122,12 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,64 ; je 1c4ee <_sk_lerp_u8_sse2+0xb6>
+ DB 116,64 ; je 1ca2e <_sk_lerp_u8_sse2+0xb6>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1c4d0 <_sk_lerp_u8_sse2+0x98>
+ DB 116,23 ; je 1ca10 <_sk_lerp_u8_sse2+0x98>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,161 ; jne 1c460 <_sk_lerp_u8_sse2+0x28>
+ DB 117,161 ; jne 1c9a0 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
@@ -26848,10 +27136,10 @@ _sk_lerp_u8_sse2 LABEL PROC
DB 102,68,15,96,200 ; punpcklbw %xmm0,%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 233,114,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28>
+ DB 233,114,255,255,255 ; jmpq 1c9a0 <_sk_lerp_u8_sse2+0x28>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,99,255,255,255 ; jmpq 1c460 <_sk_lerp_u8_sse2+0x28>
+ DB 233,99,255,255,255 ; jmpq 1c9a0 <_sk_lerp_u8_sse2+0x28>
PUBLIC _sk_lerp_565_sse2
_sk_lerp_565_sse2 LABEL PROC
@@ -26863,20 +27151,20 @@ _sk_lerp_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 15,133,173,0,0,0 ; jne 1c5c9 <_sk_lerp_565_sse2+0xcc>
+ DB 15,133,173,0,0,0 ; jne 1cb09 <_sk_lerp_565_sse2+0xcc>
DB 243,71,15,126,4,89 ; movq (%r9,%r11,2),%xmm8
DB 102,68,15,97,192 ; punpcklwd %xmm0,%xmm8
- DB 102,68,15,111,13,48,2,1,0 ; movdqa 0x10230(%rip),%xmm9 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,68,15,111,13,48,2,1,0 ; movdqa 0x10230(%rip),%xmm9 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,69,15,219,200 ; pand %xmm8,%xmm9
DB 69,15,91,201 ; cvtdq2ps %xmm9,%xmm9
- DB 68,15,89,13,47,2,1,0 ; mulps 0x1022f(%rip),%xmm9 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,68,15,111,21,54,2,1,0 ; movdqa 0x10236(%rip),%xmm10 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 68,15,89,13,47,2,1,0 ; mulps 0x1022f(%rip),%xmm9 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,68,15,111,21,54,2,1,0 ; movdqa 0x10236(%rip),%xmm10 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,69,15,219,208 ; pand %xmm8,%xmm10
DB 69,15,91,218 ; cvtdq2ps %xmm10,%xmm11
- DB 68,15,89,29,53,2,1,0 ; mulps 0x10235(%rip),%xmm11 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,68,15,219,5,60,2,1,0 ; pand 0x1023c(%rip),%xmm8 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 68,15,89,29,53,2,1,0 ; mulps 0x10235(%rip),%xmm11 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,68,15,219,5,60,2,1,0 ; pand 0x1023c(%rip),%xmm8 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
- DB 68,15,89,5,64,2,1,0 ; mulps 0x10240(%rip),%xmm8 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 68,15,89,5,64,2,1,0 ; mulps 0x10240(%rip),%xmm8 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 68,15,40,211 ; movaps %xmm3,%xmm10
DB 68,15,194,215,1 ; cmpltps %xmm7,%xmm10
DB 69,15,40,227 ; movaps %xmm11,%xmm12
@@ -26905,34 +27193,34 @@ _sk_lerp_565_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1c611 <_sk_lerp_565_sse2+0x114>
+ DB 116,59 ; je 1cb51 <_sk_lerp_565_sse2+0x114>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,27 ; je 1c5fc <_sk_lerp_565_sse2+0xff>
+ DB 116,27 ; je 1cb3c <_sk_lerp_565_sse2+0xff>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,60,255,255,255 ; jne 1c527 <_sk_lerp_565_sse2+0x2a>
+ DB 15,133,60,255,255,255 ; jne 1ca67 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
DB 102,69,15,112,192,69 ; pshufd $0x45,%xmm8,%xmm8
DB 102,71,15,110,12,89 ; movd (%r9,%r11,2),%xmm9
DB 102,68,15,97,200 ; punpcklwd %xmm0,%xmm9
DB 242,69,15,16,193 ; movsd %xmm9,%xmm8
- DB 233,22,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a>
+ DB 233,22,255,255,255 ; jmpq 1ca67 <_sk_lerp_565_sse2+0x2a>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,68,15,110,192 ; movd %eax,%xmm8
- DB 233,7,255,255,255 ; jmpq 1c527 <_sk_lerp_565_sse2+0x2a>
+ DB 233,7,255,255,255 ; jmpq 1ca67 <_sk_lerp_565_sse2+0x2a>
PUBLIC _sk_load_tables_sse2
_sk_load_tables_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 76,139,8 ; mov (%rax),%r9
DB 77,133,192 ; test %r8,%r8
- DB 15,133,36,1,0,0 ; jne 1c752 <_sk_load_tables_sse2+0x132>
+ DB 15,133,36,1,0,0 ; jne 1cc92 <_sk_load_tables_sse2+0x132>
DB 243,69,15,111,12,145 ; movdqu (%r9,%rdx,4),%xmm9
DB 65,87 ; push %r15
DB 65,86 ; push %r14
DB 83 ; push %rbx
- DB 102,68,15,111,5,190,255,0,0 ; movdqa 0xffbe(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,68,15,111,5,190,255,0,0 ; movdqa 0xffbe(%rip),%xmm8 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
@@ -26988,7 +27276,7 @@ _sk_load_tables_sse2 LABEL PROC
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 102,65,15,114,209,24 ; psrld $0x18,%xmm9
DB 65,15,91,217 ; cvtdq2ps %xmm9,%xmm3
- DB 15,89,29,7,0,1,0 ; mulps 0x10007(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,29,7,0,1,0 ; mulps 0x10007(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -26997,18 +27285,18 @@ _sk_load_tables_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,45 ; je 1c78c <_sk_load_tables_sse2+0x16c>
+ DB 116,45 ; je 1cccc <_sk_load_tables_sse2+0x16c>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,23 ; je 1c781 <_sk_load_tables_sse2+0x161>
+ DB 116,23 ; je 1ccc1 <_sk_load_tables_sse2+0x161>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 15,133,192,254,255,255 ; jne 1c634 <_sk_load_tables_sse2+0x14>
+ DB 15,133,192,254,255,255 ; jne 1cb74 <_sk_load_tables_sse2+0x14>
DB 102,65,15,110,68,145,8 ; movd 0x8(%r9,%rdx,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,145 ; movlpd (%r9,%rdx,4),%xmm9
- DB 233,168,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14>
+ DB 233,168,254,255,255 ; jmpq 1cb74 <_sk_load_tables_sse2+0x14>
DB 102,69,15,110,12,145 ; movd (%r9,%rdx,4),%xmm9
- DB 233,157,254,255,255 ; jmpq 1c634 <_sk_load_tables_sse2+0x14>
+ DB 233,157,254,255,255 ; jmpq 1cb74 <_sk_load_tables_sse2+0x14>
PUBLIC _sk_load_tables_u16_be_sse2
_sk_load_tables_u16_be_sse2 LABEL PROC
@@ -27016,7 +27304,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,149,0,0,0,0 ; lea 0x0(,%rdx,4),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,101,1,0,0 ; jne 1c912 <_sk_load_tables_u16_be_sse2+0x17b>
+ DB 15,133,101,1,0,0 ; jne 1ce52 <_sk_load_tables_u16_be_sse2+0x17b>
DB 102,67,15,16,4,81 ; movupd (%r9,%r10,2),%xmm0
DB 102,67,15,16,76,81,16 ; movupd 0x10(%r9,%r10,2),%xmm1
DB 65,87 ; push %r15
@@ -27028,7 +27316,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 102,68,15,105,200 ; punpckhwd %xmm0,%xmm9
- DB 102,68,15,111,21,220,255,0,0 ; movdqa 0xffdc(%rip),%xmm10 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
+ DB 102,68,15,111,21,220,255,0,0 ; movdqa 0xffdc(%rip),%xmm10 # 2cd00 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,194 ; pand %xmm10,%xmm0
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -27090,7 +27378,7 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 102,65,15,235,217 ; por %xmm9,%xmm3
DB 102,65,15,97,216 ; punpcklwd %xmm8,%xmm3
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,215,254,0,0 ; mulps 0xfed7(%rip),%xmm3 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
+ DB 15,89,29,215,254,0,0 ; mulps 0xfed7(%rip),%xmm3 # 2cd20 <_sk_overlay_sse2_8bit+0x10d3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
@@ -27098,17 +27386,17 @@ _sk_load_tables_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,67,15,16,4,81 ; movsd (%r9,%r10,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1c92f <_sk_load_tables_u16_be_sse2+0x198>
+ DB 117,17 ; jne 1ce6f <_sk_load_tables_u16_be_sse2+0x198>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,139,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,139,254,255,255 ; jmpq 1ccfa <_sk_load_tables_u16_be_sse2+0x23>
DB 102,67,15,22,68,81,8 ; movhpd 0x8(%r9,%r10,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,118,254,255,255 ; jb 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
+ DB 15,130,118,254,255,255 ; jb 1ccfa <_sk_load_tables_u16_be_sse2+0x23>
DB 242,67,15,16,76,81,16 ; movsd 0x10(%r9,%r10,2),%xmm1
- DB 233,106,254,255,255 ; jmpq 1c7ba <_sk_load_tables_u16_be_sse2+0x23>
+ DB 233,106,254,255,255 ; jmpq 1ccfa <_sk_load_tables_u16_be_sse2+0x23>
PUBLIC _sk_load_tables_rgb_u16_be_sse2
_sk_load_tables_rgb_u16_be_sse2 LABEL PROC
@@ -27116,7 +27404,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 76,141,20,82 ; lea (%rdx,%rdx,2),%r10
DB 77,133,192 ; test %r8,%r8
- DB 15,133,84,1,0,0 ; jne 1cab6 <_sk_load_tables_rgb_u16_be_sse2+0x166>
+ DB 15,133,84,1,0,0 ; jne 1cff6 <_sk_load_tables_rgb_u16_be_sse2+0x166>
DB 243,71,15,111,28,81 ; movdqu (%r9,%r10,2),%xmm11
DB 243,67,15,111,76,81,8 ; movdqu 0x8(%r9,%r10,2),%xmm1
DB 102,15,115,217,4 ; psrldq $0x4,%xmm1
@@ -27131,7 +27419,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,68,15,97,208 ; punpcklwd %xmm0,%xmm10
DB 102,65,15,111,195 ; movdqa %xmm11,%xmm0
DB 102,65,15,97,194 ; punpcklwd %xmm10,%xmm0
- DB 102,68,15,111,5,22,254,0,0 ; movdqa 0xfe16(%rip),%xmm8 # 2c7c0 <_sk_overlay_sse2_8bit+0x10b3>
+ DB 102,68,15,111,5,22,254,0,0 ; movdqa 0xfe16(%rip),%xmm8 # 2cd00 <_sk_overlay_sse2_8bit+0x10b3>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,65,15,219,192 ; pand %xmm8,%xmm0
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -27187,7 +27475,7 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 65,15,20,208 ; unpcklps %xmm8,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,161,250,0,0 ; movaps 0xfaa1(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,161,250,0,0 ; movaps 0xfaa1(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 65,94 ; pop %r14
DB 65,95 ; pop %r15
@@ -27196,21 +27484,21 @@ _sk_load_tables_rgb_u16_be_sse2 LABEL PROC
DB 102,71,15,196,92,81,4,2 ; pinsrw $0x2,0x4(%r9,%r10,2),%xmm11
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,14 ; jne 1cadc <_sk_load_tables_rgb_u16_be_sse2+0x18c>
+ DB 117,14 ; jne 1d01c <_sk_load_tables_rgb_u16_be_sse2+0x18c>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
- DB 233,172,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,172,254,255,255 ; jmpq 1cec8 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,71,15,110,84,81,6 ; movd 0x6(%r9,%r10,2),%xmm10
DB 102,71,15,196,84,81,10,2 ; pinsrw $0x2,0xa(%r9,%r10,2),%xmm10
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 1cb0d <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
+ DB 114,24 ; jb 1d04d <_sk_load_tables_rgb_u16_be_sse2+0x1bd>
DB 102,67,15,110,76,81,12 ; movd 0xc(%r9,%r10,2),%xmm1
DB 102,67,15,196,76,81,16,2 ; pinsrw $0x2,0x10(%r9,%r10,2),%xmm1
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,123,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,123,254,255,255 ; jmpq 1cec8 <_sk_load_tables_rgb_u16_be_sse2+0x38>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,114,254,255,255 ; jmpq 1c988 <_sk_load_tables_rgb_u16_be_sse2+0x38>
+ DB 233,114,254,255,255 ; jmpq 1cec8 <_sk_load_tables_rgb_u16_be_sse2+0x38>
PUBLIC _sk_byte_tables_sse2
_sk_byte_tables_sse2 LABEL PROC
@@ -27219,7 +27507,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 65,86 ; push %r14
DB 83 ; push %rbx
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,10,251,0,0 ; movaps 0xfb0a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,10,251,0,0 ; movaps 0xfb0a(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,91,192 ; cvtps2dq %xmm0,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
@@ -27247,7 +27535,7 @@ _sk_byte_tables_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,180,251,0,0 ; movaps 0xfbb4(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,21,180,251,0,0 ; movaps 0xfbb4(%rip),%xmm10 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27366,7 +27654,7 @@ _sk_byte_tables_rgb_sse2 LABEL PROC
DB 102,65,15,96,193 ; punpcklbw %xmm9,%xmm0
DB 102,65,15,97,193 ; punpcklwd %xmm9,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,21,236,249,0,0 ; movaps 0xf9ec(%rip),%xmm10 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,21,236,249,0,0 ; movaps 0xf9ec(%rip),%xmm10 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,194 ; mulps %xmm10,%xmm0
DB 65,15,89,200 ; mulps %xmm8,%xmm1
DB 102,15,91,201 ; cvtps2dq %xmm1,%xmm1
@@ -27563,15 +27851,15 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,192,247,0,0 ; mulps 0xf7c0(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,21,200,247,0,0 ; andps 0xf7c8(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,21,240,244,0,0 ; orps 0xf4f0(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,13,200,247,0,0 ; addps 0xf7c8(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 68,15,40,37,208,247,0,0 ; movaps 0xf7d0(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,13,192,247,0,0 ; mulps 0xf7c0(%rip),%xmm9 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,200,247,0,0 ; andps 0xf7c8(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,240,244,0,0 ; orps 0xf4f0(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,200,247,0,0 ; addps 0xf7c8(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,208,247,0,0 ; movaps 0xf7d0(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,208,247,0,0 ; addps 0xf7d0(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 68,15,40,37,216,247,0,0 ; movaps 0xf7d8(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,21,208,247,0,0 ; addps 0xf7d0(%rip),%xmm10 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,216,247,0,0 ; movaps 0xf7d8(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27579,22 +27867,22 @@ _sk_parametric_r_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,178,244,0,0 ; movaps 0xf4b2(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,178,244,0,0 ; movaps 0xf4b2(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,166,247,0,0 ; addps 0xf7a6(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,13,166,247,0,0 ; addps 0xf7a6(%rip),%xmm9 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,37,174,247,0,0 ; movaps 0xf7ae(%rip),%xmm12 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,178,247,0,0 ; movaps 0xf7b2(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,45,178,247,0,0 ; movaps 0xf7b2(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,178,247,0,0 ; mulps 0xf7b2(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 68,15,89,45,178,247,0,0 ; mulps 0xf7b2(%rip),%xmm13 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27628,15 +27916,15 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,130,246,0,0 ; mulps 0xf682(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,21,138,246,0,0 ; andps 0xf68a(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,21,178,243,0,0 ; orps 0xf3b2(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,13,138,246,0,0 ; addps 0xf68a(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 68,15,40,37,146,246,0,0 ; movaps 0xf692(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,13,130,246,0,0 ; mulps 0xf682(%rip),%xmm9 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,138,246,0,0 ; andps 0xf68a(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,178,243,0,0 ; orps 0xf3b2(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,138,246,0,0 ; addps 0xf68a(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,146,246,0,0 ; movaps 0xf692(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,146,246,0,0 ; addps 0xf692(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 68,15,40,37,154,246,0,0 ; movaps 0xf69a(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,21,146,246,0,0 ; addps 0xf692(%rip),%xmm10 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,154,246,0,0 ; movaps 0xf69a(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27644,22 +27932,22 @@ _sk_parametric_g_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,116,243,0,0 ; movaps 0xf374(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,116,243,0,0 ; movaps 0xf374(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,104,246,0,0 ; addps 0xf668(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,13,104,246,0,0 ; addps 0xf668(%rip),%xmm9 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,37,112,246,0,0 ; movaps 0xf670(%rip),%xmm12 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,116,246,0,0 ; movaps 0xf674(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,45,116,246,0,0 ; movaps 0xf674(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,116,246,0,0 ; mulps 0xf674(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 68,15,89,45,116,246,0,0 ; mulps 0xf674(%rip),%xmm13 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27693,15 +27981,15 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,68,245,0,0 ; mulps 0xf544(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,21,76,245,0,0 ; andps 0xf54c(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,21,116,242,0,0 ; orps 0xf274(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,13,76,245,0,0 ; addps 0xf54c(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 68,15,40,37,84,245,0,0 ; movaps 0xf554(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,13,68,245,0,0 ; mulps 0xf544(%rip),%xmm9 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,76,245,0,0 ; andps 0xf54c(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,116,242,0,0 ; orps 0xf274(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,76,245,0,0 ; addps 0xf54c(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,84,245,0,0 ; movaps 0xf554(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,84,245,0,0 ; addps 0xf554(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 68,15,40,37,92,245,0,0 ; movaps 0xf55c(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,21,84,245,0,0 ; addps 0xf554(%rip),%xmm10 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,92,245,0,0 ; movaps 0xf55c(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27709,22 +27997,22 @@ _sk_parametric_b_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,54,242,0,0 ; movaps 0xf236(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,54,242,0,0 ; movaps 0xf236(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,42,245,0,0 ; addps 0xf52a(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,13,42,245,0,0 ; addps 0xf52a(%rip),%xmm9 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,37,50,245,0,0 ; movaps 0xf532(%rip),%xmm12 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,54,245,0,0 ; movaps 0xf536(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,45,54,245,0,0 ; movaps 0xf536(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,54,245,0,0 ; mulps 0xf536(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 68,15,89,45,54,245,0,0 ; mulps 0xf536(%rip),%xmm13 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27758,15 +28046,15 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,88,209 ; addps %xmm9,%xmm10
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,91,202 ; cvtdq2ps %xmm10,%xmm9
- DB 68,15,89,13,6,244,0,0 ; mulps 0xf406(%rip),%xmm9 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 68,15,84,21,14,244,0,0 ; andps 0xf40e(%rip),%xmm10 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,86,21,54,241,0,0 ; orps 0xf136(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
- DB 68,15,88,13,14,244,0,0 ; addps 0xf40e(%rip),%xmm9 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
- DB 68,15,40,37,22,244,0,0 ; movaps 0xf416(%rip),%xmm12 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,89,13,6,244,0,0 ; mulps 0xf406(%rip),%xmm9 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 68,15,84,21,14,244,0,0 ; andps 0xf40e(%rip),%xmm10 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,86,21,54,241,0,0 ; orps 0xf136(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,13,14,244,0,0 ; addps 0xf40e(%rip),%xmm9 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,22,244,0,0 ; movaps 0xf416(%rip),%xmm12 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 69,15,89,226 ; mulps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,88,21,22,244,0,0 ; addps 0xf416(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
- DB 68,15,40,37,30,244,0,0 ; movaps 0xf41e(%rip),%xmm12 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,88,21,22,244,0,0 ; addps 0xf416(%rip),%xmm10 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,37,30,244,0,0 ; movaps 0xf41e(%rip),%xmm12 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 69,15,94,226 ; divps %xmm10,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
DB 69,15,89,203 ; mulps %xmm11,%xmm9
@@ -27774,22 +28062,22 @@ _sk_parametric_a_sse2 LABEL PROC
DB 69,15,91,226 ; cvtdq2ps %xmm10,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,194,236,1 ; cmpltps %xmm12,%xmm13
- DB 68,15,40,21,248,240,0,0 ; movaps 0xf0f8(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,248,240,0,0 ; movaps 0xf0f8(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,234 ; andps %xmm10,%xmm13
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,229 ; subps %xmm13,%xmm12
DB 69,15,40,233 ; movaps %xmm9,%xmm13
DB 69,15,92,236 ; subps %xmm12,%xmm13
- DB 68,15,88,13,236,243,0,0 ; addps 0xf3ec(%rip),%xmm9 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
- DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 68,15,88,13,236,243,0,0 ; addps 0xf3ec(%rip),%xmm9 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
+ DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 69,15,89,229 ; mulps %xmm13,%xmm12
DB 69,15,92,204 ; subps %xmm12,%xmm9
- DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 68,15,40,37,244,243,0,0 ; movaps 0xf3f4(%rip),%xmm12 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 69,15,92,229 ; subps %xmm13,%xmm12
- DB 68,15,40,45,248,243,0,0 ; movaps 0xf3f8(%rip),%xmm13 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,45,248,243,0,0 ; movaps 0xf3f8(%rip),%xmm13 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 69,15,94,236 ; divps %xmm12,%xmm13
DB 69,15,88,233 ; addps %xmm9,%xmm13
- DB 68,15,89,45,248,243,0,0 ; mulps 0xf3f8(%rip),%xmm13 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 68,15,89,45,248,243,0,0 ; mulps 0xf3f8(%rip),%xmm13 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 102,69,15,91,205 ; cvtps2dq %xmm13,%xmm9
DB 243,68,15,16,96,20 ; movss 0x14(%rax),%xmm12
DB 69,15,198,228,0 ; shufps $0x0,%xmm12,%xmm12
@@ -27813,19 +28101,19 @@ _sk_gamma_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 15,91,194 ; cvtdq2ps %xmm2,%xmm0
- DB 15,89,5,0,243,0,0 ; mulps 0xf300(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 15,84,21,9,243,0,0 ; andps 0xf309(%rip),%xmm2 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 68,15,40,53,49,240,0,0 ; movaps 0xf031(%rip),%xmm14 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,89,5,0,243,0,0 ; mulps 0xf300(%rip),%xmm0 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,21,9,243,0,0 ; andps 0xf309(%rip),%xmm2 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 68,15,40,53,49,240,0,0 ; movaps 0xf031(%rip),%xmm14 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,86,214 ; orps %xmm14,%xmm2
- DB 68,15,40,37,5,243,0,0 ; movaps 0xf305(%rip),%xmm12 # 2c820 <_sk_overlay_sse2_8bit+0x1113>
+ DB 68,15,40,37,5,243,0,0 ; movaps 0xf305(%rip),%xmm12 # 2cd60 <_sk_overlay_sse2_8bit+0x1113>
DB 65,15,88,196 ; addps %xmm12,%xmm0
- DB 68,15,40,29,9,243,0,0 ; movaps 0xf309(%rip),%xmm11 # 2c830 <_sk_overlay_sse2_8bit+0x1123>
+ DB 68,15,40,29,9,243,0,0 ; movaps 0xf309(%rip),%xmm11 # 2cd70 <_sk_overlay_sse2_8bit+0x1123>
DB 15,40,226 ; movaps %xmm2,%xmm4
DB 65,15,89,227 ; mulps %xmm11,%xmm4
DB 15,92,196 ; subps %xmm4,%xmm0
- DB 68,15,40,21,7,243,0,0 ; movaps 0xf307(%rip),%xmm10 # 2c840 <_sk_overlay_sse2_8bit+0x1133>
+ DB 68,15,40,21,7,243,0,0 ; movaps 0xf307(%rip),%xmm10 # 2cd80 <_sk_overlay_sse2_8bit+0x1133>
DB 65,15,88,210 ; addps %xmm10,%xmm2
- DB 68,15,40,45,11,243,0,0 ; movaps 0xf30b(%rip),%xmm13 # 2c850 <_sk_overlay_sse2_8bit+0x1143>
+ DB 68,15,40,45,11,243,0,0 ; movaps 0xf30b(%rip),%xmm13 # 2cd90 <_sk_overlay_sse2_8bit+0x1143>
DB 65,15,40,229 ; movaps %xmm13,%xmm4
DB 15,94,226 ; divps %xmm2,%xmm4
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -27837,27 +28125,27 @@ _sk_gamma_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,194,226,1 ; cmpltps %xmm2,%xmm4
- DB 68,15,40,13,219,239,0,0 ; movaps 0xefdb(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,13,219,239,0,0 ; movaps 0xefdb(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 65,15,84,225 ; andps %xmm9,%xmm4
DB 15,92,212 ; subps %xmm4,%xmm2
DB 15,40,224 ; movaps %xmm0,%xmm4
DB 15,92,226 ; subps %xmm2,%xmm4
- DB 15,40,53,215,242,0,0 ; movaps 0xf2d7(%rip),%xmm6 # 2c860 <_sk_overlay_sse2_8bit+0x1153>
+ DB 15,40,53,215,242,0,0 ; movaps 0xf2d7(%rip),%xmm6 # 2cda0 <_sk_overlay_sse2_8bit+0x1153>
DB 15,88,198 ; addps %xmm6,%xmm0
- DB 15,40,61,237,242,0,0 ; movaps 0xf2ed(%rip),%xmm7 # 2c880 <_sk_overlay_sse2_8bit+0x1173>
+ DB 15,40,61,237,242,0,0 ; movaps 0xf2ed(%rip),%xmm7 # 2cdc0 <_sk_overlay_sse2_8bit+0x1173>
DB 15,40,239 ; movaps %xmm7,%xmm5
DB 15,92,236 ; subps %xmm4,%xmm5
DB 15,40,212 ; movaps %xmm4,%xmm2
- DB 15,40,37,205,242,0,0 ; movaps 0xf2cd(%rip),%xmm4 # 2c870 <_sk_overlay_sse2_8bit+0x1163>
+ DB 15,40,37,205,242,0,0 ; movaps 0xf2cd(%rip),%xmm4 # 2cdb0 <_sk_overlay_sse2_8bit+0x1163>
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 15,92,194 ; subps %xmm2,%xmm0
- DB 68,15,40,61,223,242,0,0 ; movaps 0xf2df(%rip),%xmm15 # 2c890 <_sk_overlay_sse2_8bit+0x1183>
+ DB 68,15,40,61,223,242,0,0 ; movaps 0xf2df(%rip),%xmm15 # 2cdd0 <_sk_overlay_sse2_8bit+0x1183>
DB 65,15,40,215 ; movaps %xmm15,%xmm2
DB 15,94,213 ; divps %xmm5,%xmm2
DB 15,88,208 ; addps %xmm0,%xmm2
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 15,89,5,59,242,0,0 ; mulps 0xf23b(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 15,84,13,68,242,0,0 ; andps 0xf244(%rip),%xmm1 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
+ DB 15,89,5,59,242,0,0 ; mulps 0xf23b(%rip),%xmm0 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,13,68,242,0,0 ; andps 0xf244(%rip),%xmm1 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
DB 65,15,86,206 ; orps %xmm14,%xmm1
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 15,40,233 ; movaps %xmm1,%xmm5
@@ -27887,9 +28175,9 @@ _sk_gamma_sse2 LABEL PROC
DB 15,94,206 ; divps %xmm6,%xmm1
DB 15,88,200 ; addps %xmm0,%xmm1
DB 15,91,195 ; cvtdq2ps %xmm3,%xmm0
- DB 15,89,5,202,241,0,0 ; mulps 0xf1ca(%rip),%xmm0 # 2c800 <_sk_overlay_sse2_8bit+0x10f3>
- DB 15,84,29,211,241,0,0 ; andps 0xf1d3(%rip),%xmm3 # 2c810 <_sk_overlay_sse2_8bit+0x1103>
- DB 15,86,29,252,238,0,0 ; orps 0xeefc(%rip),%xmm3 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,89,5,202,241,0,0 ; mulps 0xf1ca(%rip),%xmm0 # 2cd40 <_sk_overlay_sse2_8bit+0x10f3>
+ DB 15,84,29,211,241,0,0 ; andps 0xf1d3(%rip),%xmm3 # 2cd50 <_sk_overlay_sse2_8bit+0x1103>
+ DB 15,86,29,252,238,0,0 ; orps 0xeefc(%rip),%xmm3 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,88,196 ; addps %xmm12,%xmm0
DB 68,15,89,219 ; mulps %xmm3,%xmm11
DB 65,15,92,195 ; subps %xmm11,%xmm0
@@ -27911,7 +28199,7 @@ _sk_gamma_sse2 LABEL PROC
DB 15,92,253 ; subps %xmm5,%xmm7
DB 68,15,94,255 ; divps %xmm7,%xmm15
DB 68,15,88,248 ; addps %xmm0,%xmm15
- DB 15,40,5,9,242,0,0 ; movaps 0xf209(%rip),%xmm0 # 2c8a0 <_sk_overlay_sse2_8bit+0x1193>
+ DB 15,40,5,9,242,0,0 ; movaps 0xf209(%rip),%xmm0 # 2cde0 <_sk_overlay_sse2_8bit+0x1193>
DB 15,89,208 ; mulps %xmm0,%xmm2
DB 15,89,200 ; mulps %xmm0,%xmm1
DB 68,15,89,248 ; mulps %xmm0,%xmm15
@@ -27929,29 +28217,29 @@ _sk_gamma_sse2 LABEL PROC
PUBLIC _sk_lab_to_xyz_sse2
_sk_lab_to_xyz_sse2 LABEL PROC
- DB 15,89,5,219,241,0,0 ; mulps 0xf1db(%rip),%xmm0 # 2c8b0 <_sk_overlay_sse2_8bit+0x11a3>
- DB 68,15,40,5,83,239,0,0 ; movaps 0xef53(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 15,89,5,219,241,0,0 ; mulps 0xf1db(%rip),%xmm0 # 2cdf0 <_sk_overlay_sse2_8bit+0x11a3>
+ DB 68,15,40,5,83,239,0,0 ; movaps 0xef53(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 65,15,89,200 ; mulps %xmm8,%xmm1
- DB 68,15,40,13,215,241,0,0 ; movaps 0xf1d7(%rip),%xmm9 # 2c8c0 <_sk_overlay_sse2_8bit+0x11b3>
+ DB 68,15,40,13,215,241,0,0 ; movaps 0xf1d7(%rip),%xmm9 # 2ce00 <_sk_overlay_sse2_8bit+0x11b3>
DB 65,15,88,201 ; addps %xmm9,%xmm1
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 65,15,88,209 ; addps %xmm9,%xmm2
- DB 15,88,5,212,241,0,0 ; addps 0xf1d4(%rip),%xmm0 # 2c8d0 <_sk_overlay_sse2_8bit+0x11c3>
- DB 15,89,5,221,241,0,0 ; mulps 0xf1dd(%rip),%xmm0 # 2c8e0 <_sk_overlay_sse2_8bit+0x11d3>
- DB 15,89,13,230,241,0,0 ; mulps 0xf1e6(%rip),%xmm1 # 2c8f0 <_sk_overlay_sse2_8bit+0x11e3>
+ DB 15,88,5,212,241,0,0 ; addps 0xf1d4(%rip),%xmm0 # 2ce10 <_sk_overlay_sse2_8bit+0x11c3>
+ DB 15,89,5,221,241,0,0 ; mulps 0xf1dd(%rip),%xmm0 # 2ce20 <_sk_overlay_sse2_8bit+0x11d3>
+ DB 15,89,13,230,241,0,0 ; mulps 0xf1e6(%rip),%xmm1 # 2ce30 <_sk_overlay_sse2_8bit+0x11e3>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,21,236,241,0,0 ; mulps 0xf1ec(%rip),%xmm2 # 2c900 <_sk_overlay_sse2_8bit+0x11f3>
+ DB 15,89,21,236,241,0,0 ; mulps 0xf1ec(%rip),%xmm2 # 2ce40 <_sk_overlay_sse2_8bit+0x11f3>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 68,15,92,202 ; subps %xmm2,%xmm9
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
DB 68,15,89,225 ; mulps %xmm1,%xmm12
- DB 15,40,21,225,241,0,0 ; movaps 0xf1e1(%rip),%xmm2 # 2c910 <_sk_overlay_sse2_8bit+0x1203>
+ DB 15,40,21,225,241,0,0 ; movaps 0xf1e1(%rip),%xmm2 # 2ce50 <_sk_overlay_sse2_8bit+0x1203>
DB 68,15,40,194 ; movaps %xmm2,%xmm8
DB 69,15,194,196,1 ; cmpltps %xmm12,%xmm8
- DB 68,15,40,21,224,241,0,0 ; movaps 0xf1e0(%rip),%xmm10 # 2c920 <_sk_overlay_sse2_8bit+0x1213>
+ DB 68,15,40,21,224,241,0,0 ; movaps 0xf1e0(%rip),%xmm10 # 2ce60 <_sk_overlay_sse2_8bit+0x1213>
DB 65,15,88,202 ; addps %xmm10,%xmm1
- DB 68,15,40,29,228,241,0,0 ; movaps 0xf1e4(%rip),%xmm11 # 2c930 <_sk_overlay_sse2_8bit+0x1223>
+ DB 68,15,40,29,228,241,0,0 ; movaps 0xf1e4(%rip),%xmm11 # 2ce70 <_sk_overlay_sse2_8bit+0x1223>
DB 65,15,89,203 ; mulps %xmm11,%xmm1
DB 69,15,84,224 ; andps %xmm8,%xmm12
DB 68,15,85,193 ; andnps %xmm1,%xmm8
@@ -27975,8 +28263,8 @@ _sk_lab_to_xyz_sse2 LABEL PROC
DB 15,84,194 ; andps %xmm2,%xmm0
DB 65,15,85,209 ; andnps %xmm9,%xmm2
DB 15,86,208 ; orps %xmm0,%xmm2
- DB 68,15,89,5,148,241,0,0 ; mulps 0xf194(%rip),%xmm8 # 2c940 <_sk_overlay_sse2_8bit+0x1233>
- DB 15,89,21,157,241,0,0 ; mulps 0xf19d(%rip),%xmm2 # 2c950 <_sk_overlay_sse2_8bit+0x1243>
+ DB 68,15,89,5,148,241,0,0 ; mulps 0xf194(%rip),%xmm8 # 2ce80 <_sk_overlay_sse2_8bit+0x1233>
+ DB 15,89,21,157,241,0,0 ; mulps 0xf19d(%rip),%xmm2 # 2ce90 <_sk_overlay_sse2_8bit+0x1243>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -27990,13 +28278,13 @@ _sk_load_a8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 1d801 <_sk_load_a8_sse2+0x46>
+ DB 117,46 ; jne 1dd41 <_sk_load_a8_sse2+0x46>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,23,238,0,0 ; pand 0xee17(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,5,23,238,0,0 ; pand 0xee17(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,93,239,0,0 ; mulps 0xef5d(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,29,93,239,0,0 ; mulps 0xef5d(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
@@ -28005,12 +28293,12 @@ _sk_load_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d844 <_sk_load_a8_sse2+0x89>
+ DB 116,54 ; je 1dd84 <_sk_load_a8_sse2+0x89>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d82d <_sk_load_a8_sse2+0x72>
+ DB 116,21 ; je 1dd6d <_sk_load_a8_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 1d7e1 <_sk_load_a8_sse2+0x26>
+ DB 117,195 ; jne 1dd21 <_sk_load_a8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -28019,10 +28307,10 @@ _sk_load_a8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,157 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26>
+ DB 235,157 ; jmp 1dd21 <_sk_load_a8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,146 ; jmp 1d7e1 <_sk_load_a8_sse2+0x26>
+ DB 235,146 ; jmp 1dd21 <_sk_load_a8_sse2+0x26>
PUBLIC _sk_load_a8_dst_sse2
_sk_load_a8_dst_sse2 LABEL PROC
@@ -28033,13 +28321,13 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,46 ; jne 1d895 <_sk_load_a8_dst_sse2+0x46>
+ DB 117,46 ; jne 1ddd5 <_sk_load_a8_dst_sse2+0x46>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,131,237,0,0 ; pand 0xed83(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,37,131,237,0,0 ; pand 0xed83(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,252 ; cvtdq2ps %xmm4,%xmm7
- DB 15,89,61,201,238,0,0 ; mulps 0xeec9(%rip),%xmm7 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,61,201,238,0,0 ; mulps 0xeec9(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,228 ; xorps %xmm4,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
@@ -28048,12 +28336,12 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1d8d8 <_sk_load_a8_dst_sse2+0x89>
+ DB 116,54 ; je 1de18 <_sk_load_a8_dst_sse2+0x89>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1d8c1 <_sk_load_a8_dst_sse2+0x72>
+ DB 116,21 ; je 1de01 <_sk_load_a8_dst_sse2+0x72>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,195 ; jne 1d875 <_sk_load_a8_dst_sse2+0x26>
+ DB 117,195 ; jne 1ddb5 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -28062,10 +28350,10 @@ _sk_load_a8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,157 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26>
+ DB 235,157 ; jmp 1ddb5 <_sk_load_a8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,146 ; jmp 1d875 <_sk_load_a8_dst_sse2+0x26>
+ DB 235,146 ; jmp 1ddb5 <_sk_load_a8_dst_sse2+0x26>
PUBLIC _sk_gather_a8_sse2
_sk_gather_a8_sse2 LABEL PROC
@@ -28105,7 +28393,7 @@ _sk_gather_a8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,216 ; cvtdq2ps %xmm0,%xmm3
- DB 15,89,29,218,237,0,0 ; mulps 0xedda(%rip),%xmm3 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,29,218,237,0,0 ; mulps 0xedda(%rip),%xmm3 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
@@ -28123,7 +28411,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 77,15,175,202 ; imul %r10,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,138,236,0,0 ; movaps 0xec8a(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,138,236,0,0 ; movaps 0xec8a(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,89,195 ; mulps %xmm3,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
DB 102,65,15,114,240,16 ; pslld $0x10,%xmm8
@@ -28131,7 +28419,7 @@ _sk_store_a8_sse2 LABEL PROC
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 1d9db <_sk_store_a8_sse2+0x54>
+ DB 117,17 ; jne 1df1b <_sk_store_a8_sse2+0x54>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 67,137,4,25 ; mov %eax,(%r9,%r11,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -28142,24 +28430,24 @@ _sk_store_a8_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,59 ; je 1da2d <_sk_store_a8_sse2+0xa6>
+ DB 116,59 ; je 1df6d <_sk_store_a8_sse2+0xa6>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,22 ; je 1da0e <_sk_store_a8_sse2+0x87>
+ DB 116,22 ; je 1df4e <_sk_store_a8_sse2+0x87>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,213 ; jne 1d9d3 <_sk_store_a8_sse2+0x4c>
+ DB 117,213 ; jne 1df13 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,68,36,16 ; movdqa %xmm8,0x10(%rsp)
DB 138,68,36,24 ; mov 0x18(%rsp),%al
DB 67,136,68,25,2 ; mov %al,0x2(%r9,%r11,1)
- DB 102,68,15,219,5,233,235,0,0 ; pand 0xebe9(%rip),%xmm8 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,68,15,219,5,233,235,0,0 ; pand 0xebe9(%rip),%xmm8 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,69,15,103,192 ; packuswb %xmm8,%xmm8
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,25 ; mov %ax,(%r9,%r11,1)
- DB 235,166 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c>
+ DB 235,166 ; jmp 1df13 <_sk_store_a8_sse2+0x4c>
DB 102,68,15,127,4,36 ; movdqa %xmm8,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 67,136,4,25 ; mov %al,(%r9,%r11,1)
- DB 235,151 ; jmp 1d9d3 <_sk_store_a8_sse2+0x4c>
+ DB 235,151 ; jmp 1df13 <_sk_store_a8_sse2+0x4c>
PUBLIC _sk_load_g8_sse2
_sk_load_g8_sse2 LABEL PROC
@@ -28170,27 +28458,27 @@ _sk_load_g8_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 1da85 <_sk_load_g8_sse2+0x49>
+ DB 117,49 ; jne 1dfc5 <_sk_load_g8_sse2+0x49>
DB 102,67,15,110,4,25 ; movd (%r9,%r11,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
- DB 102,15,219,5,150,235,0,0 ; pand 0xeb96(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,5,150,235,0,0 ; pand 0xeb96(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,220,236,0,0 ; mulps 0xecdc(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,5,220,236,0,0 ; mulps 0xecdc(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,211,234,0,0 ; movaps 0xead3(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,211,234,0,0 ; movaps 0xead3(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1dac8 <_sk_load_g8_sse2+0x8c>
+ DB 116,54 ; je 1e008 <_sk_load_g8_sse2+0x8c>
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1dab1 <_sk_load_g8_sse2+0x75>
+ DB 116,21 ; je 1dff1 <_sk_load_g8_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1da62 <_sk_load_g8_sse2+0x26>
+ DB 117,192 ; jne 1dfa2 <_sk_load_g8_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
@@ -28199,10 +28487,10 @@ _sk_load_g8_sse2 LABEL PROC
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 102,15,97,200 ; punpcklwd %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 235,154 ; jmp 1da62 <_sk_load_g8_sse2+0x26>
+ DB 235,154 ; jmp 1dfa2 <_sk_load_g8_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,143 ; jmp 1da62 <_sk_load_g8_sse2+0x26>
+ DB 235,143 ; jmp 1dfa2 <_sk_load_g8_sse2+0x26>
PUBLIC _sk_load_g8_dst_sse2
_sk_load_g8_dst_sse2 LABEL PROC
@@ -28213,27 +28501,27 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,49 ; jne 1db1c <_sk_load_g8_dst_sse2+0x49>
+ DB 117,49 ; jne 1e05c <_sk_load_g8_dst_sse2+0x49>
DB 102,67,15,110,36,25 ; movd (%r9,%r11,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
- DB 102,15,219,37,255,234,0,0 ; pand 0xeaff(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,219,37,255,234,0,0 ; pand 0xeaff(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,69,236,0,0 ; mulps 0xec45(%rip),%xmm4 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,37,69,236,0,0 ; mulps 0xec45(%rip),%xmm4 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,60,234,0,0 ; movaps 0xea3c(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,61,60,234,0,0 ; movaps 0xea3c(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,236 ; movaps %xmm4,%xmm5
DB 15,40,244 ; movaps %xmm4,%xmm6
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,54 ; je 1db5f <_sk_load_g8_dst_sse2+0x8c>
+ DB 116,54 ; je 1e09f <_sk_load_g8_dst_sse2+0x8c>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1db48 <_sk_load_g8_dst_sse2+0x75>
+ DB 116,21 ; je 1e088 <_sk_load_g8_dst_sse2+0x75>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,192 ; jne 1daf9 <_sk_load_g8_dst_sse2+0x26>
+ DB 117,192 ; jne 1e039 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,68,25,2 ; movzbl 0x2(%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,69 ; pshufd $0x45,%xmm4,%xmm4
@@ -28242,10 +28530,10 @@ _sk_load_g8_dst_sse2 LABEL PROC
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 102,15,97,232 ; punpcklwd %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 235,154 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26>
+ DB 235,154 ; jmp 1e039 <_sk_load_g8_dst_sse2+0x26>
DB 67,15,182,4,25 ; movzbl (%r9,%r11,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 235,143 ; jmp 1daf9 <_sk_load_g8_dst_sse2+0x26>
+ DB 235,143 ; jmp 1e039 <_sk_load_g8_dst_sse2+0x26>
PUBLIC _sk_gather_g8_sse2
_sk_gather_g8_sse2 LABEL PROC
@@ -28285,9 +28573,9 @@ _sk_gather_g8_sse2 LABEL PROC
DB 102,15,96,193 ; punpcklbw %xmm1,%xmm0
DB 102,15,97,193 ; punpcklwd %xmm1,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,83,235,0,0 ; mulps 0xeb53(%rip),%xmm0 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 15,89,5,83,235,0,0 ; mulps 0xeb53(%rip),%xmm0 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,74,233,0,0 ; movaps 0xe94a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,74,233,0,0 ; movaps 0xe94a(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
DB 91 ; pop %rbx
@@ -28304,42 +28592,42 @@ _sk_load_565_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 1dc7e <_sk_load_565_sse2+0x6e>
+ DB 117,83 ; jne 1e1be <_sk_load_565_sse2+0x6e>
DB 243,67,15,126,20,89 ; movq (%r9,%r11,2),%xmm2
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,35,235,0,0 ; movdqa 0xeb23(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,5,35,235,0,0 ; movdqa 0xeb23(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,37,235,0,0 ; mulps 0xeb25(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,13,45,235,0,0 ; movdqa 0xeb2d(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 15,89,5,37,235,0,0 ; mulps 0xeb25(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,45,235,0,0 ; movdqa 0xeb2d(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,47,235,0,0 ; mulps 0xeb2f(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,15,219,21,55,235,0,0 ; pand 0xeb37(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 15,89,13,47,235,0,0 ; mulps 0xeb2f(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,55,235,0,0 ; pand 0xeb37(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,61,235,0,0 ; mulps 0xeb3d(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,89,21,61,235,0,0 ; mulps 0xeb3d(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,212,232,0,0 ; movaps 0xe8d4(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,212,232,0,0 ; movaps 0xe8d4(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1dcbd <_sk_load_565_sse2+0xad>
+ DB 116,50 ; je 1e1fd <_sk_load_565_sse2+0xad>
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1dcaa <_sk_load_565_sse2+0x9a>
+ DB 116,21 ; je 1e1ea <_sk_load_565_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1dc35 <_sk_load_565_sse2+0x25>
+ DB 117,154 ; jne 1e175 <_sk_load_565_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,208,69 ; pshufd $0x45,%xmm0,%xmm2
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,208 ; movsd %xmm0,%xmm2
- DB 233,120,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1e175 <_sk_load_565_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,106,255,255,255 ; jmpq 1dc35 <_sk_load_565_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1e175 <_sk_load_565_sse2+0x25>
PUBLIC _sk_load_565_dst_sse2
_sk_load_565_dst_sse2 LABEL PROC
@@ -28351,42 +28639,42 @@ _sk_load_565_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,83 ; jne 1dd39 <_sk_load_565_dst_sse2+0x6e>
+ DB 117,83 ; jne 1e279 <_sk_load_565_dst_sse2+0x6e>
DB 243,67,15,126,52,89 ; movq (%r9,%r11,2),%xmm6
DB 102,15,97,240 ; punpcklwd %xmm0,%xmm6
- DB 102,15,111,37,104,234,0,0 ; movdqa 0xea68(%rip),%xmm4 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,37,104,234,0,0 ; movdqa 0xea68(%rip),%xmm4 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,106,234,0,0 ; mulps 0xea6a(%rip),%xmm4 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,45,114,234,0,0 ; movdqa 0xea72(%rip),%xmm5 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 15,89,37,106,234,0,0 ; mulps 0xea6a(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,45,114,234,0,0 ; movdqa 0xea72(%rip),%xmm5 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,238 ; pand %xmm6,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,116,234,0,0 ; mulps 0xea74(%rip),%xmm5 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,15,219,53,124,234,0,0 ; pand 0xea7c(%rip),%xmm6 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 15,89,45,116,234,0,0 ; mulps 0xea74(%rip),%xmm5 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,53,124,234,0,0 ; pand 0xea7c(%rip),%xmm6 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,130,234,0,0 ; mulps 0xea82(%rip),%xmm6 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,89,53,130,234,0,0 ; mulps 0xea82(%rip),%xmm6 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,61,25,232,0,0 ; movaps 0xe819(%rip),%xmm7 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,61,25,232,0,0 ; movaps 0xe819(%rip),%xmm7 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1dd78 <_sk_load_565_dst_sse2+0xad>
+ DB 116,50 ; je 1e2b8 <_sk_load_565_dst_sse2+0xad>
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1dd65 <_sk_load_565_dst_sse2+0x9a>
+ DB 116,21 ; je 1e2a5 <_sk_load_565_dst_sse2+0x9a>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,154 ; jne 1dcf0 <_sk_load_565_dst_sse2+0x25>
+ DB 117,154 ; jne 1e230 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,244,69 ; pshufd $0x45,%xmm4,%xmm6
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,244 ; movsd %xmm4,%xmm6
- DB 233,120,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25>
+ DB 233,120,255,255,255 ; jmpq 1e230 <_sk_load_565_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,106,255,255,255 ; jmpq 1dcf0 <_sk_load_565_dst_sse2+0x25>
+ DB 233,106,255,255,255 ; jmpq 1e230 <_sk_load_565_dst_sse2+0x25>
PUBLIC _sk_gather_565_sse2
_sk_gather_565_sse2 LABEL PROC
@@ -28419,19 +28707,19 @@ _sk_gather_565_sse2 LABEL PROC
DB 102,15,196,208,3 ; pinsrw $0x3,%eax,%xmm2
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,208 ; punpcklwd %xmm0,%xmm2
- DB 102,15,111,5,84,233,0,0 ; movdqa 0xe954(%rip),%xmm0 # 2c760 <_sk_overlay_sse2_8bit+0x1053>
+ DB 102,15,111,5,84,233,0,0 ; movdqa 0xe954(%rip),%xmm0 # 2cca0 <_sk_overlay_sse2_8bit+0x1053>
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,86,233,0,0 ; mulps 0xe956(%rip),%xmm0 # 2c770 <_sk_overlay_sse2_8bit+0x1063>
- DB 102,15,111,13,94,233,0,0 ; movdqa 0xe95e(%rip),%xmm1 # 2c780 <_sk_overlay_sse2_8bit+0x1073>
+ DB 15,89,5,86,233,0,0 ; mulps 0xe956(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x1063>
+ DB 102,15,111,13,94,233,0,0 ; movdqa 0xe95e(%rip),%xmm1 # 2ccc0 <_sk_overlay_sse2_8bit+0x1073>
DB 102,15,219,202 ; pand %xmm2,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,96,233,0,0 ; mulps 0xe960(%rip),%xmm1 # 2c790 <_sk_overlay_sse2_8bit+0x1083>
- DB 102,15,219,21,104,233,0,0 ; pand 0xe968(%rip),%xmm2 # 2c7a0 <_sk_overlay_sse2_8bit+0x1093>
+ DB 15,89,13,96,233,0,0 ; mulps 0xe960(%rip),%xmm1 # 2ccd0 <_sk_overlay_sse2_8bit+0x1083>
+ DB 102,15,219,21,104,233,0,0 ; pand 0xe968(%rip),%xmm2 # 2cce0 <_sk_overlay_sse2_8bit+0x1093>
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,110,233,0,0 ; mulps 0xe96e(%rip),%xmm2 # 2c7b0 <_sk_overlay_sse2_8bit+0x10a3>
+ DB 15,89,21,110,233,0,0 ; mulps 0xe96e(%rip),%xmm2 # 2ccf0 <_sk_overlay_sse2_8bit+0x10a3>
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,5,231,0,0 ; movaps 0xe705(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,5,231,0,0 ; movaps 0xe705(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -28444,12 +28732,12 @@ _sk_store_565_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,4,235,0,0 ; movaps 0xeb04(%rip),%xmm8 # 2c970 <_sk_overlay_sse2_8bit+0x1263>
+ DB 68,15,40,5,4,235,0,0 ; movaps 0xeb04(%rip),%xmm8 # 2ceb0 <_sk_overlay_sse2_8bit+0x1263>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
DB 102,65,15,114,241,11 ; pslld $0xb,%xmm9
- DB 68,15,40,21,249,234,0,0 ; movaps 0xeaf9(%rip),%xmm10 # 2c980 <_sk_overlay_sse2_8bit+0x1273>
+ DB 68,15,40,21,249,234,0,0 ; movaps 0xeaf9(%rip),%xmm10 # 2cec0 <_sk_overlay_sse2_8bit+0x1273>
DB 68,15,89,209 ; mulps %xmm1,%xmm10
DB 102,69,15,91,210 ; cvtps2dq %xmm10,%xmm10
DB 102,65,15,114,242,5 ; pslld $0x5,%xmm10
@@ -28461,7 +28749,7 @@ _sk_store_565_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1dec9 <_sk_store_565_sse2+0x7b>
+ DB 117,10 ; jne 1e409 <_sk_store_565_sse2+0x7b>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28469,19 +28757,19 @@ _sk_store_565_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 1df01 <_sk_store_565_sse2+0xb3>
+ DB 116,38 ; je 1e441 <_sk_store_565_sse2+0xb3>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1def3 <_sk_store_565_sse2+0xa5>
+ DB 116,18 ; je 1e433 <_sk_store_565_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 1dec5 <_sk_store_565_sse2+0x77>
+ DB 117,222 ; jne 1e405 <_sk_store_565_sse2+0x77>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 1dec5 <_sk_store_565_sse2+0x77>
+ DB 235,196 ; jmp 1e405 <_sk_store_565_sse2+0x77>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 1dec5 <_sk_store_565_sse2+0x77>
+ DB 235,184 ; jmp 1e405 <_sk_store_565_sse2+0x77>
PUBLIC _sk_load_4444_sse2
_sk_load_4444_sse2 LABEL PROC
@@ -28493,45 +28781,45 @@ _sk_load_4444_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1df8a <_sk_load_4444_sse2+0x7d>
+ DB 117,98 ; jne 1e4ca <_sk_load_4444_sse2+0x7d>
DB 243,67,15,126,28,89 ; movq (%r9,%r11,2),%xmm3
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,86,234,0,0 ; movdqa 0xea56(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
+ DB 102,15,111,5,86,234,0,0 ; movdqa 0xea56(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,88,234,0,0 ; mulps 0xea58(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
- DB 102,15,111,13,96,234,0,0 ; movdqa 0xea60(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
+ DB 15,89,5,88,234,0,0 ; mulps 0xea58(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,96,234,0,0 ; movdqa 0xea60(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,98,234,0,0 ; mulps 0xea62(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
- DB 102,15,111,21,106,234,0,0 ; movdqa 0xea6a(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
+ DB 15,89,13,98,234,0,0 ; mulps 0xea62(%rip),%xmm1 # 2cf00 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,106,234,0,0 ; movdqa 0xea6a(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,108,234,0,0 ; mulps 0xea6c(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
- DB 102,15,219,29,116,234,0,0 ; pand 0xea74(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
+ DB 15,89,21,108,234,0,0 ; mulps 0xea6c(%rip),%xmm2 # 2cf20 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,116,234,0,0 ; pand 0xea74(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,122,234,0,0 ; mulps 0xea7a(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
+ DB 15,89,29,122,234,0,0 ; mulps 0xea7a(%rip),%xmm3 # 2cf40 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1dfc9 <_sk_load_4444_sse2+0xbc>
+ DB 116,50 ; je 1e509 <_sk_load_4444_sse2+0xbc>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1dfb6 <_sk_load_4444_sse2+0xa9>
+ DB 116,21 ; je 1e4f6 <_sk_load_4444_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 1df32 <_sk_load_4444_sse2+0x25>
+ DB 117,139 ; jne 1e472 <_sk_load_4444_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,112,216,69 ; pshufd $0x45,%xmm0,%xmm3
DB 102,67,15,110,4,89 ; movd (%r9,%r11,2),%xmm0
DB 102,15,97,192 ; punpcklwd %xmm0,%xmm0
DB 242,15,16,216 ; movsd %xmm0,%xmm3
- DB 233,105,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1e472 <_sk_load_4444_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 233,91,255,255,255 ; jmpq 1df32 <_sk_load_4444_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1e472 <_sk_load_4444_sse2+0x25>
PUBLIC _sk_load_4444_dst_sse2
_sk_load_4444_dst_sse2 LABEL PROC
@@ -28543,45 +28831,45 @@ _sk_load_4444_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e054 <_sk_load_4444_dst_sse2+0x7d>
+ DB 117,98 ; jne 1e594 <_sk_load_4444_dst_sse2+0x7d>
DB 243,67,15,126,60,89 ; movq (%r9,%r11,2),%xmm7
DB 102,15,97,248 ; punpcklwd %xmm0,%xmm7
- DB 102,15,111,37,140,233,0,0 ; movdqa 0xe98c(%rip),%xmm4 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
+ DB 102,15,111,37,140,233,0,0 ; movdqa 0xe98c(%rip),%xmm4 # 2ced0 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,231 ; pand %xmm7,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 15,89,37,142,233,0,0 ; mulps 0xe98e(%rip),%xmm4 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
- DB 102,15,111,45,150,233,0,0 ; movdqa 0xe996(%rip),%xmm5 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
+ DB 15,89,37,142,233,0,0 ; mulps 0xe98e(%rip),%xmm4 # 2cee0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,45,150,233,0,0 ; movdqa 0xe996(%rip),%xmm5 # 2cef0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,239 ; pand %xmm7,%xmm5
DB 15,91,237 ; cvtdq2ps %xmm5,%xmm5
- DB 15,89,45,152,233,0,0 ; mulps 0xe998(%rip),%xmm5 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
- DB 102,15,111,53,160,233,0,0 ; movdqa 0xe9a0(%rip),%xmm6 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
+ DB 15,89,45,152,233,0,0 ; mulps 0xe998(%rip),%xmm5 # 2cf00 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,53,160,233,0,0 ; movdqa 0xe9a0(%rip),%xmm6 # 2cf10 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,247 ; pand %xmm7,%xmm6
DB 15,91,246 ; cvtdq2ps %xmm6,%xmm6
- DB 15,89,53,162,233,0,0 ; mulps 0xe9a2(%rip),%xmm6 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
- DB 102,15,219,61,170,233,0,0 ; pand 0xe9aa(%rip),%xmm7 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
+ DB 15,89,53,162,233,0,0 ; mulps 0xe9a2(%rip),%xmm6 # 2cf20 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,61,170,233,0,0 ; pand 0xe9aa(%rip),%xmm7 # 2cf30 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,255 ; cvtdq2ps %xmm7,%xmm7
- DB 15,89,61,176,233,0,0 ; mulps 0xe9b0(%rip),%xmm7 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
+ DB 15,89,61,176,233,0,0 ; mulps 0xe9b0(%rip),%xmm7 # 2cf40 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,50 ; je 1e093 <_sk_load_4444_dst_sse2+0xbc>
+ DB 116,50 ; je 1e5d3 <_sk_load_4444_dst_sse2+0xbc>
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,21 ; je 1e080 <_sk_load_4444_dst_sse2+0xa9>
+ DB 116,21 ; je 1e5c0 <_sk_load_4444_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,139 ; jne 1dffc <_sk_load_4444_dst_sse2+0x25>
+ DB 117,139 ; jne 1e53c <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,68,89,4 ; movzwl 0x4(%r9,%r11,2),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,252,69 ; pshufd $0x45,%xmm4,%xmm7
DB 102,67,15,110,36,89 ; movd (%r9,%r11,2),%xmm4
DB 102,15,97,224 ; punpcklwd %xmm0,%xmm4
DB 242,15,16,252 ; movsd %xmm4,%xmm7
- DB 233,105,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25>
+ DB 233,105,255,255,255 ; jmpq 1e53c <_sk_load_4444_dst_sse2+0x25>
DB 67,15,183,4,89 ; movzwl (%r9,%r11,2),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,91,255,255,255 ; jmpq 1dffc <_sk_load_4444_dst_sse2+0x25>
+ DB 233,91,255,255,255 ; jmpq 1e53c <_sk_load_4444_dst_sse2+0x25>
PUBLIC _sk_gather_4444_sse2
_sk_gather_4444_sse2 LABEL PROC
@@ -28614,21 +28902,21 @@ _sk_gather_4444_sse2 LABEL PROC
DB 102,15,196,216,3 ; pinsrw $0x3,%eax,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,97,216 ; punpcklwd %xmm0,%xmm3
- DB 102,15,111,5,105,232,0,0 ; movdqa 0xe869(%rip),%xmm0 # 2c990 <_sk_overlay_sse2_8bit+0x1283>
+ DB 102,15,111,5,105,232,0,0 ; movdqa 0xe869(%rip),%xmm0 # 2ced0 <_sk_overlay_sse2_8bit+0x1283>
DB 102,15,219,195 ; pand %xmm3,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 15,89,5,107,232,0,0 ; mulps 0xe86b(%rip),%xmm0 # 2c9a0 <_sk_overlay_sse2_8bit+0x1293>
- DB 102,15,111,13,115,232,0,0 ; movdqa 0xe873(%rip),%xmm1 # 2c9b0 <_sk_overlay_sse2_8bit+0x12a3>
+ DB 15,89,5,107,232,0,0 ; mulps 0xe86b(%rip),%xmm0 # 2cee0 <_sk_overlay_sse2_8bit+0x1293>
+ DB 102,15,111,13,115,232,0,0 ; movdqa 0xe873(%rip),%xmm1 # 2cef0 <_sk_overlay_sse2_8bit+0x12a3>
DB 102,15,219,203 ; pand %xmm3,%xmm1
DB 15,91,201 ; cvtdq2ps %xmm1,%xmm1
- DB 15,89,13,117,232,0,0 ; mulps 0xe875(%rip),%xmm1 # 2c9c0 <_sk_overlay_sse2_8bit+0x12b3>
- DB 102,15,111,21,125,232,0,0 ; movdqa 0xe87d(%rip),%xmm2 # 2c9d0 <_sk_overlay_sse2_8bit+0x12c3>
+ DB 15,89,13,117,232,0,0 ; mulps 0xe875(%rip),%xmm1 # 2cf00 <_sk_overlay_sse2_8bit+0x12b3>
+ DB 102,15,111,21,125,232,0,0 ; movdqa 0xe87d(%rip),%xmm2 # 2cf10 <_sk_overlay_sse2_8bit+0x12c3>
DB 102,15,219,211 ; pand %xmm3,%xmm2
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
- DB 15,89,21,127,232,0,0 ; mulps 0xe87f(%rip),%xmm2 # 2c9e0 <_sk_overlay_sse2_8bit+0x12d3>
- DB 102,15,219,29,135,232,0,0 ; pand 0xe887(%rip),%xmm3 # 2c9f0 <_sk_overlay_sse2_8bit+0x12e3>
+ DB 15,89,21,127,232,0,0 ; mulps 0xe87f(%rip),%xmm2 # 2cf20 <_sk_overlay_sse2_8bit+0x12d3>
+ DB 102,15,219,29,135,232,0,0 ; pand 0xe887(%rip),%xmm3 # 2cf30 <_sk_overlay_sse2_8bit+0x12e3>
DB 15,91,219 ; cvtdq2ps %xmm3,%xmm3
- DB 15,89,29,141,232,0,0 ; mulps 0xe88d(%rip),%xmm3 # 2ca00 <_sk_overlay_sse2_8bit+0x12f3>
+ DB 15,89,29,141,232,0,0 ; mulps 0xe88d(%rip),%xmm3 # 2cf40 <_sk_overlay_sse2_8bit+0x12f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 91 ; pop %rbx
DB 255,224 ; jmpq *%rax
@@ -28642,7 +28930,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 76,99,218 ; movslq %edx,%r11
- DB 68,15,40,5,122,232,0,0 ; movaps 0xe87a(%rip),%xmm8 # 2ca10 <_sk_overlay_sse2_8bit+0x1303>
+ DB 68,15,40,5,122,232,0,0 ; movaps 0xe87a(%rip),%xmm8 # 2cf50 <_sk_overlay_sse2_8bit+0x1303>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28664,7 +28952,7 @@ _sk_store_4444_sse2 LABEL PROC
DB 102,65,15,114,224,16 ; psrad $0x10,%xmm8
DB 102,69,15,107,192 ; packssdw %xmm8,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1e207 <_sk_store_4444_sse2+0x8f>
+ DB 117,10 ; jne 1e747 <_sk_store_4444_sse2+0x8f>
DB 242,71,15,17,4,89 ; movsd %xmm8,(%r9,%r11,2)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -28672,19 +28960,19 @@ _sk_store_4444_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,38 ; je 1e23f <_sk_store_4444_sse2+0xc7>
+ DB 116,38 ; je 1e77f <_sk_store_4444_sse2+0xc7>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,18 ; je 1e231 <_sk_store_4444_sse2+0xb9>
+ DB 116,18 ; je 1e771 <_sk_store_4444_sse2+0xb9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,222 ; jne 1e203 <_sk_store_4444_sse2+0x8b>
+ DB 117,222 ; jne 1e743 <_sk_store_4444_sse2+0x8b>
DB 102,65,15,197,192,4 ; pextrw $0x4,%xmm8,%eax
DB 102,67,137,68,89,4 ; mov %ax,0x4(%r9,%r11,2)
DB 242,69,15,112,192,232 ; pshuflw $0xe8,%xmm8,%xmm8
DB 102,71,15,126,4,89 ; movd %xmm8,(%r9,%r11,2)
- DB 235,196 ; jmp 1e203 <_sk_store_4444_sse2+0x8b>
+ DB 235,196 ; jmp 1e743 <_sk_store_4444_sse2+0x8b>
DB 102,68,15,126,192 ; movd %xmm8,%eax
DB 102,67,137,4,89 ; mov %ax,(%r9,%r11,2)
- DB 235,184 ; jmp 1e203 <_sk_store_4444_sse2+0x8b>
+ DB 235,184 ; jmp 1e743 <_sk_store_4444_sse2+0x8b>
PUBLIC _sk_load_8888_sse2
_sk_load_8888_sse2 LABEL PROC
@@ -28696,13 +28984,13 @@ _sk_load_8888_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e2c9 <_sk_load_8888_sse2+0x7e>
+ DB 117,98 ; jne 1e809 <_sk_load_8888_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,21,139,227,0,0 ; movdqa 0xe38b(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,21,139,227,0,0 ; movdqa 0xe38b(%rip),%xmm2 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,199,228,0,0 ; movaps 0xe4c7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,199,228,0,0 ; movaps 0xe4c7(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28722,18 +29010,18 @@ _sk_load_8888_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e2ff <_sk_load_8888_sse2+0xb4>
+ DB 116,41 ; je 1e83f <_sk_load_8888_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e2f4 <_sk_load_8888_sse2+0xa9>
+ DB 116,19 ; je 1e834 <_sk_load_8888_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1e26d <_sk_load_8888_sse2+0x22>
+ DB 117,134 ; jne 1e7ad <_sk_load_8888_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e7ad <_sk_load_8888_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e26d <_sk_load_8888_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e7ad <_sk_load_8888_sse2+0x22>
PUBLIC _sk_load_8888_dst_sse2
_sk_load_8888_dst_sse2 LABEL PROC
@@ -28745,13 +29033,13 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e388 <_sk_load_8888_dst_sse2+0x7e>
+ DB 117,98 ; jne 1e8c8 <_sk_load_8888_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,53,204,226,0,0 ; movdqa 0xe2cc(%rip),%xmm6 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,53,204,226,0,0 ; movdqa 0xe2cc(%rip),%xmm6 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,225 ; movdqa %xmm9,%xmm4
DB 102,15,219,230 ; pand %xmm6,%xmm4
DB 15,91,228 ; cvtdq2ps %xmm4,%xmm4
- DB 68,15,40,5,8,228,0,0 ; movaps 0xe408(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,8,228,0,0 ; movaps 0xe408(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,224 ; mulps %xmm8,%xmm4
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28771,18 +29059,18 @@ _sk_load_8888_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e3be <_sk_load_8888_dst_sse2+0xb4>
+ DB 116,41 ; je 1e8fe <_sk_load_8888_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e3b3 <_sk_load_8888_dst_sse2+0xa9>
+ DB 116,19 ; je 1e8f3 <_sk_load_8888_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1e32c <_sk_load_8888_dst_sse2+0x22>
+ DB 117,134 ; jne 1e86c <_sk_load_8888_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1e86c <_sk_load_8888_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e32c <_sk_load_8888_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1e86c <_sk_load_8888_dst_sse2+0x22>
PUBLIC _sk_gather_8888_sse2
_sk_gather_8888_sse2 LABEL PROC
@@ -28814,11 +29102,11 @@ _sk_gather_8888_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,21,181,225,0,0 ; movdqa 0xe1b5(%rip),%xmm2 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,21,181,225,0,0 ; movdqa 0xe1b5(%rip),%xmm2 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,219,194 ; pand %xmm2,%xmm0
DB 15,91,192 ; cvtdq2ps %xmm0,%xmm0
- DB 68,15,40,5,241,226,0,0 ; movaps 0xe2f1(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,241,226,0,0 ; movaps 0xe2f1(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28846,7 +29134,7 @@ _sk_store_8888_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,113,225,0,0 ; movaps 0xe171(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,113,225,0,0 ; movaps 0xe171(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -28865,24 +29153,24 @@ _sk_store_8888_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1e51f <_sk_store_8888_sse2+0x7f>
+ DB 117,10 ; jne 1ea5f <_sk_store_8888_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 1e54d <_sk_store_8888_sse2+0xad>
+ DB 116,33 ; je 1ea8d <_sk_store_8888_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e545 <_sk_store_8888_sse2+0xa5>
+ DB 116,19 ; je 1ea85 <_sk_store_8888_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1e51b <_sk_store_8888_sse2+0x7b>
+ DB 117,227 ; jne 1ea5b <_sk_store_8888_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 1e51b <_sk_store_8888_sse2+0x7b>
+ DB 235,206 ; jmp 1ea5b <_sk_store_8888_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 1e51b <_sk_store_8888_sse2+0x7b>
+ DB 235,198 ; jmp 1ea5b <_sk_store_8888_sse2+0x7b>
PUBLIC _sk_load_bgra_sse2
_sk_load_bgra_sse2 LABEL PROC
@@ -28894,13 +29182,13 @@ _sk_load_bgra_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e5d3 <_sk_load_bgra_sse2+0x7e>
+ DB 117,98 ; jne 1eb13 <_sk_load_bgra_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,5,129,224,0,0 ; movdqa 0xe081(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,129,224,0,0 ; movdqa 0xe081(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,189,225,0,0 ; movaps 0xe1bd(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,189,225,0,0 ; movaps 0xe1bd(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -28920,18 +29208,18 @@ _sk_load_bgra_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e609 <_sk_load_bgra_sse2+0xb4>
+ DB 116,41 ; je 1eb49 <_sk_load_bgra_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e5fe <_sk_load_bgra_sse2+0xa9>
+ DB 116,19 ; je 1eb3e <_sk_load_bgra_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1e577 <_sk_load_bgra_sse2+0x22>
+ DB 117,134 ; jne 1eab7 <_sk_load_bgra_sse2+0x22>
DB 102,65,15,110,68,129,8 ; movd 0x8(%r9,%rax,4),%xmm0
DB 102,68,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1eab7 <_sk_load_bgra_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e577 <_sk_load_bgra_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1eab7 <_sk_load_bgra_sse2+0x22>
PUBLIC _sk_load_bgra_dst_sse2
_sk_load_bgra_dst_sse2 LABEL PROC
@@ -28943,13 +29231,13 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 117,98 ; jne 1e692 <_sk_load_bgra_dst_sse2+0x7e>
+ DB 117,98 ; jne 1ebd2 <_sk_load_bgra_dst_sse2+0x7e>
DB 243,69,15,111,12,129 ; movdqu (%r9,%rax,4),%xmm9
- DB 102,15,111,37,194,223,0,0 ; movdqa 0xdfc2(%rip),%xmm4 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,37,194,223,0,0 ; movdqa 0xdfc2(%rip),%xmm4 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 15,91,245 ; cvtdq2ps %xmm5,%xmm6
- DB 68,15,40,5,254,224,0,0 ; movaps 0xe0fe(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,254,224,0,0 ; movaps 0xe0fe(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,240 ; mulps %xmm8,%xmm6
DB 102,65,15,111,233 ; movdqa %xmm9,%xmm5
DB 102,15,114,213,8 ; psrld $0x8,%xmm5
@@ -28969,18 +29257,18 @@ _sk_load_bgra_dst_sse2 LABEL PROC
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,41 ; je 1e6c8 <_sk_load_bgra_dst_sse2+0xb4>
+ DB 116,41 ; je 1ec08 <_sk_load_bgra_dst_sse2+0xb4>
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e6bd <_sk_load_bgra_dst_sse2+0xa9>
+ DB 116,19 ; je 1ebfd <_sk_load_bgra_dst_sse2+0xa9>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,134 ; jne 1e636 <_sk_load_bgra_dst_sse2+0x22>
+ DB 117,134 ; jne 1eb76 <_sk_load_bgra_dst_sse2+0x22>
DB 102,65,15,110,100,129,8 ; movd 0x8(%r9,%rax,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,69,15,18,12,129 ; movlpd (%r9,%rax,4),%xmm9
- DB 233,110,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,110,255,255,255 ; jmpq 1eb76 <_sk_load_bgra_dst_sse2+0x22>
DB 102,69,15,110,12,129 ; movd (%r9,%rax,4),%xmm9
- DB 233,99,255,255,255 ; jmpq 1e636 <_sk_load_bgra_dst_sse2+0x22>
+ DB 233,99,255,255,255 ; jmpq 1eb76 <_sk_load_bgra_dst_sse2+0x22>
PUBLIC _sk_gather_bgra_sse2
_sk_gather_bgra_sse2 LABEL PROC
@@ -29012,11 +29300,11 @@ _sk_gather_bgra_sse2 LABEL PROC
DB 102,67,15,110,12,145 ; movd (%r9,%r10,4),%xmm1
DB 102,68,15,98,201 ; punpckldq %xmm1,%xmm9
DB 102,68,15,98,200 ; punpckldq %xmm0,%xmm9
- DB 102,15,111,5,171,222,0,0 ; movdqa 0xdeab(%rip),%xmm0 # 2c600 <_sk_overlay_sse2_8bit+0xef3>
+ DB 102,15,111,5,171,222,0,0 ; movdqa 0xdeab(%rip),%xmm0 # 2cb40 <_sk_overlay_sse2_8bit+0xef3>
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,219,200 ; pand %xmm0,%xmm1
DB 15,91,209 ; cvtdq2ps %xmm1,%xmm2
- DB 68,15,40,5,231,223,0,0 ; movaps 0xdfe7(%rip),%xmm8 # 2c750 <_sk_overlay_sse2_8bit+0x1043>
+ DB 68,15,40,5,231,223,0,0 ; movaps 0xdfe7(%rip),%xmm8 # 2cc90 <_sk_overlay_sse2_8bit+0x1043>
DB 65,15,89,208 ; mulps %xmm8,%xmm2
DB 102,65,15,111,201 ; movdqa %xmm9,%xmm1
DB 102,15,114,209,8 ; psrld $0x8,%xmm1
@@ -29044,7 +29332,7 @@ _sk_store_bgra_sse2 LABEL PROC
DB 73,193,225,2 ; shl $0x2,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 68,15,40,5,103,222,0,0 ; movaps 0xde67(%rip),%xmm8 # 2c630 <_sk_overlay_sse2_8bit+0xf23>
+ DB 68,15,40,5,103,222,0,0 ; movaps 0xde67(%rip),%xmm8 # 2cb70 <_sk_overlay_sse2_8bit+0xf23>
DB 68,15,40,202 ; movaps %xmm2,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 102,69,15,91,201 ; cvtps2dq %xmm9,%xmm9
@@ -29063,24 +29351,24 @@ _sk_store_bgra_sse2 LABEL PROC
DB 102,69,15,235,193 ; por %xmm9,%xmm8
DB 102,69,15,235,194 ; por %xmm10,%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,10 ; jne 1e829 <_sk_store_bgra_sse2+0x7f>
+ DB 117,10 ; jne 1ed69 <_sk_store_bgra_sse2+0x7f>
DB 243,69,15,127,4,129 ; movdqu %xmm8,(%r9,%rax,4)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 69,137,194 ; mov %r8d,%r10d
DB 65,128,226,3 ; and $0x3,%r10b
DB 65,128,250,1 ; cmp $0x1,%r10b
- DB 116,33 ; je 1e857 <_sk_store_bgra_sse2+0xad>
+ DB 116,33 ; je 1ed97 <_sk_store_bgra_sse2+0xad>
DB 65,128,250,2 ; cmp $0x2,%r10b
- DB 116,19 ; je 1e84f <_sk_store_bgra_sse2+0xa5>
+ DB 116,19 ; je 1ed8f <_sk_store_bgra_sse2+0xa5>
DB 65,128,250,3 ; cmp $0x3,%r10b
- DB 117,227 ; jne 1e825 <_sk_store_bgra_sse2+0x7b>
+ DB 117,227 ; jne 1ed65 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,112,200,78 ; pshufd $0x4e,%xmm8,%xmm9
DB 102,69,15,126,76,129,8 ; movd %xmm9,0x8(%r9,%rax,4)
DB 102,69,15,214,4,129 ; movq %xmm8,(%r9,%rax,4)
- DB 235,206 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b>
+ DB 235,206 ; jmp 1ed65 <_sk_store_bgra_sse2+0x7b>
DB 102,69,15,126,4,129 ; movd %xmm8,(%r9,%rax,4)
- DB 235,198 ; jmp 1e825 <_sk_store_bgra_sse2+0x7b>
+ DB 235,198 ; jmp 1ed65 <_sk_store_bgra_sse2+0x7b>
PUBLIC _sk_load_f16_sse2
_sk_load_f16_sse2 LABEL PROC
@@ -29092,7 +29380,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 1e9e1 <_sk_load_f16_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1ef21 <_sk_load_f16_sse2+0x182>
DB 102,65,15,16,4,193 ; movupd (%r9,%rax,8),%xmm0
DB 102,65,15,16,76,193,16 ; movupd 0x10(%r9,%rax,8),%xmm1
DB 102,68,15,40,192 ; movapd %xmm0,%xmm8
@@ -29104,7 +29392,7 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,95,225,0,0 ; movdqa 0xe15f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
+ DB 102,68,15,111,13,95,225,0,0 ; movdqa 0xe15f(%rip),%xmm9 # 2cf60 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -29112,11 +29400,11 @@ _sk_load_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,84,225,0,0 ; movdqa 0xe154(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
+ DB 102,68,15,111,29,84,225,0,0 ; movdqa 0xe154(%rip),%xmm11 # 2cf80 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,86,225,0,0 ; movdqa 0xe156(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 102,68,15,111,37,86,225,0,0 ; movdqa 0xe156(%rip),%xmm12 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,249,226,0,0 ; movdqa 0xe2f9(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
+ DB 102,15,111,29,249,226,0,0 ; movdqa 0xe2f9(%rip),%xmm3 # 2d140 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29164,17 +29452,17 @@ _sk_load_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,193 ; movsd (%r9,%rax,8),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1e9fe <_sk_load_f16_sse2+0x19f>
+ DB 117,17 ; jne 1ef3e <_sk_load_f16_sse2+0x19f>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,142,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1edcc <_sk_load_f16_sse2+0x2d>
DB 102,65,15,22,68,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 1e88c <_sk_load_f16_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1edcc <_sk_load_f16_sse2+0x2d>
DB 242,65,15,16,76,193,16 ; movsd 0x10(%r9,%rax,8),%xmm1
- DB 233,109,254,255,255 ; jmpq 1e88c <_sk_load_f16_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1edcc <_sk_load_f16_sse2+0x2d>
PUBLIC _sk_load_f16_dst_sse2
_sk_load_f16_dst_sse2 LABEL PROC
@@ -29186,7 +29474,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,98,1,0,0 ; jne 1eba1 <_sk_load_f16_dst_sse2+0x182>
+ DB 15,133,98,1,0,0 ; jne 1f0e1 <_sk_load_f16_dst_sse2+0x182>
DB 102,65,15,16,36,193 ; movupd (%r9,%rax,8),%xmm4
DB 102,65,15,16,108,193,16 ; movupd 0x10(%r9,%rax,8),%xmm5
DB 102,68,15,40,196 ; movapd %xmm4,%xmm8
@@ -29198,7 +29486,7 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,238 ; movdqa %xmm14,%xmm5
DB 102,65,15,97,234 ; punpcklwd %xmm10,%xmm5
- DB 102,68,15,111,13,159,223,0,0 ; movdqa 0xdf9f(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
+ DB 102,68,15,111,13,159,223,0,0 ; movdqa 0xdf9f(%rip),%xmm9 # 2cf60 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,229 ; movdqa %xmm5,%xmm4
DB 102,65,15,219,225 ; pand %xmm9,%xmm4
DB 102,15,239,236 ; pxor %xmm4,%xmm5
@@ -29206,11 +29494,11 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 102,68,15,111,237 ; movdqa %xmm5,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,236 ; por %xmm4,%xmm13
- DB 102,68,15,111,29,148,223,0,0 ; movdqa 0xdf94(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
+ DB 102,68,15,111,29,148,223,0,0 ; movdqa 0xdf94(%rip),%xmm11 # 2cf80 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,150,223,0,0 ; movdqa 0xdf96(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 102,68,15,111,37,150,223,0,0 ; movdqa 0xdf96(%rip),%xmm12 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,236 ; pxor %xmm12,%xmm5
- DB 102,15,111,61,57,225,0,0 ; movdqa 0xe139(%rip),%xmm7 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
+ DB 102,15,111,61,57,225,0,0 ; movdqa 0xe139(%rip),%xmm7 # 2d140 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,231 ; movdqa %xmm7,%xmm4
DB 102,15,102,229 ; pcmpgtd %xmm5,%xmm4
DB 102,65,15,223,229 ; pandn %xmm13,%xmm4
@@ -29258,17 +29546,17 @@ _sk_load_f16_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,36,193 ; movsd (%r9,%rax,8),%xmm4
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1ebbe <_sk_load_f16_dst_sse2+0x19f>
+ DB 117,17 ; jne 1f0fe <_sk_load_f16_dst_sse2+0x19f>
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 102,15,20,229 ; unpcklpd %xmm5,%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
- DB 233,142,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,142,254,255,255 ; jmpq 1ef8c <_sk_load_f16_dst_sse2+0x2d>
DB 102,65,15,22,100,193,8 ; movhpd 0x8(%r9,%rax,8),%xmm4
DB 102,15,87,237 ; xorpd %xmm5,%xmm5
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,121,254,255,255 ; jb 1ea4c <_sk_load_f16_dst_sse2+0x2d>
+ DB 15,130,121,254,255,255 ; jb 1ef8c <_sk_load_f16_dst_sse2+0x2d>
DB 242,65,15,16,108,193,16 ; movsd 0x10(%r9,%rax,8),%xmm5
- DB 233,109,254,255,255 ; jmpq 1ea4c <_sk_load_f16_dst_sse2+0x2d>
+ DB 233,109,254,255,255 ; jmpq 1ef8c <_sk_load_f16_dst_sse2+0x2d>
PUBLIC _sk_gather_f16_sse2
_sk_gather_f16_sse2 LABEL PROC
@@ -29308,7 +29596,7 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,97,202 ; punpcklwd %xmm10,%xmm1
- DB 102,68,15,111,13,152,221,0,0 ; movdqa 0xdd98(%rip),%xmm9 # 2ca20 <_sk_overlay_sse2_8bit+0x1313>
+ DB 102,68,15,111,13,152,221,0,0 ; movdqa 0xdd98(%rip),%xmm9 # 2cf60 <_sk_overlay_sse2_8bit+0x1313>
DB 102,15,111,193 ; movdqa %xmm1,%xmm0
DB 102,65,15,219,193 ; pand %xmm9,%xmm0
DB 102,15,239,200 ; pxor %xmm0,%xmm1
@@ -29316,11 +29604,11 @@ _sk_gather_f16_sse2 LABEL PROC
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,65,15,114,245,13 ; pslld $0xd,%xmm13
DB 102,68,15,235,232 ; por %xmm0,%xmm13
- DB 102,68,15,111,29,141,221,0,0 ; movdqa 0xdd8d(%rip),%xmm11 # 2ca40 <_sk_overlay_sse2_8bit+0x1333>
+ DB 102,68,15,111,29,141,221,0,0 ; movdqa 0xdd8d(%rip),%xmm11 # 2cf80 <_sk_overlay_sse2_8bit+0x1333>
DB 102,69,15,254,235 ; paddd %xmm11,%xmm13
- DB 102,68,15,111,37,143,221,0,0 ; movdqa 0xdd8f(%rip),%xmm12 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 102,68,15,111,37,143,221,0,0 ; movdqa 0xdd8f(%rip),%xmm12 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 102,65,15,239,204 ; pxor %xmm12,%xmm1
- DB 102,15,111,29,50,223,0,0 ; movdqa 0xdf32(%rip),%xmm3 # 2cc00 <_sk_overlay_sse2_8bit+0x14f3>
+ DB 102,15,111,29,50,223,0,0 ; movdqa 0xdf32(%rip),%xmm3 # 2d140 <_sk_overlay_sse2_8bit+0x14f3>
DB 102,15,111,195 ; movdqa %xmm3,%xmm0
DB 102,15,102,193 ; pcmpgtd %xmm1,%xmm0
DB 102,65,15,223,197 ; pandn %xmm13,%xmm0
@@ -29377,17 +29665,17 @@ _sk_store_f16_sse2 LABEL PROC
DB 73,193,225,3 ; shl $0x3,%r9
DB 76,3,8 ; add (%rax),%r9
DB 72,99,194 ; movslq %edx,%rax
- DB 102,68,15,111,21,135,220,0,0 ; movdqa 0xdc87(%rip),%xmm10 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 102,68,15,111,21,135,220,0,0 ; movdqa 0xdc87(%rip),%xmm10 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 102,68,15,111,224 ; movdqa %xmm0,%xmm12
DB 102,69,15,219,226 ; pand %xmm10,%xmm12
DB 102,68,15,111,232 ; movdqa %xmm0,%xmm13
DB 102,69,15,239,236 ; pxor %xmm12,%xmm13
- DB 102,68,15,111,13,122,220,0,0 ; movdqa 0xdc7a(%rip),%xmm9 # 2ca60 <_sk_overlay_sse2_8bit+0x1353>
+ DB 102,68,15,111,13,122,220,0,0 ; movdqa 0xdc7a(%rip),%xmm9 # 2cfa0 <_sk_overlay_sse2_8bit+0x1353>
DB 102,65,15,114,212,16 ; psrld $0x10,%xmm12
DB 102,69,15,111,193 ; movdqa %xmm9,%xmm8
DB 102,69,15,102,197 ; pcmpgtd %xmm13,%xmm8
DB 102,65,15,114,213,13 ; psrld $0xd,%xmm13
- DB 102,68,15,111,29,107,220,0,0 ; movdqa 0xdc6b(%rip),%xmm11 # 2ca70 <_sk_overlay_sse2_8bit+0x1363>
+ DB 102,68,15,111,29,107,220,0,0 ; movdqa 0xdc6b(%rip),%xmm11 # 2cfb0 <_sk_overlay_sse2_8bit+0x1363>
DB 102,69,15,235,227 ; por %xmm11,%xmm12
DB 102,69,15,254,229 ; paddd %xmm13,%xmm12
DB 102,65,15,114,244,16 ; pslld $0x10,%xmm12
@@ -29439,7 +29727,7 @@ _sk_store_f16_sse2 LABEL PROC
DB 102,69,15,111,200 ; movdqa %xmm8,%xmm9
DB 102,69,15,98,204 ; punpckldq %xmm12,%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 1ef27 <_sk_store_f16_sse2+0x17e>
+ DB 117,21 ; jne 1f467 <_sk_store_f16_sse2+0x17e>
DB 69,15,17,12,193 ; movups %xmm9,(%r9,%rax,8)
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 243,69,15,127,68,193,16 ; movdqu %xmm8,0x10(%r9,%rax,8)
@@ -29447,13 +29735,13 @@ _sk_store_f16_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,12,193 ; movq %xmm9,(%r9,%rax,8)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 1ef23 <_sk_store_f16_sse2+0x17a>
+ DB 116,240 ; je 1f463 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,23,76,193,8 ; movhpd %xmm9,0x8(%r9,%rax,8)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 1ef23 <_sk_store_f16_sse2+0x17a>
+ DB 114,227 ; jb 1f463 <_sk_store_f16_sse2+0x17a>
DB 102,69,15,106,196 ; punpckhdq %xmm12,%xmm8
DB 102,69,15,214,68,193,16 ; movq %xmm8,0x10(%r9,%rax,8)
- DB 235,213 ; jmp 1ef23 <_sk_store_f16_sse2+0x17a>
+ DB 235,213 ; jmp 1f463 <_sk_store_f16_sse2+0x17a>
PUBLIC _sk_load_u16_be_sse2
_sk_load_u16_be_sse2 LABEL PROC
@@ -29466,7 +29754,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,190,0,0,0 ; jne 1f033 <_sk_load_u16_be_sse2+0xe5>
+ DB 15,133,190,0,0,0 ; jne 1f573 <_sk_load_u16_be_sse2+0xe5>
DB 102,65,15,16,4,65 ; movupd (%r9,%rax,2),%xmm0
DB 102,65,15,16,76,65,16 ; movupd 0x10(%r9,%rax,2),%xmm1
DB 102,15,40,208 ; movapd %xmm0,%xmm2
@@ -29483,7 +29771,7 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 102,65,15,97,201 ; punpcklwd %xmm9,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,5,26,216,0,0 ; movaps 0xd81a(%rip),%xmm8 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
+ DB 68,15,40,5,26,216,0,0 ; movaps 0xd81a(%rip),%xmm8 # 2cd20 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29511,17 +29799,17 @@ _sk_load_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 242,65,15,16,4,65 ; movsd (%r9,%rax,2),%xmm0
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,17 ; jne 1f050 <_sk_load_u16_be_sse2+0x102>
+ DB 117,17 ; jne 1f590 <_sk_load_u16_be_sse2+0x102>
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 102,15,20,193 ; unpcklpd %xmm1,%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
- DB 233,50,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34>
+ DB 233,50,255,255,255 ; jmpq 1f4c2 <_sk_load_u16_be_sse2+0x34>
DB 102,65,15,22,68,65,8 ; movhpd 0x8(%r9,%rax,2),%xmm0
DB 102,15,87,201 ; xorpd %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 15,130,29,255,255,255 ; jb 1ef82 <_sk_load_u16_be_sse2+0x34>
+ DB 15,130,29,255,255,255 ; jb 1f4c2 <_sk_load_u16_be_sse2+0x34>
DB 242,65,15,16,76,65,16 ; movsd 0x10(%r9,%rax,2),%xmm1
- DB 233,17,255,255,255 ; jmpq 1ef82 <_sk_load_u16_be_sse2+0x34>
+ DB 233,17,255,255,255 ; jmpq 1f4c2 <_sk_load_u16_be_sse2+0x34>
PUBLIC _sk_load_rgb_u16_be_sse2
_sk_load_rgb_u16_be_sse2 LABEL PROC
@@ -29536,7 +29824,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 72,141,4,64 ; lea (%rax,%rax,2),%rax
DB 72,193,248,32 ; sar $0x20,%rax
DB 77,133,192 ; test %r8,%r8
- DB 15,133,175,0,0,0 ; jne 1f14b <_sk_load_rgb_u16_be_sse2+0xda>
+ DB 15,133,175,0,0,0 ; jne 1f68b <_sk_load_rgb_u16_be_sse2+0xda>
DB 243,65,15,111,20,65 ; movdqu (%r9,%rax,2),%xmm2
DB 243,65,15,111,92,65,8 ; movdqu 0x8(%r9,%rax,2),%xmm3
DB 102,15,115,219,4 ; psrldq $0x4,%xmm3
@@ -29557,7 +29845,7 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,65,15,97,200 ; punpcklwd %xmm8,%xmm1
DB 15,91,193 ; cvtdq2ps %xmm1,%xmm0
- DB 68,15,40,13,224,214,0,0 ; movaps 0xd6e0(%rip),%xmm9 # 2c7e0 <_sk_overlay_sse2_8bit+0x10d3>
+ DB 68,15,40,13,224,214,0,0 ; movaps 0xd6e0(%rip),%xmm9 # 2cd20 <_sk_overlay_sse2_8bit+0x10d3>
DB 65,15,89,193 ; mulps %xmm9,%xmm0
DB 102,15,111,203 ; movdqa %xmm3,%xmm1
DB 102,15,113,241,8 ; psllw $0x8,%xmm1
@@ -29574,27 +29862,27 @@ _sk_load_rgb_u16_be_sse2 LABEL PROC
DB 15,91,210 ; cvtdq2ps %xmm2,%xmm2
DB 65,15,89,209 ; mulps %xmm9,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,7,212,0,0 ; movaps 0xd407(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,7,212,0,0 ; movaps 0xd407(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 255,224 ; jmpq *%rax
DB 102,65,15,110,20,65 ; movd (%r9,%rax,2),%xmm2
DB 102,65,15,196,84,65,4,2 ; pinsrw $0x2,0x4(%r9,%rax,2),%xmm2
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,13 ; jne 1f170 <_sk_load_rgb_u16_be_sse2+0xff>
+ DB 117,13 ; jne 1f6b0 <_sk_load_rgb_u16_be_sse2+0xff>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,239,192 ; pxor %xmm0,%xmm0
- DB 233,80,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,80,255,255,255 ; jmpq 1f600 <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,65,15,110,68,65,6 ; movd 0x6(%r9,%rax,2),%xmm0
DB 102,65,15,196,68,65,10,2 ; pinsrw $0x2,0xa(%r9,%rax,2),%xmm0
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,24 ; jb 1f1a1 <_sk_load_rgb_u16_be_sse2+0x130>
+ DB 114,24 ; jb 1f6e1 <_sk_load_rgb_u16_be_sse2+0x130>
DB 102,65,15,110,92,65,12 ; movd 0xc(%r9,%rax,2),%xmm3
DB 102,65,15,196,92,65,16,2 ; pinsrw $0x2,0x10(%r9,%rax,2),%xmm3
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 233,31,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,31,255,255,255 ; jmpq 1f600 <_sk_load_rgb_u16_be_sse2+0x4f>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
- DB 233,22,255,255,255 ; jmpq 1f0c0 <_sk_load_rgb_u16_be_sse2+0x4f>
+ DB 233,22,255,255,255 ; jmpq 1f600 <_sk_load_rgb_u16_be_sse2+0x4f>
PUBLIC _sk_store_u16_be_sse2
_sk_store_u16_be_sse2 LABEL PROC
@@ -29606,7 +29894,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 77,1,201 ; add %r9,%r9
DB 76,3,8 ; add (%rax),%r9
DB 73,99,194 ; movslq %r10d,%rax
- DB 68,15,40,21,176,216,0,0 ; movaps 0xd8b0(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0x1373>
+ DB 68,15,40,21,176,216,0,0 ; movaps 0xd8b0(%rip),%xmm10 # 2cfc0 <_sk_overlay_sse2_8bit+0x1373>
DB 68,15,40,192 ; movaps %xmm0,%xmm8
DB 69,15,89,194 ; mulps %xmm10,%xmm8
DB 102,69,15,91,192 ; cvtps2dq %xmm8,%xmm8
@@ -29651,7 +29939,7 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 102,69,15,111,208 ; movdqa %xmm8,%xmm10
DB 102,69,15,98,209 ; punpckldq %xmm9,%xmm10
DB 77,133,192 ; test %r8,%r8
- DB 117,21 ; jne 1f2ca <_sk_store_u16_be_sse2+0x120>
+ DB 117,21 ; jne 1f80a <_sk_store_u16_be_sse2+0x120>
DB 69,15,17,20,65 ; movups %xmm10,(%r9,%rax,2)
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 243,69,15,127,68,65,16 ; movdqu %xmm8,0x10(%r9,%rax,2)
@@ -29659,13 +29947,13 @@ _sk_store_u16_be_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 102,69,15,214,20,65 ; movq %xmm10,(%r9,%rax,2)
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,240 ; je 1f2c6 <_sk_store_u16_be_sse2+0x11c>
+ DB 116,240 ; je 1f806 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,23,84,65,8 ; movhpd %xmm10,0x8(%r9,%rax,2)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,227 ; jb 1f2c6 <_sk_store_u16_be_sse2+0x11c>
+ DB 114,227 ; jb 1f806 <_sk_store_u16_be_sse2+0x11c>
DB 102,69,15,106,193 ; punpckhdq %xmm9,%xmm8
DB 102,69,15,214,68,65,16 ; movq %xmm8,0x10(%r9,%rax,2)
- DB 235,213 ; jmp 1f2c6 <_sk_store_u16_be_sse2+0x11c>
+ DB 235,213 ; jmp 1f806 <_sk_store_u16_be_sse2+0x11c>
PUBLIC _sk_load_f32_sse2
_sk_load_f32_sse2 LABEL PROC
@@ -29679,7 +29967,7 @@ _sk_load_f32_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1f35c <_sk_load_f32_sse2+0x6b>
+ DB 117,66 ; jne 1f89c <_sk_load_f32_sse2+0x6b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -29699,17 +29987,17 @@ _sk_load_f32_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1f36e <_sk_load_f32_sse2+0x7d>
+ DB 117,8 ; jne 1f8ae <_sk_load_f32_sse2+0x7d>
DB 15,87,219 ; xorps %xmm3,%xmm3
DB 15,87,192 ; xorps %xmm0,%xmm0
- DB 235,190 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
+ DB 235,190 ; jmp 1f86c <_sk_load_f32_sse2+0x3b>
DB 65,15,16,68,129,16 ; movups 0x10(%r9,%rax,4),%xmm0
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1f382 <_sk_load_f32_sse2+0x91>
+ DB 114,8 ; jb 1f8c2 <_sk_load_f32_sse2+0x91>
DB 65,15,16,92,129,32 ; movups 0x20(%r9,%rax,4),%xmm3
- DB 235,170 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
+ DB 235,170 ; jmp 1f86c <_sk_load_f32_sse2+0x3b>
DB 15,87,219 ; xorps %xmm3,%xmm3
- DB 235,165 ; jmp 1f32c <_sk_load_f32_sse2+0x3b>
+ DB 235,165 ; jmp 1f86c <_sk_load_f32_sse2+0x3b>
PUBLIC _sk_load_f32_dst_sse2
_sk_load_f32_dst_sse2 LABEL PROC
@@ -29723,7 +30011,7 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 73,99,194 ; movslq %r10d,%rax
DB 69,15,16,4,129 ; movups (%r9,%rax,4),%xmm8
DB 77,133,192 ; test %r8,%r8
- DB 117,66 ; jne 1f3f2 <_sk_load_f32_dst_sse2+0x6b>
+ DB 117,66 ; jne 1f932 <_sk_load_f32_dst_sse2+0x6b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
DB 69,15,16,76,129,48 ; movups 0x30(%r9,%rax,4),%xmm9
@@ -29743,17 +30031,17 @@ _sk_load_f32_dst_sse2 LABEL PROC
DB 255,224 ; jmpq *%rax
DB 69,15,87,201 ; xorps %xmm9,%xmm9
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 117,8 ; jne 1f404 <_sk_load_f32_dst_sse2+0x7d>
+ DB 117,8 ; jne 1f944 <_sk_load_f32_dst_sse2+0x7d>
DB 15,87,255 ; xorps %xmm7,%xmm7
DB 15,87,228 ; xorps %xmm4,%xmm4
- DB 235,190 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,190 ; jmp 1f902 <_sk_load_f32_dst_sse2+0x3b>
DB 65,15,16,100,129,16 ; movups 0x10(%r9,%rax,4),%xmm4
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,8 ; jb 1f418 <_sk_load_f32_dst_sse2+0x91>
+ DB 114,8 ; jb 1f958 <_sk_load_f32_dst_sse2+0x91>
DB 65,15,16,124,129,32 ; movups 0x20(%r9,%rax,4),%xmm7
- DB 235,170 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,170 ; jmp 1f902 <_sk_load_f32_dst_sse2+0x3b>
DB 15,87,255 ; xorps %xmm7,%xmm7
- DB 235,165 ; jmp 1f3c2 <_sk_load_f32_dst_sse2+0x3b>
+ DB 235,165 ; jmp 1f902 <_sk_load_f32_dst_sse2+0x3b>
PUBLIC _sk_store_f32_sse2
_sk_store_f32_sse2 LABEL PROC
@@ -29780,7 +30068,7 @@ _sk_store_f32_sse2 LABEL PROC
DB 102,69,15,20,203 ; unpcklpd %xmm11,%xmm9
DB 102,69,15,17,36,129 ; movupd %xmm12,(%r9,%rax,4)
DB 77,133,192 ; test %r8,%r8
- DB 117,29 ; jne 1f49a <_sk_store_f32_sse2+0x7d>
+ DB 117,29 ; jne 1f9da <_sk_store_f32_sse2+0x7d>
DB 102,69,15,21,211 ; unpckhpd %xmm11,%xmm10
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
@@ -29788,12 +30076,12 @@ _sk_store_f32_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 73,131,248,1 ; cmp $0x1,%r8
- DB 116,246 ; je 1f496 <_sk_store_f32_sse2+0x79>
+ DB 116,246 ; je 1f9d6 <_sk_store_f32_sse2+0x79>
DB 69,15,17,68,129,16 ; movups %xmm8,0x10(%r9,%rax,4)
DB 73,131,248,3 ; cmp $0x3,%r8
- DB 114,234 ; jb 1f496 <_sk_store_f32_sse2+0x79>
+ DB 114,234 ; jb 1f9d6 <_sk_store_f32_sse2+0x79>
DB 102,69,15,17,76,129,32 ; movupd %xmm9,0x20(%r9,%rax,4)
- DB 235,225 ; jmp 1f496 <_sk_store_f32_sse2+0x79>
+ DB 235,225 ; jmp 1f9d6 <_sk_store_f32_sse2+0x79>
PUBLIC _sk_clamp_x_sse2
_sk_clamp_x_sse2 LABEL PROC
@@ -29833,7 +30121,7 @@ _sk_repeat_x_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,29,208,0,0 ; andps 0xd01d(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,84,21,29,208,0,0 ; andps 0xd01d(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -29857,7 +30145,7 @@ _sk_repeat_y_sse2 LABEL PROC
DB 243,69,15,91,194 ; cvttps2dq %xmm10,%xmm8
DB 69,15,91,216 ; cvtdq2ps %xmm8,%xmm11
DB 69,15,194,211,1 ; cmpltps %xmm11,%xmm10
- DB 68,15,84,21,195,207,0,0 ; andps 0xcfc3(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,84,21,195,207,0,0 ; andps 0xcfc3(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,218 ; subps %xmm10,%xmm11
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
@@ -29881,13 +30169,13 @@ _sk_mirror_x_sse2 LABEL PROC
DB 65,15,92,193 ; subps %xmm9,%xmm0
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,144,197,0,0 ; mulss 0xc590(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,29,144,197,0,0 ; mulss 0xc590(%rip),%xmm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,216 ; mulps %xmm0,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,73,207,0,0 ; andps 0xcf49(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,84,29,73,207,0,0 ; andps 0xcf49(%rip),%xmm11 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -29914,13 +30202,13 @@ _sk_mirror_y_sse2 LABEL PROC
DB 65,15,92,201 ; subps %xmm9,%xmm1
DB 243,69,15,88,210 ; addss %xmm10,%xmm10
DB 69,15,198,210,0 ; shufps $0x0,%xmm10,%xmm10
- DB 243,68,15,89,29,11,197,0,0 ; mulss 0xc50b(%rip),%xmm11 # 2bb78 <_sk_overlay_sse2_8bit+0x46b>
+ DB 243,68,15,89,29,11,197,0,0 ; mulss 0xc50b(%rip),%xmm11 # 2c0b8 <_sk_overlay_sse2_8bit+0x46b>
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 68,15,89,217 ; mulps %xmm1,%xmm11
DB 243,69,15,91,195 ; cvttps2dq %xmm11,%xmm8
DB 69,15,91,224 ; cvtdq2ps %xmm8,%xmm12
DB 69,15,194,220,1 ; cmpltps %xmm12,%xmm11
- DB 68,15,84,29,196,206,0,0 ; andps 0xcec4(%rip),%xmm11 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,84,29,196,206,0,0 ; andps 0xcec4(%rip),%xmm11 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 69,15,92,227 ; subps %xmm11,%xmm12
DB 69,15,89,226 ; mulps %xmm10,%xmm12
@@ -29941,7 +30229,7 @@ PUBLIC _sk_clamp_x_1_sse2
_sk_clamp_x_1_sse2 LABEL PROC
DB 69,15,87,192 ; xorps %xmm8,%xmm8
DB 68,15,95,192 ; maxps %xmm0,%xmm8
- DB 68,15,93,5,123,206,0,0 ; minps 0xce7b(%rip),%xmm8 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,93,5,123,206,0,0 ; minps 0xce7b(%rip),%xmm8 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 65,15,40,192 ; movaps %xmm8,%xmm0
DB 255,224 ; jmpq *%rax
@@ -29952,7 +30240,7 @@ _sk_repeat_x_1_sse2 LABEL PROC
DB 69,15,91,192 ; cvtdq2ps %xmm8,%xmm8
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,194,200,1 ; cmpltps %xmm8,%xmm9
- DB 68,15,84,13,89,206,0,0 ; andps 0xce59(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,84,13,89,206,0,0 ; andps 0xce59(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,193 ; subps %xmm9,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -29960,14 +30248,14 @@ _sk_repeat_x_1_sse2 LABEL PROC
PUBLIC _sk_mirror_x_1_sse2
_sk_mirror_x_1_sse2 LABEL PROC
- DB 68,15,40,5,165,206,0,0 ; movaps 0xcea5(%rip),%xmm8 # 2c5b0 <_sk_overlay_sse2_8bit+0xea3>
+ DB 68,15,40,5,165,206,0,0 ; movaps 0xcea5(%rip),%xmm8 # 2caf0 <_sk_overlay_sse2_8bit+0xea3>
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,13,41,206,0,0 ; movaps 0xce29(%rip),%xmm9 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,13,41,206,0,0 ; movaps 0xce29(%rip),%xmm9 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,89,200 ; mulps %xmm0,%xmm9
DB 243,69,15,91,209 ; cvttps2dq %xmm9,%xmm10
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,84,13,31,206,0,0 ; andps 0xce1f(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,84,13,31,206,0,0 ; andps 0xce1f(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,87,219 ; xorps %xmm11,%xmm11
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,88,210 ; addps %xmm10,%xmm10
@@ -29981,10 +30269,10 @@ _sk_mirror_x_1_sse2 LABEL PROC
PUBLIC _sk_luminance_to_alpha_sse2
_sk_luminance_to_alpha_sse2 LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
- DB 15,89,5,53,211,0,0 ; mulps 0xd335(%rip),%xmm0 # 2ca90 <_sk_overlay_sse2_8bit+0x1383>
- DB 15,89,13,62,211,0,0 ; mulps 0xd33e(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0x1393>
+ DB 15,89,5,53,211,0,0 ; mulps 0xd335(%rip),%xmm0 # 2cfd0 <_sk_overlay_sse2_8bit+0x1383>
+ DB 15,89,13,62,211,0,0 ; mulps 0xd33e(%rip),%xmm1 # 2cfe0 <_sk_overlay_sse2_8bit+0x1393>
DB 15,88,200 ; addps %xmm0,%xmm1
- DB 15,89,29,68,211,0,0 ; mulps 0xd344(%rip),%xmm3 # 2cab0 <_sk_overlay_sse2_8bit+0x13a3>
+ DB 15,89,29,68,211,0,0 ; mulps 0xd344(%rip),%xmm3 # 2cff0 <_sk_overlay_sse2_8bit+0x13a3>
DB 15,88,217 ; addps %xmm1,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,87,192 ; xorps %xmm0,%xmm0
@@ -30280,9 +30568,9 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
DB 72,139,24 ; mov (%rax),%rbx
DB 76,139,112,8 ; mov 0x8(%rax),%r14
DB 72,255,203 ; dec %rbx
- DB 120,7 ; js 1fc0c <_sk_evenly_spaced_gradient_sse2+0x18>
+ DB 120,7 ; js 2014c <_sk_evenly_spaced_gradient_sse2+0x18>
DB 243,72,15,42,203 ; cvtsi2ss %rbx,%xmm1
- DB 235,21 ; jmp 1fc21 <_sk_evenly_spaced_gradient_sse2+0x2d>
+ DB 235,21 ; jmp 20161 <_sk_evenly_spaced_gradient_sse2+0x2d>
DB 73,137,217 ; mov %rbx,%r9
DB 73,209,233 ; shr %r9
DB 131,227,1 ; and $0x1,%ebx
@@ -30378,15 +30666,15 @@ _sk_evenly_spaced_gradient_sse2 LABEL PROC
PUBLIC _sk_gauss_a_to_rgba_sse2
_sk_gauss_a_to_rgba_sse2 LABEL PROC
- DB 15,40,5,19,205,0,0 ; movaps 0xcd13(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0x13b3>
+ DB 15,40,5,19,205,0,0 ; movaps 0xcd13(%rip),%xmm0 # 2d000 <_sk_overlay_sse2_8bit+0x13b3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,25,205,0,0 ; addps 0xcd19(%rip),%xmm0 # 2cad0 <_sk_overlay_sse2_8bit+0x13c3>
+ DB 15,88,5,25,205,0,0 ; addps 0xcd19(%rip),%xmm0 # 2d010 <_sk_overlay_sse2_8bit+0x13c3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,31,205,0,0 ; addps 0xcd1f(%rip),%xmm0 # 2cae0 <_sk_overlay_sse2_8bit+0x13d3>
+ DB 15,88,5,31,205,0,0 ; addps 0xcd1f(%rip),%xmm0 # 2d020 <_sk_overlay_sse2_8bit+0x13d3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,37,205,0,0 ; addps 0xcd25(%rip),%xmm0 # 2caf0 <_sk_overlay_sse2_8bit+0x13e3>
+ DB 15,88,5,37,205,0,0 ; addps 0xcd25(%rip),%xmm0 # 2d030 <_sk_overlay_sse2_8bit+0x13e3>
DB 15,89,195 ; mulps %xmm3,%xmm0
- DB 15,88,5,43,205,0,0 ; addps 0xcd2b(%rip),%xmm0 # 2cb00 <_sk_overlay_sse2_8bit+0x13f3>
+ DB 15,88,5,43,205,0,0 ; addps 0xcd2b(%rip),%xmm0 # 2d040 <_sk_overlay_sse2_8bit+0x13f3>
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 15,40,208 ; movaps %xmm0,%xmm2
@@ -30402,12 +30690,12 @@ _sk_gradient_sse2 LABEL PROC
DB 76,139,8 ; mov (%rax),%r9
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 73,131,249,2 ; cmp $0x2,%r9
- DB 114,50 ; jb 1fe28 <_sk_gradient_sse2+0x46>
+ DB 114,50 ; jb 20368 <_sk_gradient_sse2+0x46>
DB 72,139,88,72 ; mov 0x48(%rax),%rbx
DB 73,255,201 ; dec %r9
DB 72,131,195,4 ; add $0x4,%rbx
DB 102,15,239,201 ; pxor %xmm1,%xmm1
- DB 15,40,21,84,199,0,0 ; movaps 0xc754(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 15,40,21,84,199,0,0 ; movaps 0xc754(%rip),%xmm2 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 243,15,16,27 ; movss (%rbx),%xmm3
DB 15,198,219,0 ; shufps $0x0,%xmm3,%xmm3
DB 15,194,216,2 ; cmpleps %xmm0,%xmm3
@@ -30415,7 +30703,7 @@ _sk_gradient_sse2 LABEL PROC
DB 102,15,254,203 ; paddd %xmm3,%xmm1
DB 72,131,195,4 ; add $0x4,%rbx
DB 73,255,201 ; dec %r9
- DB 117,228 ; jne 1fe0c <_sk_gradient_sse2+0x2a>
+ DB 117,228 ; jne 2034c <_sk_gradient_sse2+0x2a>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,211 ; movq %xmm2,%r11
DB 69,137,217 ; mov %r11d,%r9d
@@ -30550,29 +30838,29 @@ _sk_xy_to_unit_angle_sse2 LABEL PROC
DB 69,15,94,220 ; divps %xmm12,%xmm11
DB 69,15,40,227 ; movaps %xmm11,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
- DB 68,15,40,45,181,202,0,0 ; movaps 0xcab5(%rip),%xmm13 # 2cb10 <_sk_overlay_sse2_8bit+0x1403>
+ DB 68,15,40,45,181,202,0,0 ; movaps 0xcab5(%rip),%xmm13 # 2d050 <_sk_overlay_sse2_8bit+0x1403>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,185,202,0,0 ; addps 0xcab9(%rip),%xmm13 # 2cb20 <_sk_overlay_sse2_8bit+0x1413>
+ DB 68,15,88,45,185,202,0,0 ; addps 0xcab9(%rip),%xmm13 # 2d060 <_sk_overlay_sse2_8bit+0x1413>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,189,202,0,0 ; addps 0xcabd(%rip),%xmm13 # 2cb30 <_sk_overlay_sse2_8bit+0x1423>
+ DB 68,15,88,45,189,202,0,0 ; addps 0xcabd(%rip),%xmm13 # 2d070 <_sk_overlay_sse2_8bit+0x1423>
DB 69,15,89,236 ; mulps %xmm12,%xmm13
- DB 68,15,88,45,193,202,0,0 ; addps 0xcac1(%rip),%xmm13 # 2cb40 <_sk_overlay_sse2_8bit+0x1433>
+ DB 68,15,88,45,193,202,0,0 ; addps 0xcac1(%rip),%xmm13 # 2d080 <_sk_overlay_sse2_8bit+0x1433>
DB 69,15,89,235 ; mulps %xmm11,%xmm13
DB 69,15,194,202,1 ; cmpltps %xmm10,%xmm9
- DB 68,15,40,21,192,202,0,0 ; movaps 0xcac0(%rip),%xmm10 # 2cb50 <_sk_overlay_sse2_8bit+0x1443>
+ DB 68,15,40,21,192,202,0,0 ; movaps 0xcac0(%rip),%xmm10 # 2d090 <_sk_overlay_sse2_8bit+0x1443>
DB 69,15,92,213 ; subps %xmm13,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,205 ; andnps %xmm13,%xmm9
DB 69,15,86,202 ; orps %xmm10,%xmm9
DB 68,15,194,192,1 ; cmpltps %xmm0,%xmm8
- DB 68,15,40,21,147,196,0,0 ; movaps 0xc493(%rip),%xmm10 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,21,147,196,0,0 ; movaps 0xc493(%rip),%xmm10 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,92,209 ; subps %xmm9,%xmm10
DB 69,15,84,208 ; andps %xmm8,%xmm10
DB 69,15,85,193 ; andnps %xmm9,%xmm8
DB 69,15,86,194 ; orps %xmm10,%xmm8
DB 68,15,40,201 ; movaps %xmm1,%xmm9
DB 68,15,194,200,1 ; cmpltps %xmm0,%xmm9
- DB 68,15,40,21,130,196,0,0 ; movaps 0xc482(%rip),%xmm10 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,21,130,196,0,0 ; movaps 0xc482(%rip),%xmm10 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,208 ; subps %xmm8,%xmm10
DB 69,15,84,209 ; andps %xmm9,%xmm10
DB 69,15,85,200 ; andnps %xmm8,%xmm9
@@ -30603,7 +30891,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,41,202,0,0 ; mulps 0xca29(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
+ DB 68,15,89,13,41,202,0,0 ; mulps 0xca29(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30611,7 +30899,7 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,20,202,0,0 ; mulps 0xca14(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
+ DB 68,15,89,21,20,202,0,0 ; mulps 0xca14(%rip),%xmm10 # 2d0b0 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30620,8 +30908,8 @@ _sk_xy_to_2pt_conical_quadratic_max_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,204,200,0,0 ; xorps 0xc8cc(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
- DB 68,15,89,5,180,195,0,0 ; mulps 0xc3b4(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,87,13,204,200,0,0 ; xorps 0xc8cc(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,180,195,0,0 ; mulps 0xc3b4(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30640,7 +30928,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,203 ; mulss %xmm11,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,139,201,0,0 ; mulps 0xc98b(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
+ DB 68,15,89,13,139,201,0,0 ; mulps 0xc98b(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,225 ; movaps %xmm1,%xmm12
DB 69,15,89,228 ; mulps %xmm12,%xmm12
@@ -30648,7 +30936,7 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 243,69,15,89,219 ; mulss %xmm11,%xmm11
DB 69,15,198,219,0 ; shufps $0x0,%xmm11,%xmm11
DB 69,15,92,227 ; subps %xmm11,%xmm12
- DB 68,15,89,21,118,201,0,0 ; mulps 0xc976(%rip),%xmm10 # 2cb70 <_sk_overlay_sse2_8bit+0x1463>
+ DB 68,15,89,21,118,201,0,0 ; mulps 0xc976(%rip),%xmm10 # 2d0b0 <_sk_overlay_sse2_8bit+0x1463>
DB 69,15,89,212 ; mulps %xmm12,%xmm10
DB 65,15,40,193 ; movaps %xmm9,%xmm0
DB 15,89,192 ; mulps %xmm0,%xmm0
@@ -30657,8 +30945,8 @@ _sk_xy_to_2pt_conical_quadratic_min_sse2 LABEL PROC
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,40,194 ; movaps %xmm10,%xmm0
DB 65,15,92,193 ; subps %xmm9,%xmm0
- DB 68,15,87,13,46,200,0,0 ; xorps 0xc82e(%rip),%xmm9 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
- DB 68,15,89,5,22,195,0,0 ; mulps 0xc316(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,87,13,46,200,0,0 ; xorps 0xc82e(%rip),%xmm9 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
+ DB 68,15,89,5,22,195,0,0 ; mulps 0xc316(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 65,15,89,192 ; mulps %xmm8,%xmm0
DB 69,15,92,202 ; subps %xmm10,%xmm9
DB 69,15,89,200 ; mulps %xmm8,%xmm9
@@ -30674,7 +30962,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,200 ; mulss %xmm8,%xmm9
DB 69,15,198,201,0 ; shufps $0x0,%xmm9,%xmm9
DB 68,15,88,200 ; addps %xmm0,%xmm9
- DB 68,15,89,13,254,200,0,0 ; mulps 0xc8fe(%rip),%xmm9 # 2cb60 <_sk_overlay_sse2_8bit+0x1453>
+ DB 68,15,89,13,254,200,0,0 ; mulps 0xc8fe(%rip),%xmm9 # 2d0a0 <_sk_overlay_sse2_8bit+0x1453>
DB 15,89,192 ; mulps %xmm0,%xmm0
DB 68,15,40,209 ; movaps %xmm1,%xmm10
DB 69,15,89,210 ; mulps %xmm10,%xmm10
@@ -30682,7 +30970,7 @@ _sk_xy_to_2pt_conical_linear_sse2 LABEL PROC
DB 243,69,15,89,192 ; mulss %xmm8,%xmm8
DB 69,15,198,192,0 ; shufps $0x0,%xmm8,%xmm8
DB 65,15,92,192 ; subps %xmm8,%xmm0
- DB 15,87,5,202,199,0,0 ; xorps 0xc7ca(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0x1343>
+ DB 15,87,5,202,199,0,0 ; xorps 0xc7ca(%rip),%xmm0 # 2cf90 <_sk_overlay_sse2_8bit+0x1343>
DB 65,15,94,193 ; divps %xmm9,%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30719,7 +31007,7 @@ _sk_apply_vector_mask_sse2 LABEL PROC
PUBLIC _sk_save_xy_sse2
_sk_save_xy_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,80,194,0,0 ; movaps 0xc250(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,5,80,194,0,0 ; movaps 0xc250(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,17,0 ; movups %xmm0,(%rax)
DB 68,15,40,200 ; movaps %xmm0,%xmm9
DB 69,15,88,200 ; addps %xmm8,%xmm9
@@ -30727,7 +31015,7 @@ _sk_save_xy_sse2 LABEL PROC
DB 69,15,91,210 ; cvtdq2ps %xmm10,%xmm10
DB 69,15,40,217 ; movaps %xmm9,%xmm11
DB 69,15,194,218,1 ; cmpltps %xmm10,%xmm11
- DB 68,15,40,37,59,194,0,0 ; movaps 0xc23b(%rip),%xmm12 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 68,15,40,37,59,194,0,0 ; movaps 0xc23b(%rip),%xmm12 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,84,220 ; andps %xmm12,%xmm11
DB 69,15,92,211 ; subps %xmm11,%xmm10
DB 69,15,92,202 ; subps %xmm10,%xmm9
@@ -30770,8 +31058,8 @@ _sk_bilinear_nx_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,212,199,0,0 ; addps 0xc7d4(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,156,193,0,0 ; movaps 0xc19c(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,5,212,199,0,0 ; addps 0xc7d4(%rip),%xmm0 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,156,193,0,0 ; movaps 0xc19c(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30782,7 +31070,7 @@ _sk_bilinear_px_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,107,193,0,0 ; addps 0xc16b(%rip),%xmm0 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,88,5,107,193,0,0 ; addps 0xc16b(%rip),%xmm0 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30792,8 +31080,8 @@ _sk_bilinear_ny_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,141,199,0,0 ; addps 0xc78d(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,85,193,0,0 ; movaps 0xc155(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,13,141,199,0,0 ; addps 0xc78d(%rip),%xmm1 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,85,193,0,0 ; movaps 0xc155(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30804,7 +31092,7 @@ _sk_bilinear_py_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,35,193,0,0 ; addps 0xc123(%rip),%xmm1 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 15,88,13,35,193,0,0 ; addps 0xc123(%rip),%xmm1 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30814,13 +31102,13 @@ _sk_bicubic_n3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,86,199,0,0 ; addps 0xc756(%rip),%xmm0 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
- DB 68,15,40,13,14,193,0,0 ; movaps 0xc10e(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,5,86,199,0,0 ; addps 0xc756(%rip),%xmm0 # 2d0d0 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,14,193,0,0 ; movaps 0xc10e(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,74,199,0,0 ; mulps 0xc74a(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,13,226,194,0,0 ; addps 0xc2e2(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,13,74,199,0,0 ; mulps 0xc74a(%rip),%xmm9 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,226,194,0,0 ; addps 0xc2e2(%rip),%xmm9 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,128,0,0,0 ; movups %xmm9,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30831,16 +31119,16 @@ _sk_bicubic_n1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,1,199,0,0 ; addps 0xc701(%rip),%xmm0 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,201,192,0,0 ; movaps 0xc0c9(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,5,1,199,0,0 ; addps 0xc701(%rip),%xmm0 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,201,192,0,0 ; movaps 0xc0c9(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,29,199,0,0 ; movaps 0xc71d(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,5,29,199,0,0 ; movaps 0xc71d(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,33,199,0,0 ; addps 0xc721(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,5,33,199,0,0 ; addps 0xc721(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,149,192,0,0 ; addps 0xc095(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,149,192,0,0 ; addps 0xc095(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,25,199,0,0 ; addps 0xc719(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,5,25,199,0,0 ; addps 0xc719(%rip),%xmm8 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30848,17 +31136,17 @@ _sk_bicubic_n1x_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1x_sse2
_sk_bicubic_p1x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,115,192,0,0 ; movaps 0xc073(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,5,115,192,0,0 ; movaps 0xc073(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,72,64 ; movups 0x40(%rax),%xmm9
DB 65,15,88,192 ; addps %xmm8,%xmm0
- DB 68,15,40,21,207,198,0,0 ; movaps 0xc6cf(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,21,207,198,0,0 ; movaps 0xc6cf(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,211,198,0,0 ; addps 0xc6d3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,21,211,198,0,0 ; addps 0xc6d3(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,207,198,0,0 ; addps 0xc6cf(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,21,207,198,0,0 ; addps 0xc6cf(%rip),%xmm10 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,128,0,0,0 ; movups %xmm10,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30868,11 +31156,11 @@ _sk_bicubic_p3x_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,0 ; movups (%rax),%xmm0
DB 68,15,16,64,64 ; movups 0x40(%rax),%xmm8
- DB 15,88,5,162,198,0,0 ; addps 0xc6a2(%rip),%xmm0 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 15,88,5,162,198,0,0 ; addps 0xc6a2(%rip),%xmm0 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,114,198,0,0 ; mulps 0xc672(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,5,10,194,0,0 ; addps 0xc20a(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,5,114,198,0,0 ; mulps 0xc672(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,10,194,0,0 ; addps 0xc20a(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,128,0,0,0 ; movups %xmm8,0x80(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30883,13 +31171,13 @@ _sk_bicubic_n3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,56,198,0,0 ; addps 0xc638(%rip),%xmm1 # 2cb90 <_sk_overlay_sse2_8bit+0x1483>
- DB 68,15,40,13,240,191,0,0 ; movaps 0xbff0(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,13,56,198,0,0 ; addps 0xc638(%rip),%xmm1 # 2d0d0 <_sk_overlay_sse2_8bit+0x1483>
+ DB 68,15,40,13,240,191,0,0 ; movaps 0xbff0(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
DB 69,15,40,193 ; movaps %xmm9,%xmm8
DB 69,15,89,192 ; mulps %xmm8,%xmm8
- DB 68,15,89,13,44,198,0,0 ; mulps 0xc62c(%rip),%xmm9 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,13,196,193,0,0 ; addps 0xc1c4(%rip),%xmm9 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,13,44,198,0,0 ; mulps 0xc62c(%rip),%xmm9 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,13,196,193,0,0 ; addps 0xc1c4(%rip),%xmm9 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,200 ; mulps %xmm8,%xmm9
DB 68,15,17,136,160,0,0,0 ; movups %xmm9,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -30900,16 +31188,16 @@ _sk_bicubic_n1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,226,197,0,0 ; addps 0xc5e2(%rip),%xmm1 # 2cb80 <_sk_overlay_sse2_8bit+0x1473>
- DB 68,15,40,13,170,191,0,0 ; movaps 0xbfaa(%rip),%xmm9 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,88,13,226,197,0,0 ; addps 0xc5e2(%rip),%xmm1 # 2d0c0 <_sk_overlay_sse2_8bit+0x1473>
+ DB 68,15,40,13,170,191,0,0 ; movaps 0xbfaa(%rip),%xmm9 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 69,15,92,200 ; subps %xmm8,%xmm9
- DB 68,15,40,5,254,197,0,0 ; movaps 0xc5fe(%rip),%xmm8 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,5,254,197,0,0 ; movaps 0xc5fe(%rip),%xmm8 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,2,198,0,0 ; addps 0xc602(%rip),%xmm8 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,5,2,198,0,0 ; addps 0xc602(%rip),%xmm8 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,118,191,0,0 ; addps 0xbf76(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,88,5,118,191,0,0 ; addps 0xbf76(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
- DB 68,15,88,5,250,197,0,0 ; addps 0xc5fa(%rip),%xmm8 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,5,250,197,0,0 ; addps 0xc5fa(%rip),%xmm8 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30917,17 +31205,17 @@ _sk_bicubic_n1y_sse2 LABEL PROC
PUBLIC _sk_bicubic_p1y_sse2
_sk_bicubic_p1y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 68,15,40,5,84,191,0,0 ; movaps 0xbf54(%rip),%xmm8 # 2c540 <_sk_overlay_sse2_8bit+0xe33>
+ DB 68,15,40,5,84,191,0,0 ; movaps 0xbf54(%rip),%xmm8 # 2ca80 <_sk_overlay_sse2_8bit+0xe33>
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,72,96 ; movups 0x60(%rax),%xmm9
DB 65,15,88,200 ; addps %xmm8,%xmm1
- DB 68,15,40,21,175,197,0,0 ; movaps 0xc5af(%rip),%xmm10 # 2cbb0 <_sk_overlay_sse2_8bit+0x14a3>
+ DB 68,15,40,21,175,197,0,0 ; movaps 0xc5af(%rip),%xmm10 # 2d0f0 <_sk_overlay_sse2_8bit+0x14a3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,179,197,0,0 ; addps 0xc5b3(%rip),%xmm10 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 68,15,88,21,179,197,0,0 ; addps 0xc5b3(%rip),%xmm10 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,89,209 ; mulps %xmm9,%xmm10
DB 69,15,88,208 ; addps %xmm8,%xmm10
DB 69,15,89,209 ; mulps %xmm9,%xmm10
- DB 68,15,88,21,175,197,0,0 ; addps 0xc5af(%rip),%xmm10 # 2cbd0 <_sk_overlay_sse2_8bit+0x14c3>
+ DB 68,15,88,21,175,197,0,0 ; addps 0xc5af(%rip),%xmm10 # 2d110 <_sk_overlay_sse2_8bit+0x14c3>
DB 68,15,17,144,160,0,0,0 ; movups %xmm10,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
@@ -30937,11 +31225,11 @@ _sk_bicubic_p3y_sse2 LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 15,16,72,32 ; movups 0x20(%rax),%xmm1
DB 68,15,16,64,96 ; movups 0x60(%rax),%xmm8
- DB 15,88,13,129,197,0,0 ; addps 0xc581(%rip),%xmm1 # 2cbc0 <_sk_overlay_sse2_8bit+0x14b3>
+ DB 15,88,13,129,197,0,0 ; addps 0xc581(%rip),%xmm1 # 2d100 <_sk_overlay_sse2_8bit+0x14b3>
DB 69,15,40,200 ; movaps %xmm8,%xmm9
DB 69,15,89,201 ; mulps %xmm9,%xmm9
- DB 68,15,89,5,81,197,0,0 ; mulps 0xc551(%rip),%xmm8 # 2cba0 <_sk_overlay_sse2_8bit+0x1493>
- DB 68,15,88,5,233,192,0,0 ; addps 0xc0e9(%rip),%xmm8 # 2c740 <_sk_overlay_sse2_8bit+0x1033>
+ DB 68,15,89,5,81,197,0,0 ; mulps 0xc551(%rip),%xmm8 # 2d0e0 <_sk_overlay_sse2_8bit+0x1493>
+ DB 68,15,88,5,233,192,0,0 ; addps 0xc0e9(%rip),%xmm8 # 2cc80 <_sk_overlay_sse2_8bit+0x1033>
DB 69,15,89,193 ; mulps %xmm9,%xmm8
DB 68,15,17,128,160,0,0,0 ; movups %xmm8,0xa0(%rax)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -31076,7 +31364,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,65,15,111,198 ; movdqa %xmm14,%xmm0
DB 102,15,254,195 ; paddd %xmm3,%xmm0
- DB 102,15,111,45,157,195,0,0 ; movdqa 0xc39d(%rip),%xmm5 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,45,157,195,0,0 ; movdqa 0xc39d(%rip),%xmm5 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,192,232 ; pshufd $0xe8,%xmm0,%xmm0
@@ -31099,7 +31387,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,241 ; unpcklps %xmm1,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,161,188,0,0 ; paddd 0xbca1(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,13,161,188,0,0 ; paddd 0xbca1(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,233,78 ; pshufd $0x4e,%xmm1,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -31116,7 +31404,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,253 ; unpcklps %xmm5,%xmm7
DB 15,20,249 ; unpcklps %xmm1,%xmm7
- DB 102,15,254,5,119,188,0,0 ; paddd 0xbc77(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,5,119,188,0,0 ; paddd 0xbc77(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31133,7 +31421,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,200 ; unpcklps %xmm0,%xmm1
- DB 15,40,45,142,194,0,0 ; movaps 0xc28e(%rip),%xmm5 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
+ DB 15,40,45,142,194,0,0 ; movaps 0xc28e(%rip),%xmm5 # 2d120 <_sk_overlay_sse2_8bit+0x14d3>
DB 15,88,229 ; addps %xmm5,%xmm4
DB 15,41,100,36,64 ; movaps %xmm4,0x40(%rsp)
DB 68,15,88,213 ; addps %xmm5,%xmm10
@@ -31148,7 +31436,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,15,127,68,36,32 ; movdqa %xmm0,0x20(%rsp)
DB 102,15,254,216 ; paddd %xmm0,%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,15,111,5,87,194,0,0 ; movdqa 0xc257(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,87,194,0,0 ; movdqa 0xc257(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
DB 102,15,112,211,232 ; pshufd $0xe8,%xmm3,%xmm2
DB 102,15,244,224 ; pmuludq %xmm0,%xmm4
@@ -31170,7 +31458,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,227 ; unpcklps %xmm3,%xmm4
DB 15,20,229 ; unpcklps %xmm5,%xmm4
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
- DB 102,15,254,29,96,187,0,0 ; paddd 0xbb60(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,29,96,187,0,0 ; paddd 0xbb60(%rip),%xmm3 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,235,78 ; pshufd $0x4e,%xmm3,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,218 ; movq %xmm3,%r10
@@ -31187,7 +31475,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
DB 15,20,216 ; unpcklps %xmm0,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
- DB 102,15,254,21,54,187,0,0 ; paddd 0xbb36(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,21,54,187,0,0 ; paddd 0xbb36(%rip),%xmm2 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,194,78 ; pshufd $0x4e,%xmm2,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31249,7 +31537,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,193 ; unpcklps %xmm1,%xmm8
DB 68,15,20,199 ; unpcklps %xmm7,%xmm8
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,21,1,186,0,0 ; movdqa 0xba01(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,21,1,186,0,0 ; movdqa 0xba01(%rip),%xmm10 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,202 ; paddd %xmm10,%xmm1
DB 102,15,112,249,78 ; pshufd $0x4e,%xmm1,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
@@ -31267,7 +31555,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,205 ; unpcklps %xmm5,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,111,45,210,185,0,0 ; movdqa 0xb9d2(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,111,45,210,185,0,0 ; movdqa 0xb9d2(%rip),%xmm5 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,197 ; paddd %xmm5,%xmm0
DB 102,15,112,232,78 ; pshufd $0x4e,%xmm0,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31325,7 +31613,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 68,15,20,223 ; unpcklps %xmm7,%xmm11
DB 68,15,20,221 ; unpcklps %xmm5,%xmm11
- DB 102,15,111,45,205,184,0,0 ; movdqa 0xb8cd(%rip),%xmm5 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,111,45,205,184,0,0 ; movdqa 0xb8cd(%rip),%xmm5 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,254,245 ; paddd %xmm5,%xmm6
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,112,238,78 ; pshufd $0x4e,%xmm6,%xmm5
@@ -31372,7 +31660,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 102,65,15,111,206 ; movdqa %xmm14,%xmm1
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,5,112,190,0,0 ; movdqa 0xbe70(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,112,190,0,0 ; movdqa 0xbe70(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,200 ; pmuludq %xmm0,%xmm1
DB 102,15,112,217,232 ; pshufd $0xe8,%xmm1,%xmm3
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
@@ -31394,7 +31682,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,202 ; unpcklps %xmm2,%xmm1
DB 102,15,111,211 ; movdqa %xmm3,%xmm2
- DB 102,15,111,5,122,183,0,0 ; movdqa 0xb77a(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,5,122,183,0,0 ; movdqa 0xb77a(%rip),%xmm0 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -31470,7 +31758,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,4,139 ; movss (%rbx,%r9,4),%xmm0
DB 15,20,240 ; unpcklps %xmm0,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,29,75,182,0,0 ; paddd 0xb64b(%rip),%xmm3 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,29,75,182,0,0 ; paddd 0xb64b(%rip),%xmm3 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,195,78 ; pshufd $0x4e,%xmm3,%xmm0
DB 102,73,15,126,193 ; movq %xmm0,%r9
DB 102,73,15,126,218 ; movq %xmm3,%r10
@@ -31521,7 +31809,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,72,181,0,0 ; paddd 0xb548(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,13,72,181,0,0 ; paddd 0xb548(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -31538,7 +31826,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,20,139 ; movss (%rbx,%r9,4),%xmm2
DB 68,15,20,242 ; unpcklps %xmm2,%xmm14
DB 68,15,20,241 ; unpcklps %xmm1,%xmm14
- DB 102,15,254,5,27,181,0,0 ; paddd 0xb51b(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,5,27,181,0,0 ; paddd 0xb51b(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,200,78 ; pshufd $0x4e,%xmm0,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31576,7 +31864,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,37,78,180,0,0 ; movdqa 0xb44e(%rip),%xmm4 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,37,78,180,0,0 ; movdqa 0xb44e(%rip),%xmm4 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,226 ; paddd %xmm2,%xmm4
DB 102,15,112,204,78 ; pshufd $0x4e,%xmm4,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -31594,7 +31882,7 @@ _sk_clut_3D_sse2 LABEL PROC
DB 243,66,15,16,36,139 ; movss (%rbx,%r9,4),%xmm4
DB 15,20,204 ; unpcklps %xmm4,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,32,180,0,0 ; paddd 0xb420(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,21,32,180,0,0 ; paddd 0xb420(%rip),%xmm2 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,226,78 ; pshufd $0x4e,%xmm2,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31745,7 +32033,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,209 ; paddd %xmm1,%xmm2
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
DB 102,15,254,218 ; paddd %xmm2,%xmm3
- DB 102,68,15,111,21,236,183,0,0 ; movdqa 0xb7ec(%rip),%xmm10 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,68,15,111,21,236,183,0,0 ; movdqa 0xb7ec(%rip),%xmm10 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,112,235,245 ; pshufd $0xf5,%xmm3,%xmm5
DB 102,65,15,244,218 ; pmuludq %xmm10,%xmm3
DB 102,15,112,227,232 ; pshufd $0xe8,%xmm3,%xmm4
@@ -31768,7 +32056,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,222 ; unpcklps %xmm6,%xmm3
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 102,15,111,236 ; movdqa %xmm4,%xmm5
- DB 102,15,254,45,238,176,0,0 ; paddd 0xb0ee(%rip),%xmm5 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,45,238,176,0,0 ; paddd 0xb0ee(%rip),%xmm5 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,245,78 ; pshufd $0x4e,%xmm5,%xmm6
DB 102,73,15,126,241 ; movq %xmm6,%r9
DB 102,73,15,126,234 ; movq %xmm5,%r10
@@ -31785,7 +32073,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,247 ; unpcklps %xmm7,%xmm6
DB 15,20,245 ; unpcklps %xmm5,%xmm6
- DB 102,15,254,37,196,176,0,0 ; paddd 0xb0c4(%rip),%xmm4 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,37,196,176,0,0 ; paddd 0xb0c4(%rip),%xmm4 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
DB 102,73,15,126,226 ; movq %xmm4,%r10
@@ -31802,7 +32090,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,239 ; unpcklps %xmm7,%xmm5
DB 15,20,236 ; unpcklps %xmm4,%xmm5
- DB 15,40,61,219,182,0,0 ; movaps 0xb6db(%rip),%xmm7 # 2cbe0 <_sk_overlay_sse2_8bit+0x14d3>
+ DB 15,40,61,219,182,0,0 ; movaps 0xb6db(%rip),%xmm7 # 2d120 <_sk_overlay_sse2_8bit+0x14d3>
DB 68,15,88,199 ; addps %xmm7,%xmm8
DB 68,15,41,68,36,48 ; movaps %xmm8,0x30(%rsp)
DB 68,15,88,207 ; addps %xmm7,%xmm9
@@ -31840,7 +32128,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,234 ; unpcklps %xmm2,%xmm13
DB 68,15,20,239 ; unpcklps %xmm7,%xmm13
DB 102,15,111,208 ; movdqa %xmm0,%xmm2
- DB 102,15,254,21,155,175,0,0 ; paddd 0xaf9b(%rip),%xmm2 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,21,155,175,0,0 ; paddd 0xaf9b(%rip),%xmm2 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -31857,7 +32145,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,70,15,16,12,139 ; movss (%rbx,%r9,4),%xmm9
DB 65,15,20,209 ; unpcklps %xmm9,%xmm2
DB 15,20,215 ; unpcklps %xmm7,%xmm2
- DB 102,15,254,5,112,175,0,0 ; paddd 0xaf70(%rip),%xmm0 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,5,112,175,0,0 ; paddd 0xaf70(%rip),%xmm0 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,248,78 ; pshufd $0x4e,%xmm0,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,194 ; movq %xmm0,%r10
@@ -31898,7 +32186,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
DB 102,15,254,92,36,32 ; paddd 0x20(%rsp),%xmm3
DB 102,15,112,227,245 ; pshufd $0xf5,%xmm3,%xmm4
- DB 102,68,15,111,53,46,181,0,0 ; movdqa 0xb52e(%rip),%xmm14 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,68,15,111,53,46,181,0,0 ; movdqa 0xb52e(%rip),%xmm14 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,65,15,244,222 ; pmuludq %xmm14,%xmm3
DB 102,15,112,219,232 ; pshufd $0xe8,%xmm3,%xmm3
DB 102,65,15,244,230 ; pmuludq %xmm14,%xmm4
@@ -31919,7 +32207,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,228 ; unpcklps %xmm4,%xmm12
DB 68,15,20,229 ; unpcklps %xmm5,%xmm12
DB 102,15,111,227 ; movdqa %xmm3,%xmm4
- DB 102,15,111,61,55,174,0,0 ; movdqa 0xae37(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,61,55,174,0,0 ; movdqa 0xae37(%rip),%xmm7 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,231 ; paddd %xmm7,%xmm4
DB 102,15,112,236,78 ; pshufd $0x4e,%xmm4,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -31937,7 +32225,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,245 ; unpcklps %xmm5,%xmm6
DB 15,20,244 ; unpcklps %xmm4,%xmm6
- DB 102,68,15,111,5,8,174,0,0 ; movdqa 0xae08(%rip),%xmm8 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,5,8,174,0,0 ; movdqa 0xae08(%rip),%xmm8 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,216 ; paddd %xmm8,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32051,7 +32339,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,68,15,111,108,36,32 ; movdqa 0x20(%rsp),%xmm13
DB 102,65,15,254,205 ; paddd %xmm13,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,107,178,0,0 ; movdqa 0xb26b(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,29,107,178,0,0 ; movdqa 0xb26b(%rip),%xmm3 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32073,7 +32361,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,205 ; unpcklps %xmm5,%xmm9
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
- DB 102,15,111,29,114,171,0,0 ; movdqa 0xab72(%rip),%xmm3 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,29,114,171,0,0 ; movdqa 0xab72(%rip),%xmm3 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,211 ; paddd %xmm3,%xmm2
DB 102,15,112,234,78 ; pshufd $0x4e,%xmm2,%xmm5
DB 102,73,15,126,233 ; movq %xmm5,%r9
@@ -32181,7 +32469,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,211 ; movdqa %xmm11,%xmm2
DB 102,65,15,254,213 ; paddd %xmm13,%xmm2
DB 102,15,112,218,245 ; pshufd $0xf5,%xmm2,%xmm3
- DB 102,15,111,5,48,176,0,0 ; movdqa 0xb030(%rip),%xmm0 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,5,48,176,0,0 ; movdqa 0xb030(%rip),%xmm0 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,208 ; pmuludq %xmm0,%xmm2
DB 102,15,112,250,232 ; pshufd $0xe8,%xmm2,%xmm7
DB 102,15,244,216 ; pmuludq %xmm0,%xmm3
@@ -32202,7 +32490,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 68,15,20,203 ; unpcklps %xmm3,%xmm9
DB 102,15,111,215 ; movdqa %xmm7,%xmm2
- DB 102,15,111,5,59,169,0,0 ; movdqa 0xa93b(%rip),%xmm0 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,5,59,169,0,0 ; movdqa 0xa93b(%rip),%xmm0 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,208 ; paddd %xmm0,%xmm2
DB 102,15,112,218,78 ; pshufd $0x4e,%xmm2,%xmm3
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -32220,7 +32508,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,28,139 ; movss (%rbx,%r9,4),%xmm3
DB 15,20,243 ; unpcklps %xmm3,%xmm6
DB 15,20,242 ; unpcklps %xmm2,%xmm6
- DB 102,68,15,111,45,12,169,0,0 ; movdqa 0xa90c(%rip),%xmm13 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,45,12,169,0,0 ; movdqa 0xa90c(%rip),%xmm13 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,253 ; paddd %xmm13,%xmm7
DB 102,15,112,215,78 ; pshufd $0x4e,%xmm7,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
@@ -32240,7 +32528,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,250 ; unpcklps %xmm2,%xmm7
DB 102,68,15,254,220 ; paddd %xmm4,%xmm11
DB 102,65,15,112,219,245 ; pshufd $0xf5,%xmm11,%xmm3
- DB 102,15,111,37,34,175,0,0 ; movdqa 0xaf22(%rip),%xmm4 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,37,34,175,0,0 ; movdqa 0xaf22(%rip),%xmm4 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,68,15,244,220 ; pmuludq %xmm4,%xmm11
DB 102,65,15,112,211,232 ; pshufd $0xe8,%xmm11,%xmm2
DB 102,15,244,220 ; pmuludq %xmm4,%xmm3
@@ -32341,7 +32629,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,65,15,111,202 ; movdqa %xmm10,%xmm1
DB 102,15,254,200 ; paddd %xmm0,%xmm1
DB 102,15,112,209,245 ; pshufd $0xf5,%xmm1,%xmm2
- DB 102,15,111,29,88,173,0,0 ; movdqa 0xad58(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,29,88,173,0,0 ; movdqa 0xad58(%rip),%xmm3 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
DB 102,15,112,201,232 ; pshufd $0xe8,%xmm1,%xmm1
DB 102,15,244,211 ; pmuludq %xmm3,%xmm2
@@ -32363,7 +32651,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,212 ; unpcklps %xmm4,%xmm2
DB 15,20,211 ; unpcklps %xmm3,%xmm2
DB 102,15,111,217 ; movdqa %xmm1,%xmm3
- DB 102,15,111,61,97,166,0,0 ; movdqa 0xa661(%rip),%xmm7 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,61,97,166,0,0 ; movdqa 0xa661(%rip),%xmm7 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,223 ; paddd %xmm7,%xmm3
DB 102,15,112,227,78 ; pshufd $0x4e,%xmm3,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32381,7 +32669,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,44,139 ; movss (%rbx,%r9,4),%xmm5
DB 15,20,221 ; unpcklps %xmm5,%xmm3
DB 15,20,220 ; unpcklps %xmm4,%xmm3
- DB 102,68,15,111,13,50,166,0,0 ; movdqa 0xa632(%rip),%xmm9 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,68,15,111,13,50,166,0,0 ; movdqa 0xa632(%rip),%xmm9 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,65,15,254,201 ; paddd %xmm9,%xmm1
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,73,15,126,225 ; movq %xmm4,%r9
@@ -32493,7 +32781,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,246 ; unpcklps %xmm6,%xmm14
DB 68,15,20,243 ; unpcklps %xmm3,%xmm14
DB 102,15,111,220 ; movdqa %xmm4,%xmm3
- DB 102,68,15,111,21,34,164,0,0 ; movdqa 0xa422(%rip),%xmm10 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,21,34,164,0,0 ; movdqa 0xa422(%rip),%xmm10 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,218 ; paddd %xmm10,%xmm3
DB 102,15,112,243,78 ; pshufd $0x4e,%xmm3,%xmm6
DB 102,73,15,126,241 ; movq %xmm6,%r9
@@ -32614,7 +32902,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,111,116,36,32 ; movdqa 0x20(%rsp),%xmm6
DB 102,15,254,198 ; paddd %xmm6,%xmm0
DB 102,15,112,200,245 ; pshufd $0xf5,%xmm0,%xmm1
- DB 102,15,111,29,153,168,0,0 ; movdqa 0xa899(%rip),%xmm3 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,29,153,168,0,0 ; movdqa 0xa899(%rip),%xmm3 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,195 ; pmuludq %xmm3,%xmm0
DB 102,15,112,208,232 ; pshufd $0xe8,%xmm0,%xmm2
DB 102,15,244,203 ; pmuludq %xmm3,%xmm1
@@ -32636,7 +32924,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,20,195 ; unpcklps %xmm3,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
DB 102,15,111,202 ; movdqa %xmm2,%xmm1
- DB 102,68,15,111,5,161,161,0,0 ; movdqa 0xa1a1(%rip),%xmm8 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,68,15,111,5,161,161,0,0 ; movdqa 0xa1a1(%rip),%xmm8 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,65,15,254,200 ; paddd %xmm8,%xmm1
DB 102,15,112,217,78 ; pshufd $0x4e,%xmm1,%xmm3
DB 102,73,15,126,217 ; movq %xmm3,%r9
@@ -32742,7 +33030,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 102,15,254,60,36 ; paddd (%rsp),%xmm7
DB 102,15,254,247 ; paddd %xmm7,%xmm6
DB 102,15,112,206,245 ; pshufd $0xf5,%xmm6,%xmm1
- DB 102,15,111,21,100,166,0,0 ; movdqa 0xa664(%rip),%xmm2 # 2cbf0 <_sk_overlay_sse2_8bit+0x14e3>
+ DB 102,15,111,21,100,166,0,0 ; movdqa 0xa664(%rip),%xmm2 # 2d130 <_sk_overlay_sse2_8bit+0x14e3>
DB 102,15,244,242 ; pmuludq %xmm2,%xmm6
DB 102,15,112,198,232 ; pshufd $0xe8,%xmm6,%xmm0
DB 102,15,244,202 ; pmuludq %xmm2,%xmm1
@@ -32764,7 +33052,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 68,15,20,201 ; unpcklps %xmm1,%xmm9
DB 68,15,20,202 ; unpcklps %xmm2,%xmm9
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,15,254,13,107,159,0,0 ; paddd 0x9f6b(%rip),%xmm1 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,254,13,107,159,0,0 ; paddd 0x9f6b(%rip),%xmm1 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,112,209,78 ; pshufd $0x4e,%xmm1,%xmm2
DB 102,73,15,126,209 ; movq %xmm2,%r9
DB 102,73,15,126,202 ; movq %xmm1,%r10
@@ -32820,7 +33108,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,66,15,16,60,139 ; movss (%rbx,%r9,4),%xmm7
DB 15,20,199 ; unpcklps %xmm7,%xmm0
DB 15,20,193 ; unpcklps %xmm1,%xmm0
- DB 102,15,111,53,109,158,0,0 ; movdqa 0x9e6d(%rip),%xmm6 # 2c560 <_sk_overlay_sse2_8bit+0xe53>
+ DB 102,15,111,53,109,158,0,0 ; movdqa 0x9e6d(%rip),%xmm6 # 2caa0 <_sk_overlay_sse2_8bit+0xe53>
DB 102,15,254,242 ; paddd %xmm2,%xmm6
DB 102,15,112,206,78 ; pshufd $0x4e,%xmm6,%xmm1
DB 102,73,15,126,201 ; movq %xmm1,%r9
@@ -32838,7 +33126,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 243,70,15,16,60,139 ; movss (%rbx,%r9,4),%xmm15
DB 65,15,20,207 ; unpcklps %xmm15,%xmm1
DB 15,20,207 ; unpcklps %xmm7,%xmm1
- DB 102,15,254,21,62,158,0,0 ; paddd 0x9e3e(%rip),%xmm2 # 2c580 <_sk_overlay_sse2_8bit+0xe73>
+ DB 102,15,254,21,62,158,0,0 ; paddd 0x9e3e(%rip),%xmm2 # 2cac0 <_sk_overlay_sse2_8bit+0xe73>
DB 102,15,112,250,78 ; pshufd $0x4e,%xmm2,%xmm7
DB 102,73,15,126,249 ; movq %xmm7,%r9
DB 102,73,15,126,210 ; movq %xmm2,%r10
@@ -32900,7 +33188,7 @@ _sk_clut_4D_sse2 LABEL PROC
DB 15,89,212 ; mulps %xmm4,%xmm2
DB 65,15,88,213 ; addps %xmm13,%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,29,26,157,0,0 ; movaps 0x9d1a(%rip),%xmm3 # 2c550 <_sk_overlay_sse2_8bit+0xe43>
+ DB 15,40,29,26,157,0,0 ; movaps 0x9d1a(%rip),%xmm3 # 2ca90 <_sk_overlay_sse2_8bit+0xe43>
DB 15,40,164,36,240,0,0,0 ; movaps 0xf0(%rsp),%xmm4
DB 15,40,172,36,0,1,0,0 ; movaps 0x100(%rsp),%xmm5
DB 15,40,180,36,16,1,0,0 ; movaps 0x110(%rsp),%xmm6
@@ -32940,7 +33228,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 2296d <_sk_start_pipeline_hsw_8bit+0x10d>
+ DB 15,131,138,0,0,0 ; jae 22ead <_sk_start_pipeline_hsw_8bit+0x10d>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,16 ; lea 0x10(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -32950,7 +33238,7 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
DB 72,57,157,248,254,255,255 ; cmp %rbx,-0x108(%rbp)
- DB 119,36 ; ja 22949 <_sk_start_pipeline_hsw_8bit+0xe9>
+ DB 119,36 ; ja 22e89 <_sk_start_pipeline_hsw_8bit+0xe9>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -32959,17 +33247,17 @@ _sk_start_pipeline_hsw_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,32 ; add $0x20,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 22925 <_sk_start_pipeline_hsw_8bit+0xc5>
+ DB 118,220 ; jbe 22e65 <_sk_start_pipeline_hsw_8bit+0xc5>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 22961 <_sk_start_pipeline_hsw_8bit+0x101>
+ DB 116,16 ; je 22ea1 <_sk_start_pipeline_hsw_8bit+0x101>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 228fc <_sk_start_pipeline_hsw_8bit+0x9c>
+ DB 117,143 ; jne 22e3c <_sk_start_pipeline_hsw_8bit+0x9c>
DB 197,248,40,181,32,255,255,255 ; vmovaps -0xe0(%rbp),%xmm6
DB 197,248,40,189,48,255,255,255 ; vmovaps -0xd0(%rbp),%xmm7
DB 197,120,40,133,64,255,255,255 ; vmovaps -0xc0(%rbp),%xmm8
@@ -33007,7 +33295,7 @@ _sk_uniform_color_hsw_8bit LABEL PROC
PUBLIC _sk_set_rgb_hsw_8bit
_sk_set_rgb_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 197,250,16,37,197,145,0,0 ; vmovss 0x91c5(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,250,16,37,197,145,0,0 ; vmovss 0x91c5(%rip),%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,218,89,40 ; vmulss (%rax),%xmm4,%xmm5
DB 196,225,250,44,205 ; vcvttss2si %xmm5,%rcx
DB 197,218,89,104,4 ; vmulss 0x4(%rax),%xmm4,%xmm5
@@ -33020,7 +33308,7 @@ _sk_set_rgb_hsw_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,88,228 ; vpbroadcastd %xmm4,%ymm4
- DB 197,253,111,45,5,151,0,0 ; vmovdqa 0x9705(%rip),%ymm5 # 2c120 <_sk_overlay_sse2_8bit+0xa13>
+ DB 197,253,111,45,5,151,0,0 ; vmovdqa 0x9705(%rip),%ymm5 # 2c660 <_sk_overlay_sse2_8bit+0xa13>
DB 197,245,219,205 ; vpand %ymm5,%ymm1,%ymm1
DB 197,253,219,197 ; vpand %ymm5,%ymm0,%ymm0
DB 197,221,235,192 ; vpor %ymm0,%ymm4,%ymm0
@@ -33030,10 +33318,10 @@ _sk_set_rgb_hsw_8bit LABEL PROC
PUBLIC _sk_premul_hsw_8bit
_sk_premul_hsw_8bit LABEL PROC
- DB 197,253,111,37,9,151,0,0 ; vmovdqa 0x9709(%rip),%ymm4 # 2c140 <_sk_overlay_sse2_8bit+0xa33>
+ DB 197,253,111,37,9,151,0,0 ; vmovdqa 0x9709(%rip),%ymm4 # 2c680 <_sk_overlay_sse2_8bit+0xa33>
DB 196,226,125,0,236 ; vpshufb %ymm4,%ymm0,%ymm5
DB 196,226,117,0,228 ; vpshufb %ymm4,%ymm1,%ymm4
- DB 197,253,111,53,23,151,0,0 ; vmovdqa 0x9717(%rip),%ymm6 # 2c160 <_sk_overlay_sse2_8bit+0xa53>
+ DB 197,253,111,53,23,151,0,0 ; vmovdqa 0x9717(%rip),%ymm6 # 2c6a0 <_sk_overlay_sse2_8bit+0xa53>
DB 197,221,235,230 ; vpor %ymm6,%ymm4,%ymm4
DB 197,213,235,238 ; vpor %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -33071,7 +33359,7 @@ _sk_premul_hsw_8bit LABEL PROC
PUBLIC _sk_swap_rb_hsw_8bit
_sk_swap_rb_hsw_8bit LABEL PROC
- DB 197,253,111,37,143,150,0,0 ; vmovdqa 0x968f(%rip),%ymm4 # 2c180 <_sk_overlay_sse2_8bit+0xa73>
+ DB 197,253,111,37,143,150,0,0 ; vmovdqa 0x968f(%rip),%ymm4 # 2c6c0 <_sk_overlay_sse2_8bit+0xa73>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33096,7 +33384,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22b41 <_sk_load_8888_hsw_8bit+0x32>
+ DB 117,17 ; jne 23081 <_sk_load_8888_hsw_8bit+0x32>
DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33106,14 +33394,14 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,231 ; ja 22b3d <_sk_load_8888_hsw_8bit+0x2e>
+ DB 119,231 ; ja 2307d <_sk_load_8888_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 22c78 <_sk_load_8888_hsw_8bit+0x169>
+ DB 72,141,13,23,1,0,0 ; lea 0x117(%rip),%rcx # 231b8 <_sk_load_8888_hsw_8bit+0x169>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e>
+ DB 235,203 ; jmp 2307d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33121,7 +33409,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,162 ; jmp 22b3d <_sk_load_8888_hsw_8bit+0x2e>
+ DB 235,162 ; jmp 2307d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33134,7 +33422,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,83,255,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e>
+ DB 233,83,255,255,255 ; jmpq 2307d <_sk_load_8888_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33143,7 +33431,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,23,255,255,255 ; jmpq 22b37 <_sk_load_8888_hsw_8bit+0x28>
+ DB 233,23,255,255,255 ; jmpq 23077 <_sk_load_8888_hsw_8bit+0x28>
DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33157,7 +33445,7 @@ _sk_load_8888_hsw_8bit LABEL PROC
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,199,254,255,255 ; jmpq 22b3d <_sk_load_8888_hsw_8bit+0x2e>
+ DB 233,199,254,255,255 ; jmpq 2307d <_sk_load_8888_hsw_8bit+0x2e>
DB 102,144 ; xchg %ax,%ax
DB 242,254 ; repnz (bad)
DB 255 ; (bad)
@@ -33208,7 +33496,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22ce6 <_sk_load_8888_dst_hsw_8bit+0x32>
+ DB 117,17 ; jne 23226 <_sk_load_8888_dst_hsw_8bit+0x32>
DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33218,14 +33506,14 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,231 ; ja 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 119,231 ; ja 23222 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 22e1c <_sk_load_8888_dst_hsw_8bit+0x168>
+ DB 72,141,13,22,1,0,0 ; lea 0x116(%rip),%rcx # 2335c <_sk_load_8888_dst_hsw_8bit+0x168>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 235,203 ; jmp 23222 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33233,7 +33521,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,162 ; jmp 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 235,162 ; jmp 23222 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33246,7 +33534,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,83,255,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 233,83,255,255,255 ; jmpq 23222 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33255,7 +33543,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,23,255,255,255 ; jmpq 22cdc <_sk_load_8888_dst_hsw_8bit+0x28>
+ DB 233,23,255,255,255 ; jmpq 2321c <_sk_load_8888_dst_hsw_8bit+0x28>
DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33269,7 +33557,7 @@ _sk_load_8888_dst_hsw_8bit LABEL PROC
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,199,254,255,255 ; jmpq 22ce2 <_sk_load_8888_dst_hsw_8bit+0x2e>
+ DB 233,199,254,255,255 ; jmpq 23222 <_sk_load_8888_dst_hsw_8bit+0x2e>
DB 144 ; nop
DB 243,254 ; repz (bad)
DB 255 ; (bad)
@@ -33320,7 +33608,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 22e8a <_sk_store_8888_hsw_8bit+0x32>
+ DB 117,17 ; jne 233ca <_sk_store_8888_hsw_8bit+0x32>
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
DB 196,161,126,127,76,130,32 ; vmovdqu %ymm1,0x20(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33328,17 +33616,17 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 22e86 <_sk_store_8888_hsw_8bit+0x2e>
+ DB 119,239 ; ja 233c6 <_sk_store_8888_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 22f54 <_sk_store_8888_hsw_8bit+0xfc>
+ DB 72,141,13,178,0,0,0 ; lea 0xb2(%rip),%rcx # 23494 <_sk_store_8888_hsw_8bit+0xfc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,4,130 ; vmovd %xmm0,(%rdx,%r8,4)
- DB 235,211 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,211 ; jmp 233c6 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,163,121,22,68,130,8,2 ; vpextrd $0x2,%xmm0,0x8(%rdx,%r8,4)
DB 196,161,121,214,4,130 ; vmovq %xmm0,(%rdx,%r8,4)
- DB 235,195 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,195 ; jmp 233c6 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,163,121,22,100,130,24,2 ; vpextrd $0x2,%xmm4,0x18(%rdx,%r8,4)
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
@@ -33346,12 +33634,12 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,196,1 ; vextracti128 $0x1,%ymm0,%xmm4
DB 196,161,121,126,100,130,16 ; vmovd %xmm4,0x10(%rdx,%r8,4)
DB 196,161,122,127,4,130 ; vmovdqu %xmm0,(%rdx,%r8,4)
- DB 235,146 ; jmp 22e86 <_sk_store_8888_hsw_8bit+0x2e>
+ DB 235,146 ; jmp 233c6 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,163,121,22,76,130,40,2 ; vpextrd $0x2,%xmm1,0x28(%rdx,%r8,4)
DB 196,163,121,22,76,130,36,1 ; vpextrd $0x1,%xmm1,0x24(%rdx,%r8,4)
DB 196,161,121,126,76,130,32 ; vmovd %xmm1,0x20(%rdx,%r8,4)
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
- DB 233,112,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e>
+ DB 233,112,255,255,255 ; jmpq 233c6 <_sk_store_8888_hsw_8bit+0x2e>
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
DB 196,163,121,22,100,130,56,2 ; vpextrd $0x2,%xmm4,0x38(%rdx,%r8,4)
DB 196,227,125,57,204,1 ; vextracti128 $0x1,%ymm1,%xmm4
@@ -33360,7 +33648,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 196,161,121,126,100,130,48 ; vmovd %xmm4,0x30(%rdx,%r8,4)
DB 196,161,126,127,4,130 ; vmovdqu %ymm0,(%rdx,%r8,4)
DB 196,161,122,127,76,130,32 ; vmovdqu %xmm1,0x20(%rdx,%r8,4)
- DB 233,53,255,255,255 ; jmpq 22e86 <_sk_store_8888_hsw_8bit+0x2e>
+ DB 233,53,255,255,255 ; jmpq 233c6 <_sk_store_8888_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 87 ; push %rdi
DB 255 ; (bad)
@@ -33373,7 +33661,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 22f69 <_sk_store_8888_hsw_8bit+0x111>
+ DB 125,255 ; jge 234a9 <_sk_store_8888_hsw_8bit+0x111>
DB 255 ; (bad)
DB 255,111,255 ; ljmp *-0x1(%rdi)
DB 255 ; (bad)
@@ -33384,7 +33672,7 @@ _sk_store_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 235,255 ; jmp 22f81 <_sk_store_8888_hsw_8bit+0x129>
+ DB 235,255 ; jmp 234c1 <_sk_store_8888_hsw_8bit+0x129>
DB 255 ; (bad)
DB 255 ; (bad)
DB 222,255 ; fdivrp %st,%st(7)
@@ -33408,10 +33696,10 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 22fd4 <_sk_load_bgra_hsw_8bit+0x44>
+ DB 117,35 ; jne 23514 <_sk_load_bgra_hsw_8bit+0x44>
DB 196,161,126,111,76,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm1
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
- DB 197,253,111,37,218,145,0,0 ; vmovdqa 0x91da(%rip),%ymm4 # 2c1a0 <_sk_overlay_sse2_8bit+0xa93>
+ DB 197,253,111,37,218,145,0,0 ; vmovdqa 0x91da(%rip),%ymm4 # 2c6e0 <_sk_overlay_sse2_8bit+0xa93>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33421,14 +33709,14 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 197,253,239,192 ; vpxor %ymm0,%ymm0,%ymm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,213 ; ja 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 119,213 ; ja 234fe <_sk_load_bgra_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 2310c <_sk_load_bgra_hsw_8bit+0x17c>
+ DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 2364c <_sk_load_bgra_hsw_8bit+0x17c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,4,130 ; vmovd (%rdx,%r8,4),%xmm0
- DB 235,185 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 235,185 ; jmp 234fe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33436,7 +33724,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,125,2,196,3 ; vpblendd $0x3,%ymm4,%ymm0,%ymm0
- DB 235,144 ; jmp 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 235,144 ; jmp 234fe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33449,7 +33737,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,125,56,196,1 ; vinserti128 $0x1,%xmm4,%ymm0,%ymm0
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,192,240 ; vpblendd $0xf0,%ymm0,%ymm4,%ymm0
- DB 233,65,255,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 233,65,255,255,255 ; jmpq 234fe <_sk_load_bgra_hsw_8bit+0x2e>
DB 196,161,121,110,68,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm0
DB 196,226,121,89,192 ; vpbroadcastq %xmm0,%xmm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33458,7 +33746,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,227,117,2,200,15 ; vpblendd $0xf,%ymm0,%ymm1,%ymm1
DB 196,161,121,110,68,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm0
DB 196,227,117,2,200,1 ; vpblendd $0x1,%ymm0,%ymm1,%ymm1
- DB 233,5,255,255,255 ; jmpq 22fb8 <_sk_load_bgra_hsw_8bit+0x28>
+ DB 233,5,255,255,255 ; jmpq 234f8 <_sk_load_bgra_hsw_8bit+0x28>
DB 196,161,121,110,68,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm0
DB 196,226,125,89,192 ; vpbroadcastq %xmm0,%ymm0
DB 197,245,239,201 ; vpxor %ymm1,%ymm1,%ymm1
@@ -33472,7 +33760,7 @@ _sk_load_bgra_hsw_8bit LABEL PROC
DB 196,161,126,111,4,130 ; vmovdqu (%rdx,%r8,4),%ymm0
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,201,240 ; vpblendd $0xf0,%ymm1,%ymm4,%ymm1
- DB 233,181,254,255,255 ; jmpq 22fbe <_sk_load_bgra_hsw_8bit+0x2e>
+ DB 233,181,254,255,255 ; jmpq 234fe <_sk_load_bgra_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33521,10 +33809,10 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 2318c <_sk_load_bgra_dst_hsw_8bit+0x44>
+ DB 117,35 ; jne 236cc <_sk_load_bgra_dst_hsw_8bit+0x44>
DB 196,161,126,111,92,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%ymm3
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
- DB 197,253,111,37,66,144,0,0 ; vmovdqa 0x9042(%rip),%ymm4 # 2c1c0 <_sk_overlay_sse2_8bit+0xab3>
+ DB 197,253,111,37,66,144,0,0 ; vmovdqa 0x9042(%rip),%ymm4 # 2c700 <_sk_overlay_sse2_8bit+0xab3>
DB 196,226,109,0,212 ; vpshufb %ymm4,%ymm2,%ymm2
DB 196,226,101,0,220 ; vpshufb %ymm4,%ymm3,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33534,14 +33822,14 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 197,237,239,210 ; vpxor %ymm2,%ymm2,%ymm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,213 ; ja 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 119,213 ; ja 236b6 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 232c4 <_sk_load_bgra_dst_hsw_8bit+0x17c>
+ DB 72,141,13,24,1,0,0 ; lea 0x118(%rip),%rcx # 23804 <_sk_load_bgra_dst_hsw_8bit+0x17c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,110,20,130 ; vmovd (%rdx,%r8,4),%xmm2
- DB 235,185 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 235,185 ; jmp 236b6 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,8 ; vmovd 0x8(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33549,7 +33837,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,162,121,53,36,130 ; vpmovzxdq (%rdx,%r8,4),%xmm4
DB 197,249,112,228,232 ; vpshufd $0xe8,%xmm4,%xmm4
DB 196,227,109,2,212,3 ; vpblendd $0x3,%ymm4,%ymm2,%ymm2
- DB 235,144 ; jmp 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 235,144 ; jmp 236b6 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,24 ; vmovd 0x18(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33562,7 +33850,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,109,56,212,1 ; vinserti128 $0x1,%xmm4,%ymm2,%ymm2
DB 196,161,122,111,36,130 ; vmovdqu (%rdx,%r8,4),%xmm4
DB 196,227,93,2,210,240 ; vpblendd $0xf0,%ymm2,%ymm4,%ymm2
- DB 233,65,255,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 233,65,255,255,255 ; jmpq 236b6 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 196,161,121,110,84,130,40 ; vmovd 0x28(%rdx,%r8,4),%xmm2
DB 196,226,121,89,210 ; vpbroadcastq %xmm2,%xmm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33571,7 +33859,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,227,101,2,218,15 ; vpblendd $0xf,%ymm2,%ymm3,%ymm3
DB 196,161,121,110,84,130,32 ; vmovd 0x20(%rdx,%r8,4),%xmm2
DB 196,227,101,2,218,1 ; vpblendd $0x1,%ymm2,%ymm3,%ymm3
- DB 233,5,255,255,255 ; jmpq 23170 <_sk_load_bgra_dst_hsw_8bit+0x28>
+ DB 233,5,255,255,255 ; jmpq 236b0 <_sk_load_bgra_dst_hsw_8bit+0x28>
DB 196,161,121,110,84,130,56 ; vmovd 0x38(%rdx,%r8,4),%xmm2
DB 196,226,125,89,210 ; vpbroadcastq %xmm2,%ymm2
DB 197,229,239,219 ; vpxor %ymm3,%ymm3,%ymm3
@@ -33585,7 +33873,7 @@ _sk_load_bgra_dst_hsw_8bit LABEL PROC
DB 196,161,126,111,20,130 ; vmovdqu (%rdx,%r8,4),%ymm2
DB 196,161,122,111,100,130,32 ; vmovdqu 0x20(%rdx,%r8,4),%xmm4
DB 196,227,93,2,219,240 ; vpblendd $0xf0,%ymm3,%ymm4,%ymm3
- DB 233,181,254,255,255 ; jmpq 23176 <_sk_load_bgra_dst_hsw_8bit+0x2e>
+ DB 233,181,254,255,255 ; jmpq 236b6 <_sk_load_bgra_dst_hsw_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 241 ; icebp
DB 254 ; (bad)
@@ -33633,11 +33921,11 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 197,253,111,37,188,142,0,0 ; vmovdqa 0x8ebc(%rip),%ymm4 # 2c1e0 <_sk_overlay_sse2_8bit+0xad3>
+ DB 197,253,111,37,188,142,0,0 ; vmovdqa 0x8ebc(%rip),%ymm4 # 2c720 <_sk_overlay_sse2_8bit+0xad3>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 23344 <_sk_store_bgra_hsw_8bit+0x44>
+ DB 117,17 ; jne 23884 <_sk_store_bgra_hsw_8bit+0x44>
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
DB 196,161,126,127,108,130,32 ; vmovdqu %ymm5,0x20(%rdx,%r8,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -33645,17 +33933,17 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 23340 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 119,239 ; ja 23880 <_sk_store_bgra_hsw_8bit+0x40>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 2340c <_sk_store_bgra_hsw_8bit+0x10c>
+ DB 72,141,13,176,0,0,0 ; lea 0xb0(%rip),%rcx # 2394c <_sk_store_bgra_hsw_8bit+0x10c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,36,130 ; vmovd %xmm4,(%rdx,%r8,4)
- DB 235,211 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,211 ; jmp 23880 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,163,121,22,100,130,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,4)
DB 196,161,121,214,36,130 ; vmovq %xmm4,(%rdx,%r8,4)
- DB 235,195 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,195 ; jmp 23880 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,163,121,22,108,130,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r8,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -33663,12 +33951,12 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,161,121,126,108,130,16 ; vmovd %xmm5,0x10(%rdx,%r8,4)
DB 196,161,122,127,36,130 ; vmovdqu %xmm4,(%rdx,%r8,4)
- DB 235,146 ; jmp 23340 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 235,146 ; jmp 23880 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,163,121,22,108,130,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r8,4)
DB 196,163,121,22,108,130,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r8,4)
DB 196,161,121,126,108,130,32 ; vmovd %xmm5,0x20(%rdx,%r8,4)
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
- DB 233,112,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 233,112,255,255,255 ; jmpq 23880 <_sk_store_bgra_hsw_8bit+0x40>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,163,121,22,116,130,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r8,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -33677,7 +33965,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 196,161,121,126,116,130,48 ; vmovd %xmm6,0x30(%rdx,%r8,4)
DB 196,161,126,127,36,130 ; vmovdqu %ymm4,(%rdx,%r8,4)
DB 196,161,122,127,108,130,32 ; vmovdqu %xmm5,0x20(%rdx,%r8,4)
- DB 233,53,255,255,255 ; jmpq 23340 <_sk_store_bgra_hsw_8bit+0x40>
+ DB 233,53,255,255,255 ; jmpq 23880 <_sk_store_bgra_hsw_8bit+0x40>
DB 144 ; nop
DB 89 ; pop %rcx
DB 255 ; (bad)
@@ -33690,7 +33978,7 @@ _sk_store_bgra_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,255 ; jg 23421 <_sk_store_bgra_hsw_8bit+0x121>
+ DB 127,255 ; jg 23961 <_sk_store_bgra_hsw_8bit+0x121>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33726,7 +34014,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 23488 <_sk_load_a8_hsw_8bit+0x40>
+ DB 117,35 ; jne 239c8 <_sk_load_a8_hsw_8bit+0x40>
DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0
DB 197,249,112,200,78 ; vpshufd $0x4e,%xmm0,%xmm1
DB 196,226,125,49,201 ; vpmovzxbd %xmm1,%ymm1
@@ -33739,35 +34027,35 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 2346b <_sk_load_a8_hsw_8bit+0x23>
+ DB 119,210 ; ja 239ab <_sk_load_a8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 23564 <_sk_load_a8_hsw_8bit+0x11c>
+ DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 23aa4 <_sk_load_a8_hsw_8bit+0x11c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,179 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,179 ; jmp 239ab <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 235,150 ; jmp 2346b <_sk_load_a8_hsw_8bit+0x23>
+ DB 235,150 ; jmp 239ab <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,105,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq 239ab <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,60,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,60,255,255,255 ; jmpq 239ab <_sk_load_a8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -33775,7 +34063,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,7,255,255,255 ; jmpq 2346b <_sk_load_a8_hsw_8bit+0x23>
+ DB 233,7,255,255,255 ; jmpq 239ab <_sk_load_a8_hsw_8bit+0x23>
DB 73,255 ; rex.WB (bad)
DB 255 ; (bad)
DB 255,96,255 ; jmpq *-0x1(%rax)
@@ -33785,7 +34073,7 @@ _sk_load_a8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 23579 <_sk_load_a8_hsw_8bit+0x131>
+ DB 125,255 ; jge 23ab9 <_sk_load_a8_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33820,7 +34108,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 235e0 <_sk_load_a8_dst_hsw_8bit+0x40>
+ DB 117,35 ; jne 23b20 <_sk_load_a8_dst_hsw_8bit+0x40>
DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2
DB 197,249,112,218,78 ; vpshufd $0x4e,%xmm2,%xmm3
DB 196,226,125,49,219 ; vpmovzxbd %xmm3,%ymm3
@@ -33833,35 +34121,35 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,210 ; ja 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 119,210 ; ja 23b03 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 236bc <_sk_load_a8_dst_hsw_8bit+0x11c>
+ DB 72,141,13,192,0,0,0 ; lea 0xc0(%rip),%rcx # 23bfc <_sk_load_a8_dst_hsw_8bit+0x11c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,179 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,179 ; jmp 23b03 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 235,150 ; jmp 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 235,150 ; jmp 23b03 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,105,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,105,255,255,255 ; jmpq 23b03 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,60,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,60,255,255,255 ; jmpq 23b03 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -33869,7 +34157,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,7,255,255,255 ; jmpq 235c3 <_sk_load_a8_dst_hsw_8bit+0x23>
+ DB 233,7,255,255,255 ; jmpq 23b03 <_sk_load_a8_dst_hsw_8bit+0x23>
DB 73,255 ; rex.WB (bad)
DB 255 ; (bad)
DB 255,96,255 ; jmpq *-0x1(%rax)
@@ -33879,7 +34167,7 @@ _sk_load_a8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 125,255 ; jge 236d1 <_sk_load_a8_dst_hsw_8bit+0x131>
+ DB 125,255 ; jge 23c11 <_sk_load_a8_dst_hsw_8bit+0x131>
DB 255 ; (bad)
DB 255,113,255 ; pushq -0x1(%rcx)
DB 255 ; (bad)
@@ -33913,49 +34201,49 @@ _sk_store_a8_hsw_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 197,253,111,37,232,138,0,0 ; vmovdqa 0x8ae8(%rip),%ymm4 # 2c200 <_sk_overlay_sse2_8bit+0xaf3>
+ DB 197,253,111,37,232,138,0,0 ; vmovdqa 0x8ae8(%rip),%ymm4 # 2c740 <_sk_overlay_sse2_8bit+0xaf3>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,227,253,0,237,232 ; vpermq $0xe8,%ymm5,%ymm5
- DB 197,249,111,53,229,148,0,0 ; vmovdqa 0x94e5(%rip),%xmm6 # 2cc10 <_sk_overlay_sse2_8bit+0x1503>
+ DB 197,249,111,53,229,148,0,0 ; vmovdqa 0x94e5(%rip),%xmm6 # 2d150 <_sk_overlay_sse2_8bit+0x1503>
DB 196,226,81,0,238 ; vpshufb %xmm6,%xmm5,%xmm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,227,253,0,228,232 ; vpermq $0xe8,%ymm4,%ymm4
DB 196,226,89,0,230 ; vpshufb %xmm6,%xmm4,%xmm4
DB 197,217,108,229 ; vpunpcklqdq %xmm5,%xmm4,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,10 ; jne 23753 <_sk_store_a8_hsw_8bit+0x5b>
+ DB 117,10 ; jne 23c93 <_sk_store_a8_hsw_8bit+0x5b>
DB 196,161,122,127,36,2 ; vmovdqu %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,15 ; and $0xf,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,239 ; ja 2374f <_sk_store_a8_hsw_8bit+0x57>
+ DB 119,239 ; ja 23c8f <_sk_store_a8_hsw_8bit+0x57>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 237f4 <_sk_store_a8_hsw_8bit+0xfc>
+ DB 72,141,13,137,0,0,0 ; lea 0x89(%rip),%rcx # 23d34 <_sk_store_a8_hsw_8bit+0xfc>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,163,121,20,36,2,0 ; vpextrb $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,210 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,210 ; jmp 23c8f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,2,2 ; vpextrb $0x2,%xmm4,0x2(%rdx,%r8,1)
DB 196,163,121,21,36,2,0 ; vpextrw $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,193 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,193 ; jmp 23c8f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,6,6 ; vpextrb $0x6,%xmm4,0x6(%rdx,%r8,1)
DB 196,163,121,20,100,2,5,5 ; vpextrb $0x5,%xmm4,0x5(%rdx,%r8,1)
DB 196,163,121,20,100,2,4,4 ; vpextrb $0x4,%xmm4,0x4(%rdx,%r8,1)
DB 196,161,121,126,36,2 ; vmovd %xmm4,(%rdx,%r8,1)
- DB 235,161 ; jmp 2374f <_sk_store_a8_hsw_8bit+0x57>
+ DB 235,161 ; jmp 23c8f <_sk_store_a8_hsw_8bit+0x57>
DB 196,163,121,20,100,2,10,10 ; vpextrb $0xa,%xmm4,0xa(%rdx,%r8,1)
DB 196,163,121,20,100,2,9,9 ; vpextrb $0x9,%xmm4,0x9(%rdx,%r8,1)
DB 196,163,121,20,100,2,8,8 ; vpextrb $0x8,%xmm4,0x8(%rdx,%r8,1)
- DB 235,32 ; jmp 237e8 <_sk_store_a8_hsw_8bit+0xf0>
+ DB 235,32 ; jmp 23d28 <_sk_store_a8_hsw_8bit+0xf0>
DB 196,163,121,20,100,2,14,14 ; vpextrb $0xe,%xmm4,0xe(%rdx,%r8,1)
DB 196,163,121,20,100,2,13,13 ; vpextrb $0xd,%xmm4,0xd(%rdx,%r8,1)
DB 196,163,121,20,100,2,12,12 ; vpextrb $0xc,%xmm4,0xc(%rdx,%r8,1)
DB 196,163,121,22,100,2,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r8,1)
DB 196,161,121,214,36,2 ; vmovq %xmm4,(%rdx,%r8,1)
- DB 233,92,255,255,255 ; jmpq 2374f <_sk_store_a8_hsw_8bit+0x57>
+ DB 233,92,255,255,255 ; jmpq 23c8f <_sk_store_a8_hsw_8bit+0x57>
DB 144 ; nop
DB 128,255,255 ; cmp $0xff,%bh
DB 255,145,255,255,255,137 ; callq *-0x76000001(%rcx)
@@ -34001,15 +34289,15 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,61 ; jne 2388a <_sk_load_g8_hsw_8bit+0x5a>
+ DB 117,61 ; jne 23dca <_sk_load_g8_hsw_8bit+0x5a>
DB 196,161,122,111,4,2 ; vmovdqu (%rdx,%r8,1),%xmm0
DB 196,226,125,49,200 ; vpmovzxbd %xmm0,%ymm1
DB 197,249,112,192,78 ; vpshufd $0x4e,%xmm0,%xmm0
DB 196,226,125,49,192 ; vpmovzxbd %xmm0,%ymm0
- DB 196,226,125,88,37,161,132,0,0 ; vpbroadcastd 0x84a1(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff>
+ DB 196,226,125,88,37,161,132,0,0 ; vpbroadcastd 0x84a1(%rip),%ymm4 # 2c24c <_sk_overlay_sse2_8bit+0x5ff>
DB 196,226,125,64,236 ; vpmulld %ymm4,%ymm0,%ymm5
DB 196,226,117,64,196 ; vpmulld %ymm4,%ymm1,%ymm0
- DB 196,226,125,88,13,146,132,0,0 ; vpbroadcastd 0x8492(%rip),%ymm1 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,88,13,146,132,0,0 ; vpbroadcastd 0x8492(%rip),%ymm1 # 2c250 <_sk_overlay_sse2_8bit+0x603>
DB 197,253,235,193 ; vpor %ymm1,%ymm0,%ymm0
DB 197,213,235,201 ; vpor %ymm1,%ymm5,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34018,35 +34306,35 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,184 ; ja 23853 <_sk_load_g8_hsw_8bit+0x23>
+ DB 119,184 ; ja 23d93 <_sk_load_g8_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 2396c <_sk_load_g8_hsw_8bit+0x13c>
+ DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 23eac <_sk_load_g8_hsw_8bit+0x13c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,192 ; vmovd %eax,%xmm0
- DB 235,153 ; jmp 23853 <_sk_load_g8_hsw_8bit+0x23>
+ DB 235,153 ; jmp 23d93 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm0,%xmm0
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,200 ; vmovd %eax,%xmm1
DB 196,227,121,14,193,1 ; vpblendw $0x1,%xmm1,%xmm0,%xmm0
- DB 233,121,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,121,255,255,255 ; jmpq 23d93 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,121,110,12,2 ; vmovd (%rdx,%r8,1),%xmm1
DB 196,227,121,2,193,1 ; vpblendd $0x1,%xmm1,%xmm0,%xmm0
- DB 233,76,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,76,255,255,255 ; jmpq 23d93 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm0,%xmm0
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,227,113,2,192,12 ; vpblendd $0xc,%xmm0,%xmm1,%xmm0
- DB 233,31,255,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,31,255,255,255 ; jmpq 23d93 <_sk_load_g8_hsw_8bit+0x23>
DB 197,249,239,192 ; vpxor %xmm0,%xmm0,%xmm0
DB 196,163,121,32,68,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm0,%xmm0
DB 196,163,121,32,68,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm0,%xmm0
@@ -34054,7 +34342,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 196,161,122,126,12,2 ; vmovq (%rdx,%r8,1),%xmm1
DB 196,163,113,34,76,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm1,%xmm1
DB 196,227,113,2,192,8 ; vpblendd $0x8,%xmm0,%xmm1,%xmm0
- DB 233,234,254,255,255 ; jmpq 23853 <_sk_load_g8_hsw_8bit+0x23>
+ DB 233,234,254,255,255 ; jmpq 23d93 <_sk_load_g8_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 67,255 ; rex.XB (bad)
DB 255 ; (bad)
@@ -34066,7 +34354,7 @@ _sk_load_g8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23981 <_sk_load_g8_hsw_8bit+0x151>
+ DB 122,255 ; jp 23ec1 <_sk_load_g8_hsw_8bit+0x151>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34100,15 +34388,15 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,61 ; jne 23a02 <_sk_load_g8_dst_hsw_8bit+0x5a>
+ DB 117,61 ; jne 23f42 <_sk_load_g8_dst_hsw_8bit+0x5a>
DB 196,161,122,111,20,2 ; vmovdqu (%rdx,%r8,1),%xmm2
DB 196,226,125,49,218 ; vpmovzxbd %xmm2,%ymm3
DB 197,249,112,210,78 ; vpshufd $0x4e,%xmm2,%xmm2
DB 196,226,125,49,210 ; vpmovzxbd %xmm2,%ymm2
- DB 196,226,125,88,37,41,131,0,0 ; vpbroadcastd 0x8329(%rip),%ymm4 # 2bd0c <_sk_overlay_sse2_8bit+0x5ff>
+ DB 196,226,125,88,37,41,131,0,0 ; vpbroadcastd 0x8329(%rip),%ymm4 # 2c24c <_sk_overlay_sse2_8bit+0x5ff>
DB 196,226,109,64,236 ; vpmulld %ymm4,%ymm2,%ymm5
DB 196,226,101,64,212 ; vpmulld %ymm4,%ymm3,%ymm2
- DB 196,226,125,88,29,26,131,0,0 ; vpbroadcastd 0x831a(%rip),%ymm3 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,88,29,26,131,0,0 ; vpbroadcastd 0x831a(%rip),%ymm3 # 2c250 <_sk_overlay_sse2_8bit+0x603>
DB 197,237,235,211 ; vpor %ymm3,%ymm2,%ymm2
DB 197,213,235,219 ; vpor %ymm3,%ymm5,%ymm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34117,35 +34405,35 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 119,184 ; ja 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 119,184 ; ja 23f0b <_sk_load_g8_dst_hsw_8bit+0x23>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 23ae4 <_sk_load_g8_dst_hsw_8bit+0x13c>
+ DB 72,141,13,198,0,0,0 ; lea 0xc6(%rip),%rcx # 24024 <_sk_load_g8_dst_hsw_8bit+0x13c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,208 ; vmovd %eax,%xmm2
- DB 235,153 ; jmp 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 235,153 ; jmp 23f0b <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm2,%xmm2
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,216 ; vmovd %eax,%xmm3
DB 196,227,105,14,211,1 ; vpblendw $0x1,%xmm3,%xmm2,%xmm2
- DB 233,121,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,121,255,255,255 ; jmpq 23f0b <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,121,110,28,2 ; vmovd (%rdx,%r8,1),%xmm3
DB 196,227,105,2,211,1 ; vpblendd $0x1,%xmm3,%xmm2,%xmm2
- DB 233,76,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,76,255,255,255 ; jmpq 23f0b <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm2,%xmm2
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,227,97,2,210,12 ; vpblendd $0xc,%xmm2,%xmm3,%xmm2
- DB 233,31,255,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,31,255,255,255 ; jmpq 23f0b <_sk_load_g8_dst_hsw_8bit+0x23>
DB 197,233,239,210 ; vpxor %xmm2,%xmm2,%xmm2
DB 196,163,105,32,84,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm2,%xmm2
DB 196,163,105,32,84,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm2,%xmm2
@@ -34153,7 +34441,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 196,161,122,126,28,2 ; vmovq (%rdx,%r8,1),%xmm3
DB 196,163,97,34,92,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm3,%xmm3
DB 196,227,97,2,210,8 ; vpblendd $0x8,%xmm2,%xmm3,%xmm2
- DB 233,234,254,255,255 ; jmpq 239cb <_sk_load_g8_dst_hsw_8bit+0x23>
+ DB 233,234,254,255,255 ; jmpq 23f0b <_sk_load_g8_dst_hsw_8bit+0x23>
DB 15,31,0 ; nopl (%rax)
DB 67,255 ; rex.XB (bad)
DB 255 ; (bad)
@@ -34165,7 +34453,7 @@ _sk_load_g8_dst_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 23af9 <_sk_load_g8_dst_hsw_8bit+0x151>
+ DB 122,255 ; jp 24039 <_sk_load_g8_dst_hsw_8bit+0x151>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34200,10 +34488,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,222,0,0,0 ; jne 23c23 <_sk_srcover_rgba_8888_hsw_8bit+0x103>
+ DB 15,133,222,0,0,0 ; jne 24163 <_sk_srcover_rgba_8888_hsw_8bit+0x103>
DB 196,33,126,111,76,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%ymm9
DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11
- DB 197,253,111,53,198,134,0,0 ; vmovdqa 0x86c6(%rip),%ymm6 # 2c220 <_sk_overlay_sse2_8bit+0xb13>
+ DB 197,253,111,53,198,134,0,0 ; vmovdqa 0x86c6(%rip),%ymm6 # 2c760 <_sk_overlay_sse2_8bit+0xb13>
DB 196,226,117,0,254 ; vpshufb %ymm6,%ymm1,%ymm7
DB 196,226,125,0,246 ; vpshufb %ymm6,%ymm0,%ymm6
DB 196,66,125,48,195 ; vpmovzxbw %xmm11,%ymm8
@@ -34241,7 +34529,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 197,221,252,224 ; vpaddb %ymm0,%ymm4,%ymm4
DB 197,213,252,233 ; vpaddb %ymm1,%ymm5,%ymm5
DB 77,133,192 ; test %r8,%r8
- DB 117,72 ; jne 23c5a <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
+ DB 117,72 ; jne 2419a <_sk_srcover_rgba_8888_hsw_8bit+0x13a>
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
DB 196,161,126,127,108,138,32 ; vmovdqu %ymm5,0x20(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -34252,25 +34540,25 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,65,37,239,219 ; vpxor %ymm11,%ymm11,%ymm11
DB 254,200 ; dec %al
DB 60,14 ; cmp $0xe,%al
- DB 15,135,22,255,255,255 ; ja 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 15,135,22,255,255,255 ; ja 24092 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 23e30 <_sk_srcover_rgba_8888_hsw_8bit+0x310>
+ DB 72,141,13,234,1,0,0 ; lea 0x1ea(%rip),%rcx # 24370 <_sk_srcover_rgba_8888_hsw_8bit+0x310>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,33,121,110,28,138 ; vmovd (%rdx,%r9,4),%xmm11
- DB 233,248,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,248,254,255,255 ; jmpq 24092 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 65,128,224,15 ; and $0xf,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,14 ; cmp $0xe,%r8b
- DB 119,184 ; ja 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 119,184 ; ja 2415f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 23e6c <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
+ DB 72,141,13,250,1,0,0 ; lea 0x1fa(%rip),%rcx # 243ac <_sk_srcover_rgba_8888_hsw_8bit+0x34c>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 196,161,121,126,36,138 ; vmovd %xmm4,(%rdx,%r9,4)
- DB 235,156 ; jmp 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 235,156 ; jmp 2415f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,161,121,110,100,138,8 ; vmovd 0x8(%rdx,%r9,4),%xmm4
DB 196,226,121,89,236 ; vpbroadcastq %xmm4,%xmm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -34278,7 +34566,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,162,121,53,52,138 ; vpmovzxdq (%rdx,%r9,4),%xmm6
DB 197,249,112,246,232 ; vpshufd $0xe8,%xmm6,%xmm6
DB 196,99,37,2,222,3 ; vpblendd $0x3,%ymm6,%ymm11,%ymm11
- DB 233,162,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,162,254,255,255 ; jmpq 24092 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,161,121,110,100,138,24 ; vmovd 0x18(%rdx,%r9,4),%xmm4
DB 196,226,125,89,236 ; vpbroadcastq %xmm4,%ymm5
DB 196,65,53,239,201 ; vpxor %ymm9,%ymm9,%ymm9
@@ -34291,7 +34579,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,37,56,222,1 ; vinserti128 $0x1,%xmm6,%ymm11,%ymm11
DB 196,161,122,111,52,138 ; vmovdqu (%rdx,%r9,4),%xmm6
DB 196,67,77,2,219,240 ; vpblendd $0xf0,%ymm11,%ymm6,%ymm11
- DB 233,82,254,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,82,254,255,255 ; jmpq 24092 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,161,121,110,100,138,40 ; vmovd 0x28(%rdx,%r9,4),%xmm4
DB 196,226,121,89,228 ; vpbroadcastq %xmm4,%xmm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -34300,7 +34588,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,99,53,2,205,15 ; vpblendd $0xf,%ymm5,%ymm9,%ymm9
DB 196,161,121,110,108,138,32 ; vmovd 0x20(%rdx,%r9,4),%xmm5
DB 196,99,53,2,205,1 ; vpblendd $0x1,%ymm5,%ymm9,%ymm9
- DB 233,22,254,255,255 ; jmpq 23b4c <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
+ DB 233,22,254,255,255 ; jmpq 2408c <_sk_srcover_rgba_8888_hsw_8bit+0x2c>
DB 196,161,121,110,100,138,56 ; vmovd 0x38(%rdx,%r9,4),%xmm4
DB 196,226,125,89,228 ; vpbroadcastq %xmm4,%ymm4
DB 197,213,239,237 ; vpxor %ymm5,%ymm5,%ymm5
@@ -34314,10 +34602,10 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,33,126,111,28,138 ; vmovdqu (%rdx,%r9,4),%ymm11
DB 196,161,122,111,116,138,32 ; vmovdqu 0x20(%rdx,%r9,4),%xmm6
DB 196,67,77,2,201,240 ; vpblendd $0xf0,%ymm9,%ymm6,%ymm9
- DB 233,198,253,255,255 ; jmpq 23b52 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
+ DB 233,198,253,255,255 ; jmpq 24092 <_sk_srcover_rgba_8888_hsw_8bit+0x32>
DB 196,163,121,22,100,138,8,2 ; vpextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
DB 196,161,121,214,36,138 ; vmovq %xmm4,(%rdx,%r9,4)
- DB 233,128,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,128,254,255,255 ; jmpq 2415f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,163,121,22,108,138,24,2 ; vpextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
@@ -34325,12 +34613,12 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,227,125,57,229,1 ; vextracti128 $0x1,%ymm4,%xmm5
DB 196,161,121,126,108,138,16 ; vmovd %xmm5,0x10(%rdx,%r9,4)
DB 196,161,122,127,36,138 ; vmovdqu %xmm4,(%rdx,%r9,4)
- DB 233,76,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,76,254,255,255 ; jmpq 2415f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,163,121,22,108,138,40,2 ; vpextrd $0x2,%xmm5,0x28(%rdx,%r9,4)
DB 196,163,121,22,108,138,36,1 ; vpextrd $0x1,%xmm5,0x24(%rdx,%r9,4)
DB 196,161,121,126,108,138,32 ; vmovd %xmm5,0x20(%rdx,%r9,4)
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
- DB 233,42,254,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,42,254,255,255 ; jmpq 2415f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
DB 196,163,121,22,116,138,56,2 ; vpextrd $0x2,%xmm6,0x38(%rdx,%r9,4)
DB 196,227,125,57,238,1 ; vextracti128 $0x1,%ymm5,%xmm6
@@ -34339,7 +34627,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 196,161,121,126,116,138,48 ; vmovd %xmm6,0x30(%rdx,%r9,4)
DB 196,161,126,127,36,138 ; vmovdqu %ymm4,(%rdx,%r9,4)
DB 196,161,122,127,108,138,32 ; vmovdqu %xmm5,0x20(%rdx,%r9,4)
- DB 233,239,253,255,255 ; jmpq 23c1f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
+ DB 233,239,253,255,255 ; jmpq 2415f <_sk_srcover_rgba_8888_hsw_8bit+0xff>
DB 31 ; (bad)
DB 254 ; (bad)
DB 255 ; (bad)
@@ -34389,7 +34677,7 @@ _sk_srcover_rgba_8888_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 126,255 ; jle 23e89 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
+ DB 126,255 ; jle 243c9 <_sk_srcover_rgba_8888_hsw_8bit+0x369>
DB 255 ; (bad)
DB 255,119,255 ; pushq -0x1(%rdi)
DB 255 ; (bad)
@@ -34409,7 +34697,7 @@ PUBLIC _sk_scale_1_float_hsw_8bit
_sk_scale_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,242,124,0,0 ; vmulss 0x7cf2(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,218,89,37,242,124,0,0 ; vmulss 0x7cf2(%rip),%xmm4,%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34419,7 +34707,7 @@ _sk_scale_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,37,85,131,0,0 ; vpand 0x8355(%rip),%ymm4,%ymm4 # 2c240 <_sk_overlay_sse2_8bit+0xb33>
+ DB 197,221,219,37,85,131,0,0 ; vpand 0x8355(%rip),%ymm4,%ymm4 # 2c780 <_sk_overlay_sse2_8bit+0xb33>
DB 197,221,213,249 ; vpmullw %ymm1,%ymm4,%ymm7
DB 197,93,213,198 ; vpmullw %ymm6,%ymm4,%ymm8
DB 197,93,213,200 ; vpmullw %ymm0,%ymm4,%ymm9
@@ -34451,12 +34739,12 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,191,0,0,0 ; jne 24023 <_sk_scale_u8_hsw_8bit+0xe0>
+ DB 15,133,191,0,0,0 ; jne 24563 <_sk_scale_u8_hsw_8bit+0xe0>
DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,223,130,0,0 ; vmovdqa 0x82df(%rip),%ymm6 # 2c260 <_sk_overlay_sse2_8bit+0xb53>
+ DB 197,253,111,53,223,130,0,0 ; vmovdqa 0x82df(%rip),%ymm6 # 2c7a0 <_sk_overlay_sse2_8bit+0xb53>
DB 196,226,93,0,230 ; vpshufb %ymm6,%ymm4,%ymm4
DB 196,226,85,0,238 ; vpshufb %ymm6,%ymm5,%ymm5
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34495,35 +34783,35 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,50,255,255,255 ; ja 23f6a <_sk_scale_u8_hsw_8bit+0x27>
+ DB 15,135,50,255,255,255 ; ja 244aa <_sk_scale_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 2410c <_sk_scale_u8_hsw_8bit+0x1c9>
+ DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 2464c <_sk_scale_u8_hsw_8bit+0x1c9>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,16,255,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,16,255,255,255 ; jmpq 244aa <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,240,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,240,254,255,255 ; jmpq 244aa <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,195,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,195,254,255,255 ; jmpq 244aa <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,150,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,150,254,255,255 ; jmpq 244aa <_sk_scale_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -34531,7 +34819,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,97,254,255,255 ; jmpq 23f6a <_sk_scale_u8_hsw_8bit+0x27>
+ DB 233,97,254,255,255 ; jmpq 244aa <_sk_scale_u8_hsw_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 64,255 ; rex (bad)
DB 255 ; (bad)
@@ -34543,7 +34831,7 @@ _sk_scale_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 24121 <_sk_scale_u8_hsw_8bit+0x1de>
+ DB 122,255 ; jp 24661 <_sk_scale_u8_hsw_8bit+0x1de>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34571,7 +34859,7 @@ PUBLIC _sk_lerp_1_float_hsw_8bit
_sk_lerp_1_float_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 197,250,16,32 ; vmovss (%rax),%xmm4
- DB 197,218,89,37,82,122,0,0 ; vmulss 0x7a52(%rip),%xmm4,%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 197,218,89,37,82,122,0,0 ; vmulss 0x7a52(%rip),%xmm4,%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 197,250,44,196 ; vcvttss2si %xmm4,%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
DB 196,226,125,120,228 ; vpbroadcastb %xmm4,%ymm4
@@ -34581,7 +34869,7 @@ _sk_lerp_1_float_hsw_8bit LABEL PROC
DB 196,226,125,48,241 ; vpmovzxbw %xmm1,%ymm6
DB 196,227,125,57,201,1 ; vextracti128 $0x1,%ymm1,%xmm1
DB 196,226,125,48,201 ; vpmovzxbw %xmm1,%ymm1
- DB 197,221,219,61,245,128,0,0 ; vpand 0x80f5(%rip),%ymm4,%ymm7 # 2c280 <_sk_overlay_sse2_8bit+0xb73>
+ DB 197,221,219,61,245,128,0,0 ; vpand 0x80f5(%rip),%ymm4,%ymm7 # 2c7c0 <_sk_overlay_sse2_8bit+0xb73>
DB 197,69,213,193 ; vpmullw %ymm1,%ymm7,%ymm8
DB 197,69,213,206 ; vpmullw %ymm6,%ymm7,%ymm9
DB 197,69,213,208 ; vpmullw %ymm0,%ymm7,%ymm10
@@ -34644,12 +34932,12 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,106,1,0,0 ; jne 24403 <_sk_lerp_u8_hsw_8bit+0x18b>
+ DB 15,133,106,1,0,0 ; jne 24943 <_sk_lerp_u8_hsw_8bit+0x18b>
DB 196,161,122,111,36,2 ; vmovdqu (%rdx,%r8,1),%xmm4
DB 196,226,125,49,236 ; vpmovzxbd %xmm4,%ymm5
DB 197,249,112,228,78 ; vpshufd $0x4e,%xmm4,%xmm4
DB 196,226,125,49,228 ; vpmovzxbd %xmm4,%ymm4
- DB 197,253,111,53,234,127,0,0 ; vmovdqa 0x7fea(%rip),%ymm6 # 2c2a0 <_sk_overlay_sse2_8bit+0xb93>
+ DB 197,253,111,53,234,127,0,0 ; vmovdqa 0x7fea(%rip),%ymm6 # 2c7e0 <_sk_overlay_sse2_8bit+0xb93>
DB 196,98,93,0,206 ; vpshufb %ymm6,%ymm4,%ymm9
DB 196,98,85,0,222 ; vpshufb %ymm6,%ymm5,%ymm11
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -34723,35 +35011,35 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,14 ; cmp $0xe,%r9b
- DB 15,135,135,254,255,255 ; ja 2429f <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 15,135,135,254,255,255 ; ja 247df <_sk_lerp_u8_hsw_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 244ec <_sk_lerp_u8_hsw_8bit+0x274>
+ DB 72,141,13,201,0,0,0 ; lea 0xc9(%rip),%rcx # 24a2c <_sk_lerp_u8_hsw_8bit+0x274>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 197,249,110,224 ; vmovd %eax,%xmm4
- DB 233,101,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,101,254,255,255 ; jmpq 247df <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,2,2 ; vpinsrb $0x2,0x2(%rdx,%r8,1),%xmm4,%xmm4
DB 66,15,183,4,2 ; movzwl (%rdx,%r8,1),%eax
DB 197,249,110,232 ; vmovd %eax,%xmm5
DB 196,227,89,14,229,1 ; vpblendw $0x1,%xmm5,%xmm4,%xmm4
- DB 233,69,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,69,254,255,255 ; jmpq 247df <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,6,6 ; vpinsrb $0x6,0x6(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,5,5 ; vpinsrb $0x5,0x5(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,4,4 ; vpinsrb $0x4,0x4(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,121,110,44,2 ; vmovd (%rdx,%r8,1),%xmm5
DB 196,227,89,2,229,1 ; vpblendd $0x1,%xmm5,%xmm4,%xmm4
- DB 233,24,254,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,24,254,255,255 ; jmpq 247df <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,10,10 ; vpinsrb $0xa,0xa(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,9,9 ; vpinsrb $0x9,0x9(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,8,8 ; vpinsrb $0x8,0x8(%rdx,%r8,1),%xmm4,%xmm4
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,227,81,2,228,12 ; vpblendd $0xc,%xmm4,%xmm5,%xmm4
- DB 233,235,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,235,253,255,255 ; jmpq 247df <_sk_lerp_u8_hsw_8bit+0x27>
DB 197,217,239,228 ; vpxor %xmm4,%xmm4,%xmm4
DB 196,163,89,32,100,2,14,14 ; vpinsrb $0xe,0xe(%rdx,%r8,1),%xmm4,%xmm4
DB 196,163,89,32,100,2,13,13 ; vpinsrb $0xd,0xd(%rdx,%r8,1),%xmm4,%xmm4
@@ -34759,7 +35047,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 196,161,122,126,44,2 ; vmovq (%rdx,%r8,1),%xmm5
DB 196,163,81,34,108,2,8,2 ; vpinsrd $0x2,0x8(%rdx,%r8,1),%xmm5,%xmm5
DB 196,227,81,2,228,8 ; vpblendd $0x8,%xmm4,%xmm5,%xmm4
- DB 233,182,253,255,255 ; jmpq 2429f <_sk_lerp_u8_hsw_8bit+0x27>
+ DB 233,182,253,255,255 ; jmpq 247df <_sk_lerp_u8_hsw_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 64,255 ; rex (bad)
DB 255 ; (bad)
@@ -34771,7 +35059,7 @@ _sk_lerp_u8_hsw_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 122,255 ; jp 24501 <_sk_lerp_u8_hsw_8bit+0x289>
+ DB 122,255 ; jp 24a41 <_sk_lerp_u8_hsw_8bit+0x289>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -34812,7 +35100,7 @@ _sk_move_dst_src_hsw_8bit LABEL PROC
PUBLIC _sk_black_color_hsw_8bit
_sk_black_color_hsw_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 196,226,125,24,5,197,119,0,0 ; vbroadcastss 0x77c5(%rip),%ymm0 # 2bd10 <_sk_overlay_sse2_8bit+0x603>
+ DB 196,226,125,24,5,197,119,0,0 ; vbroadcastss 0x77c5(%rip),%ymm0 # 2c250 <_sk_overlay_sse2_8bit+0x603>
DB 197,252,40,200 ; vmovaps %ymm0,%ymm1
DB 255,224 ; jmpq *%rax
@@ -34832,7 +35120,7 @@ _sk_clear_hsw_8bit LABEL PROC
PUBLIC _sk_srcatop_hsw_8bit
_sk_srcatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,79,125,0,0 ; vmovdqa 0x7d4f(%rip),%ymm8 # 2c2c0 <_sk_overlay_sse2_8bit+0xbb3>
+ DB 197,125,111,5,79,125,0,0 ; vmovdqa 0x7d4f(%rip),%ymm8 # 2c800 <_sk_overlay_sse2_8bit+0xbb3>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,232 ; vpshufb %ymm8,%ymm2,%ymm5
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -34907,7 +35195,7 @@ _sk_srcatop_hsw_8bit LABEL PROC
PUBLIC _sk_dstatop_hsw_8bit
_sk_dstatop_hsw_8bit LABEL PROC
- DB 197,125,111,5,10,124,0,0 ; vmovdqa 0x7c0a(%rip),%ymm8 # 2c2e0 <_sk_overlay_sse2_8bit+0xbd3>
+ DB 197,125,111,5,10,124,0,0 ; vmovdqa 0x7c0a(%rip),%ymm8 # 2c820 <_sk_overlay_sse2_8bit+0xbd3>
DB 196,194,117,0,224 ; vpshufb %ymm8,%ymm1,%ymm4
DB 196,194,125,0,232 ; vpshufb %ymm8,%ymm0,%ymm5
DB 196,98,125,48,210 ; vpmovzxbw %xmm2,%ymm10
@@ -34982,7 +35270,7 @@ _sk_dstatop_hsw_8bit LABEL PROC
PUBLIC _sk_srcin_hsw_8bit
_sk_srcin_hsw_8bit LABEL PROC
- DB 197,253,111,37,193,122,0,0 ; vmovdqa 0x7ac1(%rip),%ymm4 # 2c300 <_sk_overlay_sse2_8bit+0xbf3>
+ DB 197,253,111,37,193,122,0,0 ; vmovdqa 0x7ac1(%rip),%ymm4 # 2c840 <_sk_overlay_sse2_8bit+0xbf3>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,226,125,48,240 ; vpmovzxbw %xmm0,%ymm6
@@ -35020,7 +35308,7 @@ _sk_srcin_hsw_8bit LABEL PROC
PUBLIC _sk_dstin_hsw_8bit
_sk_dstin_hsw_8bit LABEL PROC
- DB 197,253,111,37,55,122,0,0 ; vmovdqa 0x7a37(%rip),%ymm4 # 2c320 <_sk_overlay_sse2_8bit+0xc13>
+ DB 197,253,111,37,55,122,0,0 ; vmovdqa 0x7a37(%rip),%ymm4 # 2c860 <_sk_overlay_sse2_8bit+0xc13>
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,125,48,226 ; vpmovzxbw %xmm2,%ymm4
@@ -35058,7 +35346,7 @@ _sk_dstin_hsw_8bit LABEL PROC
PUBLIC _sk_srcout_hsw_8bit
_sk_srcout_hsw_8bit LABEL PROC
- DB 197,253,111,37,171,121,0,0 ; vmovdqa 0x79ab(%rip),%ymm4 # 2c340 <_sk_overlay_sse2_8bit+0xc33>
+ DB 197,253,111,37,171,121,0,0 ; vmovdqa 0x79ab(%rip),%ymm4 # 2c880 <_sk_overlay_sse2_8bit+0xc33>
DB 196,226,109,0,236 ; vpshufb %ymm4,%ymm2,%ymm5
DB 196,226,101,0,228 ; vpshufb %ymm4,%ymm3,%ymm4
DB 197,205,118,246 ; vpcmpeqd %ymm6,%ymm6,%ymm6
@@ -35099,7 +35387,7 @@ _sk_srcout_hsw_8bit LABEL PROC
PUBLIC _sk_dstout_hsw_8bit
_sk_dstout_hsw_8bit LABEL PROC
- DB 197,253,111,37,21,121,0,0 ; vmovdqa 0x7915(%rip),%ymm4 # 2c360 <_sk_overlay_sse2_8bit+0xc53>
+ DB 197,253,111,37,21,121,0,0 ; vmovdqa 0x7915(%rip),%ymm4 # 2c8a0 <_sk_overlay_sse2_8bit+0xc53>
DB 196,226,125,0,196 ; vpshufb %ymm4,%ymm0,%ymm0
DB 196,226,117,0,204 ; vpshufb %ymm4,%ymm1,%ymm1
DB 197,221,118,228 ; vpcmpeqd %ymm4,%ymm4,%ymm4
@@ -35140,7 +35428,7 @@ _sk_dstout_hsw_8bit LABEL PROC
PUBLIC _sk_srcover_hsw_8bit
_sk_srcover_hsw_8bit LABEL PROC
- DB 197,253,111,37,125,120,0,0 ; vmovdqa 0x787d(%rip),%ymm4 # 2c380 <_sk_overlay_sse2_8bit+0xc73>
+ DB 197,253,111,37,125,120,0,0 ; vmovdqa 0x787d(%rip),%ymm4 # 2c8c0 <_sk_overlay_sse2_8bit+0xc73>
DB 196,226,117,0,236 ; vpshufb %ymm4,%ymm1,%ymm5
DB 196,226,125,0,228 ; vpshufb %ymm4,%ymm0,%ymm4
DB 196,98,125,48,202 ; vpmovzxbw %xmm2,%ymm9
@@ -35182,7 +35470,7 @@ _sk_srcover_hsw_8bit LABEL PROC
PUBLIC _sk_dstover_hsw_8bit
_sk_dstover_hsw_8bit LABEL PROC
- DB 197,253,111,37,222,119,0,0 ; vmovdqa 0x77de(%rip),%ymm4 # 2c3a0 <_sk_overlay_sse2_8bit+0xc93>
+ DB 197,253,111,37,222,119,0,0 ; vmovdqa 0x77de(%rip),%ymm4 # 2c8e0 <_sk_overlay_sse2_8bit+0xc93>
DB 196,226,101,0,236 ; vpshufb %ymm4,%ymm3,%ymm5
DB 196,226,109,0,228 ; vpshufb %ymm4,%ymm2,%ymm4
DB 196,98,125,48,200 ; vpmovzxbw %xmm0,%ymm9
@@ -35262,7 +35550,7 @@ _sk_multiply_hsw_8bit LABEL PROC
DB 72,131,236,56 ; sub $0x38,%rsp
DB 197,253,111,243 ; vmovdqa %ymm3,%ymm6
DB 197,253,111,218 ; vmovdqa %ymm2,%ymm3
- DB 197,125,111,13,155,118,0,0 ; vmovdqa 0x769b(%rip),%ymm9 # 2c3c0 <_sk_overlay_sse2_8bit+0xcb3>
+ DB 197,125,111,13,155,118,0,0 ; vmovdqa 0x769b(%rip),%ymm9 # 2c900 <_sk_overlay_sse2_8bit+0xcb3>
DB 196,194,101,0,225 ; vpshufb %ymm9,%ymm3,%ymm4
DB 196,194,77,0,233 ; vpshufb %ymm9,%ymm6,%ymm5
DB 196,65,45,118,210 ; vpcmpeqd %ymm10,%ymm10,%ymm10
@@ -35403,7 +35691,7 @@ _sk_screen_hsw_8bit LABEL PROC
PUBLIC _sk_xor__hsw_8bit
_sk_xor__hsw_8bit LABEL PROC
- DB 197,125,111,13,39,116,0,0 ; vmovdqa 0x7427(%rip),%ymm9 # 2c3e0 <_sk_overlay_sse2_8bit+0xcd3>
+ DB 197,125,111,13,39,116,0,0 ; vmovdqa 0x7427(%rip),%ymm9 # 2c920 <_sk_overlay_sse2_8bit+0xcd3>
DB 196,194,109,0,225 ; vpshufb %ymm9,%ymm2,%ymm4
DB 196,194,101,0,249 ; vpshufb %ymm9,%ymm3,%ymm7
DB 196,65,37,118,219 ; vpcmpeqd %ymm11,%ymm11,%ymm11
@@ -35487,7 +35775,7 @@ _sk_plus__hsw_8bit LABEL PROC
PUBLIC _sk_darken_hsw_8bit
_sk_darken_hsw_8bit LABEL PROC
- DB 197,125,111,5,201,114,0,0 ; vmovdqa 0x72c9(%rip),%ymm8 # 2c400 <_sk_overlay_sse2_8bit+0xcf3>
+ DB 197,125,111,5,201,114,0,0 ; vmovdqa 0x72c9(%rip),%ymm8 # 2c940 <_sk_overlay_sse2_8bit+0xcf3>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35560,7 +35848,7 @@ _sk_darken_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,110,106,0,0 ; vpbroadcastd 0x6a6e(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607>
+ DB 196,226,125,88,37,110,106,0,0 ; vpbroadcastd 0x6a6e(%rip),%ymm4 # 2c254 <_sk_overlay_sse2_8bit+0x607>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35568,7 +35856,7 @@ _sk_darken_hsw_8bit LABEL PROC
PUBLIC _sk_lighten_hsw_8bit
_sk_lighten_hsw_8bit LABEL PROC
- DB 197,125,111,5,98,113,0,0 ; vmovdqa 0x7162(%rip),%ymm8 # 2c420 <_sk_overlay_sse2_8bit+0xd13>
+ DB 197,125,111,5,98,113,0,0 ; vmovdqa 0x7162(%rip),%ymm8 # 2c960 <_sk_overlay_sse2_8bit+0xd13>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35641,7 +35929,7 @@ _sk_lighten_hsw_8bit LABEL PROC
DB 197,253,248,246 ; vpsubb %ymm6,%ymm0,%ymm6
DB 197,245,248,205 ; vpsubb %ymm5,%ymm1,%ymm1
DB 197,253,248,196 ; vpsubb %ymm4,%ymm0,%ymm0
- DB 196,226,125,88,37,231,104,0,0 ; vpbroadcastd 0x68e7(%rip),%ymm4 # 2bd14 <_sk_overlay_sse2_8bit+0x607>
+ DB 196,226,125,88,37,231,104,0,0 ; vpbroadcastd 0x68e7(%rip),%ymm4 # 2c254 <_sk_overlay_sse2_8bit+0x607>
DB 196,227,125,76,198,64 ; vpblendvb %ymm4,%ymm6,%ymm0,%ymm0
DB 196,227,117,76,207,64 ; vpblendvb %ymm4,%ymm7,%ymm1,%ymm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -35679,7 +35967,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
DB 196,227,77,56,252,1 ; vinserti128 $0x1,%xmm4,%ymm6,%ymm7
DB 196,227,77,70,228,49 ; vperm2i128 $0x31,%ymm4,%ymm6,%ymm4
DB 197,197,103,228 ; vpackuswb %ymm4,%ymm7,%ymm4
- DB 197,253,111,53,100,111,0,0 ; vmovdqa 0x6f64(%rip),%ymm6 # 2c440 <_sk_overlay_sse2_8bit+0xd33>
+ DB 197,253,111,53,100,111,0,0 ; vmovdqa 0x6f64(%rip),%ymm6 # 2c980 <_sk_overlay_sse2_8bit+0xd33>
DB 197,221,219,254 ; vpand %ymm6,%ymm4,%ymm7
DB 197,213,219,246 ; vpand %ymm6,%ymm5,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35693,7 +35981,7 @@ _sk_exclusion_hsw_8bit LABEL PROC
PUBLIC _sk_difference_hsw_8bit
_sk_difference_hsw_8bit LABEL PROC
- DB 197,125,111,5,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm8 # 2c460 <_sk_overlay_sse2_8bit+0xd53>
+ DB 197,125,111,5,88,111,0,0 ; vmovdqa 0x6f58(%rip),%ymm8 # 2c9a0 <_sk_overlay_sse2_8bit+0xd53>
DB 196,194,101,0,224 ; vpshufb %ymm8,%ymm3,%ymm4
DB 196,194,109,0,240 ; vpshufb %ymm8,%ymm2,%ymm6
DB 196,98,125,48,208 ; vpmovzxbw %xmm0,%ymm10
@@ -35760,7 +36048,7 @@ _sk_difference_hsw_8bit LABEL PROC
DB 197,197,103,237 ; vpackuswb %ymm5,%ymm7,%ymm5
DB 197,181,218,228 ; vpminub %ymm4,%ymm9,%ymm4
DB 197,165,218,237 ; vpminub %ymm5,%ymm11,%ymm5
- DB 197,253,111,53,34,110,0,0 ; vmovdqa 0x6e22(%rip),%ymm6 # 2c480 <_sk_overlay_sse2_8bit+0xd73>
+ DB 197,253,111,53,34,110,0,0 ; vmovdqa 0x6e22(%rip),%ymm6 # 2c9c0 <_sk_overlay_sse2_8bit+0xd73>
DB 197,213,219,254 ; vpand %ymm6,%ymm5,%ymm7
DB 197,221,219,246 ; vpand %ymm6,%ymm4,%ymm6
DB 197,237,252,192 ; vpaddb %ymm0,%ymm2,%ymm0
@@ -35784,7 +36072,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,227,125,57,203,1 ; vextracti128 $0x1,%ymm1,%xmm3
DB 196,98,125,48,195 ; vpmovzxbw %xmm3,%ymm8
DB 197,126,127,132,36,64,1,0,0 ; vmovdqu %ymm8,0x140(%rsp)
- DB 197,253,111,29,216,109,0,0 ; vmovdqa 0x6dd8(%rip),%ymm3 # 2c4a0 <_sk_overlay_sse2_8bit+0xd93>
+ DB 197,253,111,29,216,109,0,0 ; vmovdqa 0x6dd8(%rip),%ymm3 # 2c9e0 <_sk_overlay_sse2_8bit+0xd93>
DB 196,226,125,0,227 ; vpshufb %ymm3,%ymm0,%ymm4
DB 196,226,117,0,203 ; vpshufb %ymm3,%ymm1,%ymm1
DB 197,125,111,251 ; vmovdqa %ymm3,%ymm15
@@ -35813,7 +36101,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 196,65,125,111,231 ; vmovdqa %ymm15,%ymm12
DB 196,194,93,0,220 ; vpshufb %ymm12,%ymm4,%ymm3
DB 196,226,125,48,211 ; vpmovzxbw %xmm3,%ymm2
- DB 196,226,125,121,5,90,109,0,0 ; vpbroadcastw 0x6d5a(%rip),%ymm0 # 2c4c0 <_sk_overlay_sse2_8bit+0xdb3>
+ DB 196,226,125,121,5,90,109,0,0 ; vpbroadcastw 0x6d5a(%rip),%ymm0 # 2ca00 <_sk_overlay_sse2_8bit+0xdb3>
DB 197,109,239,248 ; vpxor %ymm0,%ymm2,%ymm15
DB 197,133,213,207 ; vpmullw %ymm7,%ymm15,%ymm1
DB 197,254,127,140,36,160,1,0,0 ; vmovdqu %ymm1,0x1a0(%rsp)
@@ -35913,7 +36201,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,254,111,116,36,96 ; vmovdqu 0x60(%rsp),%ymm6
DB 197,205,253,180,36,128,0,0,0 ; vpaddw 0x80(%rsp),%ymm6,%ymm6
DB 196,193,53,253,252 ; vpaddw %ymm12,%ymm9,%ymm7
- DB 196,98,125,121,5,57,107,0,0 ; vpbroadcastw 0x6b39(%rip),%ymm8 # 2c4c2 <_sk_overlay_sse2_8bit+0xdb5>
+ DB 196,98,125,121,5,57,107,0,0 ; vpbroadcastw 0x6b39(%rip),%ymm8 # 2ca02 <_sk_overlay_sse2_8bit+0xdb5>
DB 196,193,93,253,224 ; vpaddw %ymm8,%ymm4,%ymm4
DB 197,229,253,220 ; vpaddw %ymm4,%ymm3,%ymm3
DB 196,193,85,253,224 ; vpaddw %ymm8,%ymm5,%ymm4
@@ -35922,7 +36210,7 @@ _sk_hardlight_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,14,107,0,0 ; vpbroadcastw 0x6b0e(%rip),%ymm4 # 2c4c4 <_sk_overlay_sse2_8bit+0xdb7>
+ DB 196,226,125,121,37,14,107,0,0 ; vpbroadcastw 0x6b0e(%rip),%ymm4 # 2ca04 <_sk_overlay_sse2_8bit+0xdb7>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,237,228,212 ; vpmulhuw %ymm4,%ymm2,%ymm2
@@ -35947,7 +36235,7 @@ PUBLIC _sk_overlay_hsw_8bit
_sk_overlay_hsw_8bit LABEL PROC
DB 72,129,236,24,2,0,0 ; sub $0x218,%rsp
DB 197,252,17,140,36,192,1,0,0 ; vmovups %ymm1,0x1c0(%rsp)
- DB 197,253,111,45,181,106,0,0 ; vmovdqa 0x6ab5(%rip),%ymm5 # 2c4e0 <_sk_overlay_sse2_8bit+0xdd3>
+ DB 197,253,111,45,181,106,0,0 ; vmovdqa 0x6ab5(%rip),%ymm5 # 2ca20 <_sk_overlay_sse2_8bit+0xdd3>
DB 197,253,111,226 ; vmovdqa %ymm2,%ymm4
DB 196,227,125,57,225,1 ; vextracti128 $0x1,%ymm4,%xmm1
DB 196,98,125,48,193 ; vpmovzxbw %xmm1,%ymm8
@@ -35982,7 +36270,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,93,117,251 ; vpcmpeqw %ymm3,%ymm4,%ymm15
DB 197,253,111,216 ; vmovdqa %ymm0,%ymm3
DB 196,226,125,48,227 ; vpmovzxbw %xmm3,%ymm4
- DB 196,226,125,121,5,15,106,0,0 ; vpbroadcastw 0x6a0f(%rip),%ymm0 # 2c500 <_sk_overlay_sse2_8bit+0xdf3>
+ DB 196,226,125,121,5,15,106,0,0 ; vpbroadcastw 0x6a0f(%rip),%ymm0 # 2ca40 <_sk_overlay_sse2_8bit+0xdf3>
DB 197,117,239,232 ; vpxor %ymm0,%ymm1,%ymm13
DB 197,21,213,212 ; vpmullw %ymm4,%ymm13,%ymm10
DB 197,126,127,148,36,64,1,0,0 ; vmovdqu %ymm10,0x140(%rsp)
@@ -36083,7 +36371,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,254,111,116,36,64 ; vmovdqu 0x40(%rsp),%ymm6
DB 197,205,253,116,36,96 ; vpaddw 0x60(%rsp),%ymm6,%ymm6
DB 196,193,29,253,253 ; vpaddw %ymm13,%ymm12,%ymm7
- DB 196,98,125,121,5,2,104,0,0 ; vpbroadcastw 0x6802(%rip),%ymm8 # 2c502 <_sk_overlay_sse2_8bit+0xdf5>
+ DB 196,98,125,121,5,2,104,0,0 ; vpbroadcastw 0x6802(%rip),%ymm8 # 2ca42 <_sk_overlay_sse2_8bit+0xdf5>
DB 196,193,109,253,208 ; vpaddw %ymm8,%ymm2,%ymm2
DB 197,229,253,210 ; vpaddw %ymm2,%ymm3,%ymm2
DB 196,193,85,253,216 ; vpaddw %ymm8,%ymm5,%ymm3
@@ -36092,7 +36380,7 @@ _sk_overlay_hsw_8bit LABEL PROC
DB 197,245,253,204 ; vpaddw %ymm4,%ymm1,%ymm1
DB 196,193,69,253,224 ; vpaddw %ymm8,%ymm7,%ymm4
DB 197,253,253,196 ; vpaddw %ymm4,%ymm0,%ymm0
- DB 196,226,125,121,37,215,103,0,0 ; vpbroadcastw 0x67d7(%rip),%ymm4 # 2c504 <_sk_overlay_sse2_8bit+0xdf7>
+ DB 196,226,125,121,37,215,103,0,0 ; vpbroadcastw 0x67d7(%rip),%ymm4 # 2ca44 <_sk_overlay_sse2_8bit+0xdf7>
DB 197,253,228,196 ; vpmulhuw %ymm4,%ymm0,%ymm0
DB 197,245,228,204 ; vpmulhuw %ymm4,%ymm1,%ymm1
DB 197,229,228,220 ; vpmulhuw %ymm4,%ymm3,%ymm3
@@ -36146,7 +36434,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 25e9b <_sk_start_pipeline_sse41_8bit+0x10b>
+ DB 15,131,138,0,0,0 ; jae 263db <_sk_start_pipeline_sse41_8bit+0x10b>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -36156,7 +36444,7 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
- DB 119,36 ; ja 25e77 <_sk_start_pipeline_sse41_8bit+0xe7>
+ DB 119,36 ; ja 263b7 <_sk_start_pipeline_sse41_8bit+0xe7>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -36165,17 +36453,17 @@ _sk_start_pipeline_sse41_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,16 ; add $0x10,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 25e53 <_sk_start_pipeline_sse41_8bit+0xc3>
+ DB 118,220 ; jbe 26393 <_sk_start_pipeline_sse41_8bit+0xc3>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 25e8f <_sk_start_pipeline_sse41_8bit+0xff>
+ DB 116,16 ; je 263cf <_sk_start_pipeline_sse41_8bit+0xff>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 25e2a <_sk_start_pipeline_sse41_8bit+0x9a>
+ DB 117,143 ; jne 2636a <_sk_start_pipeline_sse41_8bit+0x9a>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -36213,7 +36501,7 @@ _sk_uniform_color_sse41_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse41_8bit
_sk_set_rgb_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,152,92,0,0 ; movss 0x5c98(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,16,37,152,92,0,0 ; movss 0x5c98(%rip),%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx
@@ -36228,7 +36516,7 @@ _sk_set_rgb_sse41_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,208,108,0,0 ; movdqa 0x6cd0(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,45,208,108,0,0 ; movdqa 0x6cd0(%rip),%xmm5 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -36240,12 +36528,12 @@ PUBLIC _sk_premul_sse41_8bit
_sk_premul_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,188,108,0,0 ; movdqa 0x6cbc(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,5,188,108,0,0 ; movdqa 0x6cbc(%rip),%xmm0 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,253 ; movdqa %xmm5,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,244 ; movdqa %xmm4,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
- DB 102,15,111,5,146,108,0,0 ; movdqa 0x6c92(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,5,146,108,0,0 ; movdqa 0x6c92(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
@@ -36276,7 +36564,7 @@ _sk_premul_sse41_8bit LABEL PROC
PUBLIC _sk_swap_rb_sse41_8bit
_sk_swap_rb_sse41_8bit LABEL PROC
- DB 102,15,111,37,47,108,0,0 ; movdqa 0x6c2f(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
+ DB 102,15,111,37,47,108,0,0 ; movdqa 0x6c2f(%rip),%xmm4 # 2d180 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36301,7 +36589,7 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 26061 <_sk_load_8888_sse41_8bit+0x32>
+ DB 117,17 ; jne 265a1 <_sk_load_8888_sse41_8bit+0x32>
DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36311,24 +36599,24 @@ _sk_load_8888_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 2605d <_sk_load_8888_sse41_8bit+0x2e>
+ DB 119,231 ; ja 2659d <_sk_load_8888_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 260cc <_sk_load_8888_sse41_8bit+0x9d>
+ DB 72,141,13,75,0,0,0 ; lea 0x4b(%rip),%rcx # 2660c <_sk_load_8888_sse41_8bit+0x9d>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e>
+ DB 235,203 ; jmp 2659d <_sk_load_8888_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,177 ; jmp 2605d <_sk_load_8888_sse41_8bit+0x2e>
+ DB 235,177 ; jmp 2659d <_sk_load_8888_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- DB 235,139 ; jmp 26057 <_sk_load_8888_sse41_8bit+0x28>
+ DB 235,139 ; jmp 26597 <_sk_load_8888_sse41_8bit+0x28>
DB 190,255,255,255,210 ; mov $0xd2ffffff,%esi
DB 255 ; (bad)
DB 255 ; (bad)
@@ -36358,7 +36646,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,17 ; jne 2611a <_sk_load_8888_dst_sse41_8bit+0x32>
+ DB 117,17 ; jne 2665a <_sk_load_8888_dst_sse41_8bit+0x32>
DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36368,24 +36656,24 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 119,231 ; ja 26656 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 26188 <_sk_load_8888_dst_sse41_8bit+0xa0>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 266c8 <_sk_load_8888_dst_sse41_8bit+0xa0>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 235,203 ; jmp 26656 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,177 ; jmp 26116 <_sk_load_8888_dst_sse41_8bit+0x2e>
+ DB 235,177 ; jmp 26656 <_sk_load_8888_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- DB 235,139 ; jmp 26110 <_sk_load_8888_dst_sse41_8bit+0x28>
+ DB 235,139 ; jmp 26650 <_sk_load_8888_dst_sse41_8bit+0x28>
DB 15,31,0 ; nopl (%rax)
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -36397,7 +36685,7 @@ _sk_load_8888_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,221 ; jmpq ffffffffde0261a0 <_sk_overlay_sse2_8bit+0xffffffffddffaa93>
+ DB 233,255,255,255,221 ; jmpq ffffffffde0266e0 <_sk_overlay_sse2_8bit+0xffffffffddffaa93>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; .byte 0xff
@@ -36413,7 +36701,7 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 261d6 <_sk_store_8888_sse41_8bit+0x32>
+ DB 117,17 ; jne 26716 <_sk_store_8888_sse41_8bit+0x32>
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36421,22 +36709,22 @@ _sk_store_8888_sse41_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 261d2 <_sk_store_8888_sse41_8bit+0x2e>
+ DB 119,239 ; ja 26712 <_sk_store_8888_sse41_8bit+0x2e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 26234 <_sk_store_8888_sse41_8bit+0x90>
+ DB 72,141,13,70,0,0,0 ; lea 0x46(%rip),%rcx # 26774 <_sk_store_8888_sse41_8bit+0x90>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4)
- DB 235,211 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,211 ; jmp 26712 <_sk_store_8888_sse41_8bit+0x2e>
DB 102,66,15,58,22,68,138,8,2 ; pextrd $0x2,%xmm0,0x8(%rdx,%r9,4)
DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4)
- DB 235,194 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,194 ; jmp 26712 <_sk_store_8888_sse41_8bit+0x2e>
DB 102,66,15,58,22,76,138,24,2 ; pextrd $0x2,%xmm1,0x18(%rdx,%r9,4)
DB 102,66,15,58,22,76,138,20,1 ; pextrd $0x1,%xmm1,0x14(%rdx,%r9,4)
DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4)
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
- DB 235,161 ; jmp 261d2 <_sk_store_8888_sse41_8bit+0x2e>
+ DB 235,161 ; jmp 26712 <_sk_store_8888_sse41_8bit+0x2e>
DB 15,31,0 ; nopl (%rax)
DB 195 ; retq
DB 255 ; (bad)
@@ -36473,10 +36761,10 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 26294 <_sk_load_bgra_sse41_8bit+0x44>
+ DB 117,35 ; jne 267d4 <_sk_load_bgra_sse41_8bit+0x44>
DB 243,66,15,111,76,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm1
DB 243,66,15,111,4,130 ; movdqu (%rdx,%r8,4),%xmm0
- DB 102,15,111,37,186,105,0,0 ; movdqa 0x69ba(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
+ DB 102,15,111,37,186,105,0,0 ; movdqa 0x69ba(%rip),%xmm4 # 2d180 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36486,24 +36774,24 @@ _sk_load_bgra_sse41_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,213 ; ja 2627e <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 119,213 ; ja 267be <_sk_load_bgra_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 26304 <_sk_load_bgra_sse41_8bit+0xb4>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 26844 <_sk_load_bgra_sse41_8bit+0xb4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,4,130 ; movd (%rdx,%r8,4),%xmm0
- DB 235,185 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 235,185 ; jmp 267be <_sk_load_bgra_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,196,15 ; pblendw $0xf,%xmm4,%xmm0
- DB 235,159 ; jmp 2627e <_sk_load_bgra_sse41_8bit+0x2e>
+ DB 235,159 ; jmp 267be <_sk_load_bgra_sse41_8bit+0x2e>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 102,66,15,58,34,76,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm1
DB 102,66,15,58,34,76,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm1
- DB 233,118,255,255,255 ; jmpq 26278 <_sk_load_bgra_sse41_8bit+0x28>
+ DB 233,118,255,255,255 ; jmpq 267b8 <_sk_load_bgra_sse41_8bit+0x28>
DB 102,144 ; xchg %ax,%ax
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
@@ -36534,10 +36822,10 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,35 ; jne 26364 <_sk_load_bgra_dst_sse41_8bit+0x44>
+ DB 117,35 ; jne 268a4 <_sk_load_bgra_dst_sse41_8bit+0x44>
DB 243,66,15,111,92,130,16 ; movdqu 0x10(%rdx,%r8,4),%xmm3
DB 243,66,15,111,20,130 ; movdqu (%rdx,%r8,4),%xmm2
- DB 102,15,111,37,234,104,0,0 ; movdqa 0x68ea(%rip),%xmm4 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
+ DB 102,15,111,37,234,104,0,0 ; movdqa 0x68ea(%rip),%xmm4 # 2d180 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,56,0,212 ; pshufb %xmm4,%xmm2
DB 102,15,56,0,220 ; pshufb %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36547,24 +36835,24 @@ _sk_load_bgra_dst_sse41_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,213 ; ja 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 119,213 ; ja 2688e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 263d4 <_sk_load_bgra_dst_sse41_8bit+0xb4>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 26914 <_sk_load_bgra_dst_sse41_8bit+0xb4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,110,20,130 ; movd (%rdx,%r8,4),%xmm2
- DB 235,185 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 235,185 ; jmp 2688e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 243,66,15,126,36,130 ; movq (%rdx,%r8,4),%xmm4
DB 102,15,58,14,212,15 ; pblendw $0xf,%xmm4,%xmm2
- DB 235,159 ; jmp 2634e <_sk_load_bgra_dst_sse41_8bit+0x2e>
+ DB 235,159 ; jmp 2688e <_sk_load_bgra_dst_sse41_8bit+0x2e>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 102,66,15,58,34,92,130,20,1 ; pinsrd $0x1,0x14(%rdx,%r8,4),%xmm3
DB 102,66,15,58,34,92,130,16,0 ; pinsrd $0x0,0x10(%rdx,%r8,4),%xmm3
- DB 233,118,255,255,255 ; jmpq 26348 <_sk_load_bgra_dst_sse41_8bit+0x28>
+ DB 233,118,255,255,255 ; jmpq 26888 <_sk_load_bgra_dst_sse41_8bit+0x28>
DB 102,144 ; xchg %ax,%ax
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
@@ -36594,13 +36882,13 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 102,15,111,53,44,104,0,0 ; movdqa 0x682c(%rip),%xmm6 # 2cc40 <_sk_overlay_sse2_8bit+0x1533>
+ DB 102,15,111,53,44,104,0,0 ; movdqa 0x682c(%rip),%xmm6 # 2d180 <_sk_overlay_sse2_8bit+0x1533>
DB 102,15,111,233 ; movdqa %xmm1,%xmm5
DB 102,15,56,0,238 ; pshufb %xmm6,%xmm5
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,230 ; pshufb %xmm6,%xmm4
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 2643c <_sk_store_bgra_sse41_8bit+0x4c>
+ DB 117,17 ; jne 2697c <_sk_store_bgra_sse41_8bit+0x4c>
DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4)
DB 243,66,15,127,108,138,16 ; movdqu %xmm5,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36608,22 +36896,22 @@ _sk_store_bgra_sse41_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 26438 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 119,239 ; ja 26978 <_sk_store_bgra_sse41_8bit+0x48>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 26498 <_sk_store_bgra_sse41_8bit+0xa8>
+ DB 72,141,13,68,0,0,0 ; lea 0x44(%rip),%rcx # 269d8 <_sk_store_bgra_sse41_8bit+0xa8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,36,138 ; movd %xmm4,(%rdx,%r9,4)
- DB 235,211 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,211 ; jmp 26978 <_sk_store_bgra_sse41_8bit+0x48>
DB 102,66,15,58,22,100,138,8,2 ; pextrd $0x2,%xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,36,138 ; movq %xmm4,(%rdx,%r9,4)
- DB 235,194 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,194 ; jmp 26978 <_sk_store_bgra_sse41_8bit+0x48>
DB 102,66,15,58,22,108,138,24,2 ; pextrd $0x2,%xmm5,0x18(%rdx,%r9,4)
DB 102,66,15,58,22,108,138,20,1 ; pextrd $0x1,%xmm5,0x14(%rdx,%r9,4)
DB 102,66,15,126,108,138,16 ; movd %xmm5,0x10(%rdx,%r9,4)
DB 243,66,15,127,36,138 ; movdqu %xmm4,(%rdx,%r9,4)
- DB 235,161 ; jmp 26438 <_sk_store_bgra_sse41_8bit+0x48>
+ DB 235,161 ; jmp 26978 <_sk_store_bgra_sse41_8bit+0x48>
DB 144 ; nop
DB 197,255,255 ; (bad)
DB 255,214 ; callq *%rsi
@@ -36656,9 +36944,9 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,42 ; jne 264fb <_sk_load_a8_sse41_8bit+0x47>
+ DB 117,42 ; jne 26a3b <_sk_load_a8_sse41_8bit+0x47>
DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,48,96,0,0 ; pand 0x6030(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,13,48,96,0,0 ; pand 0x6030(%rip),%xmm1 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -36670,15 +36958,15 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 264d8 <_sk_load_a8_sse41_8bit+0x24>
+ DB 119,204 ; ja 26a18 <_sk_load_a8_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 2658c <_sk_load_a8_sse41_8bit+0xd8>
+ DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 26acc <_sk_load_a8_sse41_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,173 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,173 ; jmp 26a18 <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36686,7 +36974,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 235,136 ; jmp 264d8 <_sk_load_a8_sse41_8bit+0x24>
+ DB 235,136 ; jmp 26a18 <_sk_load_a8_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36697,7 +36985,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,77,255,255,255 ; jmpq 264d8 <_sk_load_a8_sse41_8bit+0x24>
+ DB 233,77,255,255,255 ; jmpq 26a18 <_sk_load_a8_sse41_8bit+0x24>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -36706,7 +36994,7 @@ _sk_load_a8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf02659c <_sk_overlay_sse2_8bit+0xffffffffdeffae8f>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf026adc <_sk_overlay_sse2_8bit+0xffffffffdeffae8f>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -36727,9 +37015,9 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,42 ; jne 265ef <_sk_load_a8_dst_sse41_8bit+0x47>
+ DB 117,42 ; jne 26b2f <_sk_load_a8_dst_sse41_8bit+0x47>
DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3
- DB 102,15,219,29,60,95,0,0 ; pand 0x5f3c(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,29,60,95,0,0 ; pand 0x5f3c(%rip),%xmm3 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -36741,15 +37029,15 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,204 ; ja 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 119,204 ; ja 26b0c <_sk_load_a8_dst_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 26680 <_sk_load_a8_dst_sse41_8bit+0xd8>
+ DB 72,141,13,117,0,0,0 ; lea 0x75(%rip),%rcx # 26bc0 <_sk_load_a8_dst_sse41_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,173 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,173 ; jmp 26b0c <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36757,7 +37045,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 235,136 ; jmp 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 235,136 ; jmp 26b0c <_sk_load_a8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36768,7 +37056,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,77,255,255,255 ; jmpq 265cc <_sk_load_a8_dst_sse41_8bit+0x24>
+ DB 233,77,255,255,255 ; jmpq 26b0c <_sk_load_a8_dst_sse41_8bit+0x24>
DB 144 ; nop
DB 148 ; xchg %eax,%esp
DB 255 ; (bad)
@@ -36777,7 +37065,7 @@ _sk_load_a8_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf026690 <_sk_overlay_sse2_8bit+0xffffffffdeffaf83>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf026bd0 <_sk_overlay_sse2_8bit+0xffffffffdeffaf83>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -36797,39 +37085,39 @@ _sk_store_a8_sse41_8bit LABEL PROC
DB 72,99,87,8 ; movslq 0x8(%rdi),%rdx
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
- DB 102,15,111,45,148,101,0,0 ; movdqa 0x6594(%rip),%xmm5 # 2cc50 <_sk_overlay_sse2_8bit+0x1543>
+ DB 102,15,111,45,148,101,0,0 ; movdqa 0x6594(%rip),%xmm5 # 2d190 <_sk_overlay_sse2_8bit+0x1543>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,245 ; pshufb %xmm5,%xmm6
DB 102,15,111,224 ; movdqa %xmm0,%xmm4
DB 102,15,56,0,229 ; pshufb %xmm5,%xmm4
DB 102,15,108,230 ; punpcklqdq %xmm6,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,19 ; jne 266ea <_sk_store_a8_sse41_8bit+0x4e>
- DB 102,15,56,0,37,48,101,0,0 ; pshufb 0x6530(%rip),%xmm4 # 2cc10 <_sk_overlay_sse2_8bit+0x1503>
+ DB 117,19 ; jne 26c2a <_sk_store_a8_sse41_8bit+0x4e>
+ DB 102,15,56,0,37,48,101,0,0 ; pshufb 0x6530(%rip),%xmm4 # 2d150 <_sk_overlay_sse2_8bit+0x1503>
DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
DB 255,224 ; jmpq *%rax
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,239 ; ja 266e6 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 119,239 ; ja 26c26 <_sk_store_a8_sse41_8bit+0x4a>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 26760 <_sk_store_a8_sse41_8bit+0xc4>
+ DB 72,141,13,94,0,0,0 ; lea 0x5e(%rip),%rcx # 26ca0 <_sk_store_a8_sse41_8bit+0xc4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,58,20,36,2,0 ; pextrb $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,209 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,209 ; jmp 26c26 <_sk_store_a8_sse41_8bit+0x4a>
DB 102,66,15,58,20,100,2,2,4 ; pextrb $0x4,%xmm4,0x2(%rdx,%r8,1)
- DB 102,15,56,0,37,249,93,0,0 ; pshufb 0x5df9(%rip),%xmm4 # 2c520 <_sk_overlay_sse2_8bit+0xe13>
+ DB 102,15,56,0,37,249,93,0,0 ; pshufb 0x5df9(%rip),%xmm4 # 2ca60 <_sk_overlay_sse2_8bit+0xe13>
DB 102,66,15,58,21,36,2,0 ; pextrw $0x0,%xmm4,(%rdx,%r8,1)
- DB 235,181 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,181 ; jmp 26c26 <_sk_store_a8_sse41_8bit+0x4a>
DB 102,66,15,58,20,100,2,6,12 ; pextrb $0xc,%xmm4,0x6(%rdx,%r8,1)
DB 102,66,15,58,20,100,2,5,10 ; pextrb $0xa,%xmm4,0x5(%rdx,%r8,1)
DB 102,66,15,58,20,100,2,4,8 ; pextrb $0x8,%xmm4,0x4(%rdx,%r8,1)
- DB 102,15,56,0,37,219,93,0,0 ; pshufb 0x5ddb(%rip),%xmm4 # 2c530 <_sk_overlay_sse2_8bit+0xe23>
+ DB 102,15,56,0,37,219,93,0,0 ; pshufb 0x5ddb(%rip),%xmm4 # 2ca70 <_sk_overlay_sse2_8bit+0xe23>
DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1)
- DB 235,137 ; jmp 266e6 <_sk_store_a8_sse41_8bit+0x4a>
+ DB 235,137 ; jmp 26c26 <_sk_store_a8_sse41_8bit+0x4a>
DB 15,31,0 ; nopl (%rax)
DB 171 ; stos %eax,%es:(%rdi)
DB 255 ; (bad)
@@ -36863,16 +37151,16 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,66 ; jne 267db <_sk_load_g8_sse41_8bit+0x5f>
+ DB 117,66 ; jne 26d1b <_sk_load_g8_sse41_8bit+0x5f>
DB 102,66,15,56,48,12,2 ; pmovzxbw (%rdx,%r8,1),%xmm1
- DB 102,15,219,13,104,93,0,0 ; pand 0x5d68(%rip),%xmm1 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,13,104,93,0,0 ; pand 0x5d68(%rip),%xmm1 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,193 ; pmovzxwd %xmm1,%xmm0
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
- DB 102,15,111,37,163,100,0,0 ; movdqa 0x64a3(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
+ DB 102,15,111,37,163,100,0,0 ; movdqa 0x64a3(%rip),%xmm4 # 2d1a0 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,56,64,204 ; pmulld %xmm4,%xmm1
DB 102,15,56,64,196 ; pmulld %xmm4,%xmm0
- DB 102,15,111,37,81,100,0,0 ; movdqa 0x6451(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,37,81,100,0,0 ; movdqa 0x6451(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36881,15 +37169,15 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 267a0 <_sk_load_g8_sse41_8bit+0x24>
+ DB 119,180 ; ja 26ce0 <_sk_load_g8_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26870 <_sk_load_g8_sse41_8bit+0xf4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26db0 <_sk_load_g8_sse41_8bit+0xf4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,200 ; movd %eax,%xmm1
- DB 235,149 ; jmp 267a0 <_sk_load_g8_sse41_8bit+0x24>
+ DB 235,149 ; jmp 26ce0 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,2 ; pinsrw $0x2,%eax,%xmm1
@@ -36897,7 +37185,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,15,110,192 ; movd %eax,%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,3 ; pblendw $0x3,%xmm0,%xmm1
- DB 233,109,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24>
+ DB 233,109,255,255,255 ; jmpq 26ce0 <_sk_load_g8_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,196,200,6 ; pinsrw $0x6,%eax,%xmm1
@@ -36908,7 +37196,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 102,66,15,110,4,2 ; movd (%rdx,%r8,1),%xmm0
DB 102,15,56,48,192 ; pmovzxbw %xmm0,%xmm0
DB 102,15,58,14,200,15 ; pblendw $0xf,%xmm0,%xmm1
- DB 233,50,255,255,255 ; jmpq 267a0 <_sk_load_g8_sse41_8bit+0x24>
+ DB 233,50,255,255,255 ; jmpq 26ce0 <_sk_load_g8_sse41_8bit+0x24>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36917,7 +37205,7 @@ _sk_load_g8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde026880 <_sk_overlay_sse2_8bit+0xffffffffddffb173>
+ DB 232,255,255,255,221 ; callq ffffffffde026dc0 <_sk_overlay_sse2_8bit+0xffffffffddffb173>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -36938,16 +37226,16 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,66 ; jne 268eb <_sk_load_g8_dst_sse41_8bit+0x5f>
+ DB 117,66 ; jne 26e2b <_sk_load_g8_dst_sse41_8bit+0x5f>
DB 102,66,15,56,48,28,2 ; pmovzxbw (%rdx,%r8,1),%xmm3
- DB 102,15,219,29,88,92,0,0 ; pand 0x5c58(%rip),%xmm3 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,29,88,92,0,0 ; pand 0x5c58(%rip),%xmm3 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,56,51,211 ; pmovzxwd %xmm3,%xmm2
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
- DB 102,15,111,37,147,99,0,0 ; movdqa 0x6393(%rip),%xmm4 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
+ DB 102,15,111,37,147,99,0,0 ; movdqa 0x6393(%rip),%xmm4 # 2d1a0 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,56,64,220 ; pmulld %xmm4,%xmm3
DB 102,15,56,64,212 ; pmulld %xmm4,%xmm2
- DB 102,15,111,37,65,99,0,0 ; movdqa 0x6341(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,37,65,99,0,0 ; movdqa 0x6341(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -36956,15 +37244,15 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,180 ; ja 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 119,180 ; ja 26df0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26980 <_sk_load_g8_dst_sse41_8bit+0xf4>
+ DB 72,141,13,121,0,0,0 ; lea 0x79(%rip),%rcx # 26ec0 <_sk_load_g8_dst_sse41_8bit+0xf4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,216 ; movd %eax,%xmm3
- DB 235,149 ; jmp 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 235,149 ; jmp 26df0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,2 ; pinsrw $0x2,%eax,%xmm3
@@ -36972,7 +37260,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,15,110,208 ; movd %eax,%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,3 ; pblendw $0x3,%xmm2,%xmm3
- DB 233,109,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 233,109,255,255,255 ; jmpq 26df0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,196,216,6 ; pinsrw $0x6,%eax,%xmm3
@@ -36983,7 +37271,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 102,66,15,110,20,2 ; movd (%rdx,%r8,1),%xmm2
DB 102,15,56,48,210 ; pmovzxbw %xmm2,%xmm2
DB 102,15,58,14,218,15 ; pblendw $0xf,%xmm2,%xmm3
- DB 233,50,255,255,255 ; jmpq 268b0 <_sk_load_g8_dst_sse41_8bit+0x24>
+ DB 233,50,255,255,255 ; jmpq 26df0 <_sk_load_g8_dst_sse41_8bit+0x24>
DB 102,144 ; xchg %ax,%ax
DB 144 ; nop
DB 255 ; (bad)
@@ -36992,7 +37280,7 @@ _sk_load_g8_dst_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 232,255,255,255,221 ; callq ffffffffde026990 <_sk_overlay_sse2_8bit+0xffffffffddffb283>
+ DB 232,255,255,255,221 ; callq ffffffffde026ed0 <_sk_overlay_sse2_8bit+0xffffffffddffb283>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,210 ; callq *%rdx
@@ -37014,11 +37302,11 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,206,0,0,0 ; jne 26a8f <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
+ DB 15,133,206,0,0,0 ; jne 26fcf <_sk_srcover_rgba_8888_sse41_8bit+0xf3>
DB 243,70,15,111,68,138,16 ; movdqu 0x10(%rdx,%r9,4),%xmm8
DB 243,70,15,111,12,138 ; movdqu (%rdx,%r9,4),%xmm9
DB 77,133,192 ; test %r8,%r8
- DB 102,15,111,37,87,98,0,0 ; movdqa 0x6257(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,37,87,98,0,0 ; movdqa 0x6257(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,241 ; movdqa %xmm1,%xmm6
DB 102,15,56,0,244 ; pshufb %xmm4,%xmm6
DB 102,15,111,248 ; movdqa %xmm0,%xmm7
@@ -37052,7 +37340,7 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,68,15,248,204 ; psubb %xmm4,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,72 ; jne 26ac6 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
+ DB 117,72 ; jne 27006 <_sk_srcover_rgba_8888_sse41_8bit+0x12a>
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -37063,43 +37351,43 @@ _sk_srcover_rgba_8888_sse41_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 254,200 ; dec %al
DB 60,6 ; cmp $0x6,%al
- DB 15,135,38,255,255,255 ; ja 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 15,135,38,255,255,255 ; ja 26f0e <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 26b6c <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
+ DB 72,141,13,186,0,0,0 ; lea 0xba(%rip),%rcx # 270ac <_sk_srcover_rgba_8888_sse41_8bit+0x1d0>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,110,12,138 ; movd (%rdx,%r9,4),%xmm9
- DB 233,8,255,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 233,8,255,255,255 ; jmpq 26f0e <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,184 ; ja 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 119,184 ; ja 26fcb <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 26b88 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
+ DB 72,141,13,170,0,0,0 ; lea 0xaa(%rip),%rcx # 270c8 <_sk_srcover_rgba_8888_sse41_8bit+0x1ec>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4)
- DB 235,156 ; jmp 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 235,156 ; jmp 26fcb <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 243,66,15,126,36,138 ; movq (%rdx,%r9,4),%xmm4
DB 102,68,15,58,14,204,15 ; pblendw $0xf,%xmm4,%xmm9
- DB 233,192,254,255,255 ; jmpq 269ce <_sk_srcover_rgba_8888_sse41_8bit+0x32>
+ DB 233,192,254,255,255 ; jmpq 26f0e <_sk_srcover_rgba_8888_sse41_8bit+0x32>
DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 102,70,15,58,34,68,138,20,1 ; pinsrd $0x1,0x14(%rdx,%r9,4),%xmm8
DB 102,70,15,58,34,68,138,16,0 ; pinsrd $0x0,0x10(%rdx,%r9,4),%xmm8
- DB 233,150,254,255,255 ; jmpq 269c8 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
+ DB 233,150,254,255,255 ; jmpq 26f08 <_sk_srcover_rgba_8888_sse41_8bit+0x2c>
DB 102,70,15,58,22,76,138,8,2 ; pextrd $0x2,%xmm9,0x8(%rdx,%r9,4)
DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4)
- DB 233,69,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 233,69,255,255,255 ; jmpq 26fcb <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,70,15,58,22,68,138,24,2 ; pextrd $0x2,%xmm8,0x18(%rdx,%r9,4)
DB 102,70,15,58,22,68,138,20,1 ; pextrd $0x1,%xmm8,0x14(%rdx,%r9,4)
DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4)
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
- DB 233,33,255,255,255 ; jmpq 26a8b <_sk_srcover_rgba_8888_sse41_8bit+0xef>
+ DB 233,33,255,255,255 ; jmpq 26fcb <_sk_srcover_rgba_8888_sse41_8bit+0xef>
DB 102,144 ; xchg %ax,%ax
DB 79,255 ; rex.WRXB (bad)
DB 255 ; (bad)
@@ -37138,7 +37426,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,238,79,0,0 ; mulss 0x4fee(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,5,238,79,0,0 ; mulss 0x4fee(%rip),%xmm0 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 15,87,192 ; xorps %xmm0,%xmm0
DB 102,68,15,56,48,197 ; pmovzxbw %xmm5,%xmm8
@@ -37146,7 +37434,7 @@ _sk_scale_1_float_sse41_8bit LABEL PROC
DB 102,68,15,56,48,204 ; pmovzxbw %xmm4,%xmm9
DB 102,15,104,224 ; punpckhbw %xmm0,%xmm4
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 102,15,56,0,53,142,96,0,0 ; pshufb 0x608e(%rip),%xmm6 # 2cc70 <_sk_overlay_sse2_8bit+0x1563>
+ DB 102,15,56,0,53,142,96,0,0 ; pshufb 0x608e(%rip),%xmm6 # 2d1b0 <_sk_overlay_sse2_8bit+0x1563>
DB 102,15,111,206 ; movdqa %xmm6,%xmm1
DB 102,65,15,213,201 ; pmullw %xmm9,%xmm1
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
@@ -37177,13 +37465,13 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,160,0,0,0 ; jne 26cf3 <_sk_scale_u8_sse41_8bit+0xc1>
+ DB 15,133,160,0,0,0 ; jne 27233 <_sk_scale_u8_sse41_8bit+0xc1>
DB 102,66,15,56,48,52,2 ; pmovzxbw (%rdx,%r8,1),%xmm6
- DB 102,15,219,53,174,88,0,0 ; pand 0x58ae(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,53,174,88,0,0 ; pand 0x58ae(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
- DB 102,15,56,0,61,12,96,0,0 ; pshufb 0x600c(%rip),%xmm7 # 2cc80 <_sk_overlay_sse2_8bit+0x1573>
- DB 102,15,56,0,53,19,96,0,0 ; pshufb 0x6013(%rip),%xmm6 # 2cc90 <_sk_overlay_sse2_8bit+0x1583>
+ DB 102,15,56,0,61,12,96,0,0 ; pshufb 0x600c(%rip),%xmm7 # 2d1c0 <_sk_overlay_sse2_8bit+0x1573>
+ DB 102,15,56,0,53,19,96,0,0 ; pshufb 0x6013(%rip),%xmm6 # 2d1d0 <_sk_overlay_sse2_8bit+0x1583>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37214,15 +37502,15 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,82,255,255,255 ; ja 26c5a <_sk_scale_u8_sse41_8bit+0x28>
+ DB 15,135,82,255,255,255 ; ja 2719a <_sk_scale_u8_sse41_8bit+0x28>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 26d90 <_sk_scale_u8_sse41_8bit+0x15e>
+ DB 72,141,13,125,0,0,0 ; lea 0x7d(%rip),%rcx # 272d0 <_sk_scale_u8_sse41_8bit+0x15e>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,240 ; movd %eax,%xmm6
- DB 233,48,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,48,255,255,255 ; jmpq 2719a <_sk_scale_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,2 ; pinsrw $0x2,%eax,%xmm6
@@ -37230,7 +37518,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,3 ; pblendw $0x3,%xmm4,%xmm6
- DB 233,8,255,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,8,255,255,255 ; jmpq 2719a <_sk_scale_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,15,196,240,6 ; pinsrw $0x6,%eax,%xmm6
@@ -37241,7 +37529,7 @@ _sk_scale_u8_sse41_8bit LABEL PROC
DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4
DB 102,15,56,48,228 ; pmovzxbw %xmm4,%xmm4
DB 102,15,58,14,244,15 ; pblendw $0xf,%xmm4,%xmm6
- DB 233,205,254,255,255 ; jmpq 26c5a <_sk_scale_u8_sse41_8bit+0x28>
+ DB 233,205,254,255,255 ; jmpq 2719a <_sk_scale_u8_sse41_8bit+0x28>
DB 15,31,0 ; nopl (%rax)
DB 140,255 ; mov %?,%edi
DB 255 ; (bad)
@@ -37266,7 +37554,7 @@ PUBLIC _sk_lerp_1_float_sse41_8bit
_sk_lerp_1_float_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,238,77,0,0 ; mulss 0x4dee(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,37,238,77,0,0 ; mulss 0x4dee(%rip),%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -37277,7 +37565,7 @@ _sk_lerp_1_float_sse41_8bit LABEL PROC
DB 102,65,15,104,193 ; punpckhbw %xmm9,%xmm0
DB 102,68,15,56,48,217 ; pmovzxbw %xmm1,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,56,0,61,171,94,0,0 ; pshufb 0x5eab(%rip),%xmm7 # 2cca0 <_sk_overlay_sse2_8bit+0x1593>
+ DB 102,15,56,0,61,171,94,0,0 ; pshufb 0x5eab(%rip),%xmm7 # 2d1e0 <_sk_overlay_sse2_8bit+0x1593>
DB 102,68,15,111,231 ; movdqa %xmm7,%xmm12
DB 102,69,15,213,227 ; pmullw %xmm11,%xmm12
DB 102,68,15,111,239 ; movdqa %xmm7,%xmm13
@@ -37336,13 +37624,13 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,46,1,0,0 ; jne 2701d <_sk_lerp_u8_sse41_8bit+0x14f>
+ DB 15,133,46,1,0,0 ; jne 2755d <_sk_lerp_u8_sse41_8bit+0x14f>
DB 102,66,15,56,48,60,2 ; pmovzxbw (%rdx,%r8,1),%xmm7
- DB 102,15,219,61,18,86,0,0 ; pand 0x5612(%rip),%xmm7 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,61,18,86,0,0 ; pand 0x5612(%rip),%xmm7 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,111,247 ; movdqa %xmm7,%xmm6
- DB 102,15,56,0,53,112,93,0,0 ; pshufb 0x5d70(%rip),%xmm6 # 2cc80 <_sk_overlay_sse2_8bit+0x1573>
- DB 102,15,56,0,61,119,93,0,0 ; pshufb 0x5d77(%rip),%xmm7 # 2cc90 <_sk_overlay_sse2_8bit+0x1583>
+ DB 102,15,56,0,53,112,93,0,0 ; pshufb 0x5d70(%rip),%xmm6 # 2d1c0 <_sk_overlay_sse2_8bit+0x1573>
+ DB 102,15,56,0,61,119,93,0,0 ; pshufb 0x5d77(%rip),%xmm7 # 2d1d0 <_sk_overlay_sse2_8bit+0x1583>
DB 102,68,15,56,48,200 ; pmovzxbw %xmm0,%xmm9
DB 102,65,15,104,192 ; punpckhbw %xmm8,%xmm0
DB 102,68,15,56,48,209 ; pmovzxbw %xmm1,%xmm10
@@ -37402,15 +37690,15 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,196,254,255,255 ; ja 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 15,135,196,254,255,255 ; ja 27436 <_sk_lerp_u8_sse41_8bit+0x28>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 270b8 <_sk_lerp_u8_sse41_8bit+0x1ea>
+ DB 72,141,13,123,0,0,0 ; lea 0x7b(%rip),%rcx # 275f8 <_sk_lerp_u8_sse41_8bit+0x1ea>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,248 ; movd %eax,%xmm7
- DB 233,162,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,162,254,255,255 ; jmpq 27436 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,2 ; pinsrw $0x2,%eax,%xmm7
@@ -37418,7 +37706,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,3 ; pblendw $0x3,%xmm5,%xmm7
- DB 233,122,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,122,254,255,255 ; jmpq 27436 <_sk_lerp_u8_sse41_8bit+0x28>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,255 ; pxor %xmm7,%xmm7
DB 102,15,196,248,6 ; pinsrw $0x6,%eax,%xmm7
@@ -37429,7 +37717,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5
DB 102,15,56,48,237 ; pmovzxbw %xmm5,%xmm5
DB 102,15,58,14,253,15 ; pblendw $0xf,%xmm5,%xmm7
- DB 233,63,254,255,255 ; jmpq 26ef6 <_sk_lerp_u8_sse41_8bit+0x28>
+ DB 233,63,254,255,255 ; jmpq 27436 <_sk_lerp_u8_sse41_8bit+0x28>
DB 144 ; nop
DB 142,255 ; mov %edi,%?
DB 255 ; (bad)
@@ -37437,7 +37725,7 @@ _sk_lerp_u8_sse41_8bit LABEL PROC
DB 255 ; (bad)
DB 255 ; (bad)
DB 255 ; (bad)
- DB 233,255,255,255,222 ; jmpq ffffffffdf0270c8 <_sk_overlay_sse2_8bit+0xffffffffdeffb9bb>
+ DB 233,255,255,255,222 ; jmpq ffffffffdf027608 <_sk_overlay_sse2_8bit+0xffffffffdeffb9bb>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,211 ; callq *%rbx
@@ -37465,7 +37753,7 @@ _sk_move_dst_src_sse41_8bit LABEL PROC
PUBLIC _sk_black_color_sse41_8bit
_sk_black_color_sse41_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,47,91,0,0 ; movaps 0x5b2f(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 15,40,5,47,91,0,0 ; movaps 0x5b2f(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -37485,7 +37773,7 @@ _sk_clear_sse41_8bit LABEL PROC
PUBLIC _sk_srcatop_sse41_8bit
_sk_srcatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,21,27,91,0,0 ; movdqa 0x5b1b(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,21,27,91,0,0 ; movdqa 0x5b1b(%rip),%xmm10 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,195 ; pmovzxbw %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
@@ -37553,7 +37841,7 @@ _sk_srcatop_sse41_8bit LABEL PROC
PUBLIC _sk_dstatop_sse41_8bit
_sk_dstatop_sse41_8bit LABEL PROC
- DB 102,68,15,111,29,224,89,0,0 ; movdqa 0x59e0(%rip),%xmm11 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,29,224,89,0,0 ; movdqa 0x59e0(%rip),%xmm11 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,233 ; movdqa %xmm1,%xmm13
DB 102,69,15,56,0,235 ; pshufb %xmm11,%xmm13
DB 102,68,15,111,248 ; movdqa %xmm0,%xmm15
@@ -37623,7 +37911,7 @@ PUBLIC _sk_srcin_sse41_8bit
_sk_srcin_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,151,88,0,0 ; movdqa 0x5897(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,5,151,88,0,0 ; movdqa 0x5897(%rip),%xmm0 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
DB 102,15,56,0,240 ; pshufb %xmm0,%xmm6
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
@@ -37656,7 +37944,7 @@ _sk_srcin_sse41_8bit LABEL PROC
PUBLIC _sk_dstin_sse41_8bit
_sk_dstin_sse41_8bit LABEL PROC
- DB 102,15,111,37,10,88,0,0 ; movdqa 0x580a(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,37,10,88,0,0 ; movdqa 0x580a(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,69,15,239,210 ; pxor %xmm10,%xmm10
@@ -37693,7 +37981,7 @@ PUBLIC _sk_srcout_sse41_8bit
_sk_srcout_sse41_8bit LABEL PROC
DB 102,15,111,225 ; movdqa %xmm1,%xmm4
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
- DB 102,15,111,5,109,87,0,0 ; movdqa 0x576d(%rip),%xmm0 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,5,109,87,0,0 ; movdqa 0x576d(%rip),%xmm0 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,111,250 ; movdqa %xmm2,%xmm7
DB 102,15,56,0,248 ; pshufb %xmm0,%xmm7
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -37729,7 +38017,7 @@ _sk_srcout_sse41_8bit LABEL PROC
PUBLIC _sk_dstout_sse41_8bit
_sk_dstout_sse41_8bit LABEL PROC
- DB 102,15,111,37,212,86,0,0 ; movdqa 0x56d4(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,37,212,86,0,0 ; movdqa 0x56d4(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,196 ; pshufb %xmm4,%xmm0
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,118,228 ; pcmpeqd %xmm4,%xmm4
@@ -37767,7 +38055,7 @@ _sk_dstout_sse41_8bit LABEL PROC
PUBLIC _sk_srcover_sse41_8bit
_sk_srcover_sse41_8bit LABEL PROC
- DB 102,15,111,53,51,86,0,0 ; movdqa 0x5633(%rip),%xmm6 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,53,51,86,0,0 ; movdqa 0x5633(%rip),%xmm6 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,68,15,56,0,222 ; pshufb %xmm6,%xmm11
DB 102,15,111,232 ; movdqa %xmm0,%xmm5
@@ -37806,7 +38094,7 @@ _sk_srcover_sse41_8bit LABEL PROC
PUBLIC _sk_dstover_sse41_8bit
_sk_dstover_sse41_8bit LABEL PROC
- DB 102,68,15,111,5,131,85,0,0 ; movdqa 0x5583(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,5,131,85,0,0 ; movdqa 0x5583(%rip),%xmm8 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,209 ; movdqa %xmm1,%xmm10
DB 102,68,15,56,48,201 ; pmovzxbw %xmm1,%xmm9
DB 102,15,252,203 ; paddb %xmm3,%xmm1
@@ -37881,7 +38169,7 @@ _sk_multiply_sse41_8bit LABEL PROC
DB 102,15,111,218 ; movdqa %xmm2,%xmm3
DB 102,15,111,209 ; movdqa %xmm1,%xmm2
DB 102,15,111,200 ; movdqa %xmm0,%xmm1
- DB 102,68,15,111,53,65,84,0,0 ; movdqa 0x5441(%rip),%xmm14 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,53,65,84,0,0 ; movdqa 0x5441(%rip),%xmm14 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,195 ; movdqa %xmm3,%xmm8
DB 102,15,111,235 ; movdqa %xmm3,%xmm5
DB 102,65,15,56,0,238 ; pshufb %xmm14,%xmm5
@@ -38006,7 +38294,7 @@ _sk_screen_sse41_8bit LABEL PROC
PUBLIC _sk_xor__sse41_8bit
_sk_xor__sse41_8bit LABEL PROC
- DB 102,68,15,111,21,255,81,0,0 ; movdqa 0x51ff(%rip),%xmm10 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,21,255,81,0,0 ; movdqa 0x51ff(%rip),%xmm10 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,226 ; movdqa %xmm2,%xmm12
DB 102,68,15,56,48,194 ; pmovzxbw %xmm2,%xmm8
DB 102,15,111,234 ; movdqa %xmm2,%xmm5
@@ -38084,7 +38372,7 @@ _sk_plus__sse41_8bit LABEL PROC
PUBLIC _sk_darken_sse41_8bit
_sk_darken_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,5,166,80,0,0 ; movdqa 0x50a6(%rip),%xmm8 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38151,7 +38439,7 @@ _sk_darken_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 15,40,5,218,79,0,0 ; movaps 0x4fda(%rip),%xmm0 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38161,7 +38449,7 @@ _sk_darken_sse41_8bit LABEL PROC
PUBLIC _sk_lighten_sse41_8bit
_sk_lighten_sse41_8bit LABEL PROC
DB 102,68,15,111,240 ; movdqa %xmm0,%xmm14
- DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,68,15,111,5,55,79,0,0 ; movdqa 0x4f37(%rip),%xmm8 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38228,7 +38516,7 @@ _sk_lighten_sse41_8bit LABEL PROC
DB 102,15,248,231 ; psubb %xmm7,%xmm4
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,68,15,248,245 ; psubb %xmm5,%xmm14
- DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 15,40,5,107,78,0,0 ; movaps 0x4e6b(%rip),%xmm0 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,56,16,244 ; pblendvb %xmm0,%xmm4,%xmm14
DB 102,65,15,56,16,200 ; pblendvb %xmm0,%xmm8,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38266,7 +38554,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,253 ; packuswb %xmm5,%xmm7
DB 102,15,103,230 ; packuswb %xmm6,%xmm4
- DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 102,15,111,45,193,77,0,0 ; movdqa 0x4dc1(%rip),%xmm5 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,204 ; psubb %xmm4,%xmm1
DB 102,15,219,229 ; pand %xmm5,%xmm4
DB 102,15,219,239 ; pand %xmm7,%xmm5
@@ -38279,7 +38567,7 @@ _sk_exclusion_sse41_8bit LABEL PROC
PUBLIC _sk_difference_sse41_8bit
_sk_difference_sse41_8bit LABEL PROC
DB 102,68,15,111,193 ; movdqa %xmm1,%xmm8
- DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,13,24,77,0,0 ; movdqa 0x4d18(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,111,219 ; movdqa %xmm3,%xmm11
DB 102,68,15,56,48,203 ; pmovzxbw %xmm3,%xmm9
DB 102,15,111,243 ; movdqa %xmm3,%xmm6
@@ -38317,7 +38605,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,113,215,8 ; psrlw $0x8,%xmm7
DB 102,15,103,254 ; packuswb %xmm6,%xmm7
- DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,37,93,76,0,0 ; movdqa 0x4c5d(%rip),%xmm4 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,15,56,0,204 ; pshufb %xmm4,%xmm1
DB 102,15,56,0,236 ; pshufb %xmm4,%xmm5
DB 102,69,15,104,236 ; punpckhbw %xmm12,%xmm13
@@ -38342,7 +38630,7 @@ _sk_difference_sse41_8bit LABEL PROC
DB 102,15,103,241 ; packuswb %xmm1,%xmm6
DB 102,65,15,218,230 ; pminub %xmm14,%xmm4
DB 102,15,218,247 ; pminub %xmm7,%xmm6
- DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 102,15,111,13,96,76,0,0 ; movdqa 0x4c60(%rip),%xmm1 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,68,15,248,198 ; psubb %xmm6,%xmm8
DB 102,15,219,241 ; pand %xmm1,%xmm6
DB 102,15,219,204 ; pand %xmm4,%xmm1
@@ -38369,7 +38657,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,69,15,56,48,221 ; pmovzxbw %xmm13,%xmm11
DB 102,68,15,127,156,36,176,0,0,0 ; movdqa %xmm11,0xb0(%rsp)
- DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,13,104,75,0,0 ; movdqa 0x4b68(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,68,15,56,0,233 ; pshufb %xmm1,%xmm13
DB 102,69,15,56,48,205 ; pmovzxbw %xmm13,%xmm9
@@ -38418,7 +38706,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,65,15,56,58,242 ; pminuw %xmm10,%xmm6
DB 102,15,117,240 ; pcmpeqw %xmm0,%xmm6
DB 102,15,127,180,36,192,0,0,0 ; movdqa %xmm6,0xc0(%rsp)
- DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,111,53,68,67,0,0 ; movdqa 0x4344(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,199 ; movdqa %xmm7,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,192 ; pmullw %xmm8,%xmm0
@@ -38525,7 +38813,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,15,253,124,36,16 ; paddw 0x10(%rsp),%xmm7
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
+ DB 102,15,111,5,177,72,0,0 ; movdqa 0x48b1(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,68,15,253,219 ; paddw %xmm3,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38534,7 +38822,7 @@ _sk_hardlight_sse41_8bit LABEL PROC
DB 102,15,253,252 ; paddw %xmm4,%xmm7
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
+ DB 102,15,111,5,151,72,0,0 ; movdqa 0x4897(%rip),%xmm0 # 2d210 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -38567,7 +38855,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,127,12,36 ; movdqa %xmm1,(%rsp)
DB 102,65,15,56,48,206 ; pmovzxbw %xmm14,%xmm1
DB 102,15,127,140,36,16,1,0,0 ; movdqa %xmm1,0x110(%rsp)
- DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2cc30 <_sk_overlay_sse2_8bit+0x1523>
+ DB 102,15,111,13,97,71,0,0 ; movdqa 0x4761(%rip),%xmm1 # 2d170 <_sk_overlay_sse2_8bit+0x1523>
DB 102,68,15,56,0,249 ; pshufb %xmm1,%xmm15
DB 102,68,15,56,0,241 ; pshufb %xmm1,%xmm14
DB 102,65,15,56,48,238 ; pmovzxbw %xmm14,%xmm5
@@ -38619,7 +38907,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,65,15,56,58,221 ; pminuw %xmm13,%xmm3
DB 102,15,117,216 ; pcmpeqw %xmm0,%xmm3
DB 102,15,127,156,36,176,0,0,0 ; movdqa %xmm3,0xb0(%rsp)
- DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,111,53,36,63,0,0 ; movdqa 0x3f24(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,15,213,196 ; pmullw %xmm4,%xmm0
@@ -38728,7 +39016,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,15,253,180,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm6
DB 102,68,15,253,132,36,128,0,0,0 ; paddw 0x80(%rsp),%xmm8
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
+ DB 102,15,111,5,144,68,0,0 ; movdqa 0x4490(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
DB 102,69,15,253,217 ; paddw %xmm9,%xmm11
DB 102,15,253,240 ; paddw %xmm0,%xmm6
@@ -38737,7 +39025,7 @@ _sk_overlay_sse41_8bit LABEL PROC
DB 102,68,15,253,195 ; paddw %xmm3,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,234 ; paddw %xmm2,%xmm5
- DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
+ DB 102,15,111,5,116,68,0,0 ; movdqa 0x4474(%rip),%xmm0 # 2d210 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
@@ -38790,7 +39078,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 73,137,246 ; mov %rsi,%r14
DB 76,137,141,240,254,255,255 ; mov %r9,-0x110(%rbp)
DB 77,57,207 ; cmp %r9,%r15
- DB 15,131,138,0,0,0 ; jae 289bf <_sk_start_pipeline_sse2_8bit+0x10b>
+ DB 15,131,138,0,0,0 ; jae 28eff <_sk_start_pipeline_sse2_8bit+0x10b>
DB 72,139,133,24,255,255,255 ; mov -0xe8(%rbp),%rax
DB 72,141,64,8 ; lea 0x8(%rax),%rax
DB 72,137,133,248,254,255,255 ; mov %rax,-0x108(%rbp)
@@ -38800,7 +39088,7 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 76,137,189,8,255,255,255 ; mov %r15,-0xf8(%rbp)
DB 72,199,133,16,255,255,255,0,0,0,0 ; movq $0x0,-0xf0(%rbp)
- DB 119,36 ; ja 2899b <_sk_start_pipeline_sse2_8bit+0xe7>
+ DB 119,36 ; ja 28edb <_sk_start_pipeline_sse2_8bit+0xe7>
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
@@ -38809,17 +39097,17 @@ _sk_start_pipeline_sse2_8bit LABEL PROC
DB 72,137,133,0,255,255,255 ; mov %rax,-0x100(%rbp)
DB 72,131,193,16 ; add $0x10,%rcx
DB 72,57,217 ; cmp %rbx,%rcx
- DB 118,220 ; jbe 28977 <_sk_start_pipeline_sse2_8bit+0xc3>
+ DB 118,220 ; jbe 28eb7 <_sk_start_pipeline_sse2_8bit+0xc3>
DB 72,137,217 ; mov %rbx,%rcx
DB 72,41,193 ; sub %rax,%rcx
- DB 116,16 ; je 289b3 <_sk_start_pipeline_sse2_8bit+0xff>
+ DB 116,16 ; je 28ef3 <_sk_start_pipeline_sse2_8bit+0xff>
DB 72,137,141,16,255,255,255 ; mov %rcx,-0xf0(%rbp)
DB 76,137,231 ; mov %r12,%rdi
DB 76,137,246 ; mov %r14,%rsi
DB 65,255,213 ; callq *%r13
DB 73,255,199 ; inc %r15
DB 76,59,189,240,254,255,255 ; cmp -0x110(%rbp),%r15
- DB 117,143 ; jne 2894e <_sk_start_pipeline_sse2_8bit+0x9a>
+ DB 117,143 ; jne 28e8e <_sk_start_pipeline_sse2_8bit+0x9a>
DB 15,40,181,32,255,255,255 ; movaps -0xe0(%rbp),%xmm6
DB 15,40,189,48,255,255,255 ; movaps -0xd0(%rbp),%xmm7
DB 68,15,40,133,64,255,255,255 ; movaps -0xc0(%rbp),%xmm8
@@ -38857,7 +39145,7 @@ _sk_uniform_color_sse2_8bit LABEL PROC
PUBLIC _sk_set_rgb_sse2_8bit
_sk_set_rgb_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 243,15,16,37,116,49,0,0 ; movss 0x3174(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,16,37,116,49,0,0 ; movss 0x3174(%rip),%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,16,40 ; movss (%rax),%xmm5
DB 243,15,89,236 ; mulss %xmm4,%xmm5
DB 243,72,15,44,205 ; cvttss2si %xmm5,%rcx
@@ -38872,7 +39160,7 @@ _sk_set_rgb_sse2_8bit LABEL PROC
DB 9,208 ; or %edx,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,112,228,0 ; pshufd $0x0,%xmm4,%xmm4
- DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,45,172,65,0,0 ; movdqa 0x41ac(%rip),%xmm5 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,219,205 ; pand %xmm5,%xmm1
DB 102,15,219,197 ; pand %xmm5,%xmm0
DB 102,15,235,196 ; por %xmm4,%xmm0
@@ -38895,7 +39183,7 @@ _sk_premul_sse2_8bit LABEL PROC
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
DB 242,15,112,192,95 ; pshuflw $0x5f,%xmm0,%xmm0
DB 243,15,112,248,95 ; pshufhw $0x5f,%xmm0,%xmm7
- DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,5,80,65,0,0 ; movdqa 0x4150(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,248 ; por %xmm0,%xmm7
DB 102,15,235,240 ; por %xmm0,%xmm6
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
@@ -38970,7 +39258,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 28bf0 <_sk_load_8888_sse2_8bit+0x31>
+ DB 117,16 ; jne 29130 <_sk_load_8888_sse2_8bit+0x31>
DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1
DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -38980,18 +39268,18 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 28bec <_sk_load_8888_sse2_8bit+0x2d>
+ DB 119,231 ; ja 2912c <_sk_load_8888_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 28c60 <_sk_load_8888_sse2_8bit+0xa1>
+ DB 72,141,13,80,0,0,0 ; lea 0x50(%rip),%rcx # 291a0 <_sk_load_8888_sse2_8bit+0xa1>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0
- DB 235,203 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d>
+ DB 235,203 ; jmp 2912c <_sk_load_8888_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 235,183 ; jmp 28bec <_sk_load_8888_sse2_8bit+0x2d>
+ DB 235,183 ; jmp 2912c <_sk_load_8888_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0
@@ -39000,7 +39288,7 @@ _sk_load_8888_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 235,134 ; jmp 28be6 <_sk_load_8888_sse2_8bit+0x27>
+ DB 235,134 ; jmp 29126 <_sk_load_8888_sse2_8bit+0x27>
DB 185,255,255,255,205 ; mov $0xcdffffff,%ecx
DB 255 ; (bad)
DB 255 ; (bad)
@@ -39029,7 +39317,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,16 ; jne 28cad <_sk_load_8888_dst_sse2_8bit+0x31>
+ DB 117,16 ; jne 291ed <_sk_load_8888_dst_sse2_8bit+0x31>
DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3
DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39039,18 +39327,18 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,231 ; ja 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 119,231 ; ja 291e9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 28d20 <_sk_load_8888_dst_sse2_8bit+0xa4>
+ DB 72,141,13,83,0,0,0 ; lea 0x53(%rip),%rcx # 29260 <_sk_load_8888_dst_sse2_8bit+0xa4>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2
- DB 235,203 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 235,203 ; jmp 291e9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 235,183 ; jmp 28ca9 <_sk_load_8888_dst_sse2_8bit+0x2d>
+ DB 235,183 ; jmp 291e9 <_sk_load_8888_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2
@@ -39059,7 +39347,7 @@ _sk_load_8888_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 235,134 ; jmp 28ca3 <_sk_load_8888_dst_sse2_8bit+0x27>
+ DB 235,134 ; jmp 291e3 <_sk_load_8888_dst_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 182,255 ; mov $0xff,%dh
DB 255 ; (bad)
@@ -39092,7 +39380,7 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 28d6e <_sk_store_8888_sse2_8bit+0x32>
+ DB 117,17 ; jne 292ae <_sk_store_8888_sse2_8bit+0x32>
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
DB 243,66,15,127,76,138,16 ; movdqu %xmm1,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39100,25 +39388,25 @@ _sk_store_8888_sse2_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 28d6a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 119,239 ; ja 292aa <_sk_store_8888_sse2_8bit+0x2e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 28dd4 <_sk_store_8888_sse2_8bit+0x98>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 29314 <_sk_store_8888_sse2_8bit+0x98>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,4,138 ; movd %xmm0,(%rdx,%r9,4)
- DB 235,211 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,211 ; jmp 292aa <_sk_store_8888_sse2_8bit+0x2e>
DB 102,15,112,224,78 ; pshufd $0x4e,%xmm0,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,4,138 ; movq %xmm0,(%rdx,%r9,4)
- DB 235,191 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,191 ; jmp 292aa <_sk_store_8888_sse2_8bit+0x2e>
DB 102,15,112,225,78 ; pshufd $0x4e,%xmm1,%xmm4
DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4)
DB 102,15,112,225,229 ; pshufd $0xe5,%xmm1,%xmm4
DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4)
DB 102,66,15,126,76,138,16 ; movd %xmm1,0x10(%rdx,%r9,4)
DB 243,66,15,127,4,138 ; movdqu %xmm0,(%rdx,%r9,4)
- DB 235,152 ; jmp 28d6a <_sk_store_8888_sse2_8bit+0x2e>
+ DB 235,152 ; jmp 292aa <_sk_store_8888_sse2_8bit+0x2e>
DB 102,144 ; xchg %ax,%ax
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -39152,7 +39440,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,92 ; jne 28e6d <_sk_load_bgra_sse2_8bit+0x7d>
+ DB 117,92 ; jne 293ad <_sk_load_bgra_sse2_8bit+0x7d>
DB 66,15,16,76,130,16 ; movups 0x10(%rdx,%r8,4),%xmm1
DB 102,66,15,16,4,130 ; movupd (%rdx,%r8,4),%xmm0
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -39179,18 +39467,18 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,155 ; ja 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 119,155 ; ja 2935d <_sk_load_bgra_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ee8 <_sk_load_bgra_sse2_8bit+0xf8>
+ DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 29428 <_sk_load_bgra_sse2_8bit+0xf8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,4,130 ; movss (%rdx,%r8,4),%xmm0
- DB 233,124,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 233,124,255,255,255 ; jmpq 2935d <_sk_load_bgra_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,8 ; movd 0x8(%rdx,%r8,4),%xmm0
DB 102,15,112,192,69 ; pshufd $0x45,%xmm0,%xmm0
DB 102,66,15,18,4,130 ; movlpd (%rdx,%r8,4),%xmm0
- DB 233,101,255,255,255 ; jmpq 28e1d <_sk_load_bgra_sse2_8bit+0x2d>
+ DB 233,101,255,255,255 ; jmpq 2935d <_sk_load_bgra_sse2_8bit+0x2d>
DB 102,66,15,110,68,130,24 ; movd 0x18(%rdx,%r8,4),%xmm0
DB 102,15,112,200,69 ; pshufd $0x45,%xmm0,%xmm1
DB 243,66,15,16,68,130,20 ; movss 0x14(%rdx,%r8,4),%xmm0
@@ -39199,7 +39487,7 @@ _sk_load_bgra_sse2_8bit LABEL PROC
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 243,66,15,16,68,130,16 ; movss 0x10(%rdx,%r8,4),%xmm0
DB 243,15,16,200 ; movss %xmm0,%xmm1
- DB 233,49,255,255,255 ; jmpq 28e17 <_sk_load_bgra_sse2_8bit+0x27>
+ DB 233,49,255,255,255 ; jmpq 29357 <_sk_load_bgra_sse2_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -39234,7 +39522,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,92 ; jne 28f81 <_sk_load_bgra_dst_sse2_8bit+0x7d>
+ DB 117,92 ; jne 294c1 <_sk_load_bgra_dst_sse2_8bit+0x7d>
DB 66,15,16,92,130,16 ; movups 0x10(%rdx,%r8,4),%xmm3
DB 102,66,15,16,20,130 ; movupd (%rdx,%r8,4),%xmm2
DB 102,15,239,228 ; pxor %xmm4,%xmm4
@@ -39261,18 +39549,18 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,155 ; ja 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 119,155 ; ja 29471 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 28ffc <_sk_load_bgra_dst_sse2_8bit+0xf8>
+ DB 72,141,13,91,0,0,0 ; lea 0x5b(%rip),%rcx # 2953c <_sk_load_bgra_dst_sse2_8bit+0xf8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,66,15,16,20,130 ; movss (%rdx,%r8,4),%xmm2
- DB 233,124,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 233,124,255,255,255 ; jmpq 29471 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,8 ; movd 0x8(%rdx,%r8,4),%xmm2
DB 102,15,112,210,69 ; pshufd $0x45,%xmm2,%xmm2
DB 102,66,15,18,20,130 ; movlpd (%rdx,%r8,4),%xmm2
- DB 233,101,255,255,255 ; jmpq 28f31 <_sk_load_bgra_dst_sse2_8bit+0x2d>
+ DB 233,101,255,255,255 ; jmpq 29471 <_sk_load_bgra_dst_sse2_8bit+0x2d>
DB 102,66,15,110,84,130,24 ; movd 0x18(%rdx,%r8,4),%xmm2
DB 102,15,112,218,69 ; pshufd $0x45,%xmm2,%xmm3
DB 243,66,15,16,84,130,20 ; movss 0x14(%rdx,%r8,4),%xmm2
@@ -39281,7 +39569,7 @@ _sk_load_bgra_dst_sse2_8bit LABEL PROC
DB 15,40,218 ; movaps %xmm2,%xmm3
DB 243,66,15,16,84,130,16 ; movss 0x10(%rdx,%r8,4),%xmm2
DB 243,15,16,218 ; movss %xmm2,%xmm3
- DB 233,49,255,255,255 ; jmpq 28f2b <_sk_load_bgra_dst_sse2_8bit+0x27>
+ DB 233,49,255,255,255 ; jmpq 2946b <_sk_load_bgra_dst_sse2_8bit+0x27>
DB 102,144 ; xchg %ax,%ax
DB 174 ; scas %es:(%rdi),%al
DB 255 ; (bad)
@@ -39335,7 +39623,7 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 243,15,112,237,198 ; pshufhw $0xc6,%xmm5,%xmm5
DB 102,15,103,238 ; packuswb %xmm6,%xmm5
DB 77,133,192 ; test %r8,%r8
- DB 117,17 ; jne 2909e <_sk_store_bgra_sse2_8bit+0x86>
+ DB 117,17 ; jne 295de <_sk_store_bgra_sse2_8bit+0x86>
DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4)
DB 243,66,15,127,100,138,16 ; movdqu %xmm4,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39343,25 +39631,25 @@ _sk_store_bgra_sse2_8bit LABEL PROC
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,239 ; ja 2909a <_sk_store_bgra_sse2_8bit+0x82>
+ DB 119,239 ; ja 295da <_sk_store_bgra_sse2_8bit+0x82>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 29104 <_sk_store_bgra_sse2_8bit+0xec>
+ DB 72,141,13,78,0,0,0 ; lea 0x4e(%rip),%rcx # 29644 <_sk_store_bgra_sse2_8bit+0xec>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,66,15,126,44,138 ; movd %xmm5,(%rdx,%r9,4)
- DB 235,211 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,211 ; jmp 295da <_sk_store_bgra_sse2_8bit+0x82>
DB 102,15,112,229,78 ; pshufd $0x4e,%xmm5,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,66,15,214,44,138 ; movq %xmm5,(%rdx,%r9,4)
- DB 235,191 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,191 ; jmp 295da <_sk_store_bgra_sse2_8bit+0x82>
DB 102,15,112,244,78 ; pshufd $0x4e,%xmm4,%xmm6
DB 102,66,15,126,116,138,24 ; movd %xmm6,0x18(%rdx,%r9,4)
DB 102,15,112,244,229 ; pshufd $0xe5,%xmm4,%xmm6
DB 102,66,15,126,116,138,20 ; movd %xmm6,0x14(%rdx,%r9,4)
DB 102,66,15,126,100,138,16 ; movd %xmm4,0x10(%rdx,%r9,4)
DB 243,66,15,127,44,138 ; movdqu %xmm5,(%rdx,%r9,4)
- DB 235,152 ; jmp 2909a <_sk_store_bgra_sse2_8bit+0x82>
+ DB 235,152 ; jmp 295da <_sk_store_bgra_sse2_8bit+0x82>
DB 102,144 ; xchg %ax,%ax
DB 187,255,255,255,207 ; mov $0xcfffffff,%ebx
DB 255 ; (bad)
@@ -39394,10 +39682,10 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,48 ; jne 2916d <_sk_load_a8_sse2_8bit+0x4d>
+ DB 117,48 ; jne 296ad <_sk_load_a8_sse2_8bit+0x4d>
DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,84,5,193,51,0,0 ; andpd 0x33c1(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,40,200 ; movapd %xmm0,%xmm1
DB 102,15,105,204 ; punpckhwd %xmm4,%xmm1
@@ -39410,15 +39698,15 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 29147 <_sk_load_a8_sse2_8bit+0x27>
+ DB 119,201 ; ja 29687 <_sk_load_a8_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 291f8 <_sk_load_a8_sse2_8bit+0xd8>
+ DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 29738 <_sk_load_a8_sse2_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 235,170 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27>
+ DB 235,170 ; jmp 29687 <_sk_load_a8_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39426,7 +39714,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 235,136 ; jmp 29147 <_sk_load_a8_sse2_8bit+0x27>
+ DB 235,136 ; jmp 29687 <_sk_load_a8_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39437,7 +39725,7 @@ _sk_load_a8_sse2_8bit LABEL PROC
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,80,255,255,255 ; jmpq 29147 <_sk_load_a8_sse2_8bit+0x27>
+ DB 233,80,255,255,255 ; jmpq 29687 <_sk_load_a8_sse2_8bit+0x27>
DB 144 ; nop
DB 154 ; (bad)
DB 255 ; (bad)
@@ -39469,10 +39757,10 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,48 ; jne 29261 <_sk_load_a8_dst_sse2_8bit+0x4d>
+ DB 117,48 ; jne 297a1 <_sk_load_a8_dst_sse2_8bit+0x4d>
DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,84,21,205,50,0,0 ; andpd 0x32cd(%rip),%xmm2 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,40,218 ; movapd %xmm2,%xmm3
DB 102,15,105,220 ; punpckhwd %xmm4,%xmm3
@@ -39485,15 +39773,15 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,201 ; ja 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 119,201 ; ja 2977b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 292ec <_sk_load_a8_dst_sse2_8bit+0xd8>
+ DB 72,141,13,111,0,0,0 ; lea 0x6f(%rip),%rcx # 2982c <_sk_load_a8_dst_sse2_8bit+0xd8>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 235,170 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 235,170 ; jmp 2977b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39501,7 +39789,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 235,136 ; jmp 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 235,136 ; jmp 2977b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39512,7 +39800,7 @@ _sk_load_a8_dst_sse2_8bit LABEL PROC
DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,80,255,255,255 ; jmpq 2923b <_sk_load_a8_dst_sse2_8bit+0x27>
+ DB 233,80,255,255,255 ; jmpq 2977b <_sk_load_a8_dst_sse2_8bit+0x27>
DB 144 ; nop
DB 154 ; (bad)
DB 255 ; (bad)
@@ -39554,8 +39842,8 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,114,228,16 ; psrad $0x10,%xmm4
DB 102,15,107,229 ; packssdw %xmm5,%xmm4
DB 77,133,201 ; test %r9,%r9
- DB 117,26 ; jne 2936d <_sk_store_a8_sse2_8bit+0x65>
- DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 117,26 ; jne 298ad <_sk_store_a8_sse2_8bit+0x65>
+ DB 102,15,219,37,181,49,0,0 ; pand 0x31b5(%rip),%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,66,15,214,36,2 ; movq %xmm4,(%rdx,%r8,1)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39564,24 +39852,24 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 65,128,225,7 ; and $0x7,%r9b
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,235 ; ja 29365 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 119,235 ; ja 298a5 <_sk_store_a8_sse2_8bit+0x5d>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 29408 <_sk_store_a8_sse2_8bit+0x100>
+ DB 72,141,13,131,0,0,0 ; lea 0x83(%rip),%rcx # 29948 <_sk_store_a8_sse2_8bit+0x100>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,15,127,36,36 ; movdqa %xmm4,(%rsp)
DB 138,4,36 ; mov (%rsp),%al
DB 66,136,4,2 ; mov %al,(%rdx,%r8,1)
- DB 235,201 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 235,201 ; jmp 298a5 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,15,127,100,36,16 ; movdqa %xmm4,0x10(%rsp)
DB 138,68,36,20 ; mov 0x14(%rsp),%al
DB 66,136,68,2,2 ; mov %al,0x2(%rdx,%r8,1)
- DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,37,93,49,0,0 ; pand 0x315d(%rip),%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,15,126,224 ; movd %xmm4,%eax
DB 102,66,137,4,2 ; mov %ax,(%rdx,%r8,1)
- DB 235,163 ; jmp 29365 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 235,163 ; jmp 298a5 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,15,127,100,36,64 ; movdqa %xmm4,0x40(%rsp)
DB 138,68,36,76 ; mov 0x4c(%rsp),%al
DB 66,136,68,2,6 ; mov %al,0x6(%rdx,%r8,1)
@@ -39591,10 +39879,10 @@ _sk_store_a8_sse2_8bit LABEL PROC
DB 102,15,127,100,36,32 ; movdqa %xmm4,0x20(%rsp)
DB 138,68,36,40 ; mov 0x28(%rsp),%al
DB 66,136,68,2,4 ; mov %al,0x4(%rdx,%r8,1)
- DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,37,25,49,0,0 ; pand 0x3119(%rip),%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,103,228 ; packuswb %xmm4,%xmm4
DB 102,66,15,126,36,2 ; movd %xmm4,(%rdx,%r8,1)
- DB 233,95,255,255,255 ; jmpq 29365 <_sk_store_a8_sse2_8bit+0x5d>
+ DB 233,95,255,255,255 ; jmpq 298a5 <_sk_store_a8_sse2_8bit+0x5d>
DB 102,144 ; xchg %ax,%ax
DB 134,255 ; xchg %bh,%bh
DB 255 ; (bad)
@@ -39626,15 +39914,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,116 ; jne 294b5 <_sk_load_g8_sse2_8bit+0x91>
+ DB 117,116 ; jne 299f5 <_sk_load_g8_sse2_8bit+0x91>
DB 243,66,15,126,4,2 ; movq (%rdx,%r8,1),%xmm0
DB 102,15,96,192 ; punpcklbw %xmm0,%xmm0
- DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,84,5,189,48,0,0 ; andpd 0x30bd(%rip),%xmm0 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,201 ; pxor %xmm1,%xmm1
DB 102,15,40,224 ; movapd %xmm0,%xmm4
DB 102,15,97,225 ; punpcklwd %xmm1,%xmm4
DB 102,15,105,193 ; punpckhwd %xmm1,%xmm0
- DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
+ DB 102,15,111,45,245,55,0,0 ; movdqa 0x37f5(%rip),%xmm5 # 2d1a0 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,112,240,245 ; pshufd $0xf5,%xmm0,%xmm6
DB 102,15,244,197 ; pmuludq %xmm5,%xmm0
DB 102,15,112,200,232 ; pshufd $0xe8,%xmm0,%xmm1
@@ -39647,7 +39935,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,196 ; punpckldq %xmm4,%xmm0
- DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,37,119,55,0,0 ; movdqa 0x3777(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,196 ; por %xmm4,%xmm0
DB 102,15,235,204 ; por %xmm4,%xmm1
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39656,15 +39944,15 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,133 ; ja 2944b <_sk_load_g8_sse2_8bit+0x27>
+ DB 119,133 ; ja 2998b <_sk_load_g8_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29548 <_sk_load_g8_sse2_8bit+0x124>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29a88 <_sk_load_g8_sse2_8bit+0x124>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,192 ; movd %eax,%xmm0
- DB 233,99,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,99,255,255,255 ; jmpq 2998b <_sk_load_g8_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,2 ; pinsrw $0x2,%eax,%xmm0
@@ -39672,7 +39960,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,15,110,200 ; movd %eax,%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 243,15,16,193 ; movss %xmm1,%xmm0
- DB 233,62,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,62,255,255,255 ; jmpq 2998b <_sk_load_g8_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,192 ; pxor %xmm0,%xmm0
DB 102,15,196,192,6 ; pinsrw $0x6,%eax,%xmm0
@@ -39683,7 +39971,7 @@ _sk_load_g8_sse2_8bit LABEL PROC
DB 102,66,15,110,12,2 ; movd (%rdx,%r8,1),%xmm1
DB 102,15,96,200 ; punpcklbw %xmm0,%xmm1
DB 242,15,16,193 ; movsd %xmm1,%xmm0
- DB 233,6,255,255,255 ; jmpq 2944b <_sk_load_g8_sse2_8bit+0x27>
+ DB 233,6,255,255,255 ; jmpq 2998b <_sk_load_g8_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39716,15 +40004,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 117,116 ; jne 295f5 <_sk_load_g8_dst_sse2_8bit+0x91>
+ DB 117,116 ; jne 29b35 <_sk_load_g8_dst_sse2_8bit+0x91>
DB 243,66,15,126,20,2 ; movq (%rdx,%r8,1),%xmm2
DB 102,15,96,208 ; punpcklbw %xmm0,%xmm2
- DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,84,21,125,47,0,0 ; andpd 0x2f7d(%rip),%xmm2 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,239,219 ; pxor %xmm3,%xmm3
DB 102,15,40,226 ; movapd %xmm2,%xmm4
DB 102,15,97,227 ; punpcklwd %xmm3,%xmm4
DB 102,15,105,211 ; punpckhwd %xmm3,%xmm2
- DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2cc60 <_sk_overlay_sse2_8bit+0x1553>
+ DB 102,15,111,45,181,54,0,0 ; movdqa 0x36b5(%rip),%xmm5 # 2d1a0 <_sk_overlay_sse2_8bit+0x1553>
DB 102,15,112,242,245 ; pshufd $0xf5,%xmm2,%xmm6
DB 102,15,244,213 ; pmuludq %xmm5,%xmm2
DB 102,15,112,218,232 ; pshufd $0xe8,%xmm2,%xmm3
@@ -39737,7 +40025,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,244,245 ; pmuludq %xmm5,%xmm6
DB 102,15,112,230,232 ; pshufd $0xe8,%xmm6,%xmm4
DB 102,15,98,212 ; punpckldq %xmm4,%xmm2
- DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 102,15,111,37,55,54,0,0 ; movdqa 0x3637(%rip),%xmm4 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 102,15,235,212 ; por %xmm4,%xmm2
DB 102,15,235,220 ; por %xmm4,%xmm3
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39746,15 +40034,15 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 119,133 ; ja 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 119,133 ; ja 29acb <_sk_load_g8_dst_sse2_8bit+0x27>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29688 <_sk_load_g8_dst_sse2_8bit+0x124>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29bc8 <_sk_load_g8_dst_sse2_8bit+0x124>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,208 ; movd %eax,%xmm2
- DB 233,99,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,99,255,255,255 ; jmpq 29acb <_sk_load_g8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,2 ; pinsrw $0x2,%eax,%xmm2
@@ -39762,7 +40050,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,15,110,216 ; movd %eax,%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 243,15,16,211 ; movss %xmm3,%xmm2
- DB 233,62,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,62,255,255,255 ; jmpq 29acb <_sk_load_g8_dst_sse2_8bit+0x27>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,210 ; pxor %xmm2,%xmm2
DB 102,15,196,208,6 ; pinsrw $0x6,%eax,%xmm2
@@ -39773,7 +40061,7 @@ _sk_load_g8_dst_sse2_8bit LABEL PROC
DB 102,66,15,110,28,2 ; movd (%rdx,%r8,1),%xmm3
DB 102,15,96,216 ; punpcklbw %xmm0,%xmm3
DB 242,15,16,211 ; movsd %xmm3,%xmm2
- DB 233,6,255,255,255 ; jmpq 2958b <_sk_load_g8_dst_sse2_8bit+0x27>
+ DB 233,6,255,255,255 ; jmpq 29acb <_sk_load_g8_dst_sse2_8bit+0x27>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -39807,7 +40095,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 72,193,226,2 ; shl $0x2,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,192 ; test %r8,%r8
- DB 15,133,253,0,0,0 ; jne 297c6 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
+ DB 15,133,253,0,0,0 ; jne 29d06 <_sk_srcover_rgba_8888_sse2_8bit+0x122>
DB 70,15,16,68,138,16 ; movups 0x10(%rdx,%r9,4),%xmm8
DB 102,70,15,16,12,138 ; movupd (%rdx,%r9,4),%xmm9
DB 77,133,192 ; test %r8,%r8
@@ -39856,7 +40144,7 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,68,15,248,207 ; psubb %xmm7,%xmm9
DB 102,68,15,252,200 ; paddb %xmm0,%xmm9
DB 102,68,15,252,193 ; paddb %xmm1,%xmm8
- DB 117,72 ; jne 297fd <_sk_srcover_rgba_8888_sse2_8bit+0x159>
+ DB 117,72 ; jne 29d3d <_sk_srcover_rgba_8888_sse2_8bit+0x159>
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
DB 243,70,15,127,68,138,16 ; movdqu %xmm8,0x10(%rdx,%r9,4)
DB 72,173 ; lods %ds:(%rsi),%rax
@@ -39867,29 +40155,29 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 102,69,15,239,201 ; pxor %xmm9,%xmm9
DB 254,200 ; dec %al
DB 60,6 ; cmp $0x6,%al
- DB 15,135,246,254,255,255 ; ja 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 15,135,246,254,255,255 ; ja 29c15 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 15,182,192 ; movzbl %al,%eax
- DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 298b8 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
+ DB 72,141,13,207,0,0,0 ; lea 0xcf(%rip),%rcx # 29df8 <_sk_srcover_rgba_8888_sse2_8bit+0x214>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 243,70,15,16,12,138 ; movss (%rdx,%r9,4),%xmm9
- DB 233,216,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 233,216,254,255,255 ; jmpq 29c15 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 65,128,224,7 ; and $0x7,%r8b
DB 65,254,200 ; dec %r8b
DB 65,128,248,6 ; cmp $0x6,%r8b
- DB 119,184 ; ja 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 119,184 ; ja 29d02 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 65,15,182,192 ; movzbl %r8b,%eax
- DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 298d4 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
+ DB 72,141,13,191,0,0,0 ; lea 0xbf(%rip),%rcx # 29e14 <_sk_srcover_rgba_8888_sse2_8bit+0x230>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 102,70,15,126,12,138 ; movd %xmm9,(%rdx,%r9,4)
- DB 235,156 ; jmp 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 235,156 ; jmp 29d02 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 102,66,15,110,100,138,8 ; movd 0x8(%rdx,%r9,4),%xmm4
DB 102,68,15,112,204,69 ; pshufd $0x45,%xmm4,%xmm9
DB 102,70,15,18,12,138 ; movlpd (%rdx,%r9,4),%xmm9
- DB 233,151,254,255,255 ; jmpq 296d5 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
+ DB 233,151,254,255,255 ; jmpq 29c15 <_sk_srcover_rgba_8888_sse2_8bit+0x31>
DB 102,66,15,110,100,138,24 ; movd 0x18(%rdx,%r9,4),%xmm4
DB 102,68,15,112,196,69 ; pshufd $0x45,%xmm4,%xmm8
DB 243,66,15,16,100,138,20 ; movss 0x14(%rdx,%r9,4),%xmm4
@@ -39898,23 +40186,23 @@ _sk_srcover_rgba_8888_sse2_8bit LABEL PROC
DB 68,15,40,196 ; movaps %xmm4,%xmm8
DB 243,66,15,16,100,138,16 ; movss 0x10(%rdx,%r9,4),%xmm4
DB 243,68,15,16,196 ; movss %xmm4,%xmm8
- DB 233,94,254,255,255 ; jmpq 296cf <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
+ DB 233,94,254,255,255 ; jmpq 29c0f <_sk_srcover_rgba_8888_sse2_8bit+0x2b>
DB 102,65,15,112,225,78 ; pshufd $0x4e,%xmm9,%xmm4
DB 102,66,15,126,100,138,8 ; movd %xmm4,0x8(%rdx,%r9,4)
DB 102,70,15,214,12,138 ; movq %xmm9,(%rdx,%r9,4)
- DB 233,57,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 233,57,255,255,255 ; jmpq 29d02 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 102,65,15,112,224,78 ; pshufd $0x4e,%xmm8,%xmm4
DB 102,66,15,126,100,138,24 ; movd %xmm4,0x18(%rdx,%r9,4)
DB 102,65,15,112,224,229 ; pshufd $0xe5,%xmm8,%xmm4
DB 102,66,15,126,100,138,20 ; movd %xmm4,0x14(%rdx,%r9,4)
DB 102,70,15,126,68,138,16 ; movd %xmm8,0x10(%rdx,%r9,4)
DB 243,70,15,127,12,138 ; movdqu %xmm9,(%rdx,%r9,4)
- DB 233,13,255,255,255 ; jmpq 297c2 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
+ DB 233,13,255,255,255 ; jmpq 29d02 <_sk_srcover_rgba_8888_sse2_8bit+0x11e>
DB 15,31,0 ; nopl (%rax)
DB 58,255 ; cmp %bh,%bh
DB 255 ; (bad)
DB 255 ; (bad)
- DB 123,255 ; jnp 298bd <_sk_srcover_rgba_8888_sse2_8bit+0x219>
+ DB 123,255 ; jnp 29dfd <_sk_srcover_rgba_8888_sse2_8bit+0x219>
DB 255 ; (bad)
DB 255,110,255 ; ljmp *-0x1(%rsi)
DB 255 ; (bad)
@@ -39950,7 +40238,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,200 ; movdqa %xmm0,%xmm9
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,0 ; movss (%rax),%xmm0
- DB 243,15,89,5,160,34,0,0 ; mulss 0x22a0(%rip),%xmm0 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,5,160,34,0,0 ; mulss 0x22a0(%rip),%xmm0 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,192 ; cvttss2si %xmm0,%eax
DB 102,15,239,246 ; pxor %xmm6,%xmm6
DB 102,65,15,111,193 ; movdqa %xmm9,%xmm0
@@ -39962,7 +40250,7 @@ _sk_scale_1_float_sse2_8bit LABEL PROC
DB 102,15,96,246 ; punpcklbw %xmm6,%xmm6
DB 242,15,112,246,0 ; pshuflw $0x0,%xmm6,%xmm6
DB 102,15,112,246,80 ; pshufd $0x50,%xmm6,%xmm6
- DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,219,53,207,43,0,0 ; pand 0x2bcf(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,254 ; movdqa %xmm6,%xmm7
DB 102,65,15,213,248 ; pmullw %xmm8,%xmm7
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
@@ -39993,10 +40281,10 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,239,0,0,0 ; jne 29aa1 <_sk_scale_u8_sse2_8bit+0x110>
+ DB 15,133,239,0,0,0 ; jne 29fe1 <_sk_scale_u8_sse2_8bit+0x110>
DB 243,66,15,126,36,2 ; movq (%rdx,%r8,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
- DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,84,37,76,43,0,0 ; andpd 0x2b4c(%rip),%xmm4 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,40,236 ; movapd %xmm4,%xmm5
DB 102,65,15,105,232 ; punpckhwd %xmm8,%xmm5
@@ -40049,15 +40337,15 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,6,255,255,255 ; ja 299bc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 15,135,6,255,255,255 ; ja 29efc <_sk_scale_u8_sse2_8bit+0x2b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 29b38 <_sk_scale_u8_sse2_8bit+0x1a7>
+ DB 72,141,13,119,0,0,0 ; lea 0x77(%rip),%rcx # 2a078 <_sk_scale_u8_sse2_8bit+0x1a7>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,224 ; movd %eax,%xmm4
- DB 233,228,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,228,254,255,255 ; jmpq 29efc <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,2 ; pinsrw $0x2,%eax,%xmm4
@@ -40065,7 +40353,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,15,110,232 ; movd %eax,%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 243,15,16,229 ; movss %xmm5,%xmm4
- DB 233,191,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,191,254,255,255 ; jmpq 29efc <_sk_scale_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,228 ; pxor %xmm4,%xmm4
DB 102,15,196,224,6 ; pinsrw $0x6,%eax,%xmm4
@@ -40076,7 +40364,7 @@ _sk_scale_u8_sse2_8bit LABEL PROC
DB 102,66,15,110,44,2 ; movd (%rdx,%r8,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
DB 242,15,16,229 ; movsd %xmm5,%xmm4
- DB 233,135,254,255,255 ; jmpq 299bc <_sk_scale_u8_sse2_8bit+0x2b>
+ DB 233,135,254,255,255 ; jmpq 29efc <_sk_scale_u8_sse2_8bit+0x2b>
DB 15,31,0 ; nopl (%rax)
DB 146 ; xchg %eax,%edx
DB 255 ; (bad)
@@ -40103,7 +40391,7 @@ PUBLIC _sk_lerp_1_float_sse2_8bit
_sk_lerp_1_float_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
DB 243,15,16,32 ; movss (%rax),%xmm4
- DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2bba8 <_sk_overlay_sse2_8bit+0x49b>
+ DB 243,15,89,37,70,32,0,0 ; mulss 0x2046(%rip),%xmm4 # 2c0e8 <_sk_overlay_sse2_8bit+0x49b>
DB 243,15,44,196 ; cvttss2si %xmm4,%eax
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,228 ; punpcklbw %xmm4,%xmm4
@@ -40116,7 +40404,7 @@ _sk_lerp_1_float_sse2_8bit LABEL PROC
DB 102,68,15,111,217 ; movdqa %xmm1,%xmm11
DB 102,69,15,96,217 ; punpcklbw %xmm9,%xmm11
DB 102,65,15,104,201 ; punpckhbw %xmm9,%xmm1
- DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,111,53,109,41,0,0 ; movdqa 0x296d(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,65,15,219,240 ; pand %xmm8,%xmm6
DB 102,15,111,230 ; movdqa %xmm6,%xmm4
DB 102,15,213,225 ; pmullw %xmm1,%xmm4
@@ -40179,10 +40467,10 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 72,15,175,209 ; imul %rcx,%rdx
DB 72,3,16 ; add (%rax),%rdx
DB 77,133,201 ; test %r9,%r9
- DB 15,133,141,1,0,0 ; jne 29e38 <_sk_lerp_u8_sse2_8bit+0x1ae>
+ DB 15,133,141,1,0,0 ; jne 2a378 <_sk_lerp_u8_sse2_8bit+0x1ae>
DB 243,66,15,126,44,2 ; movq (%rdx,%r8,1),%xmm5
DB 102,15,96,232 ; punpcklbw %xmm0,%xmm5
- DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,84,45,83,40,0,0 ; andpd 0x2853(%rip),%xmm5 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,69,15,239,192 ; pxor %xmm8,%xmm8
DB 102,15,40,229 ; movapd %xmm5,%xmm4
DB 102,65,15,105,224 ; punpckhwd %xmm8,%xmm4
@@ -40268,15 +40556,15 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 65,254,201 ; dec %r9b
DB 65,128,249,6 ; cmp $0x6,%r9b
- DB 15,135,104,254,255,255 ; ja 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 15,135,104,254,255,255 ; ja 2a1f5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 65,15,182,193 ; movzbl %r9b,%eax
- DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 29ecc <_sk_lerp_u8_sse2_8bit+0x242>
+ DB 72,141,13,116,0,0,0 ; lea 0x74(%rip),%rcx # 2a40c <_sk_lerp_u8_sse2_8bit+0x242>
DB 72,99,4,129 ; movslq (%rcx,%rax,4),%rax
DB 72,1,200 ; add %rcx,%rax
DB 255,224 ; jmpq *%rax
DB 66,15,182,4,2 ; movzbl (%rdx,%r8,1),%eax
DB 102,15,110,232 ; movd %eax,%xmm5
- DB 233,70,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,70,254,255,255 ; jmpq 2a1f5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,2 ; movzbl 0x2(%rdx,%r8,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,2 ; pinsrw $0x2,%eax,%xmm5
@@ -40284,7 +40572,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,15,110,224 ; movd %eax,%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 243,15,16,236 ; movss %xmm4,%xmm5
- DB 233,33,254,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,33,254,255,255 ; jmpq 2a1f5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 66,15,182,68,2,6 ; movzbl 0x6(%rdx,%r8,1),%eax
DB 102,15,239,237 ; pxor %xmm5,%xmm5
DB 102,15,196,232,6 ; pinsrw $0x6,%eax,%xmm5
@@ -40295,7 +40583,7 @@ _sk_lerp_u8_sse2_8bit LABEL PROC
DB 102,66,15,110,36,2 ; movd (%rdx,%r8,1),%xmm4
DB 102,15,96,224 ; punpcklbw %xmm0,%xmm4
DB 242,15,16,236 ; movsd %xmm4,%xmm5
- DB 233,233,253,255,255 ; jmpq 29cb5 <_sk_lerp_u8_sse2_8bit+0x2b>
+ DB 233,233,253,255,255 ; jmpq 2a1f5 <_sk_lerp_u8_sse2_8bit+0x2b>
DB 149 ; xchg %eax,%ebp
DB 255 ; (bad)
DB 255 ; (bad)
@@ -40334,7 +40622,7 @@ _sk_move_dst_src_sse2_8bit LABEL PROC
PUBLIC _sk_black_color_sse2_8bit
_sk_black_color_sse2_8bit LABEL PROC
DB 72,173 ; lods %ds:(%rsi),%rax
- DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2cc20 <_sk_overlay_sse2_8bit+0x1513>
+ DB 15,40,5,27,45,0,0 ; movaps 0x2d1b(%rip),%xmm0 # 2d160 <_sk_overlay_sse2_8bit+0x1513>
DB 15,40,200 ; movaps %xmm0,%xmm1
DB 255,224 ; jmpq *%rax
@@ -41205,7 +41493,7 @@ _sk_darken_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,164,30,0,0 ; movdqa 0x1ea4(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 102,15,111,37,164,30,0,0 ; movdqa 0x1ea4(%rip),%xmm4 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -41311,7 +41599,7 @@ _sk_lighten_sse2_8bit LABEL PROC
DB 102,65,15,248,234 ; psubb %xmm10,%xmm5
DB 102,15,248,207 ; psubb %xmm7,%xmm1
DB 102,15,248,196 ; psubb %xmm4,%xmm0
- DB 102,15,111,37,184,28,0,0 ; movdqa 0x1cb8(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 102,15,111,37,184,28,0,0 ; movdqa 0x1cb8(%rip),%xmm4 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,111,252 ; movdqa %xmm4,%xmm7
DB 102,15,223,248 ; pandn %xmm0,%xmm7
@@ -41359,7 +41647,7 @@ _sk_exclusion_sse2_8bit LABEL PROC
DB 102,15,113,214,8 ; psrlw $0x8,%xmm6
DB 102,15,103,244 ; packuswb %xmm4,%xmm6
DB 102,15,103,239 ; packuswb %xmm7,%xmm5
- DB 102,15,111,37,235,27,0,0 ; movdqa 0x1beb(%rip),%xmm4 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 102,15,111,37,235,27,0,0 ; movdqa 0x1beb(%rip),%xmm4 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,205 ; psubb %xmm5,%xmm1
DB 102,15,219,236 ; pand %xmm4,%xmm5
DB 102,15,219,230 ; pand %xmm6,%xmm4
@@ -41456,7 +41744,7 @@ _sk_difference_sse2_8bit LABEL PROC
DB 102,65,15,103,244 ; packuswb %xmm12,%xmm6
DB 102,65,15,218,226 ; pminub %xmm10,%xmm4
DB 102,65,15,218,243 ; pminub %xmm11,%xmm6
- DB 102,15,111,45,40,26,0,0 ; movdqa 0x1a28(%rip),%xmm5 # 2ccb0 <_sk_overlay_sse2_8bit+0x15a3>
+ DB 102,15,111,45,40,26,0,0 ; movdqa 0x1a28(%rip),%xmm5 # 2d1f0 <_sk_overlay_sse2_8bit+0x15a3>
DB 102,15,248,206 ; psubb %xmm6,%xmm1
DB 102,15,219,245 ; pand %xmm5,%xmm6
DB 102,15,219,236 ; pand %xmm4,%xmm5
@@ -41551,7 +41839,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,111,220 ; movdqa %xmm4,%xmm11
DB 102,69,15,217,211 ; psubusw %xmm11,%xmm10
DB 102,68,15,117,213 ; pcmpeqw %xmm5,%xmm10
- DB 102,15,111,45,187,16,0,0 ; movdqa 0x10bb(%rip),%xmm5 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,111,45,187,16,0,0 ; movdqa 0x10bb(%rip),%xmm5 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,198 ; movdqa %xmm6,%xmm0
DB 102,15,239,197 ; pxor %xmm5,%xmm0
DB 102,65,15,213,198 ; pmullw %xmm14,%xmm0
@@ -41655,7 +41943,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,68,15,253,188,36,160,0,0,0 ; paddw 0xa0(%rsp),%xmm15
DB 102,68,15,253,76,36,16 ; paddw 0x10(%rsp),%xmm9
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
- DB 102,15,111,5,57,22,0,0 ; movdqa 0x1639(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
+ DB 102,15,111,5,57,22,0,0 ; movdqa 0x1639(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,15,253,208 ; paddw %xmm0,%xmm2
DB 102,68,15,253,210 ; paddw %xmm2,%xmm10
DB 102,68,15,253,248 ; paddw %xmm0,%xmm15
@@ -41664,7 +41952,7 @@ _sk_hardlight_sse2_8bit LABEL PROC
DB 102,69,15,253,193 ; paddw %xmm9,%xmm8
DB 102,15,253,232 ; paddw %xmm0,%xmm5
DB 102,15,253,233 ; paddw %xmm1,%xmm5
- DB 102,15,111,5,28,22,0,0 ; movdqa 0x161c(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
+ DB 102,15,111,5,28,22,0,0 ; movdqa 0x161c(%rip),%xmm0 # 2d210 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,192 ; pmulhuw %xmm0,%xmm8
DB 102,68,15,228,248 ; pmulhuw %xmm0,%xmm15
@@ -41767,7 +42055,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,217,234 ; psubusw %xmm2,%xmm5
DB 102,15,117,236 ; pcmpeqw %xmm4,%xmm5
DB 102,15,127,172,36,160,0,0,0 ; movdqa %xmm5,0xa0(%rsp)
- DB 102,15,111,53,80,12,0,0 ; movdqa 0xc50(%rip),%xmm6 # 2c510 <_sk_overlay_sse2_8bit+0xe03>
+ DB 102,15,111,53,80,12,0,0 ; movdqa 0xc50(%rip),%xmm6 # 2ca50 <_sk_overlay_sse2_8bit+0xe03>
DB 102,15,111,194 ; movdqa %xmm2,%xmm0
DB 102,15,239,198 ; pxor %xmm6,%xmm0
DB 102,65,15,213,199 ; pmullw %xmm15,%xmm0
@@ -41875,7 +42163,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,68,15,253,92,36,112 ; paddw 0x70(%rsp),%xmm11
DB 102,15,253,44,36 ; paddw (%rsp),%xmm5
DB 102,15,253,116,36,16 ; paddw 0x10(%rsp),%xmm6
- DB 102,15,111,5,202,17,0,0 ; movdqa 0x11ca(%rip),%xmm0 # 2ccc0 <_sk_overlay_sse2_8bit+0x15b3>
+ DB 102,15,111,5,202,17,0,0 ; movdqa 0x11ca(%rip),%xmm0 # 2d200 <_sk_overlay_sse2_8bit+0x15b3>
DB 102,68,15,253,224 ; paddw %xmm0,%xmm12
DB 102,68,15,253,227 ; paddw %xmm3,%xmm12
DB 102,68,15,253,216 ; paddw %xmm0,%xmm11
@@ -41884,7 +42172,7 @@ _sk_overlay_sse2_8bit LABEL PROC
DB 102,15,253,234 ; paddw %xmm2,%xmm5
DB 102,15,253,240 ; paddw %xmm0,%xmm6
DB 102,15,253,241 ; paddw %xmm1,%xmm6
- DB 102,15,111,5,174,17,0,0 ; movdqa 0x11ae(%rip),%xmm0 # 2ccd0 <_sk_overlay_sse2_8bit+0x15c3>
+ DB 102,15,111,5,174,17,0,0 ; movdqa 0x11ae(%rip),%xmm0 # 2d210 <_sk_overlay_sse2_8bit+0x15c3>
DB 102,15,228,240 ; pmulhuw %xmm0,%xmm6
DB 102,15,228,232 ; pmulhuw %xmm0,%xmm5
DB 102,68,15,228,216 ; pmulhuw %xmm0,%xmm11
@@ -41918,14 +42206,14 @@ ALIGN 4
DB 252 ; cld
DB 190,0,0,128,191 ; mov $0xbf800000,%esi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2bbdc <.literal4+0x64>
+ DB 224,64 ; loopne 2c11c <.literal4+0x64>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
DB 62,61,10,23,63,174 ; ds cmp $0xae3f170a,%eax
- DB 71,225,61 ; rex.RXB loope 2bbe5 <.literal4+0x6d>
+ DB 71,225,61 ; rex.RXB loope 2c125 <.literal4+0x6d>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2bbef <.literal4+0x77>
+ DB 127,67 ; jg 2c12f <.literal4+0x77>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,92,143,50,63 ; sbbl $0x3f,0x328f5c3d(%rsi)
DB 10,215 ; or %bh,%dl
@@ -41958,7 +42246,7 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2bc05 <.literal4+0x8d>
+ DB 224,7 ; loopne 2c145 <.literal4+0x8d>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -41969,8 +42257,8 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 0,52,255 ; add %dh,(%rdi,%rdi,8)
DB 255 ; (bad)
- DB 127,0 ; jg 2bc18 <.literal4+0xa0>
- DB 119,115 ; ja 2bc8d <.literal4+0x115>
+ DB 127,0 ; jg 2c158 <.literal4+0xa0>
+ DB 119,115 ; ja 2c1cd <.literal4+0x115>
DB 248 ; clc
DB 194,117,191 ; retq $0xbf75
DB 191,63,249,68,180 ; mov $0xb444f93f,%edi
@@ -41993,12 +42281,12 @@ ALIGN 4
DB 190,80,128,3,62 ; mov $0x3e038050,%esi
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2bca3 <.literal4+0x12b>
+ DB 118,63 ; jbe 2c1e3 <.literal4+0x12b>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 0,0 ; add %al,(%rax)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2bcb2 <.literal4+0x13a>
+ DB 124,66 ; jl 2c1f2 <.literal4+0x13a>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 137,136,136,55,0,15 ; mov %ecx,0xf003788(%rax)
@@ -42008,9 +42296,9 @@ ALIGN 4
DB 137,136,136,59,15,0 ; mov %ecx,0xf3b88(%rax)
DB 0,0 ; add %al,(%rax)
DB 137,136,136,61,0,0 ; mov %ecx,0x3d88(%rax)
- DB 112,65 ; jo 2bcd5 <.literal4+0x15d>
+ DB 112,65 ; jo 2c215 <.literal4+0x15d>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2bcdf <.literal4+0x167>
+ DB 127,71 ; jg 2c21f <.literal4+0x167>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,89 ; ds pop %rcx
@@ -42037,15 +42325,15 @@ ALIGN 4
DB 0,0 ; add %al,(%rax)
DB 128,0,0 ; addb $0x0,(%rax)
DB 0,191,0,0,192,191 ; add %bh,-0x40400000(%rdi)
- DB 114,28 ; jb 2bcfe <.literal4+0x186>
+ DB 114,28 ; jb 2c23e <.literal4+0x186>
DB 199 ; (bad)
DB 62,0,0 ; add %al,%ds:(%rax)
DB 192,63,85 ; sarb $0x55,(%rdi)
DB 85 ; push %rbp
DB 149 ; xchg %eax,%ebp
DB 191,57,142,99,61 ; mov $0x3d638e39,%edi
- DB 114,249 ; jb 2bceb <.literal4+0x173>
- DB 127,63 ; jg 2bd33 <_sk_overlay_sse2_8bit+0x626>
+ DB 114,249 ; jb 2c22b <.literal4+0x173>
+ DB 127,63 ; jg 2c273 <_sk_overlay_sse2_8bit+0x626>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,4 ; add %al,0x4000000(%rax)
@@ -42081,16 +42369,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bd48 <_sk_overlay_sse2_8bit+0xa00063b>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c288 <_sk_overlay_sse2_8bit+0xa00063b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bd50 <_sk_overlay_sse2_8bit+0x12000643>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c290 <_sk_overlay_sse2_8bit+0x12000643>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bd58 <_sk_overlay_sse2_8bit+0x1a00064b>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c298 <_sk_overlay_sse2_8bit+0x1a00064b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bd60 <_sk_overlay_sse2_8bit+0x3000653>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c2a0 <_sk_overlay_sse2_8bit+0x3000653>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42133,16 +42421,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bda8 <_sk_overlay_sse2_8bit+0xa00069b>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c2e8 <_sk_overlay_sse2_8bit+0xa00069b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bdb0 <_sk_overlay_sse2_8bit+0x120006a3>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c2f0 <_sk_overlay_sse2_8bit+0x120006a3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bdb8 <_sk_overlay_sse2_8bit+0x1a0006ab>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c2f8 <_sk_overlay_sse2_8bit+0x1a0006ab>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bdc0 <_sk_overlay_sse2_8bit+0x30006b3>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c300 <_sk_overlay_sse2_8bit+0x30006b3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42185,16 +42473,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be08 <_sk_overlay_sse2_8bit+0xa0006fb>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c348 <_sk_overlay_sse2_8bit+0xa0006fb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be10 <_sk_overlay_sse2_8bit+0x12000703>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c350 <_sk_overlay_sse2_8bit+0x12000703>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be18 <_sk_overlay_sse2_8bit+0x1a00070b>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c358 <_sk_overlay_sse2_8bit+0x1a00070b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be20 <_sk_overlay_sse2_8bit+0x3000713>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c360 <_sk_overlay_sse2_8bit+0x3000713>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42237,16 +42525,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02be68 <_sk_overlay_sse2_8bit+0xa00075b>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c3a8 <_sk_overlay_sse2_8bit+0xa00075b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202be70 <_sk_overlay_sse2_8bit+0x12000763>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c3b0 <_sk_overlay_sse2_8bit+0x12000763>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02be78 <_sk_overlay_sse2_8bit+0x1a00076b>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c3b8 <_sk_overlay_sse2_8bit+0x1a00076b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302be80 <_sk_overlay_sse2_8bit+0x3000773>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c3c0 <_sk_overlay_sse2_8bit+0x3000773>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42289,16 +42577,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bec8 <_sk_overlay_sse2_8bit+0xa0007bb>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c408 <_sk_overlay_sse2_8bit+0xa0007bb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bed0 <_sk_overlay_sse2_8bit+0x120007c3>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c410 <_sk_overlay_sse2_8bit+0x120007c3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bed8 <_sk_overlay_sse2_8bit+0x1a0007cb>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c418 <_sk_overlay_sse2_8bit+0x1a0007cb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bee0 <_sk_overlay_sse2_8bit+0x30007d3>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c420 <_sk_overlay_sse2_8bit+0x30007d3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42341,16 +42629,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf28 <_sk_overlay_sse2_8bit+0xa00081b>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c468 <_sk_overlay_sse2_8bit+0xa00081b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf30 <_sk_overlay_sse2_8bit+0x12000823>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c470 <_sk_overlay_sse2_8bit+0x12000823>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf38 <_sk_overlay_sse2_8bit+0x1a00082b>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c478 <_sk_overlay_sse2_8bit+0x1a00082b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bf40 <_sk_overlay_sse2_8bit+0x3000833>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c480 <_sk_overlay_sse2_8bit+0x3000833>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42393,16 +42681,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bf88 <_sk_overlay_sse2_8bit+0xa00087b>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c4c8 <_sk_overlay_sse2_8bit+0xa00087b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bf90 <_sk_overlay_sse2_8bit+0x12000883>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c4d0 <_sk_overlay_sse2_8bit+0x12000883>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bf98 <_sk_overlay_sse2_8bit+0x1a00088b>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c4d8 <_sk_overlay_sse2_8bit+0x1a00088b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302bfa0 <_sk_overlay_sse2_8bit+0x3000893>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c4e0 <_sk_overlay_sse2_8bit+0x3000893>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -42445,16 +42733,16 @@ ALIGN 32
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02bfe8 <_sk_overlay_sse2_8bit+0xa0008db>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c528 <_sk_overlay_sse2_8bit+0xa0008db>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202bff0 <_sk_overlay_sse2_8bit+0x120008e3>
+ DB 255,13,255,255,255,17 ; decl 0x11ffffff(%rip) # 1202c530 <_sk_overlay_sse2_8bit+0x120008e3>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02bff8 <_sk_overlay_sse2_8bit+0x1a0008eb>
+ DB 255,21,255,255,255,25 ; callq *0x19ffffff(%rip) # 1a02c538 <_sk_overlay_sse2_8bit+0x1a0008eb>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c000 <_sk_overlay_sse2_8bit+0x30008f3>
+ DB 255,29,255,255,255,2 ; lcall *0x2ffffff(%rip) # 302c540 <_sk_overlay_sse2_8bit+0x30008f3>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43291,11 +43579,11 @@ ALIGN 16
DB 0,128,191,0,0,128 ; add %al,-0x7fffff41(%rax)
DB 191,0,0,224,64 ; mov $0x40e00000,%edi
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c608 <.literal16+0xf8>
+ DB 224,64 ; loopne 2cb48 <.literal16+0xf8>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c60c <.literal16+0xfc>
+ DB 224,64 ; loopne 2cb4c <.literal16+0xfc>
DB 0,0 ; add %al,(%rax)
- DB 224,64 ; loopne 2c610 <.literal16+0x100>
+ DB 224,64 ; loopne 2cb50 <.literal16+0x100>
DB 154 ; (bad)
DB 153 ; cltd
DB 153 ; cltd
@@ -43315,13 +43603,13 @@ ALIGN 16
DB 10,23 ; or (%rdi),%dl
DB 63 ; (bad)
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c631 <.literal16+0x121>
+ DB 71,225,61 ; rex.RXB loope 2cb71 <.literal16+0x121>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c635 <.literal16+0x125>
+ DB 71,225,61 ; rex.RXB loope 2cb75 <.literal16+0x125>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c639 <.literal16+0x129>
+ DB 71,225,61 ; rex.RXB loope 2cb79 <.literal16+0x129>
DB 174 ; scas %es:(%rdi),%al
- DB 71,225,61 ; rex.RXB loope 2c63d <.literal16+0x12d>
+ DB 71,225,61 ; rex.RXB loope 2cb7d <.literal16+0x12d>
DB 255,0 ; incl (%rax)
DB 0,0 ; add %al,(%rax)
DB 255,0 ; incl (%rax)
@@ -43332,10 +43620,10 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 1,255 ; add %edi,%edi
DB 255 ; (bad)
- DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02c618 <_sk_overlay_sse2_8bit+0xa000f0b>
+ DB 255,5,255,255,255,9 ; incl 0x9ffffff(%rip) # a02cb58 <_sk_overlay_sse2_8bit+0xa000f0b>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302c620 <_sk_overlay_sse2_8bit+0x3000f13>
+ DB 255,13,255,255,255,2 ; decl 0x2ffffff(%rip) # 302cb60 <_sk_overlay_sse2_8bit+0x3000f13>
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,6 ; incl (%rsi)
@@ -43350,11 +43638,11 @@ ALIGN 16
DB 255,0 ; incl (%rax)
DB 0,127,67 ; add %bh,0x43(%rdi)
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c67b <.literal16+0x16b>
+ DB 127,67 ; jg 2cbbb <.literal16+0x16b>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c67f <.literal16+0x16f>
+ DB 127,67 ; jg 2cbbf <.literal16+0x16f>
DB 0,0 ; add %al,(%rax)
- DB 127,67 ; jg 2c683 <.literal16+0x173>
+ DB 127,67 ; jg 2cbc3 <.literal16+0x173>
DB 145 ; xchg %eax,%ecx
DB 131,158,61,145,131,158,61 ; sbbl $0x3d,-0x617c6ec3(%rsi)
DB 145 ; xchg %eax,%ecx
@@ -43505,13 +43793,13 @@ ALIGN 16
DB 132,55 ; test %dh,(%rdi)
DB 8,33 ; or %ah,(%rcx)
DB 132,55 ; test %dh,(%rdi)
- DB 224,7 ; loopne 2c789 <.literal16+0x279>
+ DB 224,7 ; loopne 2ccc9 <.literal16+0x279>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c78d <.literal16+0x27d>
+ DB 224,7 ; loopne 2cccd <.literal16+0x27d>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c791 <.literal16+0x281>
+ DB 224,7 ; loopne 2ccd1 <.literal16+0x281>
DB 0,0 ; add %al,(%rax)
- DB 224,7 ; loopne 2c795 <.literal16+0x285>
+ DB 224,7 ; loopne 2ccd5 <.literal16+0x285>
DB 0,0 ; add %al,(%rax)
DB 33,8 ; and %ecx,(%rax)
DB 2,58 ; add (%rdx),%bh
@@ -43571,17 +43859,17 @@ ALIGN 16
DB 0,0 ; add %al,(%rax)
DB 52,255 ; xor $0xff,%al
DB 255 ; (bad)
- DB 127,0 ; jg 2c814 <.literal16+0x304>
+ DB 127,0 ; jg 2cd54 <.literal16+0x304>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c818 <.literal16+0x308>
+ DB 127,0 ; jg 2cd58 <.literal16+0x308>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c81c <.literal16+0x30c>
+ DB 127,0 ; jg 2cd5c <.literal16+0x30c>
DB 255 ; (bad)
DB 255 ; (bad)
- DB 127,0 ; jg 2c820 <.literal16+0x310>
- DB 119,115 ; ja 2c895 <.literal16+0x385>
+ DB 127,0 ; jg 2cd60 <.literal16+0x310>
+ DB 119,115 ; ja 2cdd5 <.literal16+0x385>
DB 248 ; clc
DB 194,119,115 ; retq $0x7377
DB 248 ; clc
@@ -43592,7 +43880,7 @@ ALIGN 16
DB 194,117,191 ; retq $0xbf75
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
- DB 117,191 ; jne 2c7f9 <.literal16+0x2e9>
+ DB 117,191 ; jne 2cd39 <.literal16+0x2e9>
DB 191,63,117,191,191 ; mov $0xbfbf753f,%edi
DB 63 ; (bad)
DB 249 ; stc
@@ -43604,7 +43892,7 @@ ALIGN 16
DB 249 ; stc
DB 68,180,62 ; rex.R mov $0x3e,%spl
DB 163,233,220,63,163,233,220,63,163 ; movabs %eax,0xa33fdce9a33fdce9
- DB 233,220,63,163,233 ; jmpq ffffffffe9a6083a <_sk_overlay_sse2_8bit+0xffffffffe9a3512d>
+ DB 233,220,63,163,233 ; jmpq ffffffffe9a60d7a <_sk_overlay_sse2_8bit+0xffffffffe9a3512d>
DB 220,63 ; fdivrl (%rdi)
DB 81 ; push %rcx
DB 140,242 ; mov %?,%edx
@@ -43694,16 +43982,16 @@ ALIGN 16
DB 128,3,62 ; addb $0x3e,(%rbx)
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c983 <.literal16+0x473>
+ DB 118,63 ; jbe 2cec3 <.literal16+0x473>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c987 <.literal16+0x477>
+ DB 118,63 ; jbe 2cec7 <.literal16+0x477>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c98b <.literal16+0x47b>
+ DB 118,63 ; jbe 2cecb <.literal16+0x47b>
DB 31 ; (bad)
DB 215 ; xlat %ds:(%rbx)
- DB 118,63 ; jbe 2c98f <.literal16+0x47f>
+ DB 118,63 ; jbe 2cecf <.literal16+0x47f>
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
DB 246,64,83,63 ; testb $0x3f,0x53(%rax)
@@ -43724,13 +44012,13 @@ ALIGN 16
DB 65,0,0 ; add %al,(%r8)
DB 248 ; clc
DB 65,0,0 ; add %al,(%r8)
- DB 124,66 ; jl 2c9c6 <.literal16+0x4b6>
+ DB 124,66 ; jl 2cf06 <.literal16+0x4b6>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c9ca <.literal16+0x4ba>
+ DB 124,66 ; jl 2cf0a <.literal16+0x4ba>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c9ce <.literal16+0x4be>
+ DB 124,66 ; jl 2cf0e <.literal16+0x4be>
DB 0,0 ; add %al,(%rax)
- DB 124,66 ; jl 2c9d2 <.literal16+0x4c2>
+ DB 124,66 ; jl 2cf12 <.literal16+0x4c2>
DB 0,240 ; add %dh,%al
DB 0,0 ; add %al,(%rax)
DB 0,240 ; add %dh,%al
@@ -43776,13 +44064,13 @@ ALIGN 16
DB 136,136,61,137,136,136 ; mov %cl,-0x777776c3(%rax)
DB 61,137,136,136,61 ; cmp $0x3d888889,%eax
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2ca55 <.literal16+0x545>
+ DB 112,65 ; jo 2cf95 <.literal16+0x545>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2ca59 <.literal16+0x549>
+ DB 112,65 ; jo 2cf99 <.literal16+0x549>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2ca5d <.literal16+0x54d>
+ DB 112,65 ; jo 2cf9d <.literal16+0x54d>
DB 0,0 ; add %al,(%rax)
- DB 112,65 ; jo 2ca61 <.literal16+0x551>
+ DB 112,65 ; jo 2cfa1 <.literal16+0x551>
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
DB 0,0 ; add %al,(%rax)
DB 0,128,0,0,0,128 ; add %al,-0x80000000(%rax)
@@ -43821,13 +44109,13 @@ ALIGN 16
DB 64,254 ; rex (bad)
DB 255,0 ; incl (%rax)
DB 255 ; (bad)
- DB 127,71 ; jg 2cacb <.literal16+0x5bb>
+ DB 127,71 ; jg 2d00b <.literal16+0x5bb>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2cacf <.literal16+0x5bf>
+ DB 127,71 ; jg 2d00f <.literal16+0x5bf>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2cad3 <.literal16+0x5c3>
+ DB 127,71 ; jg 2d013 <.literal16+0x5c3>
DB 0,255 ; add %bh,%bh
- DB 127,71 ; jg 2cad7 <.literal16+0x5c7>
+ DB 127,71 ; jg 2d017 <.literal16+0x5c7>
DB 208 ; (bad)
DB 179,89 ; mov $0x59,%bl
DB 62,208 ; ds (bad)
@@ -43857,10 +44145,10 @@ ALIGN 16
DB 61,152,221,147,61 ; cmp $0x3d93dd98,%eax
DB 152 ; cwtl
DB 221,147,61,45,16,17 ; fstl 0x11102d3d(%rbx)
- DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2dbda <_sk_overlay_sse2_8bit+0x2dc024cd>
+ DB 192,45,16,17,192,45,16 ; shrb $0x10,0x2dc01110(%rip) # 2dc2e11a <_sk_overlay_sse2_8bit+0x2dc024cd>
DB 17,192 ; adc %eax,%eax
DB 45,16,17,192,18 ; sub $0x12c01110,%eax
- DB 120,57 ; js 2cb0c <.literal16+0x5fc>
+ DB 120,57 ; js 2d04c <.literal16+0x5fc>
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
DB 64,18,120,57 ; adc 0x39(%rax),%dil
@@ -43925,13 +44213,13 @@ ALIGN 16
DB 192,191,0,0,192,191,0 ; sarb $0x0,-0x40400000(%rdi)
DB 0,192 ; add %al,%al
DB 191,0,0,192,191 ; mov $0xbfc00000,%edi
- DB 114,28 ; jb 2cbbe <.literal16+0x6ae>
+ DB 114,28 ; jb 2d0fe <.literal16+0x6ae>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2cbc2 <.literal16+0x6b2>
+ DB 62,114,28 ; jb,pt 2d102 <.literal16+0x6b2>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2cbc6 <.literal16+0x6b6>
+ DB 62,114,28 ; jb,pt 2d106 <.literal16+0x6b6>
DB 199 ; (bad)
- DB 62,114,28 ; jb,pt 2cbca <.literal16+0x6ba>
+ DB 62,114,28 ; jb,pt 2d10a <.literal16+0x6ba>
DB 199 ; (bad)
DB 62,85 ; ds push %rbp
DB 85 ; push %rbp
@@ -43950,15 +44238,15 @@ ALIGN 16
DB 0,192 ; add %al,%al
DB 63 ; (bad)
DB 57,142,99,61,57,142 ; cmp %ecx,-0x71c6c29d(%rsi)
- DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665a15 <_sk_overlay_sse2_8bit+0x3d63a308>
+ DB 99,61,57,142,99,61 ; movslq 0x3d638e39(%rip),%edi # 3d665f55 <_sk_overlay_sse2_8bit+0x3d63a308>
DB 57,142,99,61,114,249 ; cmp %ecx,-0x68dc29d(%rsi)
- DB 127,63 ; jg 2cc23 <.literal16+0x713>
- DB 114,249 ; jb 2cbdf <.literal16+0x6cf>
- DB 127,63 ; jg 2cc27 <.literal16+0x717>
- DB 114,249 ; jb 2cbe3 <.literal16+0x6d3>
- DB 127,63 ; jg 2cc2b <.literal16+0x71b>
- DB 114,249 ; jb 2cbe7 <.literal16+0x6d7>
- DB 127,63 ; jg 2cc2f <.literal16+0x71f>
+ DB 127,63 ; jg 2d163 <.literal16+0x713>
+ DB 114,249 ; jb 2d11f <.literal16+0x6cf>
+ DB 127,63 ; jg 2d167 <.literal16+0x717>
+ DB 114,249 ; jb 2d123 <.literal16+0x6d3>
+ DB 127,63 ; jg 2d16b <.literal16+0x71b>
+ DB 114,249 ; jb 2d127 <.literal16+0x6d7>
+ DB 127,63 ; jg 2d16f <.literal16+0x71f>
DB 3,0 ; add (%rax),%eax
DB 0,0 ; add %al,(%rax)
DB 3,0 ; add (%rax),%eax
@@ -44065,14 +44353,14 @@ ALIGN 16
DB 255 ; (bad)
DB 255 ; (bad)
DB 255,0 ; incl (%rax)
- DB 127,0 ; jg 2ccc2 <.literal16+0x7b2>
- DB 127,0 ; jg 2ccc4 <.literal16+0x7b4>
- DB 127,0 ; jg 2ccc6 <.literal16+0x7b6>
- DB 127,0 ; jg 2ccc8 <.literal16+0x7b8>
- DB 127,0 ; jg 2ccca <.literal16+0x7ba>
- DB 127,0 ; jg 2cccc <.literal16+0x7bc>
- DB 127,0 ; jg 2ccce <.literal16+0x7be>
- DB 127,0 ; jg 2ccd0 <.literal16+0x7c0>
+ DB 127,0 ; jg 2d202 <.literal16+0x7b2>
+ DB 127,0 ; jg 2d204 <.literal16+0x7b4>
+ DB 127,0 ; jg 2d206 <.literal16+0x7b6>
+ DB 127,0 ; jg 2d208 <.literal16+0x7b8>
+ DB 127,0 ; jg 2d20a <.literal16+0x7ba>
+ DB 127,0 ; jg 2d20c <.literal16+0x7bc>
+ DB 127,0 ; jg 2d20e <.literal16+0x7be>
+ DB 127,0 ; jg 2d210 <.literal16+0x7c0>
DB 129,128,129,128,129,128,129,128,129,128; addl $0x80818081,-0x7f7e7f7f(%rax)
DB 129 ; .byte 0x81
DB 128 ; .byte 0x80
diff --git a/src/jumper/SkJumper_vectors.h b/src/jumper/SkJumper_vectors.h
index 544b208a04..7aa3250abf 100644
--- a/src/jumper/SkJumper_vectors.h
+++ b/src/jumper/SkJumper_vectors.h
@@ -266,7 +266,8 @@
auto v = _mm_cvtsi32_si128(*(const uint32_t*)src);
return _mm_insert_epi16(v, src[2], 2);
};
- if (tail > 0) { _0 = load_rgb(ptr + 0); }
+ _1 = _2 = _3 = _4 = _5 = _6 = _7 = _mm_setzero_si128();
+ if ( true ) { _0 = load_rgb(ptr + 0); }
if (tail > 1) { _1 = load_rgb(ptr + 3); }
if (tail > 2) { _2 = load_rgb(ptr + 6); }
if (tail > 3) { _3 = load_rgb(ptr + 9); }
@@ -279,9 +280,9 @@
auto _23 = _mm_loadu_si128((const __m128i*)(ptr + 6)) ;
auto _45 = _mm_loadu_si128((const __m128i*)(ptr + 12)) ;
auto _67 = _mm_srli_si128(_mm_loadu_si128((const __m128i*)(ptr + 16)), 4);
- _0 = _01; _1 = _mm_srli_si128(_01, 6),
- _2 = _23; _3 = _mm_srli_si128(_23, 6),
- _4 = _45; _5 = _mm_srli_si128(_45, 6),
+ _0 = _01; _1 = _mm_srli_si128(_01, 6);
+ _2 = _23; _3 = _mm_srli_si128(_23, 6);
+ _4 = _45; _5 = _mm_srli_si128(_45, 6);
_6 = _67; _7 = _mm_srli_si128(_67, 6);
}
@@ -363,7 +364,7 @@
SI void load4(const float* ptr, size_t tail, F* r, F* g, F* b, F* a) {
F _04, _15, _26, _37;
-
+ _04 = _15 = _26 = _37 = 0;
switch (tail) {
case 0: _37 = _mm256_insertf128_ps(_37, _mm_loadu_ps(ptr+28), 1);
case 7: _26 = _mm256_insertf128_ps(_26, _mm_loadu_ps(ptr+24), 1);